Internet Kaynak Keşfi: Bir Dublin Core Üstveri Editörü ve

Slides:



Advertisements
Benzer bir sunumlar
3- Site konuyu geniş çaplı ele almış ve konuların anlaşılması için değişik ve anlaşılır örnekler verilmiş. Her konuya ayrı.
Advertisements

HTML e GİRİŞ Temel HTML etiketleri.
TÜTÜN KULLANIMI “EKONOMİK KAYIPLAR” Dilek ASLAN HÜTF Halk Sağlığı AD.
HTML’e Devam Uygulama.
Anlamsal Web, Anlamsal Web Dilleri ve Araçları
Halit Yıldırım
Web 2.0 AraçlarI OĞUZ TEKE
Sosyal Ağların Eğitimde Kullanımı
Web 2.0 Araçları Rıdvan Gezici
İnternet’in Tarihi Gelişimi
FİİLLERDE ÇATI KONUSUNDA EN İYİ ÜÇ İNTERNET SİTESİYLE İLGİLİ SUNUM
Bilginin Tanımlanması ve Diğer Bilgi Erişim Uygulamaları
Dünyanın En Büyük On Bir Açık Üniversitesinde İnternete Dayalı Eğitim Uygulamaları Öğr. Gör. M. Emin Mutlu Öğr. Gör. M. Canan Öztürk Öğr. Gör. Ruşen Yılmaz.
YAZMA ESERLERİN KATALOGLANMASINDA VE SAYISALLAŞTIRILMASINDA NİTELİK Doç. Dr. Hüseyin Odabaş Atatürk Üniversitesi Edebiyat Fakültesi Bilgi ve Belge Yönetimi.
Öğretim Teknolojileri ve Materyal Tasarımı Öğretim Materyallerinin Tasarlanması, Hazırlanması ve Seçimi Dr. Süleyman Sadi SEFEROĞLU Hacettepe Üniversitesi,
IT504 ~~DOM~~ Belge Nesne Modeli I
BBY Bilgi Teknolojisi ve Yönetimi
Metadata ve Kütüphanelerde Kullanılması
7/yazim-kurallari-konu-anlatm.html Bu sitede,konunun derinlemesine incelenmesi ve ayrıntılar ile konunun pekiştirilmesi.
XML TEKNOLOJİLERİ BTP 206. Ders İçin Gerekli Olan Ders Kitabı –XML, Zafer Demirkol, Pusula Yayınları Yardımcı Ders Kitabı –XML How To Program, Deitel.
R. Orçun Madran.
1 Kapsamlı Sağlık Bakımı Prof. Zekeriya Aktürk Atatürk Üniversitesi Tıp Fakültesi.
XML Document Object Model (DOM)
Slide 1 Web 2.0 Teknolojileri ve Uygulamaları Çalıştayı, 4 Aralık 2009, Ankara Web 2.0, Semantik Web ve Kütüphanelerin Geleceği Yaşar Tonta ve Umut Al.
İnternet Teknolojisi Temel Kavramlar
İNTERNET ADRESLERİ Ahmet SOYARSLAN biltek.info.
“Akademik Bilişim ’02” 6-8 Şubat 2002, Konya Y.T. Türkçe Arama Motorlarında Performans Değerlendirme Yaşar Tonta Hacettepe Üniversitesi
Sistem ve Ağ Yönetiminde Parola Yönetim Zorlukları
EDUCOMMONS Yazılımı. The Center for Open Sustainable Learning.
ORTA DOĞU TEKNİK ÜNİVERSİTESİ Sürekli Eğitim Merkezi www. sem. metu
Öncelikle site anlaşılır bir şekilde hazırlanıp değişik ve çarpıcı örnekler vermiştir. Konuya girmeden.
İnternet. İnternet...  dünya çapında bir bilgisayar ağı  bilgi süper otoyolu (information super highway)
Osman SAKA- Bilişim 2000 Prof.Dr. Tanju Aktuğ Ankara Üniversitesi Tıp Fakültesi Doç.Dr. Ziya Alkan Ege Üniversitesi Tıp Fakültesi Dr. Murat Sincan Hacettepe.
Dijital Kütüphanelerde Kaynak Tanımlama Türkiye Bilgi ve Belge Yönetimi Bölümleri Lisansüstü Tez Arşivi Örneği Tolga Çakmak, Güleda Doğan, Özlem Şenyurt.
XII. Türkiye’de İnternet Konferansı 8-10 Kasım 2007 Anlamsal HTML’e Yeni Bir Bakış: MİKROFORMATLAR Abdullah Çetin ÇAVDAR Mert DUATEPE.
XML ve XML Teknolojileri
Dijital Yerliler ve Kütüphanelerde Mobil Uygulamalar Tolga ÇAKMAK – 12 Ocak 2012 Hacettepe Üniversitesi Bilgi ve Belge Yönetimi Bölümü
“Metadata” 37. Kütüphane Haftası 26 Mart-01 Nisan 2001, Ankara “METADATA” Mehmet E. Küçük UmutAl Mehmet E. Küçük Umut Al H.Ü. Kütüphanecilik Bölümü {mkucuk,
Arş. Gör. Tolga Çakmak Hacettepe Üniversitesi – Bilgi ve Belge Yönetimi Bölümü Sosyal Medya ile Değişen Pazarlama Anlayışları.
PHP.
“Sosyal Bilimler ve Internet” 18 Nisan 2000, Hacettepe Üniversitesi, Beytepe Y.T. Sosyal Bilim Araştırmalarında Elektronik Yayınların Kullanımı Yaşar Tonta.
ENES KARAAĞAÇ TÜRKÇE ÖĞRETMENLIĞI II. SıNıF (ÖRGÜN ÖĞRETIM) Web 2.0 Araçları Tanıtım Sunusu.
BİLGİ OKURYAZARLIĞI EĞİTİM PROGRAMI TASARIMI ÇALIŞTAYI
explode Bu fonksiyon sayesinde belirli bir metni, istediğiniz bir karakteri referans alarak bölebilir ve istediğiniz bir diziye aktarabilirsiniz.
Rıdvan Gezici  Web 2.0 nedir ?  Web 2.0 araçları  Eğitimde web 2.0 ‘nin kullanımı  Web 2.0 Araçlarının Tanıtımı.
İnternet Teknolojisi Temel Kavramlar
Erman Yukselturk1 PHP NEDİR? Scripting / Progralama dilidir (C’ye benzer) C ++ ortamında geliştirilmiştir Bedava / Açık Kod Hızlı, açık, dengeli (stable),
BBY 207: Sosyal Bilimlerde Araştırma Yöntemleri I Y.T. SPSS Ödevi Çözümü Yaşar Tonta H.Ü. Bilgi ve Belge YönetimiBölümü
İçerik EndNote Hakkında… EndNote Kurulumu
E-ÖĞRENME SİSTEMİNİN HİZMET İÇİ EĞİTİMDE KULLANILMASI VE E-ÖĞRENME SİTELERİNİN KULLANIM KOLAYLIĞI AÇISINDAN İNCELENMESİ Yasemin BOY Yaşar ARSLAN Doç. Dr.
İNTERNET.
İKMAP İnternet 1 Ders Notu
Metadata ve Z39.50 Metadata.
İNTERNET ADRESLERİ.
Veri Tabanı Tasarım Süreci
Metadata Yaşar Tonta Hacettepe Üniversitesi
“Akademik Bilişim ’02” 6-8 Şubat 2002, Konya Y.T. Türkçe Arama Motorlarında Performans Değerlendirme Yıltan Bitirim Doğu Akdeniz Üniversitesi
Bilginin Organizasyonu Uygulama I
İnternet Nedir Bilgisayar Ağları Ağ Çeşitleri
NOT: Bu slayt üzerindeki resmi değiştirmek için resmi seçin ve silin. Ardından, kendi resminizi eklemek için yer tutucudaki Resimler simgesini tıklatın.
NOT: Bu slayt üzerindeki resmi değiştirmek için resmi seçin ve silin. Ardından, kendi resminizi eklemek için yer tutucudaki Resimler simgesini tıklatın.
BBY 263 Bilgi Kaynaklarının Tanımlanması Ders 2; Bibliyografik Denetim ve Üstveri.
İNTERNET ADRESLERİ.
Dünyanın bilgisine açılan pencere...
İNTERNET ADRESLERİ.
Tarayıcı Sorunları ve Çözümleri
Metadata ve Z39.50 Metadata.
Ontoloji Tabanlı Bir Kitap Sorgulama Sistemi Gerçekleştirimi
Dünyanın bilgisine açılan pencere...
Bilginin Organizasyonu Uygulama I
Sunum transkripti:

Internet Kaynak Keşfi: Bir Dublin Core Üstveri Editörü ve Arama Makinası Baha Olgun Hayri Sever Hacettepe Üniversitesi Bilgisayar Mühendisliği Bölümü DPT KMBGS Araştırma Birimi http://www.cs.hun.edu.tr/~km

Genel Bakış DPT tarafından desteklenen 97K121330 nolu KMBGS Projesi, Türkçe belgeleri saklayan, dizinleyen ve sorgulamaya olanak veren bir Boolean bilgi erişim sisteminin, UNIX ortamında MOTIF ile gerçekleştirimine dayanmaktadır. KMBGS Araştırma Birimi, Internet kaynaklarının gösterimini ve taranmasını süreç içinde projenin amacına dahil etmiştir.

Problem ve Çözüm Yolları Web üzerinde üç yüz milyon adreslenebilir nesne vardır (Part I of WWW-7 Tutorial Track, 1998, http://www.w3.org). Cyberspace’de kaybolma: Internet kaynaklarının insanca anlaşılabilir ve makinaca okunabilir olmasından dolayı erişim araçların yetersiz kalması. Ad-hoc Çözüm: meta TAKILARIN (TAGS) Gömülmesi HTML 4.0 (http://www.w3.org/TR/REC- html40/strict.dtd) Terim Sözlüğü Oluşturma (ontology): SHOE (http://www.cs.umd.edu/projects/plus/SHOE ) KIF (http://logic.stanford.edu/) RDF (http://www.w3.org)

Ad-hoc Çözüm: Meta Takılar

Ad-hoc Çözüm: Meta Takılar Dizinde kullanılan HTML takıları <P><B>ACADEMY OF THE SACRED HEART, New Orleans <BR></B> Sacred Heart restores shutters and cupola. <BR> <I> Preservation in Print</I> v23 n6 p28, Aug, 1996<BR> HTML Üstveri Referans Dizinine Eklenmesi <Subject><B> ACADEMY OF THE SACRED HEART, New Orleans </B> </Subject> <Title> Sacred Heart restores shutters and cupola. </Title> <Periodical><I>Preservation in Print </Periodical> <Volume>p28,</Page> <Date>Aug. 1996</Date>

HTML 4.0: Üstveri Elemanları <HEAD profile=“http://www.w3.org/RDF”> <!ELEMENT META - O EMPTY> <!ATTLIST META lang %LanguageCode #IMPLIED http-equiv NAME #IMPLIED name NAME #IMPLIED content CDATA #REQUIRED scheme CDATA #IMPLIED > <LİNK rel=“…” href=“…”> PICS etiketleri <META name=”DC.Author" content=“Hayri Sever"> <META scheme=“ISO 8601" name=“DC.Date” content=”13/03/62"> <META name=”DC.Description" lang=”tr" content=”veri madenleme ve bilgi erişim sistemleri ara&scedil;t&iwhdot;rma ..."> <META http-equiv="Content-Type" content="text/html; charset=ISO-8859-5">

SHOE ve KIF SHOE (Simple HTML Ontology Extensions) iki kısımdan oluşmaktadır: Ontoloji. Veri Sözlüğü ve Şemanın tanımlandığı belirli bir üstveri modeli Üye. İlgili üstveri kullanılarak yapılan iddalar. SHOE modeli tür, ilişki ve çıkarsama tanımlama olanağı sağlamaktadır. SHOE ile tanımlı Web kaynakları, Expose ile yerel diske yüklenir ve SHOE kütüphanesi aracılığı ile çözümlenir ve PARKA Ontolojisine yerleştirilir. KIF (Knowledge Interchange Format), “First-Order Predicate Calculus” tabanlı bir üstveri gösterim dilidir. İfade etme gücü yüksek olan KIF, heterojen Web kaynaklarını bütünleştirmede kolaylık sağlar ve arabulucu mimaride paketleyici dil olan KQML birlikte kullanılır.

RDF Tanımının Çizge ile Gösterimi Creator www.cs.hun.edu.tr webadmin RDF Tanımının XML ile Gösterimi <?xml version="1.0" ?> <rdf:RDF xmlns:rdf="http://www.w3.org/RDF" xmlns:dc="http://purl.org/DublinCore"> <rdf:Description about="http://www.cs.hun.edu.tr"> <dc:Creator> webadmin </dc:Creator> </rdf:Dexcription> </rdf:RDF>

RDF/DC Editörü: H-DCEdit RDF modeli ve DC Üstveri elemanları kullanılarak, elektronik kaynakların içeriklerinin tanımlanmasını sağlayan bir yazılım gerçekleştirilmiştir. H-DCEdit ile katalog bilgileri modellenmiştir. Katalog yapısı, RDF/DC sözdizimi temel alınarak SGML tarafından tanımlanmıştır. SGML belgelerinin özelliği, Türkçe içerik desteği olması ve XML belgesine dönüşmesi kolay bir tanımı olmasıdır.

Sistem işlev çizgesi SGML Bildirimi RDF/DC Belge Tür Tanımı DSSSL Bildirimi Biçem Bildirimi RDF/DC Ayrıştırıcı SGML Ayrıştırıcı (SP) SGML Belgesi Ayrıştı-rım Çıktısı DC Elemanları Editörü SG-ML DSSSL Motoru (Jade) Yeniden biçimlenmiş belge çıktısı (html, rtf, TeX) Yerel yardımcı programlar (vi, netscape, xview,…) RDF/DC Biçem Tanımı

Yazılım Mühendisliği Notları Yazılım Alt Kesimi Programlama Dili Satır Sayısı SP-1.2 (SGML Ayrıştırıcı) C++ 70000 RDF/DC Ayrıştırıcı C++ 800 H-DCEdit 1.0 C (MOTIF) 5000 JADE1.0.1 (DSSSL Motoru) C++ 52000

SGML Bildirimi <!SGML "ISO 8879:1986" CHARSET BASESET "ISO 646-1983//CHARSET International Reference Version (IRV)//ESC 2/5 4/0" DESCSET 0 9 UNUSED 9 2 9 11 2 UNUSED 13 1 13 14 18 UNUSED 32 95 32 127 1 UNUSED BASESET "ISO Registration Number 148//CHARSET ECMA-128 Right Part of Latin Alphabet Nr. 5//ESC 2/13 4/13" DESCSET 128 32 UNUSED 160 95 32 255 1 UNUSED NAMING LCNMSTRT "" UCNMSTRT "" LCNMCHAR "-.:" UCNMCHAR "-.:" …>

RDF/DC Belge Tür Tanımı <!-- Entities For Turkish Support --> <!ENTITY Ccedil CDATA "Ç"> <!ENTITY ccedil CDATA "ç"> <!ENTITY Ouml CDATA "Ö"> <!ENTITY ouml CDATA "ö"> <!ENTITY Scedil CDATA "Þ"> <!ENTITY scedil CDATA "þ"> <!ENTITY Idot CDATA "Ý"> <!ENTITY iwhdot CDATA "ý"> <!ENTITY Uuml CDATA "Ü"> <!ENTITY uuml CDATA "ü"> <!ENTITY Gbrewe CDATA "Ð"> <!ENTITY gbrewe CDATA "ð">

RDF/DC Belge Tür Tanımı <!-- RDF and DC elements in the same DTD In addition, XML like output is supported RDF Elements --> <!ELEMENT rdf:RDF - - ( rdf:Description )* > <!ATTLIST rdf:RDF xmlns:rdf CDATA "http://www.w3.org/RDF/” xmlns:dc CDATA "http://purl.org/DC/” <!ENTITY % property "ANY"> <!ELEMENT rdf:Description - - %property;> <!ATTLIST rdf:Description ID NMTOKEN #IMPLIED about CDATA #IMPLIED aboutEach CDATA #IMPLIED bagID NMTOKEN #IMPLIED>

RDF/DC Belge Tür Tanımı <!ENTITY % dccontent "(#PCDATA)"> <!ELEMENT DC:TITLE - - %dccontent; > <!ELEMENT DC:CREATOR - - %dccontent; > <!ELEMENT DC:SUBJECT - - %dccontent; > <!ELEMENT DC:DESCRIPTION - - %dccontent; > <!ELEMENT DC:PUBLISHER - - %dccontent; > <!ELEMENT DC:CONTRIBUTOR - - %dccontent; > <!ELEMENT DC:DATE - - %dccontent; > <!ELEMENT DC:TYPE - - %dccontent; > <!ELEMENT DC:FORMAT - - %dccontent; > <!ELEMENT DC:IDENTIFIER - - %dccontent; > <!ELEMENT DC:SOURCE - - %dccontent; > <!ELEMENT DC:LANGUAGE - - %dccontent; > <!ELEMENT DC:RELATION - 0 %dccontent; > <!ELEMENT DC:COVERAGE - - %dccontent; > <!ELEMENT DC:RIGHTS - - %dccontent; >

RDF/DC Belge Tür Tanımı <!ATTLIST DC:DATE year CDATA #IMPLIED month CDATA #IMPLIED day CDATA #IMPLIED> <!ATTLIST DC:RELATION type CDATA #IMPLIED resource CDATA #IMPLIED > <!-- Added Element for Robots --> <!ELEMENT BODY - - %dccontent; > <!ATTLIST BODY location CDATA #IMPLIED >

Oluşturulan SGML Belgeleri sgml.cs.hun.edu.tr Baha Olgun SGML Türkiye Hacettepe Üni. Hayri Sever text/sgml Creator Title Publisher Contributor Type

SGML İle Serileştirme

H-DCEdit Arayüz

DC Elemanları Girişi

Yardımcı Uygulamaları İlişkilendirme

DSSSL Standardında Biçimleme

Süzgeçleme: HTML belgesi

HTML Belgesini Biçimleme

Özet DPT KM-BGS Projesi çerçevesinde gerçekleştirilen bir RDF/DC editörü tanıtılmıştır. Bu editör, takı dizinleme ve sorgulama yapabilen Isite/Isearch arama makinası ile çıktı bazında bütünleştirilmiştir.