Sunum yükleniyor. Lütfen bekleyiniz

Sunum yükleniyor. Lütfen bekleyiniz

1 Bilgi Erişim Sorununa Yaklaşımlar Yaşar Tonta Hacettepe Üniversitesi yunus.hacettepe.edu.tr/~tonta/ BBY703 Bilgi Erişim Kuramı.

Benzer bir sunumlar


... konulu sunumlar: "1 Bilgi Erişim Sorununa Yaklaşımlar Yaşar Tonta Hacettepe Üniversitesi yunus.hacettepe.edu.tr/~tonta/ BBY703 Bilgi Erişim Kuramı."— Sunum transkripti:

1 1 Bilgi Erişim Sorununa Yaklaşımlar Yaşar Tonta Hacettepe Üniversitesi yunus.hacettepe.edu.tr/~tonta/ BBY703 Bilgi Erişim Kuramı

2 2 Bilgi Erişim Sorununa çözüm önerileri Teknolojik (Bush) Teknolojik olmayan (Weinberg raporu, Bar-Hillel)

3 3 H.G. Wells, World Encyclopedia, 1938 Hızlı bilgi artışı Darboğaz tartışması (bilgi gereksinimleri- belgeler) İnsanların diğer canlılardan farkı ne? Kültürel biriktirme Çekmece sorunu: Mevcut bütün bilginin bir çekmeceye sığdırılması –Fiziksel erişim sorunu (donanım) –Entellektüel erişim sorunu (Bu bilgiyle ne yapacaksınız ve bilgiyi nasıl düzenleyeceksiniz?)

4 4 Bush, As we may think, 1945 Uzmanlaşma ve belge sayısının artışı insanlığı tehdit ediyor ama daha iyi bilgi işleme, depolama ve erişim yöntemleri bulunabilir Bağıntılı dizinleme Memex

5 5 F. Machlup, Knowledge Industries, Kütüphanelerin içeriği 16 yılda bir ikiye katlanıyor Basılı ortamın maliyeti artıyor, elektronik ortamın azalıyor Kütüphane dışındaki bilgilerdeki artış miktarı (How much info? ve IDC çalışmalarını hatırlayın) Kütüphanelere ne olacak?

6 6 Weinberg Raporu, 1963 Bilgi “krizi” Bilimsel iletişim miktarı Bilgi aktarma zinciri ve bilgi sistemleriyle ilgili sorunlar Bilginin yaratılması, kaydedilmesi, kataloglanması, depolanması, dağıtımı, bilgiye erişim Bilgi erişim araştırma sürecinin bir parçası –“Science can ultimately cope with the information expansion only if its most gifted practitioners will compact, review and interpret the literature both for their own use and for the benefit of more specialized scientists.” Çeşitli öneriler (daha anlamlı başlıklar, gereksiz yayın yapmama, derleme yayınlara daha fazla önem verilmesi, merkezi kütüphaneler, uzmanlaşmış bilgi merkezleri vs. vs.)

7 7 Weinberg Raporu, 25 yıl sonra Bilgi “krizi” doğru bir tanımlama değil Raporda bilgi sistemlerinde bilgisayarların katkısı öngörülemedi Uzmanlaşmış bilgi merkezleri ortaya çıkmadı “Information is not a problem that admits a single solution, but remains and always will remain a process that we must cope with.”

8 8 Y. Bar-Hillel Bilgi artış hızından dolayı bilimsel iletişimde “kriz” olmaz Sorun bilgi erişim işlemlerinin mekanizasyonu ile değil, politika ve uygulamalarda yapılacak değişikliklerle çözülebilir.

9 9 Belge Erişim – Veri Erişim (M. Kochen) Veri erişim sistemleri (Kim, ne niçin, ne zaman, kaç tane sorularına yanıt veren sistemler – “information dispensing systems”) –VTYS (sorgulama -look up- sistemleri) –Uzman sistemler, soru yanıtlama sistemleri vd. (çıkarsama yeteneği: Newton 1770’te 85 yaşında öldü. Newton ne zaman doğdu?) Belge erişim sistemleri (Büyük dosyalardan arama yaparak ilgili belgelere ya da belgelerin bibliyografik bilgilerine erişim – “tutorials”) –Özellikleri bilinen kaynaklara erişim –Konu erişimi

10 10 Wilson, Temel Bilgi Erişim Kavramları Patrick Wilson, Two Kinds of Power (1968), Public Knowledge, Private Ignorance, (1977) ve Second-Hand Knowledge: An Inquiry into Cognitive Authority (1983). Bilgi, ilgililik, bir belgenin konusu, bir bilgi ihtiyacının ne olduğu gibi hususlarda ortak anlayış olmaması Bilgi (yanlış bilgi, anlayış, inanç, zayıf bilgi, kuvvetli bilgi, içerik erişim-bilgi erişim -ki Wilson bu terimlerin belge erişim ve veri erişimden farklı olduğunu düşünüyor) “About” (“a relation between words and the world”: Bir Einstein biyografisi, içinde Bern ve Zürih’ten bahsedilse de, Einstein hakkındadır) İlgililik (retrieval worthiness) Bilgi ihtiyacı (need): Wilson BE sistemlerinin değerlendirilmesinde “yarar” (utility) kavramının kullanılmasına karşı. Kullanım Belgeler konularına göre değil işlevlerine göre düzenlenmeli

11 11 Wilson -devamla “An ideal information system would provide information, not an unsorted mixture of information and misinformation; more carefully, it would provide content of high epistemic standing, not content of unknown epistemic standing.” Neyin doğru bilgi, neyin yanlış bilgi olduğuna kim karar verecek? Bir belgeyle ilgili üç önemli soru: İçeriği nedir? Bilgi mi yanlış bilgi mi içeriyor? Bu bilgi nasıl kullanılabilir? “If we are truly concerned with meeting information needs, we have to work toward taking the step from retrieval on the basis of primary use to retrieval on the basis of further use as well, and the step from content retrieval to information retrieval.”

12 12 İlgililik Bir belgenin kullanıcının bilgi ihtiyacını karşılaması: Belge kullanıcıyı tatmin ediyorsa ilgilidir (öznel ilgililik) Belgenin konusuyla sorgu cümlesinin konusu arasındaki ilişki (nesnel ilgililik)

13 13 Mükemmel Erişim İlgililik, belgeyle kullanıcı arasındaki belli bir zamandaki ilişki. Dermeyi/derlemi istenen ve istenmeyen belgeler diye doğru bir biçimde ikiye böl (mükemmel erişim: tüm ilgili belgeler ve sadece ilgili belgeler) Peki dizinleme nasıl yapılacak? Sorgu cümlesi nasıl formüle edilecek? Mükemmel erişimin gereklerini sağlayan koşullar ne?

14 14 Dizinleme İlgili belgelerin dizin bilgileri (representations) ilgisiz olanlardan farklı Belge özellikleri –Bağlamla ilgili özellikler (yazar adı, yayın yılı vs.) –Linguistik özellikler (belgede geçen her sözcük) –Anlamsal özellikler (belge ne hakkında?) Dizinleme belgelerin özelliklerini saptamak demek. Konu dizinlemesi: Belgelerin anlamsal özelliklerinin saptanması

15 15 İlgili / İlgisiz Belge Ayrımı Mükemmel erişim için bir belgeyi ilgili yapan özellik ya da özelliklerin olduğunu varsaymak zorundayız Birisi sisteme ilgili ve ilgisiz belgeleri birbirinden ayıran özelliği söylemeli Kim?

16 16 Tasarım Yaklaşımı A Bir belgeyi ilgili yapan belli özellik(ler) var Bilgisayar bu özelliklerin neler olduğunu bilmek zorunda Kendinizi kullanıcı yerine koyup istediğiniz belgenin özelliğini tanımlayan bir dizin terimi tahmin edin. Peki bunun doğru dizin terimi olduğunu nereden bileceğiz? Peki ya kullanıcıların özellikleri?

17 17 Tasarım Yaklaşımı A’nın Varsayımları Her belgeyle ilgili olarak kullanıcı grubunun bu belgeyi isteyenler ve istemeyenler olarak ikiye ayrılabileceği varsayımı Belgeyi dizinleyen kişinin kimlerin bu belgeyi kullanmak isteyebileceklerini doğru tahmin etmesi

18 18 Tasarım Yaklaşımı A Dizin tutanakları Gömü - Sözlük Dizinleme Belgeler Kullanıcılar Sorgu formülasyonu Formel sorgu cümlesi Erişim kuralı Kaynak: Maron, 1984

19 19 Nasıl işliyor? Belgelere konularıyla ilgili anahtar sözcükler atanıyor (binary subject indexing) Sorgu cümlesi kullanıcının istediği belgelerin özelliklerini tahmin eden tanımlardan oluşuyor (predictive queries) Kullanıcı “ilgili” olma ihtimali olan belgelere atanan anahtar sözcükleri doğru tahmin ederse mükemmel erişim söz gerçekleşiyor

20 20 Sorunlar Sorgu cümlesi formülasyonu açık olmayabilir Dizinleme yetersiz olabilir Belgelerin anlamsal özellikleri saptanmaya çalışılıyor, kullanıcıların özellikleri değil.

21 21 Tasarım Yaklaşımı B Bir belgeyi dizinleyen kişinin belgenin özelliklerini değil, o belgeyi kullanmak isteyebilecek kullanıcıların özelliklerini tahmin etmeye çalışması

22 22 Tasarım Yaklaşımı B Dizin tutanakları Gömü - Sözlük Dizinleme Belgeler Kullanıcılar Sorgu formülasyonu Formel sorgu cümlesi Erişim kuralı Kaynak: Maron, 1984

23 23 Nasıl işliyor? Kullanıcılar ilgilendikleri konuyla ilgili anahtar sözcükleri giriyorlar (binary queries) Dizin kaydı kullanıcının ilgili bulma ihtimali olan belgelerin özelliklerini tahmin eden tanımlardan oluşuyor (predictive indexing) Dizinlemeyi yapan kişi bir belgeyi “ilgili” bulma olma ihtimali olan kişinin o belgeyi aramak için kullanabileceği anahtar sözcükleri doğru tahmin ederek belgeye atadıysa mükemmel erişim söz gerçekleşiyor


"1 Bilgi Erişim Sorununa Yaklaşımlar Yaşar Tonta Hacettepe Üniversitesi yunus.hacettepe.edu.tr/~tonta/ BBY703 Bilgi Erişim Kuramı." indir ppt

Benzer bir sunumlar


Google Reklamları