 Bir bilgi erişim sistemi: ◦ (1) bir belge derlemi ya da bu belgeleri temsil eden dizin terimlerini içeren kayıtlar, ◦ (2) kullanıcıların sorgu cümleleri,

Slides:



Advertisements
Benzer bir sunumlar
Dört Bölüm 1.Tanıtım ve Mevcut Durum 2.Hedefler 4.Demo 3.Yeni Sürüm Planlaması.
Advertisements

360Core Kütüphane Kullanıcıları için Kütüphaneciler için
Emel ŞAHİN Gülhan ŞAM Recep OFLAZ Tuba KORKMAZ
İstatistik Tahmin ve Güven aralıkları
Bilginin Tanımlanması ve Diğer Bilgi Erişim Uygulamaları
SORUNU ÇÖZÜMLEME Dr. Y. İlker TOPCU
Bilgi Erişim Tasarım Modelleri
Dizinleme ve Öz HazIRlama
Bölüm 8: EĞRİ UYDURMA Fizikte laboratuarda yapılan deneysel ölçümlerin ne kadar hata payı içerdiğini, veya belli teorik modellere ne kadar uyduğunu bilmek.
Bilgiye Erişim Sistemlerinde Arama Kalitesini İyileştirme
Erişim Kuralları Yaşar Tonta Hacettepe Üniversitesi
BTP 108 BİLGİSAYAR AĞ SİSTEMLERİ AĞ KAVRAMI Birden çok bilgisayarın birbirine bağlı olarak kullanılmasıyla oluşturulan çalışma biçimine bilgisayar ağı.
BDEM 105.
ÇİZGELERİN GÖSTERİMİ Yılmaz KILIÇASLAN. Sunu Planı Bu derste, çizgelerin bilgisayarda gösterimine ilişkin iki standart yaklaşımı inceleyeceğiz.
MIT503 Veri Yapıları ve algoritmalar Veri ağaçları
BİLGİSAYARIN MİMARİSİ, TEMEL BİLEŞENLERİ VE ÇALIŞMA MANTIĞI
“Akademik Bilişim ’02” 6-8 Şubat 2002, Konya Y.T. Türkçe Arama Motorlarında Performans Değerlendirme Yaşar Tonta Hacettepe Üniversitesi
ÇİZGELERİN GÖSTERİMİ Yılmaz KILIÇASLAN.
BBY Bilgi Erişim İlkeleri
Bilgi Erişim Performans Ölçüleri
Web Ortamında Arama Yapmak R. Orçun MADRAN. Arama Motorları Arama Motorları, günümüzün popüler bilgiye erişim sistemlerinin başında yer almaktadır. Bir.
1 BBY Bilgi Erişim İlkeleri BES’de Etkinlik Değerlendirme.
Arama Kuralları Türkçe‘ye özgü karakterler (ğ, ş, ç, ı, İ, ö, ü) yerine, bunlara en yakın harf karakterleri (g, s, c, i, I, o, u) kullanılmalıdır. Taramada.
C PROGRAMLAMA FONKSİYONLAR Adres ile Fonksiyon Çağırma Pointer (İşaretçiler) ile Fonksiyon Çağırma Rekürsif Fonksiyonlar.
M.Fatih AMASYALI Uzman Sistemler Ders Notları
BBY Bilgi Erişim İlkeleri
Veri Tabanı Tasarım Süreci
Bilgi Erişim Sistemleri II Hayri Sever Bilgisayar Mühendisliği Bölümü Başkent Üniversitesi Bağlıca Ankara Yaşar Tonta Bilge.
Chapter 14: Files and Streams. 2Microsoft Visual C# 2012, Fifth Edition Dosyalar, Dosya Ve dizin Sınıfları Geçici Depolama – Genellikle bilgisayar belleği.
“Akademik Bilişim ’02” 6-8 Şubat 2002, Konya Y.T. Türkçe Arama Motorlarında Performans Değerlendirme Yıltan Bitirim Doğu Akdeniz Üniversitesi
Full Text Finder. Yeni Full Text Finder nedir, parçaları nelerdir? EDS, AtoZ ve LinkSource araçlarının birleştirilmiş halidir. Aşağıdaki fonksiyonlara.
BBY 156 Bilgi Erişim blogspot
BBY 156 Bilgi Erişim blogspot
 Elektronik bilgi kaynağı. Düzenli bir şekilde listelenmiş bilgilerin bilgisayardaki karşılığıdır. Genel olarak bu bilgiler ortak bir konu ya da amaca.
BBY 156 Bilgi Erişim İrem Soydal
A. Nuray DEMİRKOL Başuzman 12 Nisan 2013 Ankara ULAKBİM VERİ TABANLARINDA İNDEKSLEME.
Sayı Sistemleri Geçen Hafta Analog ve Sayısal Büyüklük Kavramı
Bilgi Erişim Sistemleri
İrem Soydal ~ Yurdagül Ünal
BBY 156 Bilgi Erişim Dizinleme Dizinleme İrem Soydal ~ Yurdagül Ünal
ANALOG-SAYISAL BÜYÜKLÜK VE SAYI SİSTEMLERİ
İrem Soydal ~ Yurdagül Ünal
Tanımlayıcı İstatistikler
ÖĞRENME AMAÇLARI İki değişken arasındaki “ilişki” ile neyin kastedildiğini öğrenmek Farklı yapıdaki ilişkileri incelemek Ki-kare analizinin uygulandığı.
• Smith-Waterman Algoritması • BLAST
Veritabanı Kavramları
Bulanık Mantık Bulanık Mantığın Temel Kavramları
Bilgisayar Grafikleri Ders 3: 2B Dönüşümler
Metin Madenciliği.
Örneklem Dağılışları ve Standart Hata
KISIM 4 Sınıfta Biliş. KISIM 4 Sınıfta Biliş BÖLÜM 11 Okumayı Öğrenme.
UNV13107 TEMEL BİLGİ TEKNOLOJİSİ KULLANIMI. Veri tabanı Bilgisayar ortamında saklanan düzenli verilerdir. Bilgisayar ve ağ ortamındaki bilginin temel.
Sayısal Analiz Sayısal Türev
İrem Soydal ~ Yurdagül Ünal
İrem Soydal ~ Yurdagül Ünal
KESİR GÖSTERİMLERİ Kesirlerin somut modellerle gösteriminde dört değişik yol vardır. Bunlar, bölge, çizgi, küme ve alan gösterimleridir. BÖLGE MODELİ.
Hafta 1: Dizinleme ve Özler BBY 264 Dizinleme ve Sınıflama.
Arama BBY256 Bilgi Mimarisi. Bulmak için Tasarım Farklı bilgi arama modelleri İnsanların bilgi arama davranışları Bu davranışların öğrenilmesi.
İrem Soydal ~ Yurdagül Ünal
Hafta 2: Dizinleme ve Öz Hazırlamaya Giriş BBY 306 Dizinleme ve Öz Hazırlama
Hafta 4: Dizinleme Süreçleri ve Dizinleme İşlemleri BBY 264 Dizinleme ve Sınıflama.
OLASILIK ve İSTATİSTİK
7. HAFTA.
İŞLEM KAVRAMI.
Türkçe Arama Motorları Ne Kadar Türkçe?
İŞLEM KAVRAMI.
Structure of an IR System
Prof. Dr. Eşref ADALI Doç. Dr. Şule Gündüz Öğüdücü Sürüm-B
Mehmet Fatih KARACA Yrd. Doç. Dr. Salih GÖRGÜNOĞLU
Mehmet Fatih KARACA Mustafa GÜNEL Akif Alkan TAŞTAN
Sunum transkripti:

 Bir bilgi erişim sistemi: ◦ (1) bir belge derlemi ya da bu belgeleri temsil eden dizin terimlerini içeren kayıtlar, ◦ (2) kullanıcıların sorgu cümleleri, ve ◦ (3) kullanıcıların sorgu cümlelerinde yer alan terimlerle derlemdeki belgelere verilen terimleri karşılaştırarak ilgili belgeleri belirlemek için kullanılan bir erişim kuralından oluşur.

Arama İlgi alanı/profil ve sorgular Belgeler ve Veriler Oyunun kuralları = Konu dizinlemesi için gerekli kurallar Thesaurus Göndermeler (Bkz, ayr. Bkz.,..) ve Dizinleme dili Depolama Potansiyel İlgili Belgeler Kıyaslama / Eşleştirme Depo1: Profiller/ Sorgu istekleri Depo2: Belge Gösterimi Dizinleme (Tanımlayıcı – Konu) Belirteçler aracılığı ile sorgu fomülasyonu Profillerin depolanması Belgelerin depolanması Bilgi Depolama ve Erişim Sistemi

 Bir bilgi erişim sisteminde derlemdeki belgeler gerektiğinde hızlı bir biçimde erişilebilmesi için ? ? ? ? saklanır.  Bilgi erişim sistemlerinde dizinlerin işlevi nedir? ◦ Dizin, derlemde bulunan her bir belgeye en hızlı biçimde erişimi sağlayan ve özel veri yapıları kullanılarak oluşturulan bir yapıdır. ◦ Dizinleme, verilere yavaş olan bellek (Hard Disk) yerine çok daha hızlı olan ana hafızadan (RAM) erişimi mümkün kılar. ◦ Bilgi erişim sistemlerinde derlemlerin boyutları düşünüldüğünde dizinleme olmadan arama sonuçlarına hızlı erişimin mümkün olmadığı açıktır. dizinlenerek

 Basit bir bilgi erişim sistemi (BES) dört parçadan oluşur: ◦ [ D, Q, F, R(q 1, d j ) ]  D => derlemde bulunan belgelerin mantıksal temsili/görüntüsünün oluşturduğu küme (içerik belirteçleri/dizin terimleri)  Q => kullanıcı ihtiyaçlarının mantıksal temsillerinin oluşturduğu küme (kullanıcı “sorgu”ları)  F => belge ve sorgu gösterimlerinin ve bunlar arasındaki bağlantıların/ilişkilerin gösterildiği iskelet yapı  R (q 1, d j ) => sıralama (ranking) fonksiyonu Bu fonksiyon, sorgu (q 1 ∈ Q) ve belge (d j ∈ D) gösterimlerini bir rakamla (sıra) ilişkilendirir. Bu tip bir sıralama sorgu için getirilecek belgelerin belirli bir kritere (örn. ilgililik) göre düzenlenmesini sağlar.

 Erişim fonksiyonu, derlemde bulunan belgeler ile kullanıcı sorgularının hangi oranda eşleştiğini bulan ve bu eşleşmeyi derecelendiren (skor değeri) yöntemdir.  Erişim fonksiyonu, kullanıcı sorgusunu derlemde bulunan her bir belge ile teker teker karşılaştırarak her bir belge – sorgu çifti için bir benzerlik değeri üretir.  Erişim fonksiyonu tarafından verilen her bir belge –sorgu skoru büyükten küçüğe doğru sıralanarak kullanıcıya sorgu ile ilgili olan belgelerin yer aldığı erişim çıktısı listesi sunulur.  Bilgi erişim sistemlerinde erişim fonksiyonu olarak: Boole Modeli, Vektör Uzayı Modeli, Dil Modeli, Olasılıksal Yöntemler, Gizli Anlam Dizinleme v.b. yöntemler kullanılmaktadır. [ D, Q, F, R(q 1, d j ) ] F, R(q 1, d j )

 Eşleştirme: ◦ Erişim fonksiyonu, derlemde bulunan belgelerle kullanıcı sorgularının hangi oranda eşleştiğini bulan ve bu eşleşmeyi derecelendiren (skor değeri) yöntemdir.  Benzerlik: ◦ Erişim fonksiyonu, kullanıcı sorgusunu derlemde bulunan her bir belge ile teker teker karşılaştırarak her bir belge– sorgu çifti için bir benzerlik değeri üretir.  Sıralama: ◦ Erişim fonksiyonu tarafından verilen her bir belge–sorgu skoru büyükten küçüğe doğru sıralanarak kullanıcıya sorgu ile ilgili olan belgelerin yer aldığı erişim çıktısı listesi sunulur.

 Bilgi erişim sistemlerinde kullanılan erişim kuralları (fonksiyonları/modelleri) kabaca üç başlık altında sınıflanabilir: ◦ Boole (kesin çakışma - exact match) ◦ Vektör uzayı ◦ Olasılık kuramı  Bunların dışında modern bilgi erişimde kullanılan daha karmaşık modeller de var: ◦ Dil Modeli, Gizli Anlam Dizinleme, Sinir Ağları (neural networks), vb.

ÖRNEK:  Derlemdeki belgelerimiz: ◦ D1 : bilgi erişim ve bilgi dizinleme ◦ D2 : sanal dünya ve bilgi ◦ D3 : kütüphane ve veri saklama ◦ D4 : dünyada ekonomik durum ◦ D5 : günlük ekonomik veriler ◦ D6 : haftalık veya günlük mali veriler olsun

Derlemin özellikleri: 6 farklı belge var Belgelerde toplam 25 kelime var Belgelerden elde edilmiş toplam 16 dizin terimi var Durma kelimeleri çıkarılmadı Gövdeleme yapılmadı  D1 : bilgi erişim ve bilgi dizinleme  D2 : sanal dünya ve bilgi  D3 : kütüphane ve veri saklama  D4 : dünyada ekonomik durum  D5 : günlük ekonomik veriler  D6 : haftalık mali ve günlük mali veriler  D1 : bilgi erişim ve bilgi dizinleme  D2 : sanal dünya ve bilgi  D3 : kütüphane ve veri saklama  D4 : dünyada ekonomik durum  D5 : günlük ekonomik veriler  D6 : haftalık mali ve günlük mali veriler Belgeler TerimlerD1D1 D2D2 D3D3 D4D4 D5D5 D6D6 T1bilgi T2erişim T3ve T4dizinleme T5sanal T6dünya T7kütüphane T8veri T9saklama T10dünyada T11ekonomik T12durum T13günlük T14veriler T15haftalık T16mali000001

 Ne gerek var? ◦ Çok büyük belge derlemlerini düz bir belge-terim matrisi ile dizinlemek çok zor.  Önceki tabloyu milyonlarca belge-milyarlarca terimin olduğu bir derlem için düşünün! ◦ Bir derlemi sorgularken en önemli noktalardan biri hızlı sonuç almak.  Sorgu terimleri ile dizin terimlerinin çakıştırılma işleminin mümkün olduğunca hızlı gerçekleşmesi gerek. ◦ “Ters dizin kütükleri” bu büyük derlemlerin dizinlenmesinde kolaylık ve bu derlemleri sorgulamada hız sağlıyor.

1. Belgeler içerisinde geçen kelimeler ayrıştırılır (parsing) ve her bir kelime ilgili belgenin numarası ile işaretlenir. DOC #1 Now is the time for all good men to come to the aid of their country DOC #2 It was a dark and stormy night in the country manor. The time was past midnight

2. Tüm belgeler ayrıştırılıp çıkan kelimeler tabloya eklendikten sonra tablo kelimelere göre alfabetik olarak sıralanır.

3. Tek bir belgede geçen birden fazla kelime birleştirilir ve kelimenin belge içerisinde geçme sıklığı da tabloya eklenir.

4. Tablo, sözlük (dictionary) ve kayıtlar (postings) olmak üzere ikiye ayrılır.

 Ters dizinler üzerinde erişim fonksiyonlarının uygulamasını «erişim fonksiyonları»nın neler olduğundan bahsettikten sonra inceleyeceğiz. ERİŞİM FONKSİYONLARI [ D, Q, F, R(q 1, d j ) ] F, R(q 1, d j ) ]

Kaynak: Tonta, 1995

 Özellikler De Morgan’s Kuralı ¬ (a V b)  (¬ a) (¬ b) ¬ (a b)  (¬ a) V (¬ b)

 Boole mantığında bir derleme yöneltilen sorgu içinde kullanılan terim derlem içindeki belgelerde ya vardır ya yoktur (yani sistem “ilgililiğe” karar verirken ikili [binary] ağırlıklandırma kullanılıyor) =>  Buna göre sorgu çalıştırıldığında aranan terim ve belge arasında çakışma varsa belge “ilgili”, yoksa “ilgisiz” olarak değerlendirilecektir. ◦ Bir terimin bir belgede bir kez geçmesi ile bin kez geçmesi arasında bir farklılık yoktur.  Bu ne demek?

 Boole modelinin temel avantajı tasarımındaki basitlik.  En önemli dezavantajı ise tam çakışma (exact match) erişim kuralının çok az ya da çok fazla sonuç getirebilecek olması.  Benzerlik derecelendirmesi yok: Sorgu ile belgenin ne kadar ilgili olduğunu gösteren bir skor değeri üretilmiyor bunun yerine ilgili / ilgisiz (1/0) yargısı var.  Eşleştirmelerde terim ağırlıklandırma yok: Bir belge içerisinde 1 kez geçen terimle 100 kez geçen terim aynı ağırlıkta, bu durum belge içeriğini ifade eden değerli terimleri seçmemizi engelliyor.  Sorgu oluşturmak zor: Kullanıcıların bilgi ihtiyaçlarını ifade edebilmek için karmaşık sorgular kurabilmesi gerekiyor.  Hata toleransı yok: Bilgi ihtiyacı tam ifade edilmek zorunda, yaklaşık sonuç alma olasılığı yok.

 Bir terimin bir belgedeki geçiş sıklığı belgenin hem belirli bir konu ile olan ilgililiğini hem de derlemdeki diğer belgelerle olan yakınlığını belirler.  Bugün biliniyor ki terim ağırlıklandırması erişim performansını fark edilir derecede artırıyor.  Bu ağırlıklandırma yöntemi Boole mantığında yer almadığı için «vektör uzayı» erişim modeli ortaya çıktı.

 Bir derlemdeki belgelerin ortak bir vektör uzayında vektörel olarak ifade edilmesine Vektör Uzayı Modeli denir.  Terimler hem sorguları hem de belgeleri göstermede kullanıldığı için vektör uzayı modelinde pratik olarak sorguların ve belgelerin “terim uzayı”nda birer nokta olarak temsil edildiği varsayılmaktadır.  Bu yaklaşımda her iki noktadan geçen ayrık iki vektör (belge vektörü ve sorgu vektörü) düşünülür.  Bu iki vektörün vektörel çarpımı (iki vektörün arasındaki açının kosinüsüne eşit olduğundan “kosinüs katsayısı” da denir) ya da skaler çarpımı (iç çarpım katsayısı da denir), sorgu-belge noktaları arasındaki benzerliğin derecesini bulmaya yardımcı olur.

 Vektör uzayı modelinin temel özelliği sorgu sözcükleri ile belgelerin içerdiği dizin terimleri arasında kısmi çakışmaya (partial matching) olanak tanıması.  Bu kısmi çakışma hem sorgu sözcüklerinin hem de belgelerdeki dizin terimlerinin ağırlıklandırılması ile gerçekleştirilebiliyor.  Bu terim ağırlıkları kullanıcı sorgusu ile sistemde tutulan belgelerde yer alan dizin terimlerinin benzerliklerinin hesaplanması için kullanılıyor.

 Erişilen belgelerin benzerlik derecelerine göre azalan sıralama ile dizilmesi sonucu vektör modeli sorgu terimleri ile kısmi olarak çakışan (partial match) belgeleri de dikkate almış olur.  Yapılan incelemeler bu şekilde (terim ağırlıklarına göre en ilgiliden daha ilgisize göre) sıralanmış bir sonuç listesinin, kullanıcıların bilgi ihtiyaçlarını daha net bir şekilde karşılaması açısından Boole modeli ile elde edilen sonuç listesinden daha iyi olduğunu gösteriyor.

Verilen a,b ve c vektörleri için bir birine en yakın olanlar hangileridir? Bir birine en yakın olan vektörler a ve b, neden?

 Vektörler arasında hesaplanan cos Ø değeri açıyı değil açısının cos değerini gösteriyor.  Ø açsı büyüdükçe açının cos değeri küçülüyor. O zaman cos Ø değeri ne kadar büyükse vektörler birbirine o kadar yakındır diyebiliriz.  Vektörler arasındaki cos Ø değeri iki vektörün birbirine ne kadar yakın olduğunu gösterir.  İki vektör arasındaki açının kosinüsünün 1,0 çıkması iki vektörün aynı ya üst üste olduğunu gösterir. Yani aralarındaki Ø açısı 0(sıfır).  Vektörler arasındaki bu açı Bilgi Erişim alanında benzerlik ölçüsü (similarity) olarak adlandırılır.

 Boole modelindeki en büyük problem belge-sorgu eşleşmeleri için bir derece (rank) belirlenememesiydi.  Vektör yaklaşımı ile bu sorun bir nebze giderilebiliyor.  Şimdi sorun, belge içerisindeki her terimin aynı önemle değerlendiriliyor olması. Oysa bir terim bir belge içerisindeki ne kadar çok geçiyorsa ? ? ? ?.  Diğer taraftan bir belgede sıklığı yüksek olan bir terim aynı zamanda derlemdeki diğer belgeler içinde de sık geçiyorsa ? ? ? ? ? ?  O halde bir belge içinde çok geçen ancak derlemde çok sayıda belgede bulunmayan terimler bizim için daha anlamlı. Bu nedenle erişim fonksiyonunda bu tür terimler daha değerli olmalı ama nasıl? o terim o belge için o kadar değerlidir. ilgili terimin ayırt edici özelliği veya belge içindeki diğer terimlere göre göreceli değeri “düşük” olacaktır. (Söz konusu terim dizin terimi olarak tercih edilmeyecektir, hatta bazı durumlarda“stop words” listesine bile eklenmesi düşünülebilir.)

Vektör uzayı modelinde, derleme ait ters dizin kütüğünde terimler için ikili (0/1) ağırlıklandırma yerine tf*idf ağırlıklandırma yöntemi kullanılır. tf (term frequency): Terim sıklığı anlamına gelir ve bir terimin bir belge içerisindeki geçme sayısını ya da sıklığını (frequency) ifade eder. tf değerini hesaplamak için 2 yöntem var: Birincisinde; terimin ilgili belge içerisinde geçme sayısı (sıklığı) doğrudan kullanılır, İkincisinde; terimin ilgili belge içerisinde geçme sayısı (sıklığı), ilgili belgedeki toplam kelime sayısına bölünür ve sayı normalleştirilir. idf (inverse document frequency): Devrik belge sıklığı anlamına gelir ve bir terimin derlemdeki diğer belgelerde geçme sıklığını ifade eder. idf toplam belge sayısının belirli bir terimi içeren belge sayısına bölündükten sonra ölçeği küçültmek için logaritmasının alınması ile bulunur. idf hesaplanırken aşağıdaki formül kullanılır: N= Derlemde bulunan toplam belge sayısı df(i)= i teriminin geçtiği belge sayısı i i

 Örneğin belgelik bir derlem olduğunu düşünelim. Aşağıdaki örneklerde pay; derlemdeki toplam belge sayısını, payda ise derlemde terimi içeren belge sayısını göstermektedir: - Terimi içeren belge sayısı arttıkça idf değeri azalıyor. - İlgili terim kullanılarak yapılacak bir sorguda idf değeri yüksek çıkan belgelerin gelmesi daha etkili sonuç listesi elde edileceği anlamına geliyor. Belgelerin idf değerleri

wij= tf ij * log (N/df j ) wij= t j teriminin d i belgesi için ağırlığı N= derlemdeki toplam belge sayısı df j = t j teriminin belge sıklığı tf ij = t j teriminin d i belgesinde geçme sıklığı (terim sıklığı)

“bilgi” teriminin D 1 belgesi için tf*idf ağırlıklandırması nedir? tf(“bilgi”) = 2 idf(“bilgi”)=log(6/2) = 0,477 tf(“bilgi”)*idf(“bilgi”) = 0,954 Derlemdeki belgelerimiz: D 1 : bilgi erişim ve bilgi dizinleme D 2 : sanal dünya ve bilgi D 3 : kütüphane ve veri saklama D 4 : dünyada ekonomik durum D 5 : günlük ekonomik veriler D 6 : haftalık mali ve günlük mali veriler “ve” teriminin D 6 belgesi için tf*idf ağırlıklandırması nedir? tf(“ve”) = 1 idf(“ve”)=log(6/4) = 0,176 tf(“ve”)*idf(“ve”) = 0,176 “mali” teriminin D 6 belgesi için tf*idf ağırlıklandırması nedir? tf(“mali”) = 2 idf(“ mali ”)=log(6/1) = 0,778 tf(“ mali ”)*idf(“ mali ”) = 1,556 Örnekler içinde en değerli terim hangisi? Neden?

Derlemdeki terimlere göre ters dizin kütüğündeki terim ağırlıklarını D 1 için güncelleyelim. tf(“bilgi”)*idf(“bilgi”)= 2*0,477 = 0,954 tf(“erişim”)*idf(“erişim”)= 1*0,778 = 0,778 tf(“dizinleme”)*idf(“dizinleme”)= 1*0,778= 0,778 tf(“ve”)*idf(“ve”)= 1*0,176 = 0,176 TerimlerBelgeler D1D1 D2D2 D3D3 D4D4 D5D5 D6D6 T1 bilgi T2 erişim T3 ve T4 dizinleme T5 sanal T6 dünya T7 kütüphane T8 veri T9 saklama T10 dünyada T11 ekonomik T12 durum T13 günlük T14 veriler T15 haftalık T16 mali Derlemdeki belgelerimiz: D 1 : bilgi erişim ve bilgi dizinleme D 2 : sanal dünya ve bilgi D 3 : kütüphane ve veri saklama D 4 : dünyada ekonomik durum D 5 : günlük ekonomik veriler D 6 : haftalık mali ve günlük mali veriler

Tonta, Y. (1995). Bilgi erişim sistemleri. ( Buckland, M. (1991). Information as thing. ( Tonta, Y., Bitirim, Y. ve Sever, H. (2002). Türkçe Arama Motorlarında Performans Değerlendirme, s (Tam metin)Tam metin Tunç, S.K. (2012). Bilgi erişim sistemleri. ( Diğer yardımcı kaynaklar: Baeza-Yates, R. and Ribeiro-Neto, B. (1999). Modern Information Retrieval. (Tam metin)Tam metin Manning, C.D., Raghavan, P. and Schütze, H. (2009). Introduction to Information Retrieval. (Tam metin)Tam metin Bu derste kullanılan slaytların çoğunluğu Information organization and retrieval (R. Larson & W. Sack, 2001) Bilgi erişim ilkeleri (Y. Tonta, 2002) Bilgi erişim (G. Köse, 2012) derslerine ait slaytlardan derlenmiştir.