“Akademik Bilişim ’02” 6-8 Şubat 2002, Konya Y.T. Türkçe Arama Motorlarında Performans Değerlendirme Yaşar Tonta Hacettepe Üniversitesi

Slides:



Advertisements
Benzer bir sunumlar
8. SINIF 3. ÜNİTE BİLGİ YARIŞMASI
Advertisements

el ma 1Erdoğan ÖZTÜRK ma ma 2 Em re 3 E ren 4.
Yrd. Doç. Dr. Mustafa Akkol
NOKTA, DOĞRU, DOĞRU PARÇASI, IŞIN, DÜZLEMDEKİ DOĞRULAR
T.C. İNÖNÜ ÜNİVERSİTESİ Arapgir Meslek YÜKSEKOKULU
Eğitim Programı Kurulum Aşamaları E. Savaş Başcı ASO 1. ORGANİZE SANAYİ BÖLGESİ AVRUPA BİLGİSAYAR YERKİNLİĞİ SERTİFİKASI EĞİTİM PROJESİ (OBİYEP)
FAKÜLTE/BÖLÜM/ YÜKSEKOKUL ADI STRATEJİK PLANLAMA SUNUMU Not:Süreçler değişebilir…
KİŞİSEL KAMP MALZEMEN Kamp malzemelerini şu ana başlıklar altında düşünebilirsin. Uyku malzemesi Yemek malzemesi Temizlik malzemesi Zorluklara karşı hazır.
Öğr.Gör.Dr. S. Sadi SEFEROĞLU & Arş. Gör. Fatih GÜRSUL
Atlayarak Sayalım Birer sayalım
BEIER CÜMLE TAMAMLAMA TESTİ
Diferansiyel Denklemler
Microsoft Danışman Öğrenci
1/27 GEOMETRİ (Kare) Aşağıdaki şekillerden hangisi karedir? AB C D.
BEIER CÜMLE TAMAMLAMA TESTİ
Yönetim Bilgi Sistemleri Şubat TAPU VE KADASTRO GENEL MÜDÜRLÜĞÜ.
KIR ÇİÇEKLERİM’ E RakamlarImIz Akhisar Koleji 1/A.
Sıvı Ölçüleri Değerlendirme.
HİSTOGRAM OLUŞTURMA VE YORUMLAMA
BPR152 ALGORİTMA VE PROGRAMLAMA - II
ETİK ve İTİBAR YÖNETİMİ
Soruya geri dön
Prof. Dr. Leyla Küçükahmet
MÜRŞİT BEKTAŞ 1-A SINIFI
CAN Özel Güvenlik Eğt. Hizmetleri canozelguvenlik.com.tr.
Özel Üçgenler Dik Üçgen.
HAZIRLAYAN:SAVAŞ TURAN AKKOYUNLU İLKÖĞRETİM OKULU 2/D SINIFI
ÖRNEKLEM VE ÖRNEKLEME Dr.A.Tevfik SÜNTER.
ARALARINDA ASAL SAYILAR
Yaşar Tonta, İrem Soydal 2. Uluslararası Değişen Dünyada Bilgi Yönetimi Sempozyumu,22-24 Eylül 2010, Ankara Hacettepe Üniversitesi Bilgi ve Belge Yönetimi.
Gün Kitabın Adı ve Yazarı Okuduğu sayfa sayısı
TÜRKİYE KAMU HASTANELERİ KURUMU
1 YASED BAROMETRE 18 MART 2008 İSTANBUL.
İL KOORDİNASYON KURULU I.NCİ DÖNEM TOPLANTISI
FİİLİMSİLER (EYLEMSİLER)
Matematik 2 Örüntü Alıştırmaları.
Uygulamalı Örneklem Seçimi
PROTOKOL.
Tam sayılarda bölme ve çarpma işlemi
TEST – 1.
HALK KÜTÜPHANELERİ SOSYAL AĞLARDA HALK KÜTÜPHANELERİNE ERİŞİM.
HABTEKUS' HABTEKUS'08 3.
Anadolu Öğretmen Lisesi
4 X x X X X
Mukavemet II Strength of Materials II
MURAT ŞEN AKDENİZ ÜNİVERSİTESİ Üçgenler.
Diferansiyel Denklemler
1 DEĞİŞMEYİN !!!
SIĞIR VE DANA ETİ PAZAR DURUMU 16 MAYIS AB TOPLAM SIĞIR HAYVANCILIK ARALIK ANKETİ HAYVANCILIK ARALIK ANKETİ ARALIK-TOPLAM ÇİFTLİK HAYVANLARI SIĞIR.
Bankacılık sektörü 2010 yılının ilk yarısındaki gelişmeler “Temmuz 2010”
1 (2009 OCAK-ARALIK) TAHAKKUK ARTIŞ ORANLARI. 2 VERGİ GELİRLERİ TOPLAMIDA TAHAKKUK ARTIŞ ORANLARI ( OCAK-ARLIK/2009 )
Çocuklar,sayılar arasındaki İlişkiyi fark ettiniz mi?
Toplama Yapalım Hikmet Sırma 1-A sınıfı.
SAYILAR NUMBERS. SAYILAR 77 55 66 99 11 33 88.
MDK ALT YAPI KIYASLAMA ÇALIŞMA GRUBU
HAYAT BİLGİSİ SORULARI.
14.ULUSAL TURİZM KONGRESİ 2013 YILI BİLDİRİLERİ ÜZERİNE BİR DEĞERLENDİRME Prof. Dr. A. Celil ÇAKICI Mersin Üniversitesi Turizm Fakültesi.
Proje Konuları.
Web Ortamında Arama Yapmak R. Orçun MADRAN. Arama Motorları Arama Motorları, günümüzün popüler bilgiye erişim sistemlerinin başında yer almaktadır. Bir.
1 BBY Bilgi Erişim İlkeleri BES’de Etkinlik Değerlendirme.
1.HAFTA 26 Ağustos 2009 ÇARŞAMBA 2.HAFTA 01 EYLÜL 2009 SALI 3.HAFTA 09 EYLÜL 2009 ÇARŞAMBA 4.HAFTA 15 EYLÜL 2009 SALI 5.HAFTA 23 EYLÜL 2009 ÇARŞAMBA 6.HAFTA.
1.HAFTA 26 Ağustos 2009 ÇARŞAMBA 2.HAFTA 01 EYLÜL 2009 SALI 3.HAFTA 09 EYLÜL 2009 ÇARŞAMBA 4.HAFTA 15 EYLÜL 2009 SALI 5.HAFTA 23 EYLÜL 2009 ÇARŞAMBA 6.HAFTA.
ECHİNODERMATA Kambriyen – Güncel tümüyle denizel Filum
SLAYT 1BBY220 OCLC WorldCat Yaşar Tonta Hacettepe Üniversitesi yunus.hacettepe.edu.tr/~tonta/ BBY220 Bilgi Erişim İlkeleri.
ÖĞR. GRV. Ş.ENGIN ŞAHİN BİLGİ VE İLETİŞİM TEKNOLOJİSİ.
Diferansiyel Denklemler
“Akademik Bilişim ’02” 6-8 Şubat 2002, Konya Y.T. Türkçe Arama Motorlarında Performans Değerlendirme Yıltan Bitirim Doğu Akdeniz Üniversitesi
İrem Soydal ~ Yurdagül Ünal
Türkçe Arama Motorları Ne Kadar Türkçe?
Sunum transkripti:

“Akademik Bilişim ’02” 6-8 Şubat 2002, Konya Y.T. Türkçe Arama Motorlarında Performans Değerlendirme Yaşar Tonta Hacettepe Üniversitesi Yıltan Bitirim Doğu Akdeniz Üniversitesi Hayri Sever Massachusetts Üniversitesi

“Akademik Bilişim ’02” 6-8 Şubat 2002, Konya Y.T. Plan F Giriş F Araştırmanın amacı F Bilgi erişim sistemleri F Arama motorları F Yöntem ve tasarım F Bulgular ve yorum F Öneriler

“Akademik Bilişim ’02” 6-8 Şubat 2002, Konya Y.T. Giriş F Internet: yarım milyar kullanıcı, 120M sunucu bilgisayar F Web: 3TB yer tutan en az 1 milyar belge   F Arama motorları:Yüzey web’in %16’sını, derin web’in onbinde üçünü kapsıyor

“Akademik Bilişim ’02” 6-8 Şubat 2002, Konya Y.T. Yüzey web – 1,5 milyar belge Derin Web – 550 milyar belge Kaynak: BrightPlanet,

“Akademik Bilişim ’02” 6-8 Şubat 2002, Konya Y.T. Amaç Türkçe arama motorlarının bilgi erişim performanslarını ölçmek

“Akademik Bilişim ’02” 6-8 Şubat 2002, Konya Y.T. Bilgi Erişim Sistemleri

“Akademik Bilişim ’02” 6-8 Şubat 2002, Konya Y.T. Arama Motorları F Klasik bilgi erişim sistemlerinden farklı F Veri tabanları büyük ve dinamik F Dizinleme örümcekler aracılığıyla F Belge kalitesi düşük F Belgelerin %30’u ikileniyor F Kullanıcılar çok çeşitli F Sorular çoğunlukla tek sözcükten oluşuyor

“Akademik Bilişim ’02” 6-8 Şubat 2002, Konya Y.T. Araştırma Soruları F Türkçe arama motorlarının duyarlık, normalize sıralama, kapsama, yenilik ve ölü bağlantı oranlarının birbirinden farklı olup olmadığı F Arama motorları hangi tür sorularda daha başarılı F Arama motorları üst veri alanlarından yararlanıyor mu F Türkçe karakter sorunu F Gövdeleme sorunu

“Akademik Bilişim ’02” 6-8 Şubat 2002, Konya Y.T. Arama Motorları F Arabul F Arama F Netbul F Superonline

“Akademik Bilişim ’02” 6-8 Şubat 2002, Konya Y.T. Sorular F Çeşitli türde 17 soru   F En sık aranan sorular –“mp3” –“oyun” –“sex” –“erotik” –“porno” F Üst verilerle ilgili iki deney  

“Akademik Bilişim ’02” 6-8 Şubat 2002, Konya Y.T. 17 Soru 1.internet ve etik 2.barok müzik 3.prozac 4.arama motorları 5.baris manco'nun mp3'leri 6.barış manço'nun mp3'leri 7.dpt 8.uzaylı 9.uzaylılar 10. demirel ve sezer 11. demirel veya sezer 12. demirel veya sezer ve tema 13. uzay 14. evren 15. uzay veya evren 16. atatürk ve fikriye hanım 17. ömer izgi  

“Akademik Bilişim ’02” 6-8 Şubat 2002, Konya Y.T. Ölçümler F Ölü bağlantı oranı –Adreslere erişilebilirlik oranı F Duyarlık oranı –Erişilen ilgili belgelerin erişilen tüm belgelere oranı F Normalize sıralama oranı –İlgili belgelere ilk sıralarda erişilebilme oranı F Kapsama oranı –İlgili belgeleri kapsama oranı F Yenilik oranı –Erişilen tekil ilgili belgelerin oranı

“Akademik Bilişim ’02” 6-8 Şubat 2002, Konya Y.T. Soruların Formülasyonu

“Akademik Bilişim ’02” 6-8 Şubat 2002, Konya Y.T. İlgililik Değerlendirmeleri ilgili ilgisiz ölü bağlantı

“Akademik Bilişim ’02” 6-8 Şubat 2002, Konya Y.T. Veri Analizi F Arama motorlarının duyarlık, normalize sıralama, kapsama, yenilik, ölü bağlantı oranları arasında fark var mı? F İstatistik testler –Kruskal-Wallis (H) testi –Mann-Whitney (U) testi –Korelasyon (r) testi

“Akademik Bilişim ’02” 6-8 Şubat 2002, Konya Y.T. Ölü Bağlantı Oranları Soru başına ortalama ölü bağlantı sayısı 1,45,10,72,8 Ort. her 6 adresten 1’i ölü

“Akademik Bilişim ’02” 6-8 Şubat 2002, Konya Y.T. Erişilen İlgili Belge Sayıları Erişilen toplam belge sayısı 971 Ortalama her 6 belgeden 5’i ilgisiz

“Akademik Bilişim ’02” 6-8 Şubat 2002, Konya Y.T. Ort. Duyarlık Değerleri %28 %11 %15 %20 %40 %27 %24 %21 %25 %21 %19 %16 %14 %16 %15 %13 %12 %10 %9

“Akademik Bilişim ’02” 6-8 Şubat 2002, Konya Y.T. Ort. Normalize Sıralama Değerleri %54 %30 %20 %37 %50 %58 %52 %54 %33 %37 %39 %21 %32 %31 %34 %16 %22 %19 %21

“Akademik Bilişim ’02” 6-8 Şubat 2002, Konya Y.T. Sorulara Göre Arama Motorlarının Ort. Duyarlık ve Ort. Normalize Sıralama Değerleri

“Akademik Bilişim ’02” 6-8 Şubat 2002, Konya Y.T. Türkçe Karakter Sorunu

“Akademik Bilişim ’02” 6-8 Şubat 2002, Konya Y.T. En Sık Aranan Beş Soru İçin Kapsama Oranları

“Akademik Bilişim ’02” 6-8 Şubat 2002, Konya Y.T. Arama Motorlarının Türkiye Adresli Belgeleri Kapsama Oranları (“oyun”)

“Akademik Bilişim ’02” 6-8 Şubat 2002, Konya Y.T. En Sık Aranan Beş Soru İçin Yenilik Oranları

“Akademik Bilişim ’02” 6-8 Şubat 2002, Konya Y.T. En Sık Aranan Beş Soru İçin Türkiye Adresli Yeni Belge Bulma Oranları

“Akademik Bilişim ’02” 6-8 Şubat 2002, Konya Y.T. Arama Motorlarının Üst Veri Alanlarından Yararlanması I

“Akademik Bilişim ’02” 6-8 Şubat 2002, Konya Y.T. Arama Motorlarının Üst Veri Alanlarından Yararlanması II

“Akademik Bilişim ’02” 6-8 Şubat 2002, Konya Y.T. Öneriler F Dizinler daha sık güncelleştirilmeli F İlgili belgelere erişememe nedenleri araştırılmalı F İlgili belgeler daha üst sıralarda gösterilmeli F Türkçe karakter sorunu çözülmeli F Gövdeleme algoritması kullanılmalı F Daha fazla Türkiye adresli belge dizinlenmeli F Üst veri alanlarından yararlanılmalı

“Akademik Bilişim ’02” 6-8 Şubat 2002, Konya Y.T. Türkçe Arama Motorlarında Performans Değerlendirme Yaşar Tonta Hacettepe Üniversitesi Yıltan Bitirim Doğu Akdeniz Üniversitesi Hayri Sever Massachusetts Üniversitesi