Türkçe Arama Motorları Ne Kadar Türkçe?

Slides:



Advertisements
Benzer bir sunumlar
Araştırma adresinde, Computer Science alanında ilk 10’da yer alan, üniversitelerin web siteleri incelenerek yapılmıştır.
Advertisements

Musicpedia Müzik Ansiklopedisi Programı (Dünya’nın En Büyük Mobil Müzik Ansiklopedisi) KADİR GÜLAĞIZ (Sakarya Üniversitesi Bilgisayar Müh.)
ATATÜRK ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ ORGANİK KİMYA BÖLÜMÜ.
ANKOS AÇIK ERİŞİM VE KURUMSAL ARŞİVLER ÇALIŞMA GRUBU
Bilgi Erişim Tasarım Modelleri
Erişim Kuralları Yaşar Tonta Hacettepe Üniversitesi
The SEE-GRID initiative is co-funded by the European Commission under the FP6 Research Infrastructures contract no SE4SEE A Grid-Enabled Search.
BBY Bilgi Teknolojisi ve Yönetimi
ETKİ DEĞERLENDİRME ÇALIŞMALARI
Yaşar Tonta, İrem Soydal 2. Uluslararası Değişen Dünyada Bilgi Yönetimi Sempozyumu,22-24 Eylül 2010, Ankara Hacettepe Üniversitesi Bilgi ve Belge Yönetimi.
İstanbul Medipol Üniversitesi
İnternet Teknolojisi Temel Kavramlar
“Akademik Bilişim ’02” 6-8 Şubat 2002, Konya Y.T. Türkçe Arama Motorlarında Performans Değerlendirme Yaşar Tonta Hacettepe Üniversitesi
İnternet. İnternet...  dünya çapında bir bilgisayar ağı  bilgi süper otoyolu (information super highway)
Bilgi Erişim Performans Ölçüleri
ENGELLİ VE AİLELERİ YARDIMLAŞMA DERNEĞİ
GOOGLE’DA ARAMA YAPMAK
Uzm. Fatma BAŞAR Cahit Arf Bilgi Merkezi Eğitim ve Tanıtım Sorumlusu 22 Eylül 2010 T.C. Sağlık Bakanlığı Eğitim Toplantısı TÜBİTAK.
Erkan ULKER & Ahmet ARSLAN Selçuk Üniversitesi,
Web Ortamında Arama Yapmak R. Orçun MADRAN. Arama Motorları Arama Motorları, günümüzün popüler bilgiye erişim sistemlerinin başında yer almaktadır. Bir.
1 BBY Bilgi Erişim İlkeleri BES’de Etkinlik Değerlendirme.
“Sosyal Bilimler ve Internet” 18 Nisan 2000, Hacettepe Üniversitesi, Beytepe Y.T. Sosyal Bilim Araştırmalarında Elektronik Yayınların Kullanımı Yaşar Tonta.
Araştırma Önerisi ve Araştırma Raporu
İnternet Teknolojisi Temel Kavramlar
- 1 Mehdi Afzali Azad İslam Üniversitesi, İran Türkiye’deki Kurumsal Arşivlerin Web Analizi Yaşar Tonta H.Ü. Bilgi ve Belge Yönetimi.
Anahtarlama Cihazları ile Laboratuvarların Internet Bağlantısının Etkin Kullanımı Fatih Ertam Akademik Bilişim 2013 Akdeniz Üniversitesi.
İNTERNET.
Mobil ve Kablosuz Sistemlerde Bilgi Erişim Özellikleri Cenk ATLIĞ 11-Ocak-2006 Trakya Üniversitesi Bilgisayar Mühendisliği Akademik Bilişim Konferansı.
Bilgi Destek Sistemlerin Kurulması Yrd. Doç. Dr
SLAYT 1 DOK 322 – Bahar 2006 DOK 422: Bilgi Ağları Yaşar Tonta Hacettepe Üniversitesi Bilgi ve Belge Yönetimi Bölümü
TÜBİTAK ULAKBİM Cahit Arf Bilgi Merkezi Araştırma Faaliyetleri ve Bilimsel İçeriğe Erişimde Cahit Arf Bilgi Merkezi & Dünden Bugüne TÜBİTAK EKUAL.
Bilgi Erişim Sistemleri II Hayri Sever Bilgisayar Mühendisliği Bölümü Başkent Üniversitesi Bağlıca Ankara Yaşar Tonta Bilge.
GİRİŞ  Organizasyon Nedir?  Neden Organizasyon? Organizasyon ve bilgi; Arşiv, kütüphane müze, v.b. Anlamak, kavramak (understanding) Veri (Data) Bilgi.
BBY208 / KÜT242 Sosyal Bilimlerde Araştırma Yöntemleri II
BBY 207: Sosyal Bilimlerde Araştırma Yöntemleri I Y.T. SPSS (Statistical Package for the.
SLIDE 1BBY208 – Bahar 2005 KÜT242 / BBY208 Sosyal Bilimlerde Araştırma Yöntemleri II Yaşar Tonta H.Ü. BBY yunus.hacettepe.edu.tr/~tonta/courses/spring2005/bby208/
SLIDE 1BBY208 BBY208 Sosyal Bilimlerde Araştırma Yöntemleri II Yaşar Tonta H.Ü. BBY yunus.hacettepe.edu.tr/~tonta/courses/spring2009/bby208/
“Akademik Bilişim ’02” 6-8 Şubat 2002, Konya Y.T. Türkçe Arama Motorlarında Performans Değerlendirme Yıltan Bitirim Doğu Akdeniz Üniversitesi
Ford Fiesta Fizy Projeler tekil kullanici sayfa gösterimi ziyaretçi Sitede geçirilen ortalama süre 46dk Rakamlarla fizy.
Koç Üniversitesi Kütüphanesi Şubat 2010
BBY 156 Bilgi Erişim blogspot
BBY 156 Bilgi Erişim İrem Soydal
Elektronik Bilgi Kaynaklarına Yatırım ile Yayın Sayısı Arasındaki İlişki Üzerine Yaşar Tonta Hacettepe Üniversitesi Bilgi ve Belge Yönetimi Bölümü yunus.hacettepe.edu.tr/~tonta/tonta.html.
BBY606: Araştırma Yöntemleri
Connecting People Through News. © PressReader. All rights reserved. 2 Connecting People Through News 2011, 2012 & 2013 Yıllarının En İyi Aplikasyon Ödülü.
İrem Soydal ~ Yurdagül Ünal
Hafta 1: Dizinleme ve Özler BBY 264 Dizinleme ve Sınıflama.
İrem Soydal ~ Yurdagül Ünal
"Açık Bilim, Araştırma Verisi ve Açık Erişim" Paneli Yaşar Tonta Hacettepe Üniversitesi Bilgi ve Belge Yönetimi Bölümü yunus.hacettepe.edu.tr/~tonta/tonta.html.
Hafta 2: Dizinleme ve Öz Hazırlamaya Giriş BBY 306 Dizinleme ve Öz Hazırlama
1. Ders: Ders İşleyişi Hazırlayan ve Sunan:
Bitirme Tezi/Mühendislik Tasarımı Proje Türkçe Başlığı
Mehmet Tahta Dokuz Eylül Üniversitesi
Internet Üzerinden Araştırma Yöntemlerinin Etkin Kullanılması
60x90 cm Title of the congress paper Author(s) Name Surname Özet
Kitapsız Kütüphane Olgusu ve Esenler Belediyesi Adnan Büyükdeniz Dijital Kütüphanesi Doç. Dr. Hüseyin ODABAŞ – Ali KAVAK Çankırı Karatekin.
TURKISH 1 (UHF1271) GÜNLER&DERSLER DAYS&SUBJECTS
Structure of an IR System
Endüstri Mühendisliği Bölümü
The 2nd UNIDOKAP International Symposium on BIODIVERSITY,
Dünyanın bilgisine açılan pencere...
60x90 cm Title of the congress paper Author(s) Name Surname Özet
Bitirme Tezi/Mühendislik Tasarımı Proje Türkçe Başlığı
Yrd. Doç. Dr. Abdullah BAYKAL Konuşmacı : Cengiz Coşkun
Kaynak Gösterme Teknikleri
Uluslararası Üniversite Sıralama Sistemleri Genel Bir Değerlendirme
Türkçe Haber Yazılarında Sosyal Ağların İncelenmesi
NİŞANTAŞI ÜNİVERSİTESİ TURİZM COĞRAFYASI
BBY208 Sosyal Bilimlerde Araştırma Yöntemleri II
Kültürel Bellek Çalışmalarının Görsel Bir Haritası Güleda Doğan
Sunum transkripti:

Türkçe Arama Motorları Ne Kadar Türkçe? Hayri Sever Başkent Üniversitesi (sever@baskent.edu.tr ) Yıltan Bitirim Doğu Akdeniz Üniversitesi (yiltan.bitirim@emu.edu.tr ) Yaşar Tonta Hacettepe Üniversitesi (tonta@hacettepe.edu.tr)

Plan Giriş Araştırmanın amacı Bilgi erişim sistemleri Arama motorları Yöntem ve tasarım Bulgular ve yorum Öneriler

Giriş Internet: yarım milyar kullanıcı, 120M sunucu bilgisayar Web: 3TB yer tutan en az 1 milyar belge  Arama motorları:Yüzey web’in %16’sını, derin web’in onbinde üçünü kapsıyor

Yüzey web – 1,5 milyar belge Derin Web – 550 milyar belge Kaynak: BrightPlanet, 2001.

Amaç Türkçe arama motorlarının bilgi erişim performanslarını ölçmek

Bilgi Erişim Sistemleri

Arama Motorları Klasik bilgi erişim sistemlerinden farklı Veri tabanları büyük ve dinamik Dizinleme örümcekler aracılığıyla Belge kalitesi düşük Belgelerin %30’u ikileniyor Kullanıcılar çok çeşitli Sorular çoğunlukla tek sözcükten oluşuyor

Araştırma Soruları Türkçe arama motorlarının duyarlık, normalize sıralama, kapsama, yenilik ve ölü bağlantı oranlarının birbirinden farklı olup olmadığı Arama motorları hangi tür sorularda daha başarılı Arama motorları üst veri alanlarından yararlanıyor mu Türkçe karakter sorunu Gövdeleme sorunu

Arama Motorları Arabul (http://www.arabul.com) Netbul (http://www.netbul.com) Superonline (http://www.superonline.com)

Sorular Çeşitli türde 17 soru  En sık aranan sorular “mp3” “oyun” “sex” “erotik” “porno” Üst verilerle ilgili iki deney 

17 Soru internet ve etik barok müzik prozac arama motorları baris manco'nun mp3'leri barış manço'nun mp3'leri dpt uzaylı uzaylılar 10. demirel ve sezer 11. demirel veya sezer 12. demirel veya sezer ve tema 13. uzay 14. evren 15. uzay veya evren 16. atatürk ve fikriye hanım 17. ömer izgi 

Ölçümler Ölü bağlantı oranı Duyarlık oranı Normalize sıralama oranı Adreslere erişilebilirlik oranı Duyarlık oranı Erişilen ilgili belgelerin erişilen tüm belgelere oranı Normalize sıralama oranı İlgili belgelere ilk sıralarda erişilebilme oranı Kapsama oranı İlgili belgeleri kapsama oranı Yenilik oranı Erişilen tekil ilgili belgelerin oranı

Soruların Formülasyonu

İlgililik Değerlendirmeleri bağlantı ilgisiz

Veri Analizi Arama motorlarının duyarlık, normalize sıralama, kapsama, yenilik, ölü bağlantı oranları arasında fark var mı?

Ölü Bağlantı Oranları Ort. her 6 adresten 1’i ölü 1,4 5,1 0,7 2,8 Soru başına ortalama ölü bağlantı sayısı

Ölü Bağlantı: – sorgu: <hayri sever> http://www.arama.com/search.php3?q=hayri+sever&weborcat=web: ilk 15 belgeden 14’i ilgili; fakat 14’de ölü bağlantı (iki yıl önce kaldırılan adresler). http://kapi.netbul.com/internet/internet.asp?b=2&tr=&sayfa=1&keyword=hayri+sever: 28. kayıtta hayri sever’in ev sayfası yanlış yönlendiriliyor; fakat en azından çalıştığı kurum doğru http://www.arabul.com/sonuc.asp: 1 ilgili belge; fakat iki yıl önce kaldırılan belge. http://arama.superonline.com/arama/search.jsp?query=hayri+sever&d0=&bul=tr&d1=&x=10&y=8 alta vista motoru ilk sırada doğru adresli ev sayfasını getiriyor.

Erişilen İlgili Belge Sayıları Erişilen toplam belge sayısı 971 Ortalama her 6 belgeden 5’i ilgisiz

Ort. Duyarlık Değerleri Kesme Noktaları Arama Arabul Netbul Superonline Altavista 5 40 16 13 25 36 10 27 14 12 21 15 24 19 35 20 9 32 Ortalama 28 11 %40 %27 %25 %24 %21 %21 %19 %16 %16 %14 %16 %15 %10 %13 %12 %9

Ortalama Normalize Sıralama Değerleri Kesme Noktaları Arama Arabul Netbul Superonline Altavista 5 50 16 21 33 35 10 58 22 32 37 38 15 52 19 31 39 42 20 54 34 56 Ortalama 30 41 %58 %52 %50 %54 %39 %37 %39 %33 %34 %32 %31 %21 %22 %21 %19 %16

Türkçe Arama Motorlarında Gövdeleme Sorgu-Çifti No Gövdeli Gövdesiz 1 çiçek çiçekler 2 çiçekleri 3 oyun oyunlar 4 gazete gazetesi 5 kitap kitaplar 6 kitapta 7 resim resimler 8 üye üyelik

Türkçe Arama Motorlarında Gövdeleme

Türkçe Karakter Sorunu

En Sık Aranan Beş Soru İçin Kapsama Oranları

Arama Motorlarının Üst Veri Alanlarından Yararlanması I

Arama Motorlarının Üst Veri Alanlarından Yararlanması II

Öneriler Dizinler daha sık güncelleştirilmeli İlgili belgelere erişememe nedenleri araştırılmalı İlgili belgeler daha üst sıralarda gösterilmeli Türkçe karakter sorunu çözülmeli Gövdeleme algoritması kullanılmalı Daha fazla Türkiye adresli belge dizinlenmeli Üst veri alanlarından yararlanılmalı

Yayınlar H. Sever, A. Gorur and M.R. Tolun. Text Categorization with ILA. 18th International Symposium on Computer and Information Sciences (ISCIS’03), November 3-5, Antalya, TR. H. Sever and Y. Bitirim. The Analysis and Evaluation of Stemming algorithms for Turkish. 10th International Symposium on String Processing and Information Retrieval (SPIRE’03). Manaus, Brazil, October 8-10, 2003. Lecture Notes in Computer Science (LNCS), Springer, 2857: 238-51. H. Sever ve Güven Köse (Eylül 2003). Skor Dağılımlı Üst Arama Modeli. TBD 20. Ulusal Bilişim Kurultayı, İstanbul. H. Sever and M.Z. Bolat. A Text Filtering Method for Digital Libraries. (IATUL’03). The 24th Annual Conference on International Association of Technological University Libraries (http://www.iatul.org/conference/proceedings/vol13/papers/SEVER_fulltext.pdf) June 2-5, 2003. Ankara, Turkey. H. Sever and M. Tolun. Comparison of Normalization Techniques for Metasearch. ADVIS'02,  Lecture Notes in Computer Science, Springer Verlag,  Vol. 2457, pp. 133-143, 2002. Y. Bitirim, Y. Tonta, and H. Sever. Information Retrieval Effectiveness of Turkish Search Engines. ADVIS'02,  Lecture Notes in Computer Science, Springer Verlag,  Vol. 2457, pp. 93-103, 2002. Y. Tonta, Y. Bitirim, and H. Sever. Turkce Arama Motorlarinda Performans Degerlendirme, pp. 1-152, Damla Publisher Ltd., 2002. R. Manmatha and H. Sever. A Formal Approach to Score Normalization for Metasearch, Human Language Technology Conference (HLT'02), March 24-27, 2002, San Diego, CA. Yıltan Bitirim, Hayri Sever ve Yaşar Tonta, " Türkçe arama motorlarında performans değerlendirme" Akademik Bilişim '02, 6-8 Şubat 2002, Konya.

Türkçe Arama Motorları Ne Kadar Türkçe? Hayri Sever Başkent Üniversitesi (sever@baskent.edu.tr) Yıltan Bitirim Doğu Akdeniz Üniversitesi (yiltan.bitirim@emu.edu.tr) Yaşar Tonta Hacettepe Üniversitesi (tonta@hacettepe.edu.tr)