The SEE-GRID initiative is co-funded by the European Commission under the FP6 Research Infrastructures contract no SE4SEE A Grid-Enabled Search Engine for South Eastern Europe Doğu Avrupa Bölgesi için Grid-Tabanlı Arama Motoru B. Barla Cambazoglu, Ata Turk, Evren Karaca, Cevdet Aykanat, Bora Ucar, and Tayfun Kucukyilmaz Bilkent Universistesi, Bilgisayar Müh. Bölümü Onur Temizsoylu TÜBİTAK/ULAKBİM SEE-GRID Bölgesel Uygulaması
II. Ulusal Grid Çalıştayı SE4SEE Nedir? SE4SEE Doğu Avrupa Ülkeleri için Kişisel İstek güdümlü Ülkeye özel Kategori özelliği olan Grid tabanlı arama motoru.
SE4SEE parçaları SE4SEE’nin üç ana parçası vardır ağ tarayıcı sınıflandırıcı (internet portalı) kullanıcı arayüzü II. Ulusal Grid Çalıştayı
Ağ Tarayıcı Ağ tarayıcı (örümcek) programı, ağ sayfalarını bulur, indirir ve kaydeder. SE4SEE ağ tarayıcısı Java dilinde geliştirilmiştir multi-threaded Websphinx kütüphanesini kulanmaktadır II. Ulusal Grid Çalıştayı
Grid-Tabanlı Ağ Tarama Uluslararası ağdaki bilgi miktarı çok fazladır; Ağ tarama uygulaması: –Ağdan hızlı indirme oranı – yüksek bağlantı hızı, –Maximum kayıt kapasitesi (hem bellek, hem disk), –Yüksek işlem kapasitesi. Merkezi bir sistemle Ağ tarama probleminin çözümlenmesi zordur Çözüm: Grid-tabanlı ağ tarama, çünkü: –Coğrafik olarak dağılmış Grid düğümleri hızlı/yüksek indirme oranı ve network yükünün dağılımını sağlar, –Grid sisteminde mevcut olan yüksek işlem gücü, disk ve bellek kapasitesi, büyük miktarda ağ içeriğinin kaydedilmesi ve işlenmesi için gerekli ortamı sağlar. II. Ulusal Grid Çalıştayı
Sınıflandırıcı Yazı sınıflandırma: Ağ sayfalarının çeşitli başlıklar altında sınıflandırılması Başlıklar her ülke için farklı olabilir ve ülkelerin yöresel özelliklerine göre belirlenebilir Uygulama geliştirimine katılan her ülkeden dil-özgü kök bulma ve sık görülen kelimelerin eliminasyonu gibi işlemler için gerekli bilgiler alınmıştır SE4SEE yazı sınıflandırıcısı C dilinde geliştirilmiştir Harbinger sınıflandırma kütüphanesini kullanmaktadır Şu an 10 farklı sınıflandırma yöntemini desteklemektedir II. Ulusal Grid Çalıştayı
İnternet Portalı Ağ portalı: Kimlik belirleme ve hesap sistemi sağlar Hem kategori tabanlı, hem de (anahtar) kelime tabanlı sorguları destekler Çeşitli sorgu parametrelerinin (örn: tarama süresi, tarama başlangıç sayfası gibi) ayarlanmasını sağlar Ülke-özel sorgular için otomatik sorumlu düğüm seçimi sağlar SE4SEE ağ portalı HTML PHP C MySQL programlama dilleri ile geliştirilmiştir II. Ulusal Grid Çalıştayı
İnternet Portalı II. Ulusal Grid Çalıştayı
SEE-GRID Meeting9 (Backup) SE4SEE Web Portal
SEE-GRID Meeting10 (Backup) SE4SEE Web Portal
İnternet Portalı II. Ulusal Grid Çalıştayı
SEE-GRID Meeting12 (Backup) SE4SEE Web Portal
İnternet Portalı II. Ulusal Grid Çalıştayı
SEE-GRID Meeting14 (Backup) SE4SEE Web Portal
II. Ulusal Grid Çalıştayı
Verimlilik Deneyleri II. Ulusal Grid Çalıştayı
Sayfa Tazeliği Deneyleri II. Ulusal Grid Çalıştayı
Coğrafik Yakınlık Deneyleri II. Ulusal Grid Çalıştayı
Gridifikasyon Deneyleri II. Ulusal Grid Çalıştayı
Etkinlik Deneyleri II. Ulusal Grid Çalıştayı
Bölgesel Arama Motorunun Faydaları Kısa tarama çevrimlerinden dolayı yüksek sayfa tazeliği, Kültürel entegrasyon ortamı, İndirilen ağ içeriği ve sorgu logları üzerinde bölgesel veri madenciliği uygulamaları çalıştırabilme imkanı SEE ülkeleri arasında sosyal, kültürel, politik ve bilimsel ilişkilerle ilgili bilgi toplama imkanı, Bölge ülkelerindeki folklorik ögelerin bulunması. II. Ulusal Grid Çalıştayı
Sonuç SE4SEE Ülke-spesifik arama hizmeti sağlamak, Kültürel ilişkilerin incelenebileceği bir veri bankası oluşturmak, SEE ülkeleri arasındaki sosyo-kültürel entegrasyona katkıda bulunmak. II. Ulusal Grid Çalıştayı
Referans B.B. Cambazoglu, A. Turk, E. Karaca, C. Aykanat, and T. Kucukyilmaz, Architecture of a grid-enabled search engine, Information Processing & Management, the Special Issue on Heterogeneous and Distributed Information Retrieval (in press). B.B. Cambazoglu, A. Turk, E. Karaca, C. Aykanat, B. Ucar, and T. Kucukyilmaz, SE4SEE: a grid-enabled search engine, Proceedings of the Hypermedia and Grid Systems Conference in the MIPRO’05 Convention, pp. 223–227, Opatija, Croatia, May SEE-GRID Meeting23
SEE-GRID Meeting24 (Backup) Differences with GRACE GRACE general-purpose dependent on other document servers keyword-based search batch processing of queries categorization of query results SE4SEE socio-cultural independent category-based search interactive categorization of Web pages
SEE-GRID Meeting25 (Backup) SE4SEE Web Portal
SEE-GRID Meeting26 (Backup) SE4SEE Web Portal
SEE-GRID Meeting27 (Backup) SE4SEE Web Portal
SEE-GRID Meeting28 (Backup) SE4SEE Web Portal
SEE-GRID Meeting29 (Backup) SE4SEE Web Portal