TÜRKÇE BİR SÖZLÜKTEKİ TANIMLARDAN KAVRAMLAR ARASINDAKİ ÜST-KAVRAM İLİŞKİLERİNİN ÇIKARILMASI Onur Güngör, Tunga Güngör Boğaziçi Üniversitesi, Bilgisayar Müh. Bölümü, İSTANBUL onurgu@boun.edu.tr, gungort@boun.edu.tr Akademik Bilişim 2007 31 Ocak 2007
Üst-kavramların Çıkarılması Çam – Ağaç Ağaç – Bitki Amaç WordNet - Bizim çalışmamız Kaynak sözlük: TDK sözlüğünün elektronik sürümü Akademik Bilişim 2007 31 Ocak 2007
Yöntem Sözlük tanımlarından üst-kavramların çıkarılması Çıkarılan üst-kavram ilişkileri kullanılarak hiyerarşinin oluşturulması Akademik Bilişim 2007 31 Ocak 2007
Üst-kavramların Çıkarılması (1. aşama) Tanım parçalara ayrılır sözcük : (sözcük* üstkavram) (, sözcük* üstkavram)* (, eşanlamlı)* Parçalar sırayla bazı kurallara göre işlenir Olası üst-kavramlar, eşanlamlar Üst-kavram seçme kriterleri (ÜSK) Akademik Bilişim 2007 31 Ocak 2007
İlişkilerin Tespitinde Kullanılan Kurallar (1. aşama) Üç grup kural: Yüzey biçimine göre Örn: “biçim bilimi” Sözlükte belirtilen kategorisine göre Sözlükteki tanımına göre A şıkkına bir örnek bul: Akademik Bilişim 2007 31 Ocak 2007
Örnek Bir Kural (1. aşama) Sözcük: Satım Sözlüksel kategori: İsim, ticaret Tanım: Satma işi, satış. Sözcük: Acayiplik Sözlüksel kategori: İsim Tanım: Acayip olma durumu, yabansılık, gariplik, tuhaflık. Üst-kavramlar: “iş”. Eşanlamları: “satış”. Üst-kavramlar: “durum”. Eşanlamları: “tuhaflık”, “gariplik”, “yabansılık”. Burada kural 10 anlatılacak. Başka bir örnek daha koyup altlarına açıkça neler çıktığı eklenecek. Akademik Bilişim 2007 31 Ocak 2007
Üst-kavram Seçme Kriterleri (ÜSK) (1. aşama) Olası üst-kavramlara uygulanan biçim bilimsel analiz Ana fikir: sözcüğün yalın halde olması Akademik Bilişim 2007 31 Ocak 2007
Hiyerarşik Yapının Kurulması (2. aşama) Kök düğümler için İngilizce WordNet 21 düğüm Örn: “olay”, “bilgi”, “madde”, … Dizin kullanılarak Derinliğine arama (depth first) Çevrimler (cycle) engellendi Burada arama yerine traversal’ın türkçesi kullanılsa? Akademik Bilişim 2007 31 Ocak 2007
Hiyerarşik yapıdan bir örnek (2. aşama) Dizinde 60000 üst-kavram 72 seviye Akademik Bilişim 2007 31 Ocak 2007
Türkçe WordNet – Bizim Çalışmamız Daha az ve özlü bilgi Elle işlenmiş Bizim çalışmamız Daha kapsamlı Ama hatalar mevcut Otomatik olarak işleniyor Türkçe wordnet ile karşılaştırma Akademik Bilişim 2007 31 Ocak 2007
Anlam Muğlaklıkları “Güneş kremi bir renk mi?” Krem: "... için sürülen koyu kıvamlı bir madde.“ “Açık saman rengi." Akademik Bilişim 2007 31 Ocak 2007
Sonuç Önemli miktarda anlamsal bilgi elde edilebiliyor Süren çalışma: Anlam muğlaklığını giderici bir modül Akademik Bilişim 2007 31 Ocak 2007