Sunum yükleniyor. Lütfen bekleyiniz

Sunum yükleniyor. Lütfen bekleyiniz

Nonobot: Hayat Bilgisi Toplama Amaçlı Oyun

Benzer bir sunumlar


... konulu sunumlar: "Nonobot: Hayat Bilgisi Toplama Amaçlı Oyun"— Sunum transkripti:

1 Nonobot: Hayat Bilgisi Toplama Amaçlı Oyun
Yunusemre Yener, Selim Serkan KAPLAN, M. Fatih Amasyalı Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

2 Sunum içeriği Hayat Bilgisi (Commonsense) Nedir? Neden ihtiyaç var?
Bilgi toplama türleri Türkçe Hayat Bilgisi Veritabanı Nonobot oyunu Gelecek Çalışmalar Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

3 Bir hikayemiz var: Kurt ve Kız
Küçük bir kız, babaannesini ziyaret etmek için ormanda yürümeye başlıyor. Çalılıkların arkasındaki aç bir kurt kızı görüyor. Onu yemeğe karar veriyor. Küçük kıza tam saldıracakken, yakındaki oduncuların seslerini duyuyor. Çalılıkların ardında saklanıp kararından vazgeçiyor. Problem: Aşağıdakileri açıklayınız. Kurt kararından neden vazgeçti? Küçük kız korktu mu? Contributed by Pat Hayes and Lokendra Shastri  (9th July, 1997)

4 Hayat Bilgisi (Commonsense) Nedir?
Herkesin bildiğini varsaydığımız bilgiler İnsanlar her gün yemek yer. İnsanlar geceleri uyur. Balıklar denizde yaşar. Elma yuvarlıktır. Kediler miyavlar. Ormanda ağaçlar vardır. Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

5 Hayat Bilgisi Veri tabanlarına Neden ihtiyaç var?
Bilgisayarlara herşeyi söylemek gerekir. Söylediklerimizden söylemediklerimizi anlayamazlar / tahmin edemezler. Bunu yapabilmenin yolu, bilgisayarlara Hayat Bilgisini vermek. Bu sayede bilgisayarlar da insanlar gibi “Ali lokantada yemek yedi” cümlesinden “Ali para ödemiştir” bilgisini çıkarabileceklerdir. Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

6 Hayat Bilgisi Veri Tabanları nasıl oluşturulur? 2 yaklaşım, 2 örnek
Bilgileri, az sayıda bilgi mühendisi özenle girsin yaklaşımı (Cyc, 20 yılda 1.5 milyon kaliteli bilgi, ) Bilgileri, çok sayıda web kullanıcısı girsin yaklaşımı (OpenMind, 8000 kişi, 3 yılda 1 milyon bilgi, ) Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

7 Türkçe Hayat Bilgisi Veritabanı
Literatürdeki çalışmalar genelde ingilizce için Türkçe için bir ilk Hangi yaklaşım kullanılmalı: Cyc, OpenMind? Mevcutları tercüme etmek / kullanmak Frekans tabanlı bilgi çıkarımı Veriler nasıl tutulmalı? (Kavram - ilişki türü – kavram) üçlüleri Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

8 Veri Kaynakları Yıldız Teknik Üniversitesi
Bilgisayar Mühendisliği Bölümü

9 CSdb ‘den örnekler Bunun için ne gerekir? Neye sebep olur?
Bundan neler yapılır? yazmak-araştırmak öldürmek-ceza taş-köprü denemek-para doğurmak-hayat çelik-makine uyumak-yatmak sevmek-umut su-bulut seyahat etmek-enerji sevmek-acı kağıt-gazete öğrenmek-okumak ateş-acı yün-kumaş yaşam-yiyecek öldürmek-üzüntü kumaş-gömlek Ne için kullanılır? Bu ne yapabilir? Nerede bulunur? asker-savaş kuş-uçmak oda-bina çatal-yemek kişi-yürümek kişi-oda top-oynamak bilgisayar-düşünmek elbise-mağaza ördek-yemek çocuk-düşmek kemik-kişi hastalık-öldürmek bıçak-kesmek baş-düşünmek gemi-batmak öğrenci-okul Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

10 Problemler Otomatik çeviri hataları Bilgi kalitesi Yanlış çeviri
Çeviri yapılamama Çözüm ? Elle çeviri Bilgi kalitesi Çözüm (çok sayıda kişiden geri besleme almak) Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

11 Nonobot Amaç: CSdb’deki bilgi sayısını ve kalitesini arttırmak
Bir android uygulaması Asıl oyun nonogram oyunu Kullanıcı ipucu istediğinde CSdb’ye katkıda bulunuyor Kullanıcı girişlerinin güvenirliklerinin ölçümü otomatik olarak yapılıyor. Kullanıcılar yeni ilişkiler ve kavramlar girebiliyor, bu sayede CSdb’deki bilgi sayısı artıyor. Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

12 Nonogram (Kare Karalamaca)
1 2 1 2 1 1 3 1 2 1 2 1 1 3 başlangıç çözüm Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

13 Neden Nonogram? Oyunlarını üretmek kolay
Kolaydan zora derecelendirmek kolay Oyunları depolamak az hafıza gerektiriyor Bilinen ve popüler bir oyun (kullanıcılara oyunu öğretmeye gerek yok) Cep telefonunda ekranında oynamak kolay Başarı hissi (uzun soluklu oyuncular için şart) veriyor Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

14 Kullanıcı ipucu istediğinde?
Kullanıcıya istediği satır ya da sütunun içeriği verilir. Neyin karşılığında? Doğru / yanlış cevaplı sorular Metin girişli sorular Problemler: Kullanıcılara saçma sorular sorulmamalı Kullanıcı cevapları otomatik kontrol edilmeli Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

15 Doğru/yanlış cevaplı sorular
Soru üretimi: Doğru cevabın doğru olması gerektiğini bildiğimiz sorular: Önceki bir çalışmamızda elde edilen listeden rastgele seçim Doğru cevabın yanlış olması gerektiğini bildiğimiz sorular: Doğruluğu bilinen üçlülerde ilişki türünün rastgele değişimi ile . Örneğin “balık- nerede bulunur- nehir” doğru üçlüsü, aradaki ilişki türü değiştirince “balık – neye sebep olur- nehir” yanlış ilişkisine dönüşür. Doğru cevabını bilmediğimiz sorular: CSdb’deki üçlülerden rastgele seçime Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

16 Doğru/yanlış cevaplı sorular
Cevap kontrolü: Kullanıcıya tek ekranda 1 değil 3 soru sorulur. 3 sorudan 2’sinin cevabını sistem zaten bilmektedir. Kullanıcı bu 2’sine doğru cevap verirse 3.süne verdiği cevap doğru kabul edilir (reCaptcha mantığı). Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

17 Metin girişli sorular Soru üretimi:
Vikisözlük sitesinde Türkçe isim, sıfat ve eylem listeleri bulunmaktadır. isim türünde 52269, sıfat türünde 10298, eylem türünde adet kavram var. Kelime türüne özel sorular üretilmiştir. Örneğin isim türündeki kavramlar için “nerede bulunur ?, üst kavramı nedir ?, vb. sıfat türündeki kavramlar için “Neyin sıfatıdır ?” eylem türündeki kavramlar için “kim/ne yapar ?, ne zaman yapılır ?, nerede yapılır? vb. Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

18 Metin girişli sorular Cevap kontrolü:
Kullanıcıya şu kavramla (W1) şu ilişkiye (R1) sahip bir kavram söyle diye sorulmaktadır. Kullanıcının söylediği kavramın (W2) bu ilişki türüne (R1) göre doğruluğunun anlaşılması için Eşitlik kullanılmaktadır. F(X), X ifadesinin Google arama motorunda aratıldığında döndürülen sonuç sayfası sayısı Goran, belirlediğimiz bir eşik değerinden büyükse verilen cevap doğru kabul edilmektedir. Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

19 Metin girişli sorular Cevap kontrolü: Goran’ın 10 olarak belirlenmesi
w1 w2 F (w1) F(w2) F(w1+w2) Goran meşale aşı 11*105 25*105 68 15,2 ateş 25*106 10000 6,8 ilaç frekans 15*106 29*105 93 14,9 hasta 7*109 48000 8,2 parazit taksi 18*105 17*106 1 20,8 bakteri 96*105 4100 8,8 Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

20 Metin girişli sorular Cevap kontrolü:
Formülün eksiği: Doğru cevabın “okul masa” olması gereken durumda “okul öğretmen” ikilisi içinde kullanıcı cevabının doğru olarak algılar. Kelimeler arası ilişkiyi kontrol etmez. Sadece kelimelerin birlikte kullanıldıklarını kontrol eder. Bu durum için geliştirebildiğimiz bir çözümümüz yoktur. Önerileriniz ? Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

21 Gelecek Çalışmalar Bilgi miktarının arttırılması (mevcut veri tabanı, haber metinlerindeki kelimelerin yaklaşık %50’sini içeriyor) Bilgi kalitesinin arttırılması (mevcut doğruluk oranı yaklaşık %50) Bilgileri kullanan uygulamaların gerçeklenmesi Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

22 Referanslar Lenat, D. B., Ramanathan V. G., Karen P., Dexter P., ve Shepherd M., “CYC: Toward programs with common sense”, The Communications of the ACM, 33(8):31–49 (1990). Push Singh, Thomas Lin, Erik T. Mueller, Grace Lim, Travell Perkins ve Wan Li Zhu, “Open Mind Common Sense: Knowledge acquisition from the general public”, Proceedings of the First International Conference on Ontologies, Databases, and Applications of Semantics for Large Scale Information Systems, Irvine, CA, 2002. Liu, H. ve Singh, P., “ConceptNet: A Practical Commonsense Reasoning Toolkit”, BT Technology Journal, Volume 22. Kluwer Academic Publishers, 2004. Miller, G. A., Beckwith, R., Fellbaum, C., Gross, D. ve Miller, K., “Introduction to WordNet: An On-line Lexical Database”, 1993. Bilgin, O., Çetinoğlu, Ö. ve Oflazer, K., “Building a WordNet for Turkish”, Romanian Journal of Information Science and Technology, 7(1-2), , (2004). Emre Yazıcı, M.Fatih Amasyalı, “Automatic Extraction of Semantic Relationships Using Turkish Dictionary Definitions”, EMO Bilimsel Dergi, Vol. 1, No. 1, pp. 1-13, 2011. Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

23 Teşekkürler. Sorularınız. Kemik Doğal Dil İşleme Grubu: www. kemik
Teşekkürler. Sorularınız ? Kemik Doğal Dil İşleme Grubu: Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü


"Nonobot: Hayat Bilgisi Toplama Amaçlı Oyun" indir ppt

Benzer bir sunumlar


Google Reklamları