Sunum yükleniyor. Lütfen bekleyiniz

Sunum yükleniyor. Lütfen bekleyiniz

Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü Nonobot: Hayat Bilgisi Toplama Amaçlı Oyun Yunusemre Yener, Selim Serkan KAPLAN, M. Fatih Amasyalı.

Benzer bir sunumlar


... konulu sunumlar: "Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü Nonobot: Hayat Bilgisi Toplama Amaçlı Oyun Yunusemre Yener, Selim Serkan KAPLAN, M. Fatih Amasyalı."— Sunum transkripti:

1 Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü Nonobot: Hayat Bilgisi Toplama Amaçlı Oyun Yunusemre Yener, Selim Serkan KAPLAN, M. Fatih Amasyalı

2 Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü Sunum içeriği •Hayat Bilgisi (Commonsense) Nedir? •Neden ihtiyaç var? •Bilgi toplama türleri •Türkçe Hayat Bilgisi Veritabanı •Nonobot oyunu •Gelecek Çalışmalar

3 Bir hikayemiz var: Kurt ve Kız •Küçük bir kız, babaannesini ziyaret etmek için ormanda yürümeye başlıyor. Çalılıkların arkasındaki aç bir kurt kızı görüyor. Onu yemeğe karar veriyor. Küçük kıza tam saldıracakken, yakındaki oduncuların seslerini duyuyor. Çalılıkların ardında saklanıp kararından vazgeçiyor. •Problem: Aşağıdakileri açıklayınız. –Kurt kararından neden vazgeçti? –Küçük kız korktu mu? •Contributed by Pat Hayes and Lokendra Shastri (9th July, 1997)Pat HayesLokendra Shastri •http://www-formal.stanford.edu/leora/commonsense/http://www-formal.stanford.edu/leora/commonsense/

4 Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü Hayat Bilgisi (Commonsense) Nedir? •Herkesin bildiğini varsaydığımız bilgiler –İnsanlar her gün yemek yer. –İnsanlar geceleri uyur. –Balıklar denizde yaşar. –Elma yuvarlıktır. –Kediler miyavlar. –Ormanda ağaçlar vardır.

5 Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü Hayat Bilgisi Veri tabanlarına Neden ihtiyaç var? •Bilgisayarlara herşeyi söylemek gerekir. Söylediklerimizden söylemediklerimizi anlayamazlar / tahmin edemezler. •Bunu yapabilmenin yolu, bilgisayarlara Hayat Bilgisini vermek. •Bu sayede bilgisayarlar da insanlar gibi “Ali lokantada yemek yedi” cümlesinden “Ali para ödemiştir” bilgisini çıkarabileceklerdir.

6 Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü Hayat Bilgisi Veri Tabanları nasıl oluşturulur? 2 yaklaşım, 2 örnek •Bilgileri, az sayıda bilgi mühendisi özenle girsin yaklaşımı (Cyc, 20 yılda 1.5 milyon kaliteli bilgi, ) •Bilgileri, çok sayıda web kullanıcısı girsin yaklaşımı (OpenMind, 8000 kişi, 3 yılda 1 milyon bilgi, )www.openmind.org

7 Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü Türkçe Hayat Bilgisi Veritabanı •Literatürdeki çalışmalar genelde ingilizce için •Türkçe için bir ilk •Hangi yaklaşım kullanılmalı: –Cyc, OpenMind? –Mevcutları tercüme etmek / kullanmak –Frekans tabanlı bilgi çıkarımı •Veriler nasıl tutulmalı? –(Kavram - ilişki türü – kavram) üçlüleri

8 Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü Veri Kaynakları

9 Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü CSdb ‘den örnekler Bunun için ne gerekir?Neye sebep olur?Bundan neler yapılır? yazmak-araştırmaköldürmek-cezataş-köprü denemek-paradoğurmak-hayatçelik-makine uyumak-yatmaksevmek-umutsu-bulut seyahat etmek-enerjisevmek-acıkağıt-gazete öğrenmek-okumakateş-acıyün-kumaş yaşam-yiyeceköldürmek-üzüntükumaş-gömlek Ne için kullanılır?Bu ne yapabilir?Nerede bulunur? asker-savaşkuş-uçmakoda-bina çatal-yemekkişi-yürümekkişi-oda top-oynamakbilgisayar-düşünmekelbise-mağaza ördek-yemekçocuk-düşmekkemik-kişi hastalık-öldürmekbıçak-kesmekasker-savaş baş-düşünmekgemi-batmaköğrenci-okul

10 Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü Problemler •Otomatik çeviri hataları –Yanlış çeviri –Çeviri yapılamama –Çözüm ? Elle çeviri •Bilgi kalitesi –Çözüm (çok sayıda kişiden geri besleme almak)

11 Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü Nonobot •Amaç: CSdb’deki bilgi sayısını ve kalitesini arttırmak •Bir android uygulaması •Asıl oyun nonogram oyunu •Kullanıcı ipucu istediğinde CSdb’ye katkıda bulunuyor •Kullanıcı girişlerinin güvenirliklerinin ölçümü otomatik olarak yapılıyor. •Kullanıcılar yeni ilişkiler ve kavramlar girebiliyor, bu sayede CSdb’deki bilgi sayısı artıyor.

12 Nonogram (Kare Karalamaca) Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü başlangıç çözüm

13 Neden Nonogram? •Oyunlarını üretmek kolay •Kolaydan zora derecelendirmek kolay •Oyunları depolamak az hafıza gerektiriyor •Bilinen ve popüler bir oyun (kullanıcılara oyunu öğretmeye gerek yok) •Cep telefonunda ekranında oynamak kolay •Başarı hissi (uzun soluklu oyuncular için şart) veriyor Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

14 Kullanıcı ipucu istediğinde? •Kullanıcıya istediği satır ya da sütunun içeriği verilir. Neyin karşılığında? –Doğru / yanlış cevaplı sorular –Metin girişli sorular •Problemler: –Kullanıcılara saçma sorular sorulmamalı –Kullanıcı cevapları otomatik kontrol edilmeli Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

15 Doğru/yanlış cevaplı sorular •Soru üretimi: –Doğru cevabın doğru olması gerektiğini bildiğimiz sorular: Önceki bir çalışmamızda elde edilen listeden rastgele seçim –Doğru cevabın yanlış olması gerektiğini bildiğimiz sorular: Doğruluğu bilinen üçlülerde ilişki türünün rastgele değişimi ile. Örneğin “balık- nerede bulunur- nehir” doğru üçlüsü, aradaki ilişki türü değiştirince “balık – neye sebep olur- nehir” yanlış ilişkisine dönüşür. –Doğru cevabını bilmediğimiz sorular: CSdb’deki üçlülerden rastgele seçime Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

16 Doğru/yanlış cevaplı sorular •Cevap kontrolü: –Kullanıcıya tek ekranda 1 değil 3 soru sorulur. 3 sorudan 2’sinin cevabını sistem zaten bilmektedir. Kullanıcı bu 2’sine doğru cevap verirse 3.süne verdiği cevap doğru kabul edilir (reCaptcha mantığı). Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

17 Metin girişli sorular •Soru üretimi: •Vikisözlük sitesinde Türkçe isim, sıfat ve eylem listeleri bulunmaktadır. isim türünde 52269, sıfat türünde 10298, eylem türünde adet kavram var. Kelime türüne özel sorular üretilmiştir. •Örneğin –isim türündeki kavramlar için “nerede bulunur ?, üst kavramı nedir ?, vb. –sıfat türündeki kavramlar için “Neyin sıfatıdır ?” –eylem türündeki kavramlar için “kim/ne yapar ?, ne zaman yapılır ?, nerede yapılır? vb. Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

18 Metin girişli sorular •Cevap kontrolü: •Kullanıcıya şu kavramla (W1) şu ilişkiye (R1) sahip bir kavram söyle diye sorulmaktadır. Kullanıcının söylediği kavramın (W2) bu ilişki türüne (R1) göre doğruluğunun anlaşılması için Eşitlik kullanılmaktadır. •F(X), X ifadesinin Google arama motorunda aratıldığında döndürülen sonuç sayfası sayısı •Goran, belirlediğimiz bir eşik değerinden büyükse verilen cevap doğru kabul edilmektedir. Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

19 Metin girişli sorular •Cevap kontrolü: •Goran’ın 10 olarak belirlenmesi Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü w1w2F (w1)F(w2)F(w1+w2)Goran meşaleaşı11* * ,2 meşaleateş11* * ,8 ilaçfrekans15* * ,9 ilaçhasta15*10 6 7* ,2 parazittaksi18* * ,8 parazitbakteri18* * ,8

20 Metin girişli sorular •Cevap kontrolü: •Formülün eksiği: Doğru cevabın “okul masa” olması gereken durumda “okul öğretmen” ikilisi içinde kullanıcı cevabının doğru olarak algılar. Kelimeler arası ilişkiyi kontrol etmez. Sadece kelimelerin birlikte kullanıldıklarını kontrol eder. Bu durum için geliştirebildiğimiz bir çözümümüz yoktur. •Önerileriniz ? Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

21 Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü Gelecek Çalışmalar •Bilgi miktarının arttırılması (mevcut veri tabanı, haber metinlerindeki kelimelerin yaklaşık %50’sini içeriyor) •Bilgi kalitesinin arttırılması (mevcut doğruluk oranı yaklaşık %50) •Bilgileri kullanan uygulamaların gerçeklenmesi

22 Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü Referanslar •Lenat, D. B., Ramanathan V. G., Karen P., Dexter P., ve Shepherd M., “CYC: Toward programs with common sense”, The Communications of the ACM, 33(8):31–49 (1990). •Push Singh, Thomas Lin, Erik T. Mueller, Grace Lim, Travell Perkins ve Wan Li Zhu, “Open Mind Common Sense: Knowledge acquisition from the general public”, Proceedings of the First International Conference on Ontologies, Databases, and Applications of Semantics for Large Scale Information Systems, Irvine, CA, •Liu, H. ve Singh, P., “ConceptNet: A Practical Commonsense Reasoning Toolkit”, BT Technology Journal, Volume 22. Kluwer Academic Publishers, •Miller, G. A., Beckwith, R., Fellbaum, C., Gross, D. ve Miller, K., “Introduction to WordNet: An On-line Lexical Database”, •Bilgin, O., Çetinoğlu, Ö. ve Oflazer, K., “Building a WordNet for Turkish”, Romanian Journal of Information Science and Technology, 7(1-2), , (2004). •Emre Yazıcı, M.Fatih Amasyalı, “Automatic Extraction of Semantic Relationships Using Turkish Dictionary Definitions”, EMO Bilimsel Dergi, Vol. 1, No. 1, pp. 1-13, 2011.

23 Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü Teşekkürler. Sorularınız ? Kemik Doğal Dil İşleme Grubu:


"Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü Nonobot: Hayat Bilgisi Toplama Amaçlı Oyun Yunusemre Yener, Selim Serkan KAPLAN, M. Fatih Amasyalı." indir ppt

Benzer bir sunumlar


Google Reklamları