Nonobot: Hayat Bilgisi Toplama Amaçlı Oyun

Slides:



Advertisements
Benzer bir sunumlar
Hayat Bilgisi Veritabanı Kullanarak Otomatik Cümle Üretimi
Advertisements

Dört Bölüm 1.Tanıtım ve Mevcut Durum 2.Hedefler 4.Demo 3.Yeni Sürüm Planlaması.
M.Fatih Amasyalı, Yıldız Teknik Üniversitesi, 2003
Hazırlayan Ebru SIRMACI
-Scopus- Uz. Kübra DEMİR
İNTERNET.
ALPER LAÇİN SERDAR TAŞAN
Diferansiyel Denklemler
Eğitim Programı Kurulum Aşamaları E. Savaş Başcı ASO 1. ORGANİZE SANAYİ BÖLGESİ AVRUPA BİLGİSAYAR YERKİNLİĞİ SERTİFİKASI EĞİTİM PROJESİ (OBİYEP)
Görme Engelliler İçin Servis Platformu
Bilgisayar Mühendisi Mehmet Veysi AYATA
Yıldız Teknik Üniversitesi
Bilgi Paketi Çalışmaları
kaynakca.info TÜRKİYE KAYNAKÇASI
İNTERNET VE İLETİŞİM.
İNTERNET ADRESLERİ.
ULAKBIM UASL Mayıs İçerik Türleri: Bilgide Bir Servet Hukuk Dergileri Online Hukuk Kitapları Yasalar, İçtihatlar ve Mahkeme Kararları Gazete ve.
INTERNET TABANLI HASTA KAYDI PAYLAŞIMI VE TELEKONSÜLTASYON PLATFORMU
Tarafından sağlanmaktadır ScienceDirect Veri Tabanı.
Tarafından sağlanmaktadır ScienceDirect Veri Tabanı.
9. ADİ DİFERANSİYEL DENKLEMLERİN SAYISAL ÇÖZÜMLERİ
KÜTÜPHANELERDE HALKLA İLİŞKİLER ve PAZARLAMA ANKARA ÜNİVERSİTESİ KÜTÜPHANESİ ÖRNEĞİ Tuna CAN & E.Erdal AYDIN
Ankara Üniversitesi Açık Arşiv Uygulaması
Hazırlayan: Zeynep Adsoy Türkçe Öğretmenliği/2 No:
Bilgi Okuryazarlığı Bu çalışma Prof. Dr. Buket Akkoyunlu’nun “Bilgi Okuryazarlığı ve Yaşam Boyu Öğrenme” başlıklı bildirisine dayanılarak hazırlanmıştır.
BBY Bilgi Teknolojisi ve Yönetimi
Chapter 3 Brainstorming a Game Idea: Gameplay, Technology, and Story
Akıllı Şebekelerde İletişim Teknolojileri
Açık Dergi Sistemleri orçun madran. Open Journal Systems (OJS) Web 2.0 Teknolojileri ve Uygulamaları Çalıştayı, Ankara - 4 Aralık
Açık Ders Malzemeleri: Dünyadaki Gelişmeler
Görsel Programlama Dr. Muhammet Balcılar
“Akademik Bilişim ’02” 6-8 Şubat 2002, Konya Y.T. Türkçe Arama Motorlarında Performans Değerlendirme Yaşar Tonta Hacettepe Üniversitesi
Yrd. Doç. Dr. Emre SÜMER Aralık-2011
Bilişim Teknolojileri Okuryazarlığı
Güvenli ve Pratik Web’de çalışma saatleri için;
MDK ALT YAPI KIYASLAMA ÇALIŞMA GRUBU
14.ULUSAL TURİZM KONGRESİ 2013 YILI BİLDİRİLERİ ÜZERİNE BİR DEĞERLENDİRME Prof. Dr. A. Celil ÇAKICI Mersin Üniversitesi Turizm Fakültesi.
Türkçe Hayat Bilgisi Veri Tabanının (CSdb) Oluşturulması ve CSoyun
VERİLERİ DÜZENLİYORUM ACCESS TANIMLAR Veri Tabanı: Düzenli bilgiler topluluğudur. Sistematik erişim imkanı olan, yönetilebilir, güncellenebilir, taşınabilir,
İşletim Sistemi.
İNTERNET VE İLETİŞİM.
Bilgehan Arslan, Süreyya Gülnar
Makİne Öğrenmesİ İle Ürün SInIflandIrma İncelemesi
M.Fatih AMASYALI Uzman Sistemler Ders Notları
Dİjİtal oyun tabanlI öğrenme
1 Tarım Politikası Dersi Uygulama Dönemi Tez Yazımında Dikkat Edilmesi Gereken Konular Dr. Yener ATASEVEN Ankara Üniversitesi.
Mobil ve Kablosuz Sistemlerde Bilgi Erişim Özellikleri Cenk ATLIĞ 11-Ocak-2006 Trakya Üniversitesi Bilgisayar Mühendisliği Akademik Bilişim Konferansı.
Ağ Teknolojileri Dr. Kemal BIÇAKCI. 2 Amaç Aşağıdaki soruları cevaplayabilir miyiz? Aşağıdaki soruları cevaplayabilir miyiz? –Günümüz İnternetinde gözlemlediğimiz.
Makine Öğrenmesinde Yeni Problemler
Bilişim Teknolojileri ve Yazarlık Dersi
Web Tarayıcıları ve Arama Motorları
 Elektronik bilgi kaynağı. Düzenli bir şekilde listelenmiş bilgilerin bilgisayardaki karşılığıdır. Genel olarak bu bilgiler ortak bir konu ya da amaca.
HUKUKTA BİLGİ YÖNETİMİ BBY Veri Tabanları (Uluslararası) Nazan Özenç Uçak Güz.
Yapay Zeka Desteği ile Parfüm Öneri Sistemi
Bilgisayar Mühendisliğindeki Yeri
Makine Öğrenmesinde Yeni Problemler YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ.
Akademik Bilgiye ulaşım
Web Tarayıcıları ve Arama Motorları
Türkçe Arama Motorları Ne Kadar Türkçe?
WEB 2.0 ARAÇLARI.
TrustRank, Dalgalanmalar, Google Penguin
Web Tarayıcıları ve Arama Motorları
Ağ Nedir IP Adresi DNS Sunucu
Makine Öğrenmesinde Yeni Problemler
FİZİK-1DERSİ UYGULAMA PROJE SUNUSU
Mehmet Fatih KARACA Yrd. Doç. Dr. Salih GÖRGÜNOĞLU
Türkçe Haber Yazılarında Sosyal Ağların İncelenmesi
Türkçe Hayat Bilgisi Veri Tabanının Oluşturulması
Bilişim Teknolojileri Meslek Seçimi ve Ücretler (2019)
Kelime Anlamları (Word Semantics) Doç.Dr.Banu Diri
Sunum transkripti:

Nonobot: Hayat Bilgisi Toplama Amaçlı Oyun Yunusemre Yener, Selim Serkan KAPLAN, M. Fatih Amasyalı mfatih@ce.yildiz.edu.tr Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

Sunum içeriği Hayat Bilgisi (Commonsense) Nedir? Neden ihtiyaç var? Bilgi toplama türleri Türkçe Hayat Bilgisi Veritabanı Nonobot oyunu Gelecek Çalışmalar Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

Bir hikayemiz var: Kurt ve Kız Küçük bir kız, babaannesini ziyaret etmek için ormanda yürümeye başlıyor. Çalılıkların arkasındaki aç bir kurt kızı görüyor. Onu yemeğe karar veriyor. Küçük kıza tam saldıracakken, yakındaki oduncuların seslerini duyuyor. Çalılıkların ardında saklanıp kararından vazgeçiyor. Problem: Aşağıdakileri açıklayınız. Kurt kararından neden vazgeçti? Küçük kız korktu mu? Contributed by Pat Hayes and Lokendra Shastri  (9th July, 1997) http://www-formal.stanford.edu/leora/commonsense/

Hayat Bilgisi (Commonsense) Nedir? Herkesin bildiğini varsaydığımız bilgiler İnsanlar her gün yemek yer. İnsanlar geceleri uyur. Balıklar denizde yaşar. Elma yuvarlıktır. Kediler miyavlar. Ormanda ağaçlar vardır. Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

Hayat Bilgisi Veri tabanlarına Neden ihtiyaç var? Bilgisayarlara herşeyi söylemek gerekir. Söylediklerimizden söylemediklerimizi anlayamazlar / tahmin edemezler. Bunu yapabilmenin yolu, bilgisayarlara Hayat Bilgisini vermek. Bu sayede bilgisayarlar da insanlar gibi “Ali lokantada yemek yedi” cümlesinden “Ali para ödemiştir” bilgisini çıkarabileceklerdir. Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

Hayat Bilgisi Veri Tabanları nasıl oluşturulur? 2 yaklaşım, 2 örnek Bilgileri, az sayıda bilgi mühendisi özenle girsin yaklaşımı (Cyc, 20 yılda 1.5 milyon kaliteli bilgi, www.cycfoundation.org/concepts ) Bilgileri, çok sayıda web kullanıcısı girsin yaklaşımı (OpenMind, 8000 kişi, 3 yılda 1 milyon bilgi, www.openmind.org ) Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

Türkçe Hayat Bilgisi Veritabanı Literatürdeki çalışmalar genelde ingilizce için Türkçe için bir ilk Hangi yaklaşım kullanılmalı: Cyc, OpenMind? Mevcutları tercüme etmek / kullanmak Frekans tabanlı bilgi çıkarımı Veriler nasıl tutulmalı? (Kavram - ilişki türü – kavram) üçlüleri Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

Veri Kaynakları Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

CSdb ‘den örnekler Bunun için ne gerekir? Neye sebep olur? Bundan neler yapılır? yazmak-araştırmak öldürmek-ceza taş-köprü denemek-para doğurmak-hayat çelik-makine uyumak-yatmak sevmek-umut su-bulut seyahat etmek-enerji sevmek-acı kağıt-gazete öğrenmek-okumak ateş-acı yün-kumaş yaşam-yiyecek öldürmek-üzüntü kumaş-gömlek Ne için kullanılır? Bu ne yapabilir? Nerede bulunur? asker-savaş kuş-uçmak oda-bina çatal-yemek kişi-yürümek kişi-oda top-oynamak bilgisayar-düşünmek elbise-mağaza ördek-yemek çocuk-düşmek kemik-kişi hastalık-öldürmek bıçak-kesmek baş-düşünmek gemi-batmak öğrenci-okul Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

Problemler Otomatik çeviri hataları Bilgi kalitesi Yanlış çeviri Çeviri yapılamama Çözüm ? Elle çeviri Bilgi kalitesi Çözüm (çok sayıda kişiden geri besleme almak) Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

Nonobot Amaç: CSdb’deki bilgi sayısını ve kalitesini arttırmak Bir android uygulaması Asıl oyun nonogram oyunu Kullanıcı ipucu istediğinde CSdb’ye katkıda bulunuyor Kullanıcı girişlerinin güvenirliklerinin ölçümü otomatik olarak yapılıyor. Kullanıcılar yeni ilişkiler ve kavramlar girebiliyor, bu sayede CSdb’deki bilgi sayısı artıyor. Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

Nonogram (Kare Karalamaca) 1 2 1 2 1 1 3 1 2 1 2 1 1 3 başlangıç çözüm Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

Neden Nonogram? Oyunlarını üretmek kolay Kolaydan zora derecelendirmek kolay Oyunları depolamak az hafıza gerektiriyor Bilinen ve popüler bir oyun (kullanıcılara oyunu öğretmeye gerek yok) Cep telefonunda ekranında oynamak kolay Başarı hissi (uzun soluklu oyuncular için şart) veriyor Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

Kullanıcı ipucu istediğinde? Kullanıcıya istediği satır ya da sütunun içeriği verilir. Neyin karşılığında? Doğru / yanlış cevaplı sorular Metin girişli sorular Problemler: Kullanıcılara saçma sorular sorulmamalı Kullanıcı cevapları otomatik kontrol edilmeli Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

Doğru/yanlış cevaplı sorular Soru üretimi: Doğru cevabın doğru olması gerektiğini bildiğimiz sorular: Önceki bir çalışmamızda elde edilen listeden rastgele seçim Doğru cevabın yanlış olması gerektiğini bildiğimiz sorular: Doğruluğu bilinen üçlülerde ilişki türünün rastgele değişimi ile . Örneğin “balık- nerede bulunur- nehir” doğru üçlüsü, aradaki ilişki türü değiştirince “balık – neye sebep olur- nehir” yanlış ilişkisine dönüşür. Doğru cevabını bilmediğimiz sorular: CSdb’deki üçlülerden rastgele seçime Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

Doğru/yanlış cevaplı sorular Cevap kontrolü: Kullanıcıya tek ekranda 1 değil 3 soru sorulur. 3 sorudan 2’sinin cevabını sistem zaten bilmektedir. Kullanıcı bu 2’sine doğru cevap verirse 3.süne verdiği cevap doğru kabul edilir (reCaptcha mantığı). Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

Metin girişli sorular Soru üretimi: Vikisözlük sitesinde Türkçe isim, sıfat ve eylem listeleri bulunmaktadır. isim türünde 52269, sıfat türünde 10298, eylem türünde 15183 adet kavram var. Kelime türüne özel sorular üretilmiştir. Örneğin isim türündeki kavramlar için “nerede bulunur ?, üst kavramı nedir ?, vb. sıfat türündeki kavramlar için “Neyin sıfatıdır ?” eylem türündeki kavramlar için “kim/ne yapar ?, ne zaman yapılır ?, nerede yapılır? vb. Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

Metin girişli sorular Cevap kontrolü: Kullanıcıya şu kavramla (W1) şu ilişkiye (R1) sahip bir kavram söyle diye sorulmaktadır. Kullanıcının söylediği kavramın (W2) bu ilişki türüne (R1) göre doğruluğunun anlaşılması için Eşitlik kullanılmaktadır. F(X), X ifadesinin Google arama motorunda aratıldığında döndürülen sonuç sayfası sayısı Goran, belirlediğimiz bir eşik değerinden büyükse verilen cevap doğru kabul edilmektedir. Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

Metin girişli sorular Cevap kontrolü: Goran’ın 10 olarak belirlenmesi w1 w2 F (w1) F(w2) F(w1+w2) Goran meşale aşı 11*105 25*105 68 15,2 ateş 25*106 10000 6,8 ilaç frekans 15*106 29*105 93 14,9 hasta 7*109 48000 8,2 parazit taksi 18*105 17*106 1 20,8 bakteri 96*105 4100 8,8 Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

Metin girişli sorular Cevap kontrolü: Formülün eksiği: Doğru cevabın “okul masa” olması gereken durumda “okul öğretmen” ikilisi içinde kullanıcı cevabının doğru olarak algılar. Kelimeler arası ilişkiyi kontrol etmez. Sadece kelimelerin birlikte kullanıldıklarını kontrol eder. Bu durum için geliştirebildiğimiz bir çözümümüz yoktur. Önerileriniz ? Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

Gelecek Çalışmalar Bilgi miktarının arttırılması (mevcut veri tabanı, haber metinlerindeki kelimelerin yaklaşık %50’sini içeriyor) Bilgi kalitesinin arttırılması (mevcut doğruluk oranı yaklaşık %50) Bilgileri kullanan uygulamaların gerçeklenmesi Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

Referanslar Lenat, D. B., Ramanathan V. G., Karen P., Dexter P., ve Shepherd M., “CYC: Toward programs with common sense”, The Communications of the ACM, 33(8):31–49 (1990). Push Singh, Thomas Lin, Erik T. Mueller, Grace Lim, Travell Perkins ve Wan Li Zhu, “Open Mind Common Sense: Knowledge acquisition from the general public”, Proceedings of the First International Conference on Ontologies, Databases, and Applications of Semantics for Large Scale Information Systems, Irvine, CA, 2002. Liu, H. ve Singh, P., “ConceptNet: A Practical Commonsense Reasoning Toolkit”, BT Technology Journal, Volume 22. Kluwer Academic Publishers, 2004. Miller, G. A., Beckwith, R., Fellbaum, C., Gross, D. ve Miller, K., “Introduction to WordNet: An On-line Lexical Database”, 1993. Bilgin, O., Çetinoğlu, Ö. ve Oflazer, K., “Building a WordNet for Turkish”, Romanian Journal of Information Science and Technology, 7(1-2), 163-172, (2004). Emre Yazıcı, M.Fatih Amasyalı, “Automatic Extraction of Semantic Relationships Using Turkish Dictionary Definitions”, EMO Bilimsel Dergi, Vol. 1, No. 1, pp. 1-13, 2011. Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü

Teşekkürler. Sorularınız. Kemik Doğal Dil İşleme Grubu: www. kemik Teşekkürler. Sorularınız ? Kemik Doğal Dil İşleme Grubu: www.kemik.yildiz.edu.tr Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü