Sunuyu indir
Sunum yükleniyor. Lütfen bekleyiniz
YayınlayanEmel Fraşerli Değiştirilmiş 5 yıl önce
1
Türkçe Haber Yazılarında Sosyal Ağların İncelenmesi
Çağrı Toraman, Fazlı Can Bilkent Üniversitesi Bilgisayar Mühendisliği, Bilgi Erişim Grubu {ctoraman, Akademik Bilişim ’15, Eskişehir
5
Bilkent Haber Portalı
6
(Philippe Wojazer/Reuters)
8
1) Varlık ismi tanımlama (Named entity recognition)
Sosyal ağ oluşturmak 1) Varlık ismi tanımlama (Named entity recognition) 2) İlişkilerin belirlenmesi (Ortaklık bilgisi-tabanlı Olasılık kuramı-tabanlı yöntemler)
9
Sosyal ağ oluşturmak / Varlık ismi tanımlama
1) Küçük ve Yazıcı’nın yöntemi* sözlük kaynağı ~260 patern Morfolojik analiz 2) Varlık ismi çözümlemesi (manuel) George Bush ? Gazi Mustafa Kemal = Atatürk * Küçük, D., Yazıcı, A., "Exploiting information extraction techniques for automatic semantic video indexing with an application to Turkish news videos", Knowledge-Based Systems, 24(6): , (2011)
10
Sosyal ağ oluşturmak / İlişkilerin belirlenmesi
Ortaklık bilgisi-tabanlı yöntem Olasılık kuramı-tabanlı yöntem
11
Sosyal ağ oluşturmak / İlişkilerin belirlenmesi
Ortaklık bilgisi-tabanlı yöntem c c = ortak bulundukları haber sayısı
12
Sosyal ağ oluşturmak / İlişkilerin belirlenmesi
Olasılık kuramı-tabanlı yöntem Cover coefficient algoritması* Eşik değeri = 0.2 ? * Can, F., Özkarahan, E. A., "Concepts and effectiveness of the cover coefficient-based clustering methodology for text databases", ACM Transactions on Database Systems, 15(4): , (1990).
13
1) Varlık ismi tanımlama (Named entity recognition)
Sosyal ağ oluşturmak 1) Varlık ismi tanımlama (Named entity recognition) 2) İlişkilerin belirlenmesi (Ortaklık bilgisi-tabanlı Olasılık kuramı-tabanlı yöntemler)
14
Temizlik işlemleri (tekrar edenler, gizli reklam vb.)
Haber koleksiyonu 20/12/ /03/2014 Temizlik işlemleri (tekrar edenler, gizli reklam vb.) Bilkent Haber Portalı
15
Deney sonuçları / Varlık ismi tanımlama
16
Deney sonuçları / Türkçe sosyal ağlar
Şekil 3. Sozcu2014'te en sık görülen 10 insan için ortaklık bilgisi-tabanlı yöntemle oluşan sosyal ağ.
17
Deney sonuçları / Türkçe sosyal ağlar
Şekil 4. Sozcu2014'te en sık görülen 10 insan için olasılık kuramı-tabanlı yöntemle oluşan sosyal ağ. Eşik değeri 0.01'in altında kalan çizgiler silinmiştir.
18
Deney sonuçları / Türkçe sosyal ağlar
Şekil 4. Sozcu2014'te en sık görülen 10 insan için olasılık kuramı-tabanlı yöntemle oluşan sosyal ağ. Eşik değeri 0.05'in altında kalan çizgiler silinmiştir.
19
Deney sonuçları / Türkçe sosyal ağlar
Şekil 4. Sozcu2014'te en sık görülen 100 insan için olasılık kuramı-tabanlı yöntemle oluşan sosyal ağ. Eşik değeri 0.05'in altında kalan çizgiler silinmiştir.
20
Sonuç Türkçe haberlerde sosyal ağlar Varlık ismi tanımlama Varlık ismi çözümleme Aktörler arası ilişkilerin belirlenmesi (ortaklık bilgisi ve olasılık kuramı-tabanlı) Yeni haber koleksiyonunda analiz: Doğru parametre ile olasılık kuramı-tabanlı yöntem, Ayrıntılı deneyler yapılmalı
21
İlginiz için teşekkürler..
Çağrı Toraman – AB’15 - Eskişehir
Benzer bir sunumlar
© 2024 SlidePlayer.biz.tr Inc.
All rights reserved.