Sunum yükleniyor. Lütfen bekleyiniz

Sunum yükleniyor. Lütfen bekleyiniz

Türkçe Haber Yazılarında Sosyal Ağların İncelenmesi

Benzer bir sunumlar


... konulu sunumlar: "Türkçe Haber Yazılarında Sosyal Ağların İncelenmesi"— Sunum transkripti:

1 Türkçe Haber Yazılarında Sosyal Ağların İncelenmesi
Çağrı Toraman, Fazlı Can Bilkent Üniversitesi Bilgisayar Mühendisliği, Bilgi Erişim Grubu {ctoraman, Akademik Bilişim ’15, Eskişehir

2

3

4

5 Bilkent Haber Portalı

6 (Philippe Wojazer/Reuters)

7

8 1) Varlık ismi tanımlama (Named entity recognition)
Sosyal ağ oluşturmak 1) Varlık ismi tanımlama (Named entity recognition) 2) İlişkilerin belirlenmesi (Ortaklık bilgisi-tabanlı Olasılık kuramı-tabanlı yöntemler)

9 Sosyal ağ oluşturmak / Varlık ismi tanımlama
1) Küçük ve Yazıcı’nın yöntemi* sözlük kaynağı ~260 patern Morfolojik analiz 2) Varlık ismi çözümlemesi (manuel) George Bush ? Gazi Mustafa Kemal = Atatürk * Küçük, D., Yazıcı, A., "Exploiting information extraction techniques for automatic semantic video indexing with an application to Turkish news videos", Knowledge-Based Systems, 24(6): , (2011)

10 Sosyal ağ oluşturmak / İlişkilerin belirlenmesi
Ortaklık bilgisi-tabanlı yöntem Olasılık kuramı-tabanlı yöntem

11 Sosyal ağ oluşturmak / İlişkilerin belirlenmesi
Ortaklık bilgisi-tabanlı yöntem c c = ortak bulundukları haber sayısı

12 Sosyal ağ oluşturmak / İlişkilerin belirlenmesi
Olasılık kuramı-tabanlı yöntem Cover coefficient algoritması* Eşik değeri = 0.2 ? * Can, F., Özkarahan, E. A., "Concepts and effectiveness of the cover coefficient-based clustering methodology for text databases", ACM Transactions on Database Systems, 15(4): , (1990).

13 1) Varlık ismi tanımlama (Named entity recognition)
Sosyal ağ oluşturmak 1) Varlık ismi tanımlama (Named entity recognition) 2) İlişkilerin belirlenmesi (Ortaklık bilgisi-tabanlı Olasılık kuramı-tabanlı yöntemler)

14 Temizlik işlemleri (tekrar edenler, gizli reklam vb.)
Haber koleksiyonu 20/12/ /03/2014 Temizlik işlemleri (tekrar edenler, gizli reklam vb.) Bilkent Haber Portalı

15 Deney sonuçları / Varlık ismi tanımlama

16 Deney sonuçları / Türkçe sosyal ağlar
Şekil 3. Sozcu2014'te en sık görülen 10 insan için ortaklık bilgisi-tabanlı yöntemle oluşan sosyal ağ.

17 Deney sonuçları / Türkçe sosyal ağlar
Şekil 4. Sozcu2014'te en sık görülen 10 insan için olasılık kuramı-tabanlı yöntemle oluşan sosyal ağ. Eşik değeri 0.01'in altında kalan çizgiler silinmiştir.

18 Deney sonuçları / Türkçe sosyal ağlar
Şekil 4. Sozcu2014'te en sık görülen 10 insan için olasılık kuramı-tabanlı yöntemle oluşan sosyal ağ. Eşik değeri 0.05'in altında kalan çizgiler silinmiştir.

19 Deney sonuçları / Türkçe sosyal ağlar
Şekil 4. Sozcu2014'te en sık görülen 100 insan için olasılık kuramı-tabanlı yöntemle oluşan sosyal ağ. Eşik değeri 0.05'in altında kalan çizgiler silinmiştir.

20 Sonuç Türkçe haberlerde sosyal ağlar Varlık ismi tanımlama Varlık ismi çözümleme Aktörler arası ilişkilerin belirlenmesi (ortaklık bilgisi ve olasılık kuramı-tabanlı) Yeni haber koleksiyonunda analiz: Doğru parametre ile olasılık kuramı-tabanlı yöntem, Ayrıntılı deneyler yapılmalı

21 İlginiz için teşekkürler..
Çağrı Toraman – AB’15 - Eskişehir


"Türkçe Haber Yazılarında Sosyal Ağların İncelenmesi" indir ppt

Benzer bir sunumlar


Google Reklamları