Türkçe Dokümanlarda Yapay Sinir Ağları ile Yazar Tanıma

Slides:



Advertisements
Benzer bir sunumlar
Nefize Gökmen, Ömer Deniz, Ayşe Yıldız
Advertisements

Yrd. Doç. Dr. Mustafa Akkol
Cümlede , fiillerin anlamını etkileyen kelimelere ne ad verilir?
Kısa Yoldan Çarpma İşlemi
DOĞAL SAYILAR.
T.C. İNÖNÜ ÜNİVERSİTESİ Arapgir Meslek YÜKSEKOKULU
Atlayarak Sayalım Birer sayalım
ÇÖZÜM SÜRECİNE TOPLUMSAL BAKIŞ
Etkensel Deney Tasarımı
Diferansiyel Denklemler
ÖRNEKLEME DAĞILIŞLARI VE TAHMİNLEYİCİLERİN ÖZELLİKLERİ
VOLEYBOL İNDEKS (OYUNCULARIN FİZİK YETENEKLERİNİN ÖLÇÜMÜ)
KÜTÜPHANELERDE HALKLA İLİŞKİLER ve PAZARLAMA ANKARA ÜNİVERSİTESİ KÜTÜPHANESİ ÖRNEĞİ Tuna CAN & E.Erdal AYDIN
KIR ÇİÇEKLERİM’ E RakamlarImIz Akhisar Koleji 1/A.
Verimli Ders Çalışma Teknikleri.
NOKTALAMA VE YAZIM KURALLARI
CAN Özel Güvenlik Eğt. Hizmetleri canozelguvenlik.com.tr.
SİMPLEKS YÖNTEM (Özel Durumlar)
GÖK-AY Özel Güvenlik Eğt. Hizmetleri
1/20 PROBLEMLER A B C D Bir fabrikada kadın ve çocuk toplam 122 işçi çalışmaktadır. Bu fabrikada kadın işçilerin sayısı, çocuk işçilerin sayısının 4 katından.
Okulu: 75.Yıl M. Akif Ersoy İlköğr. Okulu Süre:40 dakika Ders:Türkçe
Noktalama işaretleri ( NOKTA , virgül , noktalı virgül )
HAZIRLAYAN:SAVAŞ TURAN AKKOYUNLU İLKÖĞRETİM OKULU 2/D SINIFI
1/25 Dört İşlem Problemleri A B C D Sınıfımızda toplam 49 öğrenci okuyor. Erkek öğrencilerin sayısı, kız öğrencilerin sayısından 3 kişi azdır.
ÖLÇME VE DEĞERLENDİRME DERSİ
BESLENME ANEMİLERİ VE KORUNMA
CBÜ HAFSA SULTAN HASTANESİ ENFEKSİYON KONTROL KOMİTESİ 2011 OCAK-ARALIK 2012 OCAK- MART VERİLERİ.
KARE, DİKDÖRTGEN VE ÜÇGENİN ÖZELLİKLERİ
ONDALIK KESİRLER Şuayip POLAT MATEMATİK 4 5. ÜNİTE
Temel Bilgi Teknolojileri
2010-ÖSYS Öğrenci Seçme ve Yerleştirme Sistemi. 1.AŞAMA: Yükseköğretime Geçiş Sınavı (YGS) 2.AŞAMA: Lisans Yerleştirme Sınavları (LYS)
İçindekiler: Marjinal Hâsılat Fonksiyonunun Ortalama Hâsılat Fonksiyonundan Elde Edilmesi 2. Marjinal Maliyet ve Ortalama Maliyet Fonksiyonları Arasındaki.
Onluk ve birliklere ayırarak toplama işlemi
DOĞUM VE SAĞLIK: DOĞUM SAYISI SAĞLIK DURUMUNU ETKİLİYOR MU ? Amaç Annelik kadının varoluşunda ona bahşedilen bir duygudur. Anneliğin birçok getirisi olduğu.
OLASILIK ve OLASILIK DAĞILIMLARI
“Akademik Bilişim ’02” 6-8 Şubat 2002, Konya Y.T. Türkçe Arama Motorlarında Performans Değerlendirme Yaşar Tonta Hacettepe Üniversitesi
EĞİTİMDE ÖLÇME VE DEĞERLENDİRME
Sürekli Zaman Aktif Filtre Tasarımı
Yıldız Teknik Üniversitesi Makina Müh. Bölümü
Yard. Doç. Dr. Mustafa Akkol
İKİNCİ DERECEDEN FONKSİYONLAR ve GRAFİKLER
Yrd. Doç. Dr. Ayhan Demiriz
ANA BABA TUTUMU ENVANTERİ
Test : 2 Konu: Çarpanlar ve Katlar
TIP FAKÜLTESİ ÖĞRENCİLERİNİN BAŞARISINDA
BENZETİM Prof.Dr.Berna Dengiz 3. Ders Monte Carlo Benzetimi
BİYOİNFORMATİK NEDİR? BİYOİNFORMATİKTE KULLANILAN SINIFLAMA YÖNTEMLERİ
KELİME TÜRLERİ 1. İSİM ( AD ) 7. ÜNLEM 2. SIFAT 8. FİİL
‘’de’’nin Yazımı.
14.ULUSAL TURİZM KONGRESİ 2013 YILI BİLDİRİLERİ ÜZERİNE BİR DEĞERLENDİRME Prof. Dr. A. Celil ÇAKICI Mersin Üniversitesi Turizm Fakültesi.
T M SAYI AR Z.
Proje Konuları.
BM-103 Programlamaya Giriş Güz 2014 (4. Sunu)
ÜÇGENDE AÇILAR 7.sınıf.
YAPAY SİNİR AĞLARI VE BAYES SINIFLAYICI
Kaynak: NOKTALAMA İŞARETLERİ Kaynak:
USLE P FAKTÖRÜ DR. GÜNAY ERPUL.
Diferansiyel Denklemler
SÜREKLİ ŞANS DEĞİŞKENLERİ
Esra ALTUNBİLEK DANİŞMENT ÇİÇEKLİ ORTAOKULU
ÖĞRETİM MATERYAL TEKNİK VE TASARIMI DERSİ
Yapay sinir ağı, basit işlemci ünitelerinden oluşmuş, çok
YAPAY SİNİR AĞLARININ YAPISI VE TEMEL ELEMANLARI
Çok Katmanlı Algılayıcı-ÇKA (Multi-Layer Perceptron)
Mehmet Fatih KARACA Yrd. Doç. Dr. Salih GÖRGÜNOĞLU
ARAŞTIRMANIN YAZILMASI III: METİN AKTARMALARI
Mehmet Fatih KARACA Mustafa GÜNEL Akif Alkan TAŞTAN
SÖZCÜK TÜRLERİ İSİM ZAMİR SIFAT ZARF EDAT BAĞLAÇ ÜNLEM FİİL FİİLİMSİ.
Çok Katmanlı Algılayıcı-ÇKA (Multi-Layer Perceptron)
Sunum transkripti:

Türkçe Dokümanlarda Yapay Sinir Ağları ile Yazar Tanıma Doğal Dil İşleme Grubu Vecdi Emre LEVENT Doç. Dr. Banu DİRİ

İçerik Amaç Metinlerden Özellik Çıkarımı Yazar Üslubu Çıkarımı Sonuçlar

Amaç Türkçe gazete köşe yazarlarının belirli sayıda metinlerinin alınarak üsluplarının çıkarımı yapılarak yazar tanıma sistemi gerçekleştirilmiştir. Sisteme verilmeyen yazarların diğer metinleri test için kullanılıp, sistemin performans değerlendirmesi yapılmıştır.

Metinlerden Özellik Çıkarımı Cümle Sayısı Kelime Sayısı Ortalama Kelime Sayısı Farklı Kelime Sayısı Nokta Sayısı Virgül Sayısı Satır Sayısı Noktalı Virgül Sayısı Soru İşareti Sayısı Ünlem Sayısı İsim Sayısı Fiil Sayısı Sıfat Sayısı Zamir Sayısı Edat Sayısı Bağlaç Sayısı

Metinlerden Özellik Çıkarımı Zemberek Kütüphanesi Cümle İsim Fiil Sıfat Zamir Edat Bağlaç

Yazar Üslubu Çıkarımı Yapay Sinir Ağları Giriş Toplama & Ağırlıklar Dönüştürme İşlemi Ağırlıklar Giriş Çıkış Giriş Giriş Temel Yapay Sinir Ağları Yapısı

2 Yazar için 4 Yazarlık Özelliği Kullanılan Yazar Üslubu Çıkarımı Yapay Sinir Ağları Toplama & Dönüştürme İşlemi Toplama & Dönüştürme İşlemi Fiil Sayısı Sıfat Sayısı Can Ataklı Nokta Sayısı Ahmet Çakar Kelime Sayısı 2 Yazar için 4 Yazarlık Özelliği Kullanılan Yapay Sinir Ağı

Yazar Üslubu Çıkarımı Dönüştürme(Transfer Fonksiyonu) İşlemi Nöronlardan gelen değerleri toplayıp, istenen Sigmoid – 0 ile 1 arasında sonuç üretir. Lineer – 0 veya 1 sonucu üretir. Gauss – Verinin dağılımına göre sonuç üretir. fonksiyonları ile sonuç üretilmektedir.

Yazar Üslubu Çıkarımı Öğrenme Oranı: 0 – 1 arasında değer almaktadır. 0’a yakın değerler de öğrenme yavaş ancak kararlıdır. 1’e yakın değerler de ise sistemde öğrenme hızlıdır. ancak ezberler. Momentum Katsayısı: Yerel çözüme takılmamayı sağlar.

Yazar Üslubu Çıkarımı Normalizasyon Sistem’e verilecek değerlerin eşit oranda başlamaları için normalize edilmelidir.

Yazar Üslubu Çıkarımı Normalizasyon Ör. Bir metinde kelime sayısı 400, ünlem sayısı 10 olduğunda, bu halde sisteme verildiği taktirde üzerinde çalışılan yazar için üslup çıkarımında etkisi olmasa dahi kelime sayısı doğrudan çok etkili gibi çalışacaktır. Ünlem sayısı gerçekte üsluba etkisi çok olsa dahi, sistemde öneminin bulunması zorlaşacaktır.

Yazar Üslubu Çıkarımı Normalizasyon Yazarın metinlerinin içerisinde geçen en yüksek ve en düşük değere göre normalizasyon gerçekleştirilmiştir. En düşük değer 0, en yüksek değer 1 olarak atanıp, ara değerler buna göre 0-1 arasında değer almışlardır.

Yazar Üslubu Çıkarımı Eğitim Sisteme yazar özelliklerinden çıkarılan değerler verilip, yazarın ne kadar doğru tanındığına bakılır. Sonuca göre nöronlar ile çarpılan ağırlıkların değerleri değiştirilir. Minimum hata veya maksimum döngü değerine ulaşılıncaya kadar tekrar edilir.

Yazar Üslubu Çıkarımı Test Eğitimin ardından ağırlıkları optimize edilmiş olan yapay sinir ağları ile test işlemi gerçekleştirilir. Sadece girişler verilerek, çıkışların ne kadar doğru olduğuna bakılır. Ağırlıklarda değişim gerçekleşmez.

Deneysel Sonuçlar 50 adet yazar veri seti içerisinden, Farklı kategoride yazan 4, 8, 12, 16 Cinsiyete göre 10 erkek, 10 kadın Güncel kategorisinde yazan 4, 8, 12, 16 yazarlar seçilmiştir.

Deneysel Sonuçlar Seçilen her yazarın 40’ar adet metni eğitim için,10 adet metni test için kullanılmaktadır.

Deneysel Sonuçlar Farklı Kategoride Yazan Yazarlar Yazar Sayısı F-Ölçüm Hata Oranı Döngü Sayısı Süre(Dk) 4 1 0,09 2.792 3,28 8 0,78 11.119 27,46 12 0,95 0,99 11.619 44,37 16 0,73 0,1 13.768 71,58 Veriseti1 Deney Sonuçları

Deneysel Sonuçlar Cinsiyete göre Veriseti2 Deney Sonuçları F-Ölçüm Hata Oranı Döngü Sayısı Süre(Dk) 0,75 0,16 35.000 204,44 Veriseti2 Deney Sonuçları

Deneysel Sonuçlar Güncel Kategoride Yazan Yazarlar Yazar Sayısı F-Ölçüm Hata Oranı Döngü Sayısı Süre(Dk) 4 0,98 0,1 5.334 10,41 8 12.876 51,0 12 14.802 86,29 16 0,83 4,18 50.000 262,2 Veriseti3 Deney Sonuçları

Deneysel Sonuçlar Yapay Sinir Ağları & SVM(Support Vector Machine) Yazar Sayısı YSA SVM 4 1 0,95 8 0,78 0,75 12 0,84 16 0,73 YSA SVM 0,75 YSA SVM 0,98 1 0,92 0,84 0,83 0,88 Veriseti2 Veriseti1 Veriseti3

Sonuçlar http://www.kemik.yildiz.edu.tr/ Uygulamayı Yıldız Teknik Üniversitesi’nin Doğal Dil İşleme Grubu Kemik’in sayfasında yazılımlarımız bölümünden indirilebilinir. http://www.kemik.yildiz.edu.tr/

Teşekkürler