Sunum yükleniyor. Lütfen bekleyiniz

Sunum yükleniyor. Lütfen bekleyiniz

Vecdi Emre LEVENT Doç. Dr. Banu DİRİ Türkçe Dokümanlarda Yapay Sinir Ağları ile Yazar Tanıma Doğal Dil İşleme Grubu.

Benzer bir sunumlar


... konulu sunumlar: "Vecdi Emre LEVENT Doç. Dr. Banu DİRİ Türkçe Dokümanlarda Yapay Sinir Ağları ile Yazar Tanıma Doğal Dil İşleme Grubu."— Sunum transkripti:

1 Vecdi Emre LEVENT Doç. Dr. Banu DİRİ Türkçe Dokümanlarda Yapay Sinir Ağları ile Yazar Tanıma Doğal Dil İşleme Grubu

2 Amaç Metinlerden Özellik Çıkarımı Yazar Üslubu Çıkarımı Sonuçlar İçerik

3 Amaç Türkçe gazete köşe yazarlarının belirli sayıda metinlerinin alınarak üsluplarının çıkarımı yapılarak yazar tanıma sistemi gerçekleştirilmiştir. Sisteme verilmeyen yazarların diğer metinleri test için kullanılıp, sistemin performans değerlendirmesi yapılmıştır.

4 Metinlerden Özellik Çıkarımı Cümle Sayısı Kelime Sayısı Ortalama Kelime Sayısı Farklı Kelime Sayısı Nokta Sayısı Virgül Sayısı Satır Sayısı Noktalı Virgül Sayısı Soru İşareti Sayısı Ünlem Sayısı İsim Sayısı Fiil Sayısı Sıfat Sayısı Zamir Sayısı Edat Sayısı Bağlaç Sayısı

5 Metinlerden Özellik Çıkarımı Zemberek Kütüphanesi Cümle İsim Fiil Sıfat Zamir Edat Bağlaç

6 Yazar Üslubu Çıkarımı Yapay Sinir Ağları Giriş Toplama & Dönüştürme İşlemi Çıkış Temel Yapay Sinir Ağları Yapısı Ağırlıklar

7 Yazar Üslubu Çıkarımı Yapay Sinir Ağları Fiil Sayısı Sıfat Sayısı Nokta Sayısı Kelime Sayısı Toplama & Dönüştürme İşlemi Can Ataklı 2 Yazar için 4 Yazarlık Özelliği Kullanılan Yapay Sinir Ağı Ahmet Çakar Toplama & Dönüştürme İşlemi

8 Yazar Üslubu Çıkarımı Dönüştürme(Transfer Fonksiyonu) İşlemi Nöronlardan gelen değerleri toplayıp, istenen Sigmoid – 0 ile 1 arasında sonuç üretir.Sigmoid – 0 ile 1 arasında sonuç üretir. Lineer – 0 veya 1 sonucu üretir.Lineer – 0 veya 1 sonucu üretir. Gauss – Verinin dağılımına göre sonuç üretir.Gauss – Verinin dağılımına göre sonuç üretir. fonksiyonları ile sonuç üretilmektedir.

9 Yazar Üslubu Çıkarımı Öğrenme Oranı: 0 – 1 arasında değer almaktadır. 0’a yakın değerler de öğrenme yavaş ancak kararlıdır. 1’e yakın değerler de ise sistemde öğrenme hızlıdır. ancak ezberler. Momentum Katsayısı: Yerel çözüme takılmamayı sağlar.

10 Yazar Üslubu Çıkarımı Normalizasyon Sistem’e verilecek değerlerin eşit oranda başlamaları için normalize edilmelidir.

11 Yazar Üslubu Çıkarımı Normalizasyon Ör. Bir metinde kelime sayısı 400, ünlem sayısı 10 olduğunda, bu halde sisteme verildiği taktirde üzerinde çalışılan yazar için üslup çıkarımında etkisi olmasa dahi kelime sayısı doğrudan çok etkili gibi çalışacaktır. Ünlem sayısı gerçekte üsluba etkisi çok olsa dahi, sistemde öneminin bulunması zorlaşacaktır.

12 Yazar Üslubu Çıkarımı Normalizasyon Yazarın metinlerinin içerisinde geçen en yüksek ve en düşük değere göre normalizasyon gerçekleştirilmiştir. En düşük değer 0, en yüksek değer 1 olarak atanıp, ara değerler buna göre 0-1 arasında değer almışlardır.

13 Yazar Üslubu Çıkarımı Eğitim Sisteme yazar özelliklerinden çıkarılan değerler verilip, yazarın ne kadar doğru tanındığına bakılır. Sonuca göre nöronlar ile çarpılan ağırlıkların değerleri değiştirilir. Minimum hata veya maksimum döngü değerine ulaşılıncaya kadar tekrar edilir.

14 Yazar Üslubu Çıkarımı Test Eğitimin ardından ağırlıkları optimize edilmiş olan yapay sinir ağları ile test işlemi gerçekleştirilir. Sadece girişler verilerek, çıkışların ne kadar doğru olduğuna bakılır. Ağırlıklarda değişim gerçekleşmez.

15 Deneysel Sonuçlar 50 adet yazar veri seti içerisinden, Farklı kategoride yazan 4, 8, 12, 16 Cinsiyete göre 10 erkek, 10 kadın Güncel kategorisinde yazan 4, 8, 12, 16 yazarlar seçilmiştir.

16 Deneysel Sonuçlar Seçilen her yazarın 40’ar adet metni eğitim için,10 adet metni test için kullanılmaktadır.

17 Deneysel Sonuçlar Farklı Kategoride Yazan Yazarlar Yazar Sayısı F-ÖlçümHata OranıDöngü SayısıSüre(Dk) 410, ,28 80,780, ,46 120,950, ,37 160,730, ,58 Veriseti1 Deney Sonuçları

18 Deneysel Sonuçlar Cinsiyete göre F-ÖlçümHata OranıDöngü SayısıSüre(Dk) 0,750, ,44 Veriseti2 Deney Sonuçları

19 Deneysel Sonuçlar Güncel Kategoride Yazan Yazarlar Yazar Sayısı F-ÖlçümHata OranıDöngü SayısıSüre(Dk) 40,980, ,41 80,980, ,0 120,980, ,29 160,834, ,2 Veriseti3 Deney Sonuçları

20 Deneysel Sonuçlar Yapay Sinir Ağları & SVM(Support Vector Machine) Veriseti1 Yazar Sayısı YSASVM 410,95 80,780,75 120,950,84 160,730,75 YSASVM 0,75 YSASVM 0,981 0,92 0,980,84 0,830,88 Veriseti2 Veriseti3

21 Sonuçlar Uygulamayı Yıldız Teknik Üniversitesi’nin Doğal Dil İşleme Grubu Kemik’in sayfasında yazılımlarımız bölümünden indirilebilinir.

22 Teşekkürler


"Vecdi Emre LEVENT Doç. Dr. Banu DİRİ Türkçe Dokümanlarda Yapay Sinir Ağları ile Yazar Tanıma Doğal Dil İşleme Grubu." indir ppt

Benzer bir sunumlar


Google Reklamları