YALITILMIŞ KELİMELERİN GENETİK ALGORİTMA İLE OTOMATİK OLARAK BÖLÜTLENMESİ Yazarlar: İ.Yücel Özbek, Doç. Dr. Tolga Çiloğlu, Doç. Dr. Kemal Leblebicioğlu, Prof. Dr. Mübeccel Demirekler,
İçerik: Konuşma bölütlendirmenin tanımlanması ve amacı Türkçe konuşmaların bölütlendirilmesi için gerekli ön çalışmalar Genetik algoritma ile konuşma bölütlenme Kromozomların tanımlanması Uygunluk fonksiyonunun tanımlanması Uygunluk fonksiyonunun bölütlere ait sürelerin olabilirlilikleri ile ağırlıklandırılması Yeni kromozomların üretilmesi Sonuç
Konuşma bölütlemenin tanımlanması Konuşma bölütleme, konuşmanın önceden belirlenen fonetik birimlere göre parçalara ayırma işlemidir. Fonetik birimler kendi içerisinde saf (homojen) ve benzer özellikler gösteren alt birimlerdir
Konuşma bölütlemenin amacı Yüksek kalitede bir bölütlendirme konuşma işlemenin hemen her alanında Konuşmanın tanınması Konuşmacının tanıması Konuşmanın sentezlemesi * * * iyi bir altyapı sağlanmasına olanak sağlar.
Konuşmanın otomatik olarak bölütlendirilmesi Elle yapılacak bölütlendirmenin çok uzun zaman almasından ve bölütlendirmeyi yapan kişiye göre öznel olmasından dolayı konuşmanın otomatik olarak bölütlendirilebilmesi gerekmektedir
Türkçe konuşma bölütlendirme için gerekli ön çalışmalar Türkçe fonetik alfabenin belirlenmesi ve sınıflandırılması Elle bölütlendirilmiş ses veri tabanı hazırlanması
İçerik: Genetik algoritma ile konuşma bölütlenme Konuşma bölütlendirmenin tanımlanması ve amacı Türkçe konuşma bölütlendirme için gerekli ön çalışmalar Genetik algoritma ile konuşma bölütlenme Kromozomların tanımlanması Uygunluk fonksiyonunun tanımlanması Uygunluk fonksiyonunun bölütlere ait sürelerin olabilirlilikleri ile ağırlıklandırılması Yeni kromozomların üretilmesi Tek boyutta araştırma ve deneysel sonuçlar Sonuç
Genetik algoritma ile konuşma bölütleme Genetik algoritma, konuşma bölütleme işlemine, başlangıç nesli denilen ve içerisinde bölütleme probleminin çözümüne aday olan kromozomların rasgele seçilmesiyle başlar. Yeni nesiller kromozomların ugunluk fonksiyonunu artıracak şekilde uyarlanması ile elde edilir. Yeni nesillerdeki kromozomların uygunluk fonksiyonunu artırma işlemi durduğunda algoritmanın çözüme ulaştığına karar verilir
Kromozomların yapısı b1 b2 .... bλ bN-2 bN-1 Bölütleme probleminin çözümünü temsil eden kromozomlar, konuşmanın bölüt sınırlarının hücrelere yerleştirilmesiyle elde edilir. Bölüt sayısı N olan bir kromozom yapısı aşağıdaki gibi tanımlanır b1 b2 .... bλ bN-2 bN-1 Kromozomlardaki bölüt sınırlarının sağlaması gereken iki şart;
İçerik: Genetik algoritma ile konuşma bölütlenme Konuşma bölütlendirmenin tanımlanması ve amacı Türkçe konuşma bölütlendirme için gerekli ön çalışmalar Genetik algoritma ile konuşma bölütlenme Kromozomların tanımlanması Uygunluk fonksiyonunun tanımlanması Uygunluk fonksiyonunun bölütlere ait sürelerin olabilirlilikleri ile ağırlıklandırılması Yeni kromozomların üretilmesi Tek boyutta araştırma ve deneysel sonuçlar Sonuç
Uygunluk fonksiyonun tanımlanması Genetik algoritmaya dayalı konuşma bölütlendirme işlemi, bölüt sınırlarını, uygunluk fonksiyonunu maksimum yapacak şekilde yerleştirilmesiyle gerçekleştirilir. Uygunluk fonksiyonu maliyet fonksiyonu yardımıyla eldedildi. Uygunluk fonksiyonunun genel gösteriminin karmaşıklığından dolayı, uygunluk fonksiyonu bir örnek üzerinde anlatılacaktır
Örnek; Öznitelik vektör sayısı 16 olduğu varsayılan ‘siu’ kelimesi için aşağıda verilen bölüt sınırları göre maliyet fonksiyonunun belirlenmesi 1- Herbir bölüt sınırının sağ ve solundaki 3 vektörün ortalama değeri bulunur b1 b2 O1 O2 O3 O4 O6 O5 O7 O8 O9 O10 O11 O14 O12 O15 O16 O13
Örnek(devam) 2- s, i, u harflerine ait model vektörlerin Ms, Mi, Mu olduğu varsayılırsa O1 O2 O3 O4 O6 O5 O7 O8 O9 O10 O11 O14 O12 O15 O16 O13 b1 b2 3- Toplam maliyet fonksiyonu D D = D1 + D2 + D3
İçerik: Genetik algoritma ile konuşma bölütlenme Konuşma bölütlendirmenin tanımlanması ve amacı Türkçe konuşma bölütlendirme için gerekli ön çalışmalar Genetik algoritma ile konuşma bölütlenme Kromozomların tanımlanması Uygunluk fonksiyonunun tanımlanması Uygunluk fonksiyonunun bölütlere ait sürelerin olabilirlilikleri ile ağırlıklandırılması Yeni kromozomların üretilmesi Tek boyutta araştırma ve deneysel sonuçlar Sonuç
Ses birimlerine ait süre bilgilerinin gamma fonksiyonu ile modellenmesi Ses birimleri doğası gereği belirli sürelerde oluşurlar. Bölütlemede, bu bilgiden faydalanmak için bütün seslerin süre bilgileri gamma fonksiyonu yardımıyla modellendi Modeller kullanılarak bölüt içlerindeki maliyet fonksiyonları ağırlıklandırıldı
b, r ve e selerine ait süre modelleri Örnek; Süre modelleri b, r ve e selerine ait süre modelleri
Maliyet Fonksiyonu nasıl ağırlıklandırılır? Örnek (Devam) Toplam maliyet fonksiyonu D = D1 + D2 + D3 (olduğu bulunmuştu) Ağırlıklı toplam maliyet fonksiyonu AD = ? b1 b2 O1 O2 O3 O4 O6 O5 O7 O8 O9 O10 O11 O14 O12 O15 O16 O13 Ağırlıklı toplam maliyet fonksiyonu AD = D1yeni + D2yeni + D3yeni
Ses süresi olabilirliğinin nasıl hesaplanır? 0,2 ?
İçerik: Genetik algoritma ile konuşma bölütlenme Konuşma bölütlendirmenin tanımlanması ve amacı Türkçe konuşma bölütlendirme için gerekli ön çalışmalar Genetik algoritma ile konuşma bölütlenme Kromozomların tanımlanması Uygunluk fonksiyonunun tanımlanması Uygunluk fonksiyonunun bölütlere ait sürelerin olabilirlilikleri ile ağırlıklandırılması Yeni kromozomların üretilmesi Sonuç
Yeni Kromozomların üretilmesi (1) Seçme: Kromozomlar bir nesilden diğer bir nesile Roulette Wheel seçme yöntemiyle aktarıldı. Çaprazlama ve Mutasyon: Bu çalışmada aritmetik çaprazlama ve doğrusal mutasyon yöntemleri uygulandı. Bunlara ek olarak nesiller arasında en iyi kromozomun aktarılmasını sağlamak için elitizim (en iyi seçme) kullanıldı.
Yeni Kromozomların üretilmesi (2) Tek botutta araştırma:Yapmış oldığumuz bu çalışmaya özgü olan tek boyutta araştırma yöntemiyle, nesillerdeki en iyi kromozoma ait herbir bölüt sınırı belirli oranlarda sağa ve sola kaydırılarak uygunluk fonksiyonu gözlendi. Uygunluk fonksiyonunda artma olduğu tesbit edilen noktalardaki bölüt sınırları yeni kromozomların oluşturulmasında kullanıldı.
Genetik algoritma ile elde edilen deneysel sonuçalar ÜN PT SÜ PS GEN YD PÖB SES TOPLAM 55/111 13/21 424/488 11/11 355/463 411/614 398/498 70/108 1737/2314 % 49% 61% 86% 100 76% 66% 79% 64% 75% 618/737 21/29 10/11 39/48 30/49 12/15 732/893 83% 72% 90% 81% 80% 381/415 5/6 24/44 1/5 13/13 35/40 101/125 28/36 588/684 91% 54% 20% 87% 77% 85% 112/117 2/4 7/9 6/9 3/3 131/144 95% 50% 240/305 18/22 8/8 1/8 14/23 74/100 12/35 373/510 78% 12% 60% 74% 34% 73% 432/585 29/35 25/28 47/61 95/111 5/8 636/831 82% 89% 62% 701/12 794/919 9/9 113/130 11/16 7/11 17/21 1023/1222 68% 63% 69/73 7/13 30/35 17/17 21/23 44/51 188/212 94% 53% 88% TOP 1977/2455 828/972 557/666 135/158 433/557 581/829 765/964 132/209 5408/6810 70% %80 başarı
Sonuç:
TEŞEKKÜRLER..,
ODTU SIU
TEŞEKKÜRLER..,