Konuşma Terapisine Yönelik Otomatik Konuşma Tanıma Yöntemleri

Slides:



Advertisements
Benzer bir sunumlar
8. SINIF 3. ÜNİTE BİLGİ YARIŞMASI
Advertisements

HEMODİYALİZDE KALİTE ANKETİ Kriter belirleme ve mevcut durum
SES BİLGİSİ (ÜNSÜZ BENZEŞMESİ)
Sinan Doğan, Esra Beyoğlu
Diferansiyel Denklemler
1 Ocak 1989 – 31 Aralık 2004 Güneş Tutulmaları (3)
T.C. İNÖNÜ ÜNİVERSİTESİ Arapgir Meslek YÜKSEKOKULU
Eğitsel Yazılımların Değerlendirilmesi
Linear Predictive Coding ve Dynamic Time Warping Teknikleri Kullanılarak Ses Tanıma Sistemi Geliştirilmesi Murat Kemal BAYGÜN Egecom Ltd.
Ülkemizdeki Mühendislik Eğitiminde Akreditasyon
TİE Platformu Yürütme Kurulu Başkanı
Enerji Sistemlerinde Yöneylem Araştırması EBT Bahar Yarıyılı
KnowTech3D 3 Nisan 2014.
Öğr.Gör.Dr. S. Sadi SEFEROĞLU & Arş. Gör. Fatih GÜRSUL
Atlayarak Sayalım Birer sayalım
ÜNİTE DEĞERLENDİRMESİ 1.Sınıf Türkçe
AHMET NAFİZ DEMİR * * 2005 a.g.b k.g.b z.g.e a.g.b a.g.b o.l.m a.g.b
INTERNET TABANLI HASTA KAYDI PAYLAŞIMI VE TELEKONSÜLTASYON PLATFORMU
Diferansiyel Denklemler
ITY529S İTY’DE KARAR VERME
TEKNOLOJİNİN BİLİMSEL İLKELERİ
AçIk ve Uzaktan Öğrenmede KalİTE Güvence
Zehra TAŞKIN HACETTEPE ÜNİVERSİTESİ BİLGİ VE BELGE YÖNETİMİ BÖLÜMÜ TÜRK BİLİM ADAMLARININ DEPREM LİTERATÜRÜNE KATKILARI: MARMARA.
GYTE BİL MUH BİL 495 ve 496 İLK SUNUM FORMATI
HOŞGELDİNİZ YA/EM Doktora Öğrencileri Kolokyumu 2002.
KIR ÇİÇEKLERİM’ E RakamlarImIz Akhisar Koleji 1/A.
YMT 222 SAYISAL ANALİZ (Bölüm 6a)
TIP FAKÜLTESİ VE SINIF ÖĞRETMENLİĞİ ÖĞRENCİLERİNİN BİRBİRLERİNE BAKIŞ AÇILARI.
Verimli Ders Çalışma Teknikleri.
SOME-Bus Mimarisi Üzerinde Mesaj Geçişi Protokolünün Başarımını Artırmaya Yönelik Bir Algoritma Çiğdem İNAN, M. Fatih AKAY Çukurova Üniversitesi Bilgisayar.
CAN Özel Güvenlik Eğt. Hizmetleri canozelguvenlik.com.tr.
HAZIRLAYAN:SAVAŞ TURAN AKKOYUNLU İLKÖĞRETİM OKULU 2/D SINIFI
İŞARET DİLİ.
END3061 SİSTEM ANALİZİ VE MÜHENDİSLİĞİ Güz Yarıyılı.
OHSAS NEDİR? FİRMA ADI.
BESLENME ANEMİLERİ VE KORUNMA
31. IFUW (Uluslararası Üniversiteli Kadınlar Federasyonu) Kongre ve Konferansı 16 – 21 Ağustos 2013.
KONUŞMACI DÖNÜŞTÜRME Doç. Dr. Levent M. Arslan Oytun Türk
Uygulamalı Örneklem Seçimi
DİKEY GEÇİŞ SINAVI (DGS)
HACETTEPE ÜNİVERSİTESİ AFET TIBBI UYGULAMA VE ARAŞTIRMA MERKEZİ
PÇAĞEXER / SAYILAR Ali İhsan TARI İnş. Yük. Müh. F5 tuşu slaytları çalıştırmaktadır.
GRUP DEM Durna Özer Esma Aydınoğlu Merve Yurttaş
TEST – 1.
Görsel Programlama Dr. Muhammet Balcılar
Tüketici Trend Araştırması Aralık 2009 Sosyal Telefon.
Fulya Tuğçe OMUZLUOĞLU Yrd.Doç.Dr. Bünyamin TAMYÜREK
SİU 2009 Sınıflandırıcılarda Hata Ölçülmesi ve Karşılaştırılması için İstatistiksel Yöntemler Ethem Alpaydın Boğaziçi Üniversitesi
ÜNSÜZLERLE İLGİLİ SES OLAYLARI
ÜNSÜZLERLE İLGİLİ SES OLAYLARI - 1
Çiğdem EROL HAYATBOYU ÖĞRENME ERASMUS WEB SİTESİ 13 Mart 2008 Tanışma Toplantısı.
9.Sınıf Sağlık Hizmetlerinde İletişim
ANA BABA TUTUMU ENVANTERİ
Öğretim Teknolojileri ve Materyal Tasarımı Öğretimde Görsel-İşitsel Araçlar Gerçek Eşyalar ve Modeller Dr. Süleyman Sadi SEFEROĞLU Hacettepe Üniversitesi,
Hemodiyaliz Hastalarında Endovasküler Yolla Tedavi Edilen Santral Ven Darlık ve Tıkanıklıklarının Uzun Dönem Sonuçları Dr. Serkan Gür, Şifa Üniversitesi.
“YETİŞKİNLERİN OYUN OYNAMA ALIŞKANLIKLARI” ARAŞTIRMASI
ANKOS Kullanım İstatistikleri Kullanım İstatistikleri Çalışma Grubu ANKOS 7.Yıllık Toplantısı, 31 Mayıs-2 Haziran 2007 Karadeniz Teknik Üniversitesi.
SAYILAR NUMBERS. SAYILAR 77 55 66 99 11 33 88.
MDK ALT YAPI KIYASLAMA ÇALIŞMA GRUBU
Dr. Süleyman Sadi SEFEROĞLU Hacettepe Üniversitesi, Eğitim Fakültesi
ÜNSÜZLER Gökçe Hanım EMİR
PÇAĞEXER / SAYILAR Ali İhsan TARI İnş. Yük. Müh. F5 tuşu slaytları çalıştırmaktadır.
ÖĞR. GRV. Ş.ENGIN ŞAHİN BİLGİ VE İLETİŞİM TEKNOLOJİSİ.
Diferansiyel Denklemler
Internet’te uzaktan eğitim dersi tasarımı nesnelci ve oluşturmacı (objectivist and constructivist) öğrenim paradigmalarının karması bir gelişim modeli.
Dokuz Eylül Üniversitesi Çevre Araştırma ve Uygulama Merkezi
İTÜ Telsiz Haberleşme Araştırma Laboratuvarı (THAL) SIU 2015, Malatya BAŞLIK ………… BAŞLIK DEVAMI…. DEVAMI…. YAZAR 1, YAZAR 2, …. E-POSTA: {yazar1,
Enerji Sistemlerinde Akıllı Sistem Uygulamaları Akademik Yılı Bahar yarıyılı Doç.Dr. Raşit ATA
Deniz Tekin Ersan Şükran Alan
NİŞANTAŞI ÜNİVERSİTESİ TURİZM COĞRAFYASI
Sunum transkripti:

Konuşma Terapisine Yönelik Otomatik Konuşma Tanıma Yöntemleri 1 Konuşma Terapisine Yönelik Otomatik Konuşma Tanıma Yöntemleri Oytun Türk Levent M. Arslan oytun@sestek.com.tr arslanle@boun.edu.tr Boğaziçi Üniversitesi, Elektrik-Elektronik Müh. Bölümü, www.busim.ee.boun.edu.tr Sestek A.Ş., Ar-Ge Bölümü İTÜ Ayazağa Kampüsü, ARI-1 Teknopark Binası, İstanbul www.sestek.com.tr

İÇERİK AMAÇ 2 Konuşma İşleme ve Otomatik Konuşma Tanıma Konuşma Bozuklukları ve Konuşma İşleme Konuşma Tanıma Yöntemleri Yalıtılmış Fonem Tanıma Türkçe Yalıtılmış Sözcük Tanıma Birbirine Çok Yakın Türkçe Sözcüklerin Tanınması Sonuçlar AMAÇ Türkçe konuşma terapisinde kullanılabilecek konuşma tanıma yöntemlerinin incelenmesi

KONUŞMA İŞLEME VE KONUŞMA TANIMA 3 KONUŞMA İŞLEME VE KONUŞMA TANIMA Akustik Analiz Konuşma Kodlama Konuşma İşleme Konuşma Sentezi Konuşma Tanıma

KONUŞMA TERAPİSİ 4 Teşhis: Okuma testleri Tedavi: Okuma testleri Akustik ölçüm: f0, tilt, jitter, shimmer, harmonikler, ... Fiziksel muayene, işitme testleri, ... Fonemlerin seslendirilmesi Hecelerin ve hece gruplarının seslendirilmesi Sözcüklerin seslendirilmesi Cümlelerin seslendirilmesi Paragraf okuma çalışmaları Görsel/İşitsel egzersizler

KONUŞMA TERAPİSİ VE KONUŞMA İŞLEME 5 KONUŞMA TERAPİSİ VE KONUŞMA İŞLEME Yöntemler: Avantajlar: Konuşma tanıma Akustik analiz Konuşma sentezi Hızlı teşhis Terapi sürecinin izlenmesi Değerlendirmede nesnel ölçütlerin kullanılması Yardımcı yazılım araçlarının geliştirilmesi Kendi kendine test imkanı

6 Konuşma İşleme Konuşma Bozuklukları Artikülasyon Konuşma Tanıma Akustik Analiz Akış Kusurları Süre Analizi Ses Kalitesi Bozuklukları Ses Kalitesi Analizi Vurgu Sorunları Vurgu Analizi

İncelenen Konuşma Tanıma Yöntemleri 7 İncelenen Konuşma Tanıma Yöntemleri Üç problem: Yalıtılmış fonemlerin tanınması Sözcük listesinden tanıma Birbirine çok yakın sözcüklerin tanınması Yöntem: Saklı Markov Modelleri’ne (SMM) dayalı konuşma tanıma Mel frekansı kepstrum katsayıları, log enerji, ötümlülük olasılığı (Pö ), fark ve ivme parametreleri Enerji eşikleme tabanlı konuşma başlangıç/bitiş anı sezimi Fonem Türü Fonem Çifti Örnek Diş-dudak ünsüzleri /f/-/v/ defa – deva Dil ucu-Dişeti ünsüzleri /s/-/z/ /t/-/d/ kas – kaz katı - kadı Dişeti-damak ünsüzleri /ş/-/j/ /c/-/ç/ beş – bej cam – çam Çift dudak ünsüzleri /p/-/b/ put – but Art damak ünsüzleri /k/-/g/ kar – gar Dişeti ünsüzü ve sert (ön) damak ünsüzü /r/-/y/ bir – biy Türkçe’de sıklıkla birbirine karıştırılan fonem çiftleri

Yalıtılmış Fonem Tanıma Yalıtılmış fonem tanımada kullanılan fonemler 8 Yalıtılmış Fonem Tanıma Veritabanı: 14 fonem (x5), 16 KHz, ~2 s. 12 konuşmacı (4 bayan, 8 bay), 20-36 yaş Çapraz-geçerleme: (11 kişi eğitim, 1 kişi test) x 12 Ünlüler /a/, /e/, /ı/, /i/, /o/, /ö/, /u/, /ü/ Ünsüzler /f/, /j/, /s/, /ş/, /v/, /z/ Yalıtılmış fonem tanımada kullanılan fonemler

Yalıtılmış Fonem Tanıma: Sonuçlar 9 Yalıtılmış Fonem Tanıma: Sonuçlar Ortalama: %84.9 (σ = 6.8) En düşük: /ı/ (%63.3) /u/ (%77.5) /ü/ (%79.6) En çok hata: /ı//ö/ (%34.7) /o//u/ (%16.3) /u//o/ (%14.3) Fonem tanıma oranları (%)

Türkçe Yalıtılmış Sözcük Tanıma 126 Türkçe sözcük için tanıma oranları 10 Türkçe Yalıtılmış Sözcük Tanıma Veritabanı: Terapide kullanılan 126 sözcük, 16 KHz 11 konuşmacı (4 bayan, 7 bay), 20-36 yaş Model: N+2 durumlu SMM (N = fonem sayısı) Her durum 2 bileşenli GKM MFKK + Log enerji + Pö + Fark parametreleri Çapraz-geçerleme: (10 kişi eğitim, 1 kişi test) x 11 Eğitim ve Test Tanıma Oranı Konuşmacı bağımsız %94.2 Konuşmacı bağımlı %97.2 126 Türkçe sözcük için tanıma oranları

Birbirine Çok Yakın Türkçe Sözcüklerin Tanınması 11 Birbirine Çok Yakın Türkçe Sözcüklerin Tanınması Veritabanı: 24 sözcük çifti (x5), 16 KHz 9 kişi (4 bayan, 5 bay), 20-36 yaş Model: N+2 durumlu SMM Her durum 2 bileşenli GKM MFKK + Log en. + Pö + Fark Çapraz-geçerleme: (8 kişi eğitim, 1 kişi test) x 9 Konuşmacı bağımlı Birbirine çok yakın sözcükler

Birbirine Çok Yakın Türkçe Sözcüklerin Tanınması 12 Birbirine Çok Yakın Türkçe Sözcüklerin Tanınması Eğitim ve Test Tanıma Oranı Konuşmacı bağımsız %80.3 Konuşmacı bağımlı %88.0 Ortalama tanıma oranları En az hata: /r/-/y/ (%1.7) /t/-/d/ (%2.5) En çok hata: /k/-/g/ (%25.0) /c/-/ç/ (%16.7) Konuşmacı bağımlı tanıma oranları

(*) Birbirine çok yakın sözcükler 13 SONUÇLAR /ı/-/ö/ için tanıma oranı düşük Hastaya uyarlanabilir terapi yazılımı geliştiriliyor Yöntemler terapiste yardımcı olabilecek Konuşma terapisine yönelik konuşma tanıma yöntemleri için tanıma oranları (*) Birbirine çok yakın sözcükler

Ünlü Tanıma Terapist (Prototip) 14 SESTEK YAZILIMLARI Ünlü Tanıma Terapist (Prototip)

15 TARTIŞMA Disiplinlerarası ortak çalışma gerekli: Mühendislik, Tıp, Dilbilim, Psikoloji, Pedagoji, ... Türkçe fonetik – B.Ü. Dilbilim bölümüyle: http:\\www.busim.ee.boun.edu.tr\speech\speech.html Türkçe için temel incelemelerin gerçekleştirilmesi: Türk, O., Şayli, Ö., Özsoy, S. ve Arslan, L., “Türkçe’de Ünlüler Formant Frekans İncelemesi”, 18. Ulusal Dilbilim Konferansı (Ankara, Mayıs 2004) Arısoy, E., Özsoy S., Arslan, L., Türk, O., ... “Acoustic Analysis of Turkish Sounds” ICTL 2004 (İzmir, Ağustos 2004) Türkçe terapi testleri tasarlanmalı: Artikülasyon testleri, akış testleri, vurgu testleri, ses kalitesi testleri, ... Türk, O. Ve Arslan, L., “Pronunciation Scoring for the Hearing-Impaired”, SPECOM (St. Petersburg, Rusya, Eylül 2004) KAYNAKÇA [1] Russel, M., Brown, C., Skilling, A., Series, R., Wallace, J., Bonham, B. ve Barker, P., “Applications of Automatic Speech Recognition to Speech and Language Development in Young Children”, Proceedings of ICSLP 1996, Philedelphia, PA, ABD, 1996, sf. 176-179. [2] Neumeyer, L. F. H., Weintraub, M. ve Price, P., “Pronunciation Scoring of Foreign Language Student Speech”, Proceedings of ICSLP 1996, Philedelphia, PA, ABD, 1996, sf. 1457-1460. [3] Neumeyer, L. F. H., Digalakis, V. ve Weintraub, M., “Automatic scoring of pronunciation quality”, Speech Communication, 30 (2-3), sf. 83-93, 2000. [4] Bunnell, H. T., Yarrington, D. M., ve Polikoff, J. B., “STAR: Articulation training for young children”, Proceedings of ICSLP 2000, c. 4, sf. 85-88. [5] Witt, S. M. ve Young, S. J., “Phone-level pronunciation scoring and assessment for interactive language learning”, Speech Communication, 30 (2-3), sf. 95-108, 2000. [6] Chanwoo K. C. ve Sung, W., “Implementation of an intonational quality assessment system”, Proceedings of ICSLP 2002, Denver, Colorado, ABD, c. 2, sf. 1225-1228. [7] Rabiner, L. R. ve Juang, B.-H., Fundamentals of Speech Recognition, Prentice-Hall, Inc., New Jersey, NJ, 1993. [8] Girgin, C., M., Türkçe konuşan doğal işitsel sözel yöntemle eğitim gören işitme engelli kız çocukların konuşma anlaşılırlığı ile süre ve perde özellikleri ilişkisi, Anadolu Üniversitesi Yayınları, No. 1167., Eğitim Fakültesi Yayınları, No. 63., 1999.