Sunum yükleniyor. Lütfen bekleyiniz

Sunum yükleniyor. Lütfen bekleyiniz

Linear Predictive Coding ve Dynamic Time Warping Teknikleri Kullanılarak Ses Tanıma Sistemi Geliştirilmesi Murat Kemal BAYGÜN Egecom Ltd.

Benzer bir sunumlar


... konulu sunumlar: "Linear Predictive Coding ve Dynamic Time Warping Teknikleri Kullanılarak Ses Tanıma Sistemi Geliştirilmesi Murat Kemal BAYGÜN Egecom Ltd."— Sunum transkripti:

1 Linear Predictive Coding ve Dynamic Time Warping Teknikleri Kullanılarak Ses Tanıma Sistemi Geliştirilmesi Murat Kemal BAYGÜN Egecom Ltd. Yard. Doç. Dr. A. Kadir YALDIR Pamukkale Üniversitesi Akademik Bilişim DENİZLİ

2 Ses  Rabiner ve Juang: Akciğerlerden havanın dışarı atılması sonucunda oluşan hava akımının, ses sisteminde bir yerlerde sıkıştırılarak karıştırılmasından yayılan akustik dalgalardır[1].

3 Ses Tanıma  Cole vd: Mikrofon ya da telefon tarafından alınmış akustik bir sinyalin, kelime kümesine olan çevrim işlemi olarak tanımlanmaktadır [2].

4 İnsanlar arası sesli iletişim Şekil 1: Huang vd tarafından verilen, İnsanlar arası sesli iletişim modeli [3].

5 Ses Tanıma Sistemleri Nasıl Çalışır? Şekil 2: Ses Tanıma sistemleri, insanlar arası sesli iletişim sürecinde dinleyicinin yaptığı işlevleri yapay olarak gerçekleştirmeye çalışır.

6 Ses Tanıma Süreci   Sesin kaydedilmesi ve ifadenin saptanması   Sesin işlenmesi   Karşılaştırma ve eşleştirme   İşlevin gerçekleştirilmesi

7 Sesin kaydedilmesi ve ifadenin saptanması  Mikrofon veya telefon ile kayıt işleminin gerçekleştirilmesi  Konuşma başlangıç ve bitişinin belirlenmesi Bir çerçevedeki RMS değeri ve Sıfırı geçiş sayısı (1)

8 Sesin işlenmesi  Pencereleme  Filtreleme  Sesin kodlanması (Özellik çıkarımı)

9 Sesin işlenmesi – Pencereleme Şekil 3: Geliştirilen uygulama ile 8000 Hz ile örneklenerek kaydedilmiş ‘sıfır’ kelimesi için başlangıç ve bitişi saptanarak belirlenmiş ses sinyali. Şekil 4: Hamming penceresinden geçirilmiş ‘sıfır’ kelimesi için ses sinyali. (2)

10 Sesin işlenmesi – Sesin kodlanması  PCM (Linear Pulse Code Modulation)  APCM (Adaptive Pulse Code Modulation)  DPCM (Differential Pulse Code Modulation)  ADPCM (Adapted Differential Pulse Code Modulation)  DM (Delta Modulation)

11 Sesin işlenmesi – Sesin kodlanması  Bank-of-Filters  LPC (Linear Predictive Coding)  CELP (Code-Excited Linear Prediction)  PLP (Perceptual Linear Prediction)  RASTA-PLP (RelAtive SpecTrAl Technique - Perceptual Linear Prediction)

12 Karşılaştırma ve eşleştirme  HMM (Hidden Markov Model)  DTW (Dynamic Time Warping)  Yapay Sinir Ağları

13 İşlevin gerçekleştirilmesi  Ses tanıma sisteminin, giriş olarak aldığı ses sinyalinden çıkarımını yaptığı, eşleştirilen kelimeye karşılık gelen işlevin gerçekleştirilmesi.

14 LPC – Linear Predictive Coding LPC, sıradaki örneğin, önceki bir seri örnekten yaklaşık olarak elde edilebileceği prensibiyle çalışır (Eş. 5). p: LPC kodlayıcı seviyesi a 1, a 2,..., a p : LPC Parametreleri (3) (4) (5)(6)

15 DTW – Dynamic Time Warping Şekil 5: Konuşma sinyaline doğrudan DTW algoritmasının uygulanması [8].

16 LPC Parametreleri üzerine DTW uygulanması Şekil 6: LPC Parametreleri üzerine DTW algoritmasının uygulanması.

17 Geliştirilen Ses Tanıma Sistemi Modeli Şekil 7: Geliştirilen Ses Tanıma Sistemi Modeli 1. Seviye diyagramı

18 Geliştirilen Ses Tanıma Sistemi – İş parçacıkları  Ana İş Parçacığı  Kuyruk Analizcisi  İfade Kuyruğu Analizcisi  LPC Kuyruğu Analizcisi

19 Kaynaklar  [1]Rabiner, L., Juang, B., 'Fundamentals of Speech Recognition', ISBN: ,  [2] Cole, R.A., Mariani, J., Uszkoreit, H., Zaenen, A. and Zue, V., ‘Survey of the State of the Art in Human Language Technology’  [3] Huang, X., Acero, A. and Hon, H.W., ‘Spoken Language Processing: A Guide to Theory, Algorithm and System Development’(1st Ed.) Prentice Hall PTR, ISBN ,  [4]Coleman, J., ‘Introducing Speech and Language Producing’, Cambridge University Press, ISBN , 2005.

20 Kaynaklar  [5] Smith, S.W., ‘The Scientist’s and Engineer’s Guide to Digital Signal Processing’(2nd Ed.) California Technical Publishing, ISBN , 1999  [6]Robinson, T., ‘Speech Anaylsis Tutorial’, SpeechAnalysis/,  [7]Fingerhut, A., ‘U.S. Department of Defense LPC bps Voice Coder’, 1.5.tar.gz,  [8]Kale K. R., ‘Dynamic Time Warping’,

21 Teşekkürler... Murat Kemal BAYGÜN Egecom Ltd. Yard. Doç. Dr. A. Kadir YALDIR Pamukkale Üniversitesi


"Linear Predictive Coding ve Dynamic Time Warping Teknikleri Kullanılarak Ses Tanıma Sistemi Geliştirilmesi Murat Kemal BAYGÜN Egecom Ltd." indir ppt

Benzer bir sunumlar


Google Reklamları