Rakam Tanıma İçin KNN ve LDA Algoritmalarının Karşılaştırılması

Slides:



Advertisements
Benzer bir sunumlar
Unsupervised Learning (Kümeleme)
Advertisements

FEN BİLİMLERİ ENSTİTÜSÜ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ
P 6. Ünite stack veri tipini anlatmaktadır. p Bu ünitede stack laerin örnek uygulamalarından bahsedilmektedir. p Bu sunumda N-Queens problemini çözmek.
MIT563 Yapay Zeka ve Makine Öğrenmesi
Sayısal İşaret İşleme Laboratuarı
Azrael Online Hasta Takip Programı
TUVDBS VİDEO VERİTABANI YÖNETİM SİSTEMİ
Sınıflandırma Modeli K-Nearest Neighbor Sınıflandırıcı /12.
Dağıtık Simülasyon Sistemlerinde Sanal Global Zaman Hesaplamaları
GYTE BİL MUH BİL 495 ve 496 İLK SUNUM FORMATI
Yama-Tabanlı Yüz Tanıma için Yeni Yöntemler Berkay Topçu, Hakan Erdoğan Sabancı Üniversitesi.
CLUSTERING USING REPRESENTATIVES Hazırlayan: Arzu ÇOLAK
SEDA ARSLAN TUNCER Android işletim sisteminde RGB histogram değerlerinin gerçek zamanlı olarak elde edilmesi SEDA ARSLAN TUNCER
Bellek Tabanlı Sınıflandırma
Fırat Fehmi Aygün Aybars Moralı Dokuz Eylül Üniversitesi
Parmak İzİ kullanarak görüntü şİfreleme
Bilgi Okuryazarlığı Bu çalışma Prof. Dr. Buket Akkoyunlu’nun “Bilgi Okuryazarlığı ve Yaşam Boyu Öğrenme” başlıklı bildirisine dayanılarak hazırlanmıştır.
Bora GÜRSEL CBÜ BAUM Proje Yöneticisi
İstatistiksel Sınıflandırma
OPENCV İLE STEREO GÖRÜNTÜLERDEN DERİNLİK KESTİRİMİ
Hakan Öktem Orta Doğu Teknik Üniversitesi
YZM Yazılım Doğrulama ve Geçerlileme
Yüz Tanıma. Yüz Tanıma - İnsan İnsan düşük çözünürlükteki resimlerden de yüz tanıma yeteneğine sahiptir.
Fulya Tuğçe OMUZLUOĞLU Yrd.Doç.Dr. Bünyamin TAMYÜREK
KARAKTER TANIMA Utku Cevre Barış Özkan.
BİYOİNFORMATİK NEDİR? BİYOİNFORMATİKTE KULLANILAN SINIFLAMA YÖNTEMLERİ
Tanecikler Ararsı Etkileşmeler Seher DEMİRAY 2013 Materyal Metot Yapılandırmacı tabanlı etkileşimli doğrudan öğretim(YÖTEDÖ) metodu, geleneksel öğretime.
YAPAY SİNİR AĞLARI VE BAYES SINIFLAYICI
Rakam Tanıma İçin KNN ve LDA Algoritmalarının Karşılaştırılması
M.Fatih AMASYALI Uzman Sistemler Ders Notları
MEDİKAL GÖRÜNTÜ İŞLEMENİN AMACI
KNN ALGORİTMASI TABANLI MOBİL DEVAM TAKİP YAZILIMI -Mehmet BİLEN -Ali Hakan IŞIK -Tuncay YİĞİT.
ARAŞTIRMA TÜRLERİ.
En Yakın k-komşu Algoritması Bellek Tabanlı Sınıflandırma
EE465: Introduction to Digital Image Processing Copyright Xin Li
Yapay Sinir Ağları (YSA)
VERİ MADENCİLİĞİ UYGULAMALARI
Bulanık Mantık Kavramlar:
Veri Madenciligi . Sınıflandırma ve Regresyon Ağaçları ( CART )
OpenCV ile Görüntü işleme
Veri Madenciliği Birliktelik Analizi: Temel Kavramlar ve Algoritmalar
Duygu BAĞCI – Dokuz Eylül Üniversitesi
Speeded-Up Robust Features (SURF) Yöntemi ile Yüz Tanıma
Retinal Görüntülerdeki Mikroanevrizmaların ve Hemorajilerin Tespiti.
Yapay Zeka Desteği ile Parfüm Öneri Sistemi
Ege ÜNİVERSİTESİ ULUSLARARASI BİLGİSAYAR ENSTİTÜSÜ AYCAN VARGÜN Prof
BİL3112 Makine Öğrenimi (Machine Learning)
Bu çalışmada Tekirdağ ili, Bıyıkali köyü ve civarında 2500 hektar alana sahip ve arazi örtüsü/arazi kullanım çeşitliliğinin fazla olduğu bir çalışma alanı.
END 457 Sezgisel Arama ve Yapay Zeka
BİL551 – YAPAY ZEKA Kümeleme
Konu : WİNDOWSTA VERİ DEPOLAMA YÖNTEMLERİ Hazırlayan : Güray Mantar
ÇOK BANTLI GÖRÜNTÜ SINIFLANDIRMA
Makine Öğrenmesinde Yeni Problemler YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ.
DERS 2 SAYI DÜZENLERİ.
Karar Ağaçları (Decision trees)
Insertion Sort Fikir: Oyun kartlarını sıralamaya benzer.
Emg İşleme Engin Kaya.
MALTEPE ÜNİVERSİTESİ Paralel Hesaplama MATLAB ve Paralel Hesaplama
Deniz Tekin Ersan Şükran Alan
DİJİTAL GÖRÜNTÜ İŞLEME
Makine Öğrenmesinde Yeni Problemler
Plaka Tanıma Sistemleri Uygulamaları
Bilgi Güvenliğinde El Yazısı
Yrd. Doç. Dr. Abdullah BAYKAL Konuşmacı : Cengiz Coşkun
Volkan Erol1,2 Yard.Doç.Dr.Aslı Uyar Özkaya1
Yapay Öğrenme Teorisi Bölüm-1
Mehmet Fatih KARACA Mustafa GÜNEL Akif Alkan TAŞTAN
Sunum transkripti:

Rakam Tanıma İçin KNN ve LDA Algoritmalarının Karşılaştırılması Halit Çetiner Ömer Kuşcu

Görüntü Sınıflandırma Görüntü sınıflandırma, yapay zekanın en önemli araştırma alanlarından biridir. Görüntü sınıflandırma uygulamaları, optik karakter tanımada karakter tanımanın gelişmesi yönünde ilerlediği görülmektedir. Karakter tanıma son yüzyılda geniş bir şekilde uygulama alanı bulmuştur.

Uygulama Alanları Uygulama alanları posta kodlarının okunması, araç plakası tanıma, barkod okuma, banka çeklerinin otomatik okunması, büro otomasyonu, reklam, afiş,

Uygulama Alanları Market panolarının okunması, yol işaretlerinin okunarak araçların yönlendirilmesi, çeşitli bankalara ait kart numaraların tanınması gibi farklı alanlardaki karakter tanıma çalışmalarından oluşmaktadır. Bu gibi farklı uygulama alanlarında artan isteği karşılayabilmek için daha gelişmiş yöntemlere gereksinim duyulmaktadır.

Araştırmanın Sebebi Bu makalede, kimlik kartlarından elde edilmiş rakamlar üzerinde doğrusal ayırt edici analiz (LDA) ile en yakın k komşu algoritması (KNN) sınıflandırıcılarının karakteristikleri tartışılmıştır. İki farklı sınıflandırıcı, moment değişmezleri (IM) ile elde edilen özniteliklerinin sınıflandırma doğruluğu, eğitim/test süreleri incelenerek karşılaştırılmıştır.

Öznitelik Çıkarma Aynı karakterin farklı durumlarını tanımlayabilmek için karakterlerin farklı dönüşümlerinde, varyasyonlarında karakter özniteliklerinin sabit, değişmez olması gerekmektedir. Orijinal resmin döndürülmüş, ölçeklendirilmiş, gerilmiş, eğimli, eğimsiz, simetriği alınmış her durumda özniteliklerin sabit kalması gerekmektedir. Bu noktada farklı frekans ve ölçeklerdeki görüntüyü en iyi temsil edecek değişmez momentleri yöntemi tercih edilmiştir.

Sınıflandırma Sınıflandırmada öğrenme ve test aşamalarını içeren yöntemler kullanılmıştır. Öğrenme aşamasında ön işlemlerden geçirilmiş her bir rakam için değişmez momentleri kullanılarak öznitelikleri çıkarılmaktadır. İkinci adımda önceden belirlenen hedef değerlerine göre sınıflandırma işlemi yapılmaktadır. Öğrenme fazında, RIGK görüntülerinden elde edilmiş 116 tane görüntüden oluşmuş bir veri seti kullanılmaktadır.

Genel Öğrenme Algoritması Giriş: n kimlik kartının n rakamlı ön işlenmiş m x n‘lik görüntü Çıktı: her bir kimlik kartındaki her bir rakam için değişmez momentleriyle elde edilmiş 7 öznitelikten oluşan öznitelik vektörü for k=1 to m ( her bir rakam sınıfı için) for i=1 to rakam örneklerinin numarası Ön işlemlerden geçirme IM momentleriyle 7 öznitelik değerini hesapla end

KNN Sınıflandırma Algoritması KNN,   eğitimli   öğrenme algoritmasıdır   ve   amacı,   yeni   bir   örnek geldiğind e   varolan   öğrenme   verisi   üzerinde sınıflandırma   yapmaktır.   Algoritma,   yeni  bir örnek geldiğinde, onun en yakın K komşusuna bakarak  örneğin   sınıfına   karar   verir. 1. K değerini seç 2. Tüm     öğrenme   örnekleri   ile   olan  uzaklığını hesapla 3. Minimum uzaklığa göre sırala 4. Ait oldukları sınıf değerlerini bul 5. Değeri baskın olan sınıfı seç

KNN Algoritmasının Performans Kriterleri Yöntemin performansını k en yakın komşu sayısı, eşik değer, benzerlik ölçümü ve öğrenme kümesindeki normal davranışların yeterli sayıda olması kriterleri etkilemektedir

KNN Eğitim Zamanı KNN algoritmasının en önemli  avantajlarından biri model yaratmamasıdır.  Bu sebeple eğitim için bir   zaman   harcamaz.    Ama   bu   durum  a ynı zamanda bir dezavantaj yaratmaktadır.  Çünkü algoritma sınama  için diğer modellerin aksine daha çok zamana ihtiyaç duyar. Örnek o larak 4000 boyutlu eğitim kümesi  düşünelim.  Eğer KNN algoritması uygulanırsa  bir   tek  sınama örneği   için   4000   satırın   herbiriyle karşılaştırma   yapılır.  

KNN Test İşlemi KNN   algoritması   yeni   gelen örnekleri  olumlu  olumsuz   olarak   belirlemesi için çok fazla zamana ihtiyaç duymaktadır.

LDA ile Sınıflandırma LDA’nın temel fikri, dönüşüm sonrası en ayırt edilebilir öznitelik kümeleri kullanılarak kümelerin doğrusal dönüşümlerini bulmayı amaçlamaktadır. LDA, düşük boyutlu uzayda sınıfları en başarılı ayıracak vektorleri bulur. Amaç sınıf-içi saçılımı en büyük yapmaya çalışırken, sınıflar arası saçılımı en düşük seviyeye çekmektir. Yani, LDA gruplar arasında varyansı maksimum yaparken, her bir grup içerisindeki varyansı minimize etmeye çalışmaktadır.

Genel Test Algoritması  Giriş: kimlik kartlarındaki rakamlardan elde edilmiş rakam görüntüleri Çıktı: her bir rakamın sınıf tipi Her bir rakam sınıfı için tekrarla Her bir rakam sınıfındaki rakam için tekrarla KNN sınıflandırıcı kullanılarak değişmez momentleri ile elde edilmiş özniteliklerinin sınıflandırılması LDA sınıflandırıcı kullanılarak değişmez momentleri ile elde edilmiş özniteliklerinin sınıflandırılması Doğruluk = (tanımlanmış rakamların sayısı / rakam kümelerindeki toplam rakam sayısı)* 100 Zaman ve doğruluk oranı açısından performans karşılaştırılması

Sistemin Özeti KNN ve LDA algoritmalarının olumlu ve olumsuz yanları göz önünde bulundurularak yapılan çalışmada, kimlik numaralarının yer tespitleri yapılarak elde edilen numaraların ; Normalleştirme Öznitelik çıkarma Sınıflandırma Sınıflandırma sonuçlarının karşılaştırması

Deneysel Çalışmalar Her klasörde farklı bir rakam bulunmak üzere farklı kimliklerden bölütlenmiş ikili görüntüler bulunmaktadır. 10 klasör içerisinde, her klasörde 116 tane örnek olmak üzere toplam 1160 tane örnek vardır. Bu örneklerin her birinden 7 tane olmak üzere 1160x7 tane öznitelik elde edilmiştir. Çalışma MATLAB 7.14 sürümünde gerçekleştirilmiştir. Deney sonuçları, 4GB RAM’li Intel Core i5 CPU (2.06 GHz) işlemciye sahip Windows 7 işletim sistemi üzerinde elde edilmiştir.

Deneysel Çalışma Adımları - 1 Rakam Kümesi Normalleştirme İşlemleri IM Momentleriyle Öznitelik Çıkarma KNN Algoritması İle Sınıflandırma Doğruluk Yüzdelerinin Tespiti Tanıma Sonuçları Aynı Problemle Uğraşılan Uygulama Alanlarında Kullanımının Yorumlanması

Deneysel Çalışma Adımları - 2 Rakam Kümesi Normalleştirme İşlemleri IM Momentleriyle Öznitelik Çıkarma LDA Algoritması İle Sınıflandırma Doğruluk Yüzdelerinin Tespiti Tanıma Sonuçları Aynı Problemle Uğraşılan Uygulama Alanlarında Kullanımının Yorumlanması

Rakam Bazlı LDA ve KNN Algoritmalarının Karşılaştırma Sonuçları

1160 Tane Rakam Görüntüsünün Eğitim İşlemi Sınıflandırma Süreleri

1160 Tane Rakam Görüntüsünün Test İşlemi Tanıma Süreleri

1160 Tane Görüntünün Doğrulama İşlemi Süreleri

Eğitim, Test ve Doğrulama Toplam Zamanı (sn)

Araştırmanın Sonucu Eğitim/test sürelerinin yaklaşık olarak aynı olmasına karşın sınıflandırma doğruluğu açısından KNN sınıflandırıcı LDA sınıflandırıcıdan daha yüksek başarı vermektedir.

TEŞEKKÜR EDERİZ.

Kaynaklar [1] Alshebeili, S. A., Nabawib, A. A. F., Mahmoud, S. A., “Arabic character recognition using 1-D slices of the character spectrum”. Signal Processing V. 56, pp. 59-75, 1997. [2] Chim, Y. C., Kassim, A., Ibrahim, Y., “Character recognition using statistical moments”. Image and Vision Computing V. 17, pp. 299-307, Singapore, 1999.   [3] Çetiner, H., “Görüntü işleme teknikleri kullanarak optik karakter tanımlama”, SDÜ, Fen Bilimleri Enstitüsü, Yüksek Lisans Tezi, 2012.  [4] Kurt, Z., Turkmen, H., İ., Karsligil, M.E., “Linear Dicriminant Analysis in Ottoman Alphabet Character Recognition”, ECC 2007,(2007).  [5] Tatale, S., Khare, A., “Character recognition and transmission of characters using network security”, International Journal of Advances in Engineering&Technology, (2011).  [6] Das, M. S., Rani, D. S., Reddy, C., Govardhan, A., “Script identification from multilingual Telugu, Hindi and English Text Documents”, International Journal of Wisdom Based Computing, Vol. 1(3), (2011).  [7] Hu, M., “Visual pattern recognition by moment invariants”. IRE Trans. Inf. Theor. IT-8: 179–187, (1962).  [8] Mercimek, M., Gülez, K., Mumcu, T. V., “Real object recognition using moment invariants”, Sadhana Vol. 30, pp. 765-775, (2005).   [9] Wilks, S. S. “Mathematical Statistics”, New York: Wiley, (1962).  [10] Fukunaga, K., “Introduction to Statistical Pattern Recognition”. New York: Academic Press, (1990).  [11] Yang, J, Yu, H., Kunz, W., “An efficient LDA algorithm for face recognition”, (2000).  [12] Çetiner, H., Cetişli, B., Çetiner, İ., “Gerçek zamanlı T.C. kimlik numarası tanıma”, SAÜ., Fen Bilimleri Dergisi, (2012)