SİU 2009 Sınıflandırıcılarda Hata Ölçülmesi ve Karşılaştırılması için İstatistiksel Yöntemler Ethem Alpaydın Boğaziçi Üniversitesi alpaydin@boun.edu.tr.

Slides:



Advertisements
Benzer bir sunumlar
Normal Dağılım Dışındaki Teorik Dağılımlar
Advertisements

Çıkarımsal İstatistik
8. SINIF 3. ÜNİTE BİLGİ YARIŞMASI
Uygun Hipotezin Kurulması, Tip I Hata ve Tip II Hata
Bölüm 5 Örneklem ve Örneklem Dağılımları
Hipotez Testleri Uygulamada çoğu zaman örneklem istatistikleri yardımıyla ana kütle parametreleri hakkında bir karara varmaya da çalışılmaktadır. Meselâ.
Kütle varyansı için hipotez testi
GİRİŞ BÖLÜM:1-2 VERİ ANALİZİ YL.
Sosyal Bilimlerde Araştırma Yöntemleri
Soru 1 CEVAP.
Normal dağılan iki kütlenin ortalamalarının farkı için Hipotez testi
NOKTA, DOĞRU, DOĞRU PARÇASI, IŞIN, DÜZLEMDEKİ DOĞRULAR
İstatistik Tahmin ve Güven aralıkları
VARYANS ANALİZİ İki örnek ortalaması arasındaki farkın önem kontrolü, örnek büyüklüğüne göre z veya t testlerinden biriyle yapılır. Bu testlerle, ikiden.
TEK YÖNLÜ VARYANS ANALİZİ
Farklı örnek büyüklükleri ( n ) ve farklı populasyonlar için ’nın örnekleme dağılışı.
ANOVA.
HİPOTEZ TESTLERİ.
ÖRNEKLEME DAĞILIŞLARI VE TAHMİNLEYİCİLERİN ÖZELLİKLERİ
HATA TİPLERİ Karar H0 Doğru H1 Doğru H0 Kabul Doğru Karar (1 - )
4 Kare Problemi 4 Kare Problemi Hazır mısın? B A Bu şekle iyi bak
MINITAB’da Hipotez Testi Uygulamaları
Hafta 03: Verinin Numerik Analizi (Yrd.Doç.Dr. Levent AKSOY)
SİMÜLASYON VE BULANIK KÜME YAKLAŞIMI İLE PROJE RİSK DEĞERLEMESİ
İstatistiksel Sınıflandırma
ARALARINDA ASAL SAYILAR
TAHMİNLEYİCİLERİN ÖZELLİKLERİ ÖRNEKLEME DAĞILIMI
TEST – 1.
Prof. Dr. Hüseyin BAŞLIGİL
T Dağılımı.
HABTEKUS' HABTEKUS'08 3.
ÖNEMLİLİK TESTLERİ Dr.A.Tevfik SÜNTER
Büyük ve Küçük Örneklemlerden Kestirme
yunus.hacettepe.edu.tr/~tonta/courses/spring2008/bby208/
Celal Bayar Üniversitesi Hasan Ferdi Turgutlu Teknoloji Fakültesi
Programın Sunulması ve Öğrenci Beklentileri
İKİDEN ÇOK (K) ÖRNEKLEM TESTLERİ
İki Ortalama Farkının Test Edilmesi
MATEMATİKSEL İSTATİSTİK VE OLASILIK II
Toplama Yapalım Hikmet Sırma 1-A sınıfı.
14.ULUSAL TURİZM KONGRESİ 2013 YILI BİLDİRİLERİ ÜZERİNE BİR DEĞERLENDİRME Prof. Dr. A. Celil ÇAKICI Mersin Üniversitesi Turizm Fakültesi.
Hipotez Testi.
İSTATİSTİKTE GÜVEN ARALIĞI VE HATALAR
KRUSKAL WALLIS VARYANS ANALİZİ
HATA TİPLERİ Karar H0 Doğru H1 Doğru H0 Kabul Doğru Karar (1 - )
Bilişim Teknolojileri için İşletme İstatistiği
Maliye’de SPSS Uygulamaları Doç. Dr. Aykut Hamit Turan SAÜ İİBF/ Maliye Bölümü.
İletişim Fakültesi Bilişim A.B.D.
İstatistik-3 Prof.Dr. Cem S. Sütcü Marmara Üniversitesi İletişim Fakültesi Bilişim A.B.D. cemsutcu.wordpress.com.
HİPOTEZ TESTLERİNE GİRİŞ
İstatistik Tahmin ve Güven aralıkları
Parametrik ve Parametrik Olmayan Testler Ortalamaların karşılaştırılması t testleri, ANOVA Mann-Whitney U Testi Wilcoxon İşaretli Sıra Testi Kruskal Wallis.
İSTATİSTİK II Hipotez Testleri 3.
1 İ STATİSTİK II Tahminler ve Güven Aralıkları - 1.
Parametrik ve Parametrik Olmayan Testler Ortalamaların karşılaştırılması t testleri, ANOVA Mann-Whitney U Testi Wilcoxon İşaretli Sıra Testi Kruskal Wallis.
Teorik Dağılımlar: Diğer Dağılımlar
Merkezi Eğilim Ölçüleri
İSTATİSTİK II Hipotez Testleri 3.
İSTATİSTİK II Hipotez Testleri 3.
İSTATİSTİK II Hipotez Testleri 1.
Numerik Veri Tek Grup Prof. Dr. Hamit ACEMOĞLU.
HİPOTEZ TESTLERİ.
İstatistik-2 Çıkarımsal İstatistik
Tıp Fakültesi UYGULAMA 2
Hipotez Testinde 5 Aşamalı Model
ÖDE5024 DAVRANIŞ BİLİMLERİNDE İSTATİSTİK Yüksek Lisans
İSTATİSTİK II Hipotez Testleri 1.
İSTATİSTİK II Hipotez Testleri 3.
Sunum transkripti:

SİU 2009 Sınıflandırıcılarda Hata Ölçülmesi ve Karşılaştırılması için İstatistiksel Yöntemler Ethem Alpaydın Boğaziçi Üniversitesi alpaydin@boun.edu.tr http://www.cmpe.boun.edu.tr/~ethem

Giriş Sorular: Bir sınıflandırıcının hatasını nasıl ölçebiliriz? İki sınıflandırıcının hatasını nasıl karşılaştırabiliriz? Öğrenme/geçerleme/deneme kümeleri Yeniden örnekleme: K-kat çapraz geçerleme Parametrik ve parametrik olmayan testler İkiden çok sınıflandırıcının karşılaştırılması Tek/çok veri kümesi Hata dışındaki ölçütlerin karşılaştırılması SİU 2009 Eğitim semineri E Alpaydın Nisan 2009

Yöntemlerin Karşılaştırılması Kıstaslar (Uygulamaya bağlı olarak): Sınıflandırma hatası (Risk, kayıp fonksiyonları) Öğrenme zaman/bellek karmaşıklığı Deneme zaman/bellek karmaşıklığı Yorumlanabilirlik Kolay programlanabilme Masraf (karmaşıklık) duyarlı öğrenme SİU 2009 Eğitim semineri E Alpaydın Nisan 2009

Öğrenme, Ezberleme, Genelleme Kümesi Geçerleme Kümesi Deneme Kümesi Çapraz geçerleme SİU 2009 Eğitim semineri E Alpaydın Nisan 2009

Yeniden Örnekleme K-Kat Çapraz Geçerleme Birden çok öğrenme/gerçekleme kümesi yaratmak için {Xi,Vi}i: kat i X, K parçaya ayırılıyor: Xi,i=1,...,K K-2 parça ortak Sınıf olasılıklarının korunması SİU 2009 Eğitim semineri E Alpaydın Nisan 2009

5×2 Çapraz Geçerleme 5 kere 2 kat çapraz geçerleme (Dietterich, 1998) SİU 2009 Eğitim semineri E Alpaydın Nisan 2009

Aralık Kestirimi X = { xt }t , xt ~ N ( μ, σ2) m ~ N ( μ, σ2/N) 100(1- α) % güven aralığı SİU 2009 Eğitim semineri E Alpaydın Nisan 2009

Tek taraflı güven aralığı SİU 2009 Eğitim semineri E Alpaydın Nisan 2009

σ2 bilinmediğinde: SİU 2009 Eğitim semineri E Alpaydın Nisan 2009

Hipotez Testleri Sıfır hipotezi H0 Örneğin, H0: μ = μ0 vs. H1: μ ≠ μ0 Eğer μ0 , 100(1- α) güven aralığına düşmüyorsa H0 reddedilir X = { xt }t , xt ~ N ( μ, σ2) Çift taraflı test SİU 2009 Eğitim semineri E Alpaydın Nisan 2009

Tek taraflı test: H0: μ ≤ μ0 vs. H1: μ > μ0 H0 reddedilmez eğer Varyans bilinmiyorsa; z yerine t dağılımı H0: μ = μ0 reddedilmez eğer SİU 2009 Eğitim semineri E Alpaydın Nisan 2009

Testin hata tipleri ve gücü Karar Gerçek Kabul Red H0 Doğru Doğru karar Birinci tip hata (a) H0 Yanlış İkinci tip hata (b) Doğru karar (Güç) SİU 2009 Eğitim semineri E Alpaydın Nisan 2009

Hata Ölçülmesi: H0: p ≤ p0 vs. H1: p > p0 Tek öğrenme/geçerleme kümesi: Binom Testi Hata olasılığı p0 ise, en az e hata yapma olasılığı çok küçükse reddet: SİU 2009 Eğitim semineri E Alpaydın Nisan 2009

Normal Approximation to the Binomial Hata sayısı X yaklaşık olarak N (Np0 , Np0(1-p0)) X = e için bu değer > zα ise reddet 1- α SİU 2009 Eğitim semineri E Alpaydın Nisan 2009

Birden çok Öğrenme/Geçerleme xti = 1 eğer kat i’de örnek t yanlış sınıflandırılırsa Kat i’de hata: H0: p ≤ p0 vs. H1: p > p0 reddederiz, eğer > tα,K-1 SİU 2009 Eğitim semineri E Alpaydın Nisan 2009

Sınıflandırıcıların Karşılaştırılması: H0: μ1 = μ2 vs Sınıflandırıcıların Karşılaştırılması: H0: μ1 = μ2 vs. H1: μ1 ≠ μ2 K-kat Çapraz Geçerleme Eşlenmiş t testi pi1, pi2: Sınıflandırıcı 1 ve 2’nin kat i’deki hataları pi = pi1 – pi2 : Kat i’deki eşlenmiş fark Sıfır hipotezimiz pi ‘in beklenen değeri 0’dır: SİU 2009 Eğitim semineri E Alpaydın Nisan 2009

5×2 Çapraz Geçerleme Eşlenmiş t Testi (Dietterich, 1998) 5×2 çapraz geçerleme ile 5 tekrarda 2 kat öğrenme/geçerleme kümesi oluşturulur pi(j) : sınıflandırıcılar 1 ve 2’nin kat j=1, 2 tekrar i=1,...,5’deki farkı Çift taraflı : Reddet H0: μ1 = μ2 eğer (-tα/2,5,tα/2,5) Tek taraflı: Reddet H0: μ1 ≤ μ2 eğer > tα,5 SİU 2009 Eğitim semineri E Alpaydın Nisan 2009

5×2 Çapraz Geçerleme Eşlenmiş F Testi (Alpaydın, 1999) Çift taraflı test: Reddet H0: μ1 = μ2 eğer > Fα,10,5 SİU 2009 Eğitim semineri E Alpaydın Nisan 2009

L>2 Sınıflandırıcı: Varyans Analizi (Anova) L sınıflandırıcının K kattaki hataları Reddedilirse ikili testler SİU 2009 Eğitim semineri E Alpaydın Nisan 2009

Değişkenliğin kaynağı Anova tablosu Değişkenliğin kaynağı Karelerin toplamı Serbestlik derecesi Ortalama Kare F0 Gruplar arası L-1 Grup içi L(K-1) Toplam LK-1 SİU 2009 Eğitim semineri E Alpaydın Nisan 2009

Çoklu Anakütle Testleriyle İlgili Bonferroni düzeltmesi: Eğer m test sonunda bir karara varılacaksa, sonuç karar hassasiyetinin α olabilmesi için, her bir testin hassasiyetinin α/m olması gerekir. Kontrastlar SİU 2009 Eğitim semineri E Alpaydın Nisan 2009

MultiTest Yöntemiyle Sınıflandırıcıların Sıralanması (Yıldız ve Alpaydın, 2006) L sınıflandırıcı ön bir karmaşıklık ölçütüne göre sıralanır: i<j olmak üzere ikili testlerle çizge oluşturulur: Eğer H0: μi <= μj reddedilirse, (i,j) eklenir, Topolojik olarak sıralanır SİU 2009 Eğitim semineri E Alpaydın Nisan 2009

SİU 2009 Eğitim semineri E Alpaydın Nisan 2009

SİU 2009 Eğitim semineri E Alpaydın Nisan 2009

Parametrik olmayan testler İşaret testi Sıralama (rank) testleri: Kruskal-Wallis testi Friedman sıralama testi Kullanımı: Birden çok veritabanı üzerinde karşılaştırma Sınıflandırma hatası dışındaki ölçütlerin (hız, bellek, vs) karşılaştırılması SİU 2009 Eğitim semineri E Alpaydın Nisan 2009

Başarı Ölçütleri Öngörü Gerçek Artı Eksi TP FN FP TN Hata = (FN+FP) / N Recall = bulunan artılar/ toplam artılar = TP / (TP+FN) = sensitivity = hit rate Precision = bulunan artılar / bulunanlar = TP / (TP+FP) Specificity = TN / (TN+FP) False alarm rate = FP / (FP+TN) = 1 - Specificity Öngörü Gerçek Artı Eksi TP FN FP TN SİU 2009 Eğitim semineri E Alpaydın Nisan 2009

ROC Eğrisi SİU 2009 Eğitim semineri E Alpaydın Nisan 2009

SİU 2009 Eğitim semineri E Alpaydın Nisan 2009

Sonuçlar Güven aralıkları <=> Örnek kümesi büyüklüğü Öğrenme, ezberleme, genelleme Deney tasarımı SİU 2009 Eğitim semineri E Alpaydın Nisan 2009

Kaynaklar M. Aytaç (2004) “Matematiksel İstatistik,” Ezgi Yayınevi. SİU 2009 Eğitim semineri E Alpaydın Nisan 2009