Yapay Öğrenme Teorisi Bölüm-2 Dr.Batuhan Gündoğdu
öğrenilmek istenen kural) TABİAT (Bilinmeyen ve öğrenilmek istenen kural) Veri Seti Öğrenme Algoritması Öğrenilen Model
Gözetimli Öğrenme Sınıflandırma Regresyon İki sınıflı Çok sınıflı Lineer Lineer olmayan
Gözetimli Öğrenme Sınıflandırma Regresyon İki sınıflı Çok sınıflı Lineer Lineer olmayan
Gözetimli Öğrenme Sınıflandırma Regresyon İki sınıflı Çok sınıflı Lineer Lineer olmayan
Örneklerden sınıflandırma kuralı öğrenme Örnek Problem: Bu araba aile arabası mıdır? Çıktılar: Evet vs Hayır (iki sınıf) Girdi Gösterimleri: x1: fiyat, x2 : motor gücü
Eğitim Seti X
Gerçeklik (Bilinmeyen)
Hipotez Sınıfı (Uzayı) H h‘ın hatası (error)
Versiyon Uzayı En spesifik hipotez, S En genel hipotez, G
Gürültü ve Model Kompleksitesi Daha basit modeli kullanın, çünkü Hesaplaması kolaydır Eğitmesi kolaydır Açıklaması kolaydır Genellemesi daha iyidir OCCAM’S RAZOR
Gözetimli Öğrenme Sınıflandırma Regresyon İki sınıflı Çok sınıflı Lineer Lineer olmayan
Birçok sınıftan biri, Ci i=1,...,K Hipotezler hi(x), i =1,...,K:
Gözetimli Öğrenme Sınıflandırma Regresyon İki sınıflı Çok sınıflı Lineer Lineer olmayan
Lineer Regresyon
Lineer Regresyon
Gözetimli Öğrenme Sınıflandırma Regresyon İki sınıflı Çok sınıflı Lineer Lineer olmayan
Non-linear Regression (Lineer Olmayan Regresyon)
Non-linear Regression (Lineer Olmayan Regresyon) 7.Derece polinom
Model Seçimi ve Genelleme Eldeki veri tek ve mükemmel bir sonuç için yeterli değil Hipotez uzayı H için öngörüler ve varsayımlar yapılmalı Genelleme :: Bu model yeni veri için ne kadar iyi çalışır Aşırı Öğrenme (Overfitting): H, C veya f ‘den daha kompleks Eksik Öğrenme (Underfitting) : H, C veya f ‘den daha az kompleks
Triple Trade-Off H’ın kompleksitesi c (H), Eğitim setinin boyutu, N, Şu üç faktör için trade-off mevcuttur(Dietterich, 2003): H’ın kompleksitesi c (H), Eğitim setinin boyutu, N, Yeni verideki genelleme hatası, E N arttıkça, E düşer c (H) arttıkça önce E düşer sonra E artar
Çapraz Doğrulama Eğitim(50%) Doğrulama(25%) Test (25%) Genelleme Hatasını kestirebilmek için eldeki datayı aşağıdaki gibi böleriz Eğitim(50%) Doğrulama(25%) Test (25%) Az veri varken yeniden örnekleme yapılır
Gözetimli Öğrenmenin Önemli Faktörleri Model : Maliyet Fonksiyonu: Optimizasyon Prosedürü: