Verilen eğitim kümesi için, ortalama karesel hata ‘yı öğrenme performansının ölçütü olarak al ve bu amaç ölçütünü enazlayan parametreleri belirle. EK BİLGİ Bazı Eniyileme (Optimizasyon) Teknikleri Eniyileme problemi Kısıtlar: Kısıtsız Eniyileme Problemi Hatırlatma
Teorem: 1. Mertebeden gerek koşul ‘in ekstremum noktası ise Teorem: 2. Mertebeden yeter koşul kesin pozitif ‘in minimum noktasıdır. Nasıl hesaplanır? Doğrultu Belirleme (Line Search) Algoritması başlangıç noktasını belirle doğrultusunu belirle ‘yı ‘ya göre enazlayan ‘yı belirle doğrultusunu belirle Hatırlatma
Amaç: Beklenti: Algoritma fonksiyonu enazlayan ‘a yakınsayacak Ne zaman sona erdilecek? doğrultusunu belirle Nasıl ? “en dik iniş “ (steepest descent) Bu doğrultuların işe yaradığını nasıl gösterebiliriz? Newton Metodu Gauss-Newton Metodu
ile sağlanır mı? ‘yı hesaplamanın bir yolu ne olabilir? ‘yı civarında Taylor serisine açalım. Sonuç: ‘a yakınsayacak Yakınsamayı belirleyecek “En dik iniş “ (steepest descent) Metodu
Özel durum: Kuadratik 1. Mertebeden gerek koşul Kuadratik ise Uygun ‘yı belirlemenin bir yolu var mı? ‘yı ‘ya göre enazlayan ‘yı belirle 7. Sayfayı Hatırlayın Bu herzaman mümkün mü? Nasıl?
ile sağlanır mı? ‘yı civarında Taylor serisine açalım. Bu yeni terimlere neden ihtiyaç duyduk? Newton Metodu
Kesin Pozitif ise Kesin Pozitif???? Sonuç: ‘a yakınsayacak ile sağlanır mı? Kısıtlama: Gauss-Newton Metodu
Gauss-Newton Metodu’nun amacı özel bir için Hessian matrisini kullanmadan 2. mertebe yöntem kadar iyi sonuç elde etmek. Bu ifade aslında nedir?
Sonuç: ‘a yakınsayacak varsa EK BİLGİNİN SONU Amaç: Verilen eğitim kümesi için, ortalama karesel hata ‘yı öğrenme performansının ölçütü olarak al ve bu amaç ölçütünü enazlayan parametreleri belirle. Toplam ani hata: Ortalama karesel hata:
Yapılan: yerine ‘yi en azlamak Eğitim kümesindeki k. veri için ileri yolda hesaplananı yazalım: 1. Gizli Katman Çıkışı 2. Gizli Katman Çıkışı
Eğitim kümesindeki k. veri için hesaplanan toplam ani hata
Çıkış katmanındaki j. nöron ile gizli katmandaki i. nörona ilişkin ağırlığın güncellenmesi Ağırlığın güncellenmesi Hangi yöntem? “en dik iniş “ (steepest descent)
Notasyona Dikkat!!!!! k eğitim kümesindeki kaçıncı veri olduğu aynı zamanda güncellemede bir iterasyon içinde kaçıncı defa güncellendiği çıkış katmanında j. nöron çıkışı gizli katmandaki i. nöron çıkışı Yeni notasyon Çıkış katmanı Gizli katmanın sayısı
Gizli katman ve çıkış katmanındaki her nöron iki iş yapıyor: (i) nöron çıkışındaki işareti nöron girişindeki işaretler cinsinden hesaplıyor, (ii) gradyen vektörünü geriye yayılım için yaklaşık olarak hesaplıyor Yerel gradyen
Çıkış katmanındaki tüm ağırlıkların güncellenmesi
gizli katman (gks-1)’deki j. nöron ile gizli katman (o)’daki i. nörona ilişkin ağırlığın güncellenmesi