“Bilgi”’nin Gösterimi “Bilgi” İnsan veya Makina Yorumlama Öngörme Uygun yanıt verme Depolanmış enformasyon veya model Nasıl anlayacağız? Nasıl gösterimi oluşturacağız? Kurallar: (1) Benzer sınıflardan benzer girişler ağda benzer gösterimler oluşturmalı ve böylece aynı kategoriye ait olarak sınıflanmalı, (2) Farklı sınıflara ayrılacak nesnelere, ağda çok farklı gösterimler atanmalı, (3) Belirli bir özellik önemli ise ağda onun gösterimi ile görevlendirilen hücre sayısı daha fazla olmalı,
Benzerliğin bir ölçütü - Norm V vektör uzayı olmak üzere, aşağıdaki dört özelliği sağlayan fonksiyon : normdur
Gösterim için bir yol Bir T harfi Bir L harfi İşlem uygulayacağımıza göre nasıl ifade edebiliriz? Bir T harfi Bir L harfi
parametrelerin nasıl değiştirildiği ile belirlenir. Ağın içinde bulunduğu ortamdan etkilenerek parametrelerini değiştirmesi işlemi öğrenmedir. Öğrenme şekli, parametrelerin nasıl değiştirildiği ile belirlenir. Öğrenme Süreçleri Öğrenme Süreçleri Eğiticili Öğrenme Eğiticisiz Öğrenme Pekiştirmeli Öğrenme Özdüzenlemeli Öğrenme
Eğiticili Öğrenme Ortam Eğitici + - Eğitilen Sistem
Eğitici ortam hakkında bilgiye sahip Eğitilen sistem ortam hakkında bilgiye sahip değil ağırlıklar Eğitilen sisteme ilişkin ....................... eğitim kümesinde içerilen bilgi ve ........ aracılığı ile değiştiriliyor hata Eğiticinin ortam hakkında sahip olduğu bilgi, eğitilen sisteme aktarılıyor Burada rahatsız edici bir şey var, ne?
Pekiştirmeli Öğrenme Eğitilen Sistem davranış Kritik Ödül r δ Değer Atama Ortam Öğrenme işleminin her adımında istenilen yanıtı sağlayan bir eğitici yok Eğitilen sistem, sonuçta elde edilecek yanıta erişmek için gerekli davranışı eleştiriyi gözönünde tutarak bulmak zorunda 7
Özdüzenlemeli Öğrenme Ortam Eğitilen Sistem Bilgiye sahip ya da eleştiride bulunan bir eğitici yok Eğitilen sistem girişlerin istatiksel dağılımını belirledikten sonra sınıflamayı oluşturuyor. 8
Genlikte Ayrık Algılayıcı-GAA (Perceptron) x1 x2 xn 1 y x1 x2 xn 1 w1 w2 wn wn+1 w1 w2 wn wn+1 v y 9
Ancak Rosenblatt’ın 1954’de önerdiği yapı bundan farklı Giriş Katmanı y w1 w2 wm x1 x2 xn y x1 x2 xn 1 w1 w2 wn wn+1 Çıkış Katmanı Çıkış Katmanı Giriş Katmanı Birinci Katman Bağlantı ağırlıkları, eğitim kümesi ile belirlenen tek bir nöron Sabit ağırlıklar, sabit fonksiyonlar 10
Genlikte Ayrık Algılayıcı aslında Girişlere doğrudan bağlı tek bir nöron değil Birinci katman değişmeyen bir yapıya sahip Çıkış katmanı, tek bir nörondan oluşan eğitilebilir bir yapı. Birinci katmanda farklı fonksiyonları oluşturup, öğrenme ile bunlar cinsinden çıkışta istenilen fonksiyonu ifade etmek Peki Rosenblatt neden birinci katmana gerek duymuş? Tanım: Doğrusal ayrıştırılabilir küme (Linearly separable set) gi ‘ler x’in doğrusal fonksiyonu olmak üzere X kümesi R tane Xi alt kümesinden oluşsun. ise Xi kümeleri doğrusal ayrıştırılabilir kümelerdir. 11
Tanımı anlamaya çalışalım... (-1,1) (1,1) (-1,-1) (1,-1) R=? g’leri yazalım Bu iki kümenin doğrusal ayrıştırılabilir olduğunu göstermek için ne yapmalıyız? ve sağlayan a,b ve c’ler bulunmalı bir çözüm: 12
Tanım: Karar Düzlemi (Decision Surface) Kümeleri ayıran düzlem. Özellikle, örüntüleri farklı sınıflara ayıran düzlem olarak kullanılıyor. Tanım: Karar Düzlemi (Decision Surface) Kümeleri ayıran düzlem. Tek bir nöron ile neler yapılabilir? Nöron sayısını artırarak ne yapılabilir ne yapılamaz? 13
Rosenblatt’ın Genlikte Ayrık Algılayıcısında neler oluyor? Girişler Katman1’in çıkışı Ne oldu? n-boyutlu bir vektör bir örüntüyü temsil ediyor (pattern) Örüntü uzayı (pattern space) Bu dönüşüm genel olarak doğrusal değil y w1 w2 wm x1 x2 xn Genlikte Ayrık Algılayıcı için karar düzlemi: ?????? Genlikte Ayrık Algılayıcı ancak katman 1’in görüntü uzayındaki örüntüleri................................................ise iki sınıfa ayırır. Doğrusal Ayrıştırılabilir 14
Soru: Katman 1’de m işlem birimine sahip bir GAA, katman 1 görüntü uzayınındaki P tane örüntüyü 2 sınıfa kaç türlü ayırabilir? Burada işi ne? Hatırlatma: Yanıt: Soru: Herhangi bir doğrusal karar düzleminin GAA ile hesaplanabilme olasılığı nedir? Yanıt: m büyük bir sayı ise 2(m+1)’den daha az sayıdaki örüntüyü doğru şekilde sınıflayabilir. 0 < P <2(m+1) 15
XOR Genlikte Ayrık Algılayıcı ile ifade etmek: Katman 1 örüntüleri doğrusal ayrıştırılabilecekleri görüntü uzayına taşır. Doğrusal ayrıştırılamayan örüntüleri doğrusal ayrıştırılabilir kılmak iki türlü olasıdır: (i) m (ii) P XOR Genlikte Ayrık Algılayıcı ile ifade etmek: (0,1) (1,1) (0,0) (1,0) P=4, n=2 İki girişli, tek nöronun kapasitesi: 2*3=6 Kapasite açısından uygun ama doğrusal ayrıştırılabilir değiller m mi P mi değişti? (0,1) (1,1) (0,0) (1,0) (0,1,1) (1,1,1) (0,0,0) (1,0,1) 16
Şimdi Genlikte Ayrık Algılayıcı ile biraz iş yapalım m mi P mi değişti? Şimdi Genlikte Ayrık Algılayıcı ile biraz iş yapalım y x1 x2 xm 1 w1 w2 wm wm+1 Verilenler: Eğitim Kümesi Amaç: İki sınıfa ayırmak Gerçeklenebilme Koşulu: Eğitim kümesi doğrusal ayrıştırılabilir Eğitim kümesi doğrusal ayrıştırılabilir ise: 17
Eğitim kümesi doğrusal ayrıştırılabilir değil ise: Öğrenme Kuralı: öğrenme hızı <1 olan pozitif bir sayı 18