Makine Öğrenmesinde Yeni Problemler YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ
Aktif Öğrenme (Active Learning) Eğitim örneklerinin etiketlerinin başta belli olmadığı, algoritmanın etiketini istediği örnekleri seçtiği problemlerdir. Amaç: veri etiketleme maliyetini azaltmak Yöntem: Tüm eğitim seti yerine bir kısmını kullanmak. Belirli bir test seti üzerinde; tüm eğitim setini kullanmış olmamıza göre benzer, kabul edilebilir derecede düşük ya da daha yüksek başarı elde etmek YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ
Aktif Öğrenme Adımlar A: Küçük bir eğitim setiyle (E) başla. (eğitim kümesinin az bir kısmının etiketlerini iste) B: Bir model üret. Bu modele göre etiketsiz eğitim örneklerine (EE) dair tahminlerini üret. C: Bu tahminlere göre bu örneklerden bir kısmını seç (tahmin kesinliğine göre) ve etiketlerini iste. (EE’den çıkar, E’ye ekle) B ve C adımlarını tekrar et YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ
Aktif Öğrenme Sorular İlk eğitim setinin (E) seçiminin önemi var mı? EE’deki örneklerin sınıflandırma problemlerinde tahmin kesinliği nasıl hesaplanır? Tahmin kesinliği Regresyon problemlerinde nasıl ölçülebilir? Kolektif öğrenme nerede kullanılabilir? YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ
Yarı Eğiticili Öğrenme (Semisupervised Learning) Modelin oluşturulmasında etiketli verilerin yanında etiketsiz verilerinde kullanıldığı problemlerdir. Temel fikir: Elde hem etiketli hem de etiketsiz veriler var. Belirli bir test seti üzerinde, sadece etiketli verileri kullanmak yerine, etiketsizleri de kullanmak daha olur. YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ
Yarı Eğiticili Öğrenmede Sorular Etiketsiz örneklerin tahmini sınıfları nasıl hesaplanır? Regresyon problemlerinde nasıl hesaplanır? Kolektif öğrenme nerede kullanılabilir? YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ
Kısmı Etiketler (Partial labels) Örneklerin birden fazla etiketi var. Sadece 1’i doğru. Ör: İçinde birden fazla kişinin olduğu resimler ve kişilerin isimlerinin listesi var. Ama hangisi hangisinin ismi belli değil. YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ
Çok Etiketli Verilerde Öğrenme (Multi-label learning) Bir örneğin birden fazla doğru etiketinin olduğu durumlar: –Bir kişi hem baba, hem öğretmen, hem şişman olabilir. –Bir haber metni hem siyaset hem ekonomiye ait olabilir. –Bir kişide birden çok hastalık olabilir. YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ
Kalabalıktan Öğrenme (Learning from crowds) Örneklerin çok sayıda öğretmenin etiketlediği, hangisinin doğru olduğunun bilinmediği durumlar. 100 kişiye elinizdeki verileri etiketletiyorsunuz. Kişilerin genel güvenilirlikleri belli / değil Kişilerin belirli tür örnekler için güvenilirlikleri farklı/ eşit YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ
Bütçeli Öğrenme (Budgeted learning) Elinde bir bütçe var. Bununla elindeki eğitim kümesinin örneklerini, örneklerin özelliklerini satın alıyorsun. Amaç eldeki bütçe (minimum data) en iyi test performansını elde etmek YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ
Planlı Öğrenme (Curriculum Learning) İnsanları eğitim örneklerini derecelendirerek eğitiyoruz. Önce ilkokul, sonra lise, üni. vb. Aynı şey makine öğreniciler için de mümkün mü? Zorluk dereceleri nasıl hesaplanır? YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ
Planlı Öğrenme (Curriculum Learning) Eğitim kümesindeki örnekleri zorluğa göre derecelendir. Her seviye için: –Eğitim ve validasyon kümesi ayır. –Önceki seviyenin eğitimiyle bu eğitimi birleştir. –Validasyonda test et. –Test başarısız olduğu sürece ve validasyonda örnek olduğu sürece Eğitime validasyondan örnek aktar. Validasyonun kalan kısmında test et. –(opsiyonel) Eğitim ve validasyonu birleştir. Eğit. –Bir sonraki seviyeye geç M.Fatih AMASYALI YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ