Makine Öğrenmesinde Yeni Problemler

Slides:



Advertisements
Benzer bir sunumlar
MIT563 Yapay Zeka ve Makine Öğrenmesi
Advertisements

ZAMAN SERİLERİ MADENCİLİĞİ KULLANILARAK NÜFUS ARTIŞI TAHMİN UYGULAMASI
ALPER LAÇİN SERDAR TAŞAN
MIT503 Veri Yapıları ve algoritmalar Algoritma Oluşturma – Açgözlü algoritmalar ve buluşsallar Y. Doç. Yuriy Mishchenko.
MIT563 Yapay Zeka ve Makine Öğrenmesi
NESNEYE YÖNELİK PROGRAMLAMA SINIFLAR
M.Fatih AMASYALI Yapay Zeka Ders Notları
MIT563 Yapay Zeka ve Makine Öğrenmesi
Filogenetik analizlerde kullanılan en yaygın metotlar
Asansör Simülatörünün Ürettiği Sonuçlar Üzerinde Yapılan K-means++ Kümeleme Çalışması ile Trafik Türünün Tahmini M. Fatih ADAK Bilgisayar Mühendisliği.
4 Kontrol Yapıları: 1.Bölüm.
İçerik Ön Tanımlar En Kısa Yol Problemi Yol, Cevrim(çember)
Bellek Tabanlı Sınıflandırma
MIT563 Yapay Zeka ve Makine Öğrenmesi
Karar Ağaçları.
MIT563 Yapay Zeka ve Makine Öğrenmesi
Bölüm 3 – Yapısal Programlama
Çok Etmenli Sistemlerde Yük Dengeleme ve Yük Paylaşımı
İstatistiksel Sınıflandırma
YAPAY ZEKA ve UZMAN SİSTEMLER
Simülasyonların Kullanımı
Yrd. Doç. Dr. Ayhan Demiriz
Rekabet ortamında arama Adversarial Search
Arama ile sorun çözme Ders 3.
BİYOİNFORMATİK NEDİR? BİYOİNFORMATİKTE KULLANILAN SINIFLAMA YÖNTEMLERİ
PEER SUPPORT TEAM.
ÜNİTE ÖZETİ Öğrenciler çevrelerinde gördükleri teknolojik araçlar hakkında bilgi edinecekler. Yeni teknolojik araçlar tanıyacaklar. Tanıdıkları araçların.
TEOG Sınavından Yüksek Puan Almak İçin 10 Altın Tavsiye
YAPAY SİNİR AĞLARI VE BAYES SINIFLAYICI
TRAFİK SORUNU Çözüm.
Örnekleme Yöntemleri Şener BÜYÜKÖZTÜRK, Ebru KILIÇ ÇAKMAK,
DEĞERLERİM VE MESLEĞİM
SONLU ELEMANLAR YÖNTEMİ
Makine Öğrenmesinde Yeni Problemler
Uzmandan Bilgi Alma M.Fatih AMASYALI Uzman Sistemler Ders Notları.
MEDİKAL GÖRÜNTÜ İŞLEMENİN AMACI
YONT401 YÖNETİM BİLİŞİM SİSTEMLERİ
Meta Analizinde Son Gelişmeler
Temel Bilgisayar Bilimleri Dersi
Pazarlama Bilgi Sistemi (PBS)
Bulanık Mantık Kavramlar:
Yapay Zeka Desteği ile Parfüm Öneri Sistemi
BİL3112 Makine Öğrenimi (Machine Learning)
Yapay Sinir Ağları (Artificial Neural Networks) Bir Yapay Sinir Ağı Tanımı (Alexander, Morton 1990) Yapay sinir ağı, basit işlemci ünitelerinden oluşmuş,
Makine Öğrenmesinde Yeni Problemler YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ.
Bilgisayar Mühendisliğindeki Yeri
YAPIM KUŞAĞI ÜRETİYORUM ETKİNLİĞİ.
Bölüm 4 : VERİ MADENCİLİĞİ
Makine Öğrenmesinde Yeni Problemler YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ.
Örüntü Tanıma.
ÖLÇME VE DEĞERLENDİRME DERSİ
Bilişim Teknolojileri ve Yazılım Dersi
YAPAY ZEKA DERS NOTLARI UYGULAMALARI Bölüm 1 : Yapay Zeka
ARAÇLAR VE AÇIK-UÇLU ÖĞRENME ORTAMLARI
Öğr.Gör. Hüseyin TURGUT / Tefenni MYO hturgut.com.
Kümeleme ve Regresyon Problemleri için Kolektif Öğrenme
SAĞLIK KURUMLARINDA KARAR VERME YÖNTEMLERİ
EĞİTİMDE ÖLÇME VE DEĞERLENDİRME
Bilgisayar Bilimi Problem Çözme Süreci-2.
EĞİTİMDE BİLGİSAYAR KULLANIMI
Volkan Erol1,2 Yard.Doç.Dr.Aslı Uyar Özkaya1
YAPAY ZEKA Genel Kavramlar hturgut.com
Yapay Zeka Nadir Can KAVKAS
Karar Ağaçları Destekli Vadeli Mevduat Analizi
Yapay Öğrenme Teorisi Bölüm-1
Yapay Öğrenme Teorisi Bölüm-2
Bilişim Teknolojileri Meslek Seçimi ve Ücretler (2019)
Sunum transkripti:

Makine Öğrenmesinde Yeni Problemler YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ

Aktif Öğrenme (Active Learning) Eğitim örneklerinin etiketlerinin başta belli olmadığı, algoritmanın etiketini istediği örnekleri seçtiği problemlerdir. Amaç: veri etiketleme maliyetini azaltmak Yöntem: Tüm eğitim seti yerine bir kısmını kullanmak. Belirli bir test seti üzerinde; tüm eğitim setini kullanmış olmamıza göre benzer, kabul edilebilir derecede düşük ya da daha yüksek başarı elde etmek YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ

Aktif Öğrenme Adımlar A: Küçük bir eğitim setiyle (E) başla. (eğitim kümesinin az bir kısmının etiketlerini iste) B: Bir model üret. Bu modele göre etiketsiz eğitim örneklerine (EE) dair tahminlerini üret. C: Bu tahminlere göre bu örneklerden bir kısmını seç (tahmin kesinliğine göre) ve etiketlerini iste. (EE’den çıkar, E’ye ekle) B ve C adımlarını tekrar et YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ

Aktif Öğrenme Sorular İlk eğitim setinin (E) seçiminin önemi var mı? EE’deki örneklerin sınıflandırma problemlerinde tahmin kesinliği nasıl hesaplanır? Tahmin kesinliği Regresyon problemlerinde nasıl ölçülebilir? Kolektif öğrenme nerede kullanılabilir? YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ

Yarı Eğiticili Öğrenme (Semisupervised Learning) Modelin oluşturulmasında etiketli verilerin yanında etiketsiz verilerinde kullanıldığı problemlerdir. Temel fikir: Elde hem etiketli hem de etiketsiz veriler var. Belirli bir test seti üzerinde, sadece etiketli verileri kullanmak yerine, etiketsizleri de kullanmak daha olur. YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ

Yarı Eğiticili Öğrenmede Sorular Etiketsiz örneklerin tahmini sınıfları nasıl hesaplanır? Regresyon problemlerinde nasıl hesaplanır? Kolektif öğrenme nerede kullanılabilir? YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ

Kısmı Etiketler (Partial labels) Örneklerin birden fazla etiketi var. Sadece 1’i doğru. Ör: İçinde birden fazla kişinin olduğu resimler ve resimdeki kişilerin isimlerinin listesi var. Her yüz listedekilerden birine ait. Ama hangisi hangisinin ismi belli değil. YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ

Çok Etiketli Verilerde Öğrenme (Multi-label learning) Bir örneğin birden fazla doğru etiketinin olduğu durumlar: Bir kişi hem baba, hem öğretmen, hem şişman olabilir. Bir haber metni hem siyaset hem ekonomiye ait olabilir. Bir kişide birden çok hastalık olabilir. YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ

Kalabalıktan Öğrenme (Learning from crowds) Örneklerin çok sayıda öğretmenin etiketlediği, hangisinin doğru olduğunun bilinmediği durumlar. 100 kişiye elinizdeki verileri etiketletiyorsunuz. Kişilerin genel güvenilirlikleri belli / değil Kişilerin belirli tür örnekler için güvenilirlikleri farklı/ eşit YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ

Bütçeli Öğrenme (Budgeted learning) Elinde bir bütçe var. Bununla elindeki eğitim kümesinin örneklerini, örneklerin özelliklerini satın alıyorsun. Amaç eldeki bütçe (minimum data) en iyi test performansını elde etmek YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ

Planlı Öğrenme (Curriculum Learning) İnsanları eğitim örneklerini derecelendirerek eğitiyoruz. Önce ilkokul, sonra lise, üni. vb. Aynı şey makine öğreniciler için de mümkün mü? http://ronan.collobert.com/pub/matos/2009_curriculum_icml.pdf Verili bir veri kümesi için örneklerin zorluk dereceleri nasıl hesaplanır? Zorluk dereceleri farklı örnekler nasıl üretilir? YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ

Planlı Öğrenme (Curriculum Learning) Eğitim kümesindeki örnekleri zorluğa göre derecelendir. Her seviye için: Eğitim ve validasyon kümesi ayır. Önceki seviyenin eğitimiyle bu eğitimi birleştir. Validasyonda test et. Test başarısız olduğu sürece ve validasyonda örnek olduğu sürece Eğitime validasyondan örnek aktar. Validasyonun kalan kısmında test et. (opsiyonel) Eğitim ve validasyonu birleştir. Eğit. Bir sonraki seviyeye geç M.Fatih AMASYALI YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ

Anomaly / Novelty Detection One class classification Normal ve anormal durumların tespiti Uygulama alanları Güvenlik kameraları izleme Network trafiği izleme M.Fatih AMASYALI YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ

Transfer learning Bir problemi çözdükten sonra, benzeri başka bir problemi sıfırdan çözmek yerine önceki verileri, modelleri, parametreleri (gerekiyorsa dönüştürerek) kullanmak Amaç: yeni problemi sıfırdan çözmeye göre daha az maliyetli bir çözüm bulmak Örnek: eğitilmiş CNN ağırlıklarını yeni problemlerde kullanmak M.Fatih AMASYALI YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ

Online learning / Lifelong learning Modelin bir kez oluşturulup kullanılması zaman içinde değişen veriler için uygun değil Bu tür problemler için, öğrenimi devam eden modeller gerek Amaç: Minimum maliyetle modeli güncel tutmak M.Fatih AMASYALI YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ

Multi-task learning Aynı anda birden fazla şeyi öğrenmek Hem A hem B veri kümesini aynı yapı içinde modellemek Hem satranç, hem dama oynayabilen tek bir sistem M.Fatih AMASYALI YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ

Active Sampling Yeni eğitim datalarının neler olması gerektiğini keşfetmek Kararlarına güvenmediğin bölgelerden yeni örnekler iste Amaç: Veri toplama sürecinin maliyetini azaltmak M.Fatih AMASYALI YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ

Data Augmentation Eğitim datasını arttırmak mümkünse simülasyon Eğitim datasındaki örneklerle Amaç, yapay veriler üreterek eğitim kümesini daha iyi hale getirmek Örnek: bir resmin sınıfı, resmi basit dönüşümlere uğratsak değişmez M.Fatih AMASYALI YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ

Algoritmaları Kandırmak Spam email atanlar spam filter ları kandırmaya çalışır http://www.popsci.com/byzantine-science-deceiving-artificial-intelligence https://arxiv.org/abs/1412.1897 http://www.kdnuggets.com/2016/04/tricking-deep-learning.html Bunu bir avantaja çevirmek mümkün mü? Adversarial learning Generative Adversarial Networks https://www.quora.com/What-are-Generative-Adversarial-Networks https://arxiv.org/abs/1406.2661 M.Fatih AMASYALI YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ

One-shot learning Eğitim kümesinde her sınıf için tek bir örneğin olduğu problemler M.Fatih AMASYALI YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ

Zero-shot learning Eğitim kümesinde hiç örneği bulunmayan sınıflara atama yapabilmek Multi model yaklaşımlar kullanılıyor. Her örneğin bir resmi bir metni var. Test örneklerinin sadece metni var. M.Fatih AMASYALI YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ

Zero-shot learning https://nlp.stanford.edu/~socherr/SocherGanjooManningNg_NIPS2013.pdf M.Fatih AMASYALI YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ