Birol Yüceoğlu Migros T.A.Ş.

Slides:



Advertisements
Benzer bir sunumlar
ÖĞRETİM İLKE VE YÖNTEMLERİ
Advertisements

Algoritma.  Algoritma, belirli bir görevi yerine getiren sonlu sayıdaki işlemler dizisidir.  Başka bir deyişle; bir sorunu çözebilmek için gerekli olan.
Küçük Grup Eğitimi Şifa Üniversitesi Sağlık Bilimleri Yüksekokulu Eğitici Eğitimi Kursu Eylül 2015 / 281.
Çıkış katmanındaki j. nöron ile gizli katmandaki i. nörona ilişkin ağırlığın güncellenmesi Ağırlığın güncellenmesi Hangi yöntem? “en dik iniş “ (steepest.
Hat Dengeleme.
SEVDA GÜL Y MEME MR’ INDA KANSER TESPITI.
T.C. ORDU VALİLİĞİ İlköğretim Müfettişleri Başkanlığı TAM ÖĞRENME MODELİ TAM ÖĞRENME MODELİ.
Bilimsel bilgi Diğer bilgi türlerinden farklı
Verilen eğitim kümesi için, ortalama karesel hata ‘yı öğrenme performansının ölçütü olarak al ve bu amaç ölçütünü enazlayan parametreleri belirle. EK BİLGİ.
Makine Öğrenmesinde Yeni Problemler YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ.
Raporlama Yapmanın Amaçları 2 -Yapılan çalışmaların sonuçlarını daha net görebilmek -Yapılan çalışmaları geçmiş zaman verileriyle kıyaslayabilmek -Rapor.
Parametrik ve Parametrik Olmayan Testler Ortalamaların karşılaştırılması t testleri Mann-Whitney U testi Wilcoxon İşaretli Sıra testi BBY252 Araştırma.
GEOMETRİK CİSİMLER VE HACİM ÖLÇÜLERİ
İSTATİSTİK II BAĞIMSIZLIK TESTLERİ VE İYİ UYUM TESTLERİ “ c2 Kİ- KARE TESTLERİ “
Program Tasarım Modelleri
ÖRNEKLEME YÖNTEMLERİ ve
Konum ve Dağılım Ölçüleri BBY252 Araştırma Yöntemleri Güleda Doğan.
Hata Fonksiyonları Lojistik Fonksiyon ß ß Huber Fonksiyonu ß ß.
Çoklu Doğrusal Bağlantı X3X3 X2X2 r X 2 X 3 = 1 Tam Çoklu Doğrusal Bağlantı.
Istatistik I Fırat Emir.
PROGRAMLI ÖĞRETİM Tanımı:
T- Testİ: ORTALAMALAR ARASI FARKLARIN TEST EDİLMESİ
Okul Deneyimi Dersi Eser Çeker (Uz.).
Öğretimin Uyarlanması
Deneme Modelleri Neden-sonuç ilişkilerinin sorgulandığı araştırma türleridir. Deneme ve tarama modelleri arasındaki fark nedir? Deneme modellerinde amaçlar.
BİLİMSEL ARAŞTIRMA TEKNİKLERİ
Yrd.Doç.Dr.İstem Köymen KESER
ÖRNEKLEME.
Yapay Sinir Ağı Modeli (öğretmenli öğrenme) Çok Katmanlı Algılayıcı
MODEL YETERSİZLİKLERİNİ DÜZELTMEK İÇİN DÖNÜŞÜMLER VE AĞIRLIKLANDIRMA
Parametrik Olmayan (Non-parametrik) Testler
Kütle ortalamasının (µ) testi
BOYUT Hikmet SIRMA.
İleri Algoritma Analizi
Bilimsel Araştırma Yöntemleri
BİYOİNFORMATİK NEDİR? BİYOİNFORMATİKTE KULLANILAN SINIFLAMA YÖNTEMLERİ
Bölüm 6: Araştırma Evreni ve Örnekleme
İSTATİSTİK.
İSTATİSTİK Yrd. Doç. Dr. Cumhur TÜRK
EVREN VE ÖRNEKLEME YÖNTEMLERİ.
Bağımlı (Eşleştirilmiş) Örneklerde t-Testi (Paried Sample t test) Menüsü Bağımlı örnekler için deney tasarımı iki farklı biçimde karşımıza çıkmaktadır.
MİMARLIK BÖLÜMÜ STATİK DERSİ
PARAMETRİK HİPOTEZ TESTLERİ
BENZETİM Prof.Dr.Berna Dengiz 13. Ders Çıktı Analizi
Meriç ÇETİN Pamukkale Üniversitesi Bilgisayar Mühendisliği Bölümü
ÖĞRETİM ARAÇ-GEREÇLERİNİN SEÇİMİ ve HAZIRLANMASI
Bir Kurumda Öğrenme Merkezi (ÖMer) Nasıl Oluşturulur?
ÖDE5024 DAVRANIŞ BİLİMLERİNDE İSTATİSTİK Yüksek Lisans
Evren-Örneklem, Örnekleme Yöntemleri 2
ÖLÇEKLER ÖLÇMEDE HATA KORELASYON
Tezin Olası Bölümleri.
İletişim Fakültesi Bilişim A.B.D.
ÖDE5024 DAVRANIŞ BİLİMLERİNDE İSTATİSTİK Yüksek Lisans
EĞİTİMDE ÖLÇME VE DEĞERLENDİRME
ÖĞRETİM STRATEJİLERİ SUNUŞ YOLUYLA ÖĞRETİM BULUŞ YOLUYLA ÖĞRETİM
İçerik Analizi Sözel, yazılı ve diğer materyallerin içerdiği mesajı anlam ve/veya dilbilgisi açısından nesnel ve sistematik olarak sınıflandırma, sayılara.
HİPOTEZ TESTLERİ.
Evren-Örneklem, Örnekleme Yöntemleri 1
Araştırma Önerisi ve Hazırlanması
NİŞANTAŞI ÜNİVERSİTESİ
5.Hafta Varyans Analizi -ANOVA
Veri ve Türleri Araştırma amacına uygun gözlenen ve kaydedilen değişken ya da değişkenlere veri denir. Olgusal Veriler Yargısal Veriler.
Ölçmede Hata Kavramı ve Hata Türleri
6.HAFTA: ARAŞTIRMALARDA ÖLÇME VE ÖLÇEKLERDE GÜVENİLİRLİK
Dönem 2 Biyoistatistik Uygulama
ARAŞTIMALARDA YÖNTEM.
BİLİMSEL ARAŞTIRMA YÖNTEMLERİ
Bilimsel Araştırma Yöntemleri
2. HAFTA Bilimsel Araştırma Temel Kavramlar.
Kararların Modellenmesi ve Analizi Ders Notu III
Sunum transkripti:

Birol Yüceoğlu Migros T.A.Ş. www.veridefteri.com biroly@migros.com.tr Boosting Birol Yüceoğlu Migros T.A.Ş. www.veridefteri.com biroly@migros.com.tr

İçerik Karar ağaçları Bagging Boosting LightGBM Scikit-learn Ana fikir Boosting vs. Bagging LightGBM Scikit-learn AdaBoost Calibration Gradient Boosting

Karar Ağaçları Özniteliklerin değerlerine göre yapılan kırılımlarla birbirine benzeyen örnekleri ayrıştırmaya dayanır. Kırılımlarla elde edilen veri kümeleri kendi içlerinde benzer olmalıdır. Yapılan ayrıştırmalarla problem için kurallar oluşturulur. Uygulaması ve anlaması kolaydır (ağacın kendisi ve özniteliklerin önemi). Olası problemler: Düşük yanlılık (bias), yüksek varyans (variance) Parametre eniyilemesi Derinlik, yapraklardaki örnek sayısı Veriye ve alınan kararlara aşırı duyarlı

Karar Ağaçları

Karar Ağaçları Regresyon problemi Gözlemlerin x değerle- rine göre y değerlerini tahmin edeceğiz. Aşırı uyum

Bagging Hedefimiz varyansı azaltmak. Birbirinden bağımsız olarak 0.51 olasılıkla doğru tahmin yapan modellere sahip olalım. (Weak learner) Bu modellerden 1 tane kullanırsak %51 ihtimalle doğru tahmin yaparız. Bu modellerden 5 tane kullanırsak %52 ihtimalle doğru tahmin yaparız. Bu modellerden 100 tane kullanırsak %58 ihtimalle doğru tahmin yaparız. Bu modellerden 1000 tane kullanırsak %74 ihtimalle doğru tahmin yaparız. Birbirinden bağımsız modeller!!!!

Bagging Birbirinden bağımsız modeller nasıl oluşturulur? Bağımsız yerine korelasyonu düşük modeller Gözlemler Öznitelikler Bootstrap ile yeni örneklemler oluşturmak (Bagging) Rassal özniteliklerle modelleme (Rassal orman)

Boosting Yavaş öğrenmeye dayalı bir yöntem Zayıf öğrenen (weak learner) modellerle bir topluluk öğrenmesi gerçekleştirilir. Sıralı/iteratif bir yöntem Ana fikir: Hatadan öğrenmek AdaBoost: hatalı tahmin edilen gözlemlerin ağırlıklandırarak hatayı düzeltmeye çalışır. Gradient Boosting: iteratif olarak hatayı tahmin eder Stochastic Gradient Boosting: her adımda veri kümesinden örneklem seçerek ilerler.

Boosting vs. Bagging Boosting Bagging İteratif Paralel Ağırlıklı ortalama Ortalama (voting) Değiştirilmiş veri kümesi Rassal örneklem / öznitelikler Bütün veri kümesi Rassal örneklem (korrelasyon azaltma) Aşırı uyum olabilir Aşırı uyuma dayanıklı Yavaş öğrenme Rassal öğrenme Bias (yanlılık) azaltma Variance (varyans) azaltma

Gradient Boosting Gradient Boosting yönteminde her iterasyonda bir önceki iterasyondaki hata tahmin edilmeye çalışılır. Hatadan öğrenmek gradyanın tersi yönde ilerlemeye denk gelir. Örneklem ve öznitelikler rassal olarak seçilerek de ilerlenebilir (Stochastic Gradient Boosting).

Gradient Boosting

Gradient Boosting Hata terimleri

Gradient Boosting

Gradient Boosting Hatanın tahmini

Gradient Boosting

Gradient Boosting (Scikit-learn)

Gradient Boosting (Scikit-learn)

Gradient Boosting (Scikit-learn)

Gradient Boosting (Scikit-learn)

Gradient Boosting (Scikit-learn) Aşırı uyuma

AdaBoost Zayıf öğrenen modellerle ilk tahmin Hataya göre veri kümesindeki gözlemlerin ağırlıklandırılması Ağırlıklandırma ya da ağırlıklı bootstrap Ağırlıklara göre tahmin Ağırlıkların güncellenmesi Son modelin oluşturulması (ağırlıklı toplam)

AdaBoost (Örnek) Hatalı gözlemlerin ağırlıklandırılması

AdaBoost (Örnek) Ağırlıklı gözlemlere göre tahmin

AdaBoost (Örnek)

Paketler Gradient Boosting AdaBoost LightGBM (R, Python) scikit-learn (Python) xgboost (R, Python) Gbm (R) AdaBoost