Bölüm 4 için Ders Notları Introduction to Data Mining

Slides:



Advertisements
Benzer bir sunumlar
Unsupervised Learning (Kümeleme)
Advertisements

ZAMAN SERİLERİ MADENCİLİĞİ KULLANILARAK NÜFUS ARTIŞI TAHMİN UYGULAMASI
NAVIE BAYES CLASSIFICATION
MIT563 Yapay Zeka ve Makine Öğrenmesi
TUVDBS VİDEO VERİTABANI YÖNETİM SİSTEMİ
Yüz Tanıma İçin İlinti Tabanlı Yama Yerelleştirme
İstatistik Kavramı İstatistik; kesin olmayışlığın ışığı altında karar verme tekniğidir. Ana kitle hakkında örneklem yardımıyla tahmin çalışmalarıdır. Kitle.
Mustafa Seçkin DURMUŞ Serdar İPLİKÇİ
Bellek Tabanlı Sınıflandırma
Karar Ağaçları.
EMRE SEVİNDİK KONU: ANALİZ ÖNCESİ YAPILMASI GEREKEN İŞLEMLER
MIT563 Yapay Zeka ve Makine Öğrenmesi
Karar Ağaçları İle Sınıflandırma
İstatistiksel Sınıflandırma
Çizge Teorisi, Dağıtık Algoritmalar ve Telsiz Duyarga Ağları
Yazılım Proje Yönetimi
Yüz Tanıma. Yüz Tanıma - İnsan İnsan düşük çözünürlükteki resimlerden de yüz tanıma yeteneğine sahiptir.
BAŞARIM’09, Nisan 2009, ODTÜ, Ankara PARALEL VER İ MADENC İ L İĞİ ALGOR İ TMALARI.
9.Sınıf Psikoloji 4.Ünite Ruh Sağlığının Temelleri
KARAKTER TANIMA Utku Cevre Barış Özkan.
DEĞİŞKENLER VE VERİ TİPLERİ
SINIFLANDIRMA VE REGRASYON AĞAÇLARI
Yrd. Doç. Dr Hamit ACEMOĞLU
BİYOİNFORMATİK NEDİR? BİYOİNFORMATİKTE KULLANILAN SINIFLAMA YÖNTEMLERİ
Yapay Zeka Teknikleriyle Tıbbi Verilerin İşlenmesi: VERİ MADENCİLİĞİ
SQL Komutları (2) Uzm. Murat YAZICI.
Rakam Tanıma İçin KNN ve LDA Algoritmalarının Karşılaştırılması
Sınıflandırıcılar -2.
BİL551 – YAPAY ZEKA Öğrenme ve Sınıflandırma
BİL551 – YAPAY ZEKA Genetik Algoritma
Veri Madenciliği Giriş.
DEĞİŞKEN TİPLERİ ve SPSS’ de VERİTABANI HAZIRLANMASI.
Sayı Sistemleri Geçen Hafta Kayan Noktalı Sayılar
Sınıflandırma ve Tahmin
Sınıflandırma & Tahmin — Devam—
Demetleme (Clustering)
Veri Madenciliği Anormallik Tespiti
Veri Madenciliği Kümeleme Analizi: Temel Tanımlar ve Algoritmalar
Veri Madenciligi . Sınıflandırma ve Regresyon Ağaçları ( CART )
Karar Ağaçları.
Veri Madenciliği Birliktelik Analizi: Temel Kavramlar ve Algoritmalar
Yapay Zeka Desteği ile Parfüm Öneri Sistemi
Faaliyet Planlamasının Yapılması
Bazı Sorular Gerçekten de belirlenen ağırlıklar ile istenilen kararlı denge noktalarına erişmemizi sağlayacak dinamik sistem yaratıldı mı? Eğer evet ise,
BİL551 – YAPAY ZEKA Kümeleme
BİL3112 Makine Öğrenimi (Machine Learning) 7. Hafta
“Bilgi”’nin Gösterimi “Bilgi” İnsan veya Makina Yorumlama Öngörme Uygun yanıt verme Depolanmış enformasyon veya model Kurallar: (1) Benzer sınıflardan.
Örüntü Tanıma.
Sınıflandırma ve Tahmin
Gökhan SİLAHTAROĞLU, Zehra Nur CANBOLAT
Sınıflandırma & Tahmin — Devam—
Bölüm 4 için Ders Notları Introduction to Data Mining
TESTLER
BİLİMSEL SÜREÇ BECERİLERİ
Karar Ağaçları (Decision trees)
BİLGİ VE AĞ GÜVENLİĞİ DERSİ ÖDEVİ Ödev Konuları: 1) Dağıtık sistemler nedir avantajı nelerdir ? 2) Arp zehirlenmesi nedir? 3) Günümüzde kullanılan en güncel.
HTML HTML Stilleri.
Çizgeler Çizge G=(V,E), ikilisine denir, burada V sonlu bir kümedir, E ise bu kümenin elemanları arasında ikili bir bağıntıdır. V kümesine G çizgesinin.
MADDE VE YAPISI SORU BANKASI
NAVIE BAYES CLASSIFICATION
Arş.Gör.Dr.Kevser Ayar KTÜ Tıp Fakültesi Aile Hekimliği AD
Sınıflandırma & Tahmin — Devam—
Algoritmalar II Ders 11 Çizgeler. Çizgelerin bilgisayarda gösterimi. BFS algoritması.
Yrd. Doç. Dr. Abdullah BAYKAL Konuşmacı : Cengiz Coşkun
Volkan Erol1,2 Yard.Doç.Dr.Aslı Uyar Özkaya1
Çizge Algoritmalari 5. ders.
NİŞANTAŞI ÜNİVERSİTESİ
Karar Ağaçları Destekli Vadeli Mevduat Analizi
Mehmet Fatih KARACA Mustafa GÜNEL Akif Alkan TAŞTAN
TEST.
Sunum transkripti:

Bölüm 4 için Ders Notları Introduction to Data Mining Veri Madenciliği Sınıflandırma: Temel Tanımlar, Karar Ağaçları ve Model Değerlendirmesi Bölüm 4 için Ders Notları Introduction to Data Mining by Tan, Steinbach, Kumar, Çeviren Mete Çelik © Tan,Steinbach, Kumar Introduction to Data Mining 4/18/2004 1

Sınıflandırma: Tanım Bir kayıt kolleksiyonu verilsin (eğitim kümesi) Herbir kayıt parametreler grubu (x,y) ile karakterize edilir. Buradaki x özellik kümesidir ve y ise sınıf etiketidir. x: özellik, kestirici, bağımsız değişken, giriş y: etiket, cevap, bağımlı değişken, çıkış Görev: Herbir özellik kümesi x’i, daha önceden tanımlanmış sınıf etiketi y’den birine eşleştiren bir modeli öğren.

Sınıflandırma Görevi Örnekleri Özellik kümesi, x Sınıf etiketi, y E-posta mesajlarını kategorilere ayırmak Eposta üstbilgisinden veya içeriginden çıkarılan özellikler İstenmeyen e-posta (spam) veya değil ( non-spam) Tümör hücrelerini belirleme MRI görüntülerinden çıkarılan özellikler Kötü huylu veya iyi huylu hücreler Galaksileri kataloglama Teleskop resimlerinden çıkarılan özellikler Oval, spiral, or düzensiz-şekilli galaksiler

Sınıflandırma Modelinin Oluşturulması için Genel Yaklaşım

Sınıflandırma Teknikleri Temel Sınıflandırıcılar Karar Ağacı tabanlı Yöntemler Kural-tabanlı Yöntemler En yakın komşu Sinir Ağları Naïve Bayes ve Bayesian Belief Ağları Destek Vektör Makineleri Topluluk Sınıflandırıcıları (Ensemble Classifiers) Hızlandırma, Çuvallama, Rastgele Ağaçlar (Boosting, Bagging, Random Forests)

Bir Karar Ağacı Örneği Model: Karar Ağacı Eğitim Verisi kategorik kategorik sürekli sınıf Ayrılan Özellikler Home Owner Yes No NO MarSt Single, Divorced Married Income NO < 80K > 80K NO YES Eğitim Verisi Model: Karar Ağacı

Başka Bir Karar Ağacı Örneği kategorik kategorik sürekli sınıf MarSt Single, Divorced Married NO Home Owner No Yes NO Income < 80K > 80K NO YES Aynı veriye uyan birden fazla ağaç olabilir.

Karar Ağacı Sınıflandırma Görevi Decision Tree

Modelin Test Verisine Uygulanması Kökten başla Home Owner Yes No NO MarSt Single, Divorced Married Income NO < 80K > 80K NO YES

Modelin Test Verisine Uygulanması Home Owner Yes No NO MarSt Single, Divorced Married Income NO < 80K > 80K NO YES

Modelin Test Verisine Uygulanması Home Owner Yes No NO MarSt Single, Divorced Married Income NO < 80K > 80K NO YES

Modelin Test Verisine Uygulanması Home Owner Yes No NO MarSt Single, Divorced Married Income NO < 80K > 80K NO YES

Modelin Test Verisine Uygulanması Home Owner Yes No NO MarSt Single, Divorced Married Income NO < 80K > 80K NO YES

Modelin Test Verisine Uygulanması Home Owner Yes No NO MarSt Single, Divorced Married Atanan değer “No” Income NO < 80K > 80K NO YES

Karar Ağacı Sınıflandırma Görevi Decision Tree

Karar Ağacı Algoritmaları Çok Sayıda Algoritma : Hunt Algorithması (ilk algoritmalardan) CART ID3, C4.5 SLIQ,SPRINT

Karar Ağaçları Algoritmalarının Tasarım Meseleleri Eğitim verilerinin nasıl ayrılması gerekir? Test durumunu belirlemek için bir metot belirle özellik tiplerine bağlı olabilir Bir test durumunun iyiliğini değerlendirmek için ölçme yap Ayırma işleminin nasıl durması gerekir? Bütün kayıtlar aynı sınıfa ait olunca veya benzer özellik değerlerine sahip olunca dur. Erken durdurma

Test Durumlarını İfade Eden Metotlar Özellik tipine bağlı İkili Nominal Ordinal Sürekli Ayırma sayısına bağlı 2-yönlü ayırma Çok-yönlü ayırma

Nominal Değerler için Test Durumları Çok-yölü ayırma : Ayrık değerler olarak çok sayıda bölme kullanılır. İkili ayırma Değerleri iki altkümeye ayırır Optimal bölümlemeyi bulmak gerekir.

Ornidall Değerler için Test Durumları Çok-yönlü ayırma: Ayrık değerler olarak çok sayıda bölme kullanılır. İkili ayırma : Değerleri iki altkümeye ayırır Optimal bölümlemeyi bulmak gerekir. Özellik değerleri arasındaki sıralamayı koru Bu gruplama sırayı bozar

Sürekli Değerler için Test Durumları