Öğrenme ve Sınıflama.

Slides:



Advertisements
Benzer bir sunumlar
Algoritma.  Algoritma, belirli bir görevi yerine getiren sonlu sayıdaki işlemler dizisidir.  Başka bir deyişle; bir sorunu çözebilmek için gerekli olan.
Advertisements

SUNU HAZIRLAMA PROGRAMI: powerpoint
AKRAN DESTEKLİ ÖĞRENME
SEVDA GÜL Y MEME MR’ INDA KANSER TESPITI.
T.C. ORDU VALİLİĞİ İlköğretim Müfettişleri Başkanlığı TAM ÖĞRENME MODELİ TAM ÖĞRENME MODELİ.
Bilimsel bilgi Diğer bilgi türlerinden farklı
BÖLÜM 1 TEMEL KAVRAMLAR. BÖLÜM 1 TEMEL KAVRAMLAR.
İçerik Analizi Alan Araştırması BBY252 Araştırma Yöntemleri Güleda Doğan.
Tane Kavramının Öğretimi (Basamaklandırılmış Yönteme Göre)
Bilimsel Araştırma Yöntemleri ve İstatistik Doç.Dr. Ertuğrul GELEN.
Makine Öğrenmesinde Yeni Problemler YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ.
Öğretim Teknolojileri ve Materyal Geliştirme
EĞİTSEL OYUNLAR DOÇ. DR. GÜLTEN HERGÜNER BÖLÜM: 2
BULUŞ YOLUYLA ÖĞRETİM JEROME BRUNER.
Öğretim  Öğrenci gelişimini amaçlayan, öğrenmenin başlatılması, sürdürülmesi ve gerçekleştirilmesi için düzenlenen planlı etkinliklerden oluşan bir süreçtir.
Momentum Terimi Momentum terimi Bu ifade neyi anımsatıyor? Lineer zamanla değişmeyen ayrık zaman sistemi HATIRLATMA.
ÖZEL E Ğİ T İ MDE ETK İ L İ Ö Ğ RET İ M YÖNTEMLER İ KONU Ö ğ renmenin Aşamaları (Yanlışsız Ö ğ retim Yöntemleri) HAZIRLAYANLAR.
Hata Fonksiyonları Lojistik Fonksiyon ß ß Huber Fonksiyonu ß ß.
ÇOK BOYUTLU SİNYAL İŞLEME
Öğretim İlke ve Yöntemleri: Öğrenme Stratejileri
Bölüm 3 : Yapay Sinir Ağları (MatLab) Artificial Neural Network
Hipotez ve İlişkili Kavramlar
Istatistik I Fırat Emir.
Eğitimde ve Psikolojide ÖLÇME VE DEĞERLENDİRME
Erken çocukluk döneminde fen ve matematik kavramlarının gelişimi
Sıklık Dağılımları Yrd. Doç. Dr. Emine Cabı.
BİLİMSEL ARAŞTIRMA YÖNTEMLERİ ÜNİTE 3
T- Testİ: ORTALAMALAR ARASI FARKLARIN TEST EDİLMESİ
DENEYSEL TERTİPLER VE PAZAR DENEMESİ
Bilimsel Araştırma Yöntemleri
Deneme Modelleri Neden-sonuç ilişkilerinin sorgulandığı araştırma türleridir. Deneme ve tarama modelleri arasındaki fark nedir? Deneme modellerinde amaçlar.
ÖRNEKLEME.
Yapay Sinir Ağı Modeli (öğretmenli öğrenme) Çok Katmanlı Algılayıcı
BİLİŞİM SİSTEMLERİ GÜVENLİĞİ (2016)
BİYOİNFORMATİK NEDİR? BİYOİNFORMATİKTE KULLANILAN SINIFLAMA YÖNTEMLERİ
TEST GELİŞTİRME.
Buluş nedir?.
ZEE ZİHİN ENGELLİLERE BECERİ VE KAVRAM ÖĞRETİMİ
Psyc 351T Ölçme Teknikleri
KÜMELER HAZIRLAYAN : SELİM ACAR
GÖRÜŞME İLKE VE TEKNİKLERİ Sağlık Bilimleri Fakültesi
PISA 2015 Yrd. Doç. Dr. Ömer Kutlu.
İSTATİSTİK.
İSTATİSTİK Yrd. Doç. Dr. Cumhur TÜRK
PARAMETRİK HİPOTEZ TESTLERİ
Hazırlık Sınıfı Hazırlık Sınıfı 1. Kurs Olarak Uygulama
Okul Öncesi Dönemde Fen Eğitimi
EĞİTİME GİRİŞ Mehmet Akif Ersoy Üniversitesi
11. ÖĞRETMEN BİLGİ NOTLARI
Kemal AKYOL, Şafak BAYIR, Baha ŞEN
Bir Kurumda Öğrenme Merkezi (ÖMer) Nasıl Oluşturulur?
NİŞANTAŞI ÜNİVERSİTESİ
ÖĞRENME STİLLERİ.
ÖLÇEKLER ÖLÇMEDE HATA KORELASYON
ÖLÇME-DEĞERLENDİRME 1.DERS
Tezin Olası Bölümleri.
EĞİTİME GİRİŞ Mehmet Akif Ersoy Üniversitesi
Veri ve Türleri Araştırma amacına uygun gözlenen ve kaydedilen değişken ya da değişkenlere veri denir. Olgusal Veriler Yargısal Veriler.
Ölçmede Hata Kavramı ve Hata Türleri
MTM216 GÖRSEL PROGRAMLAMA
ARAŞTIMALARDA YÖNTEM.
Ders İçeriği Nicel araştırma adımları
Nitel Araştırmalar.
SES KOMUT TANIMA İLE GEZGİN ARAÇ KONTROLÜ
Sınıf Öğretmenlerinin Eğitsel Amaçlı İnternet Kullanım Öz Yeterlikleri
Bilimsel Araştırma Yöntemleri
Bilimsel araştırma türleri (Deneysel Desenler)
2. HAFTA BİLİMSEL ARAŞTIRMA YAKLAŞIMLARI
2. HAFTA Bilimsel Araştırma Temel Kavramlar.
Medİkal görüntülerde doktor – hasta bİlgİ gİzlİlİğİnİn sağlanmasI
Sunum transkripti:

Öğrenme ve Sınıflama

Sınıflandırma Sınıflandırma kavramı, basitçe bir veri kümesi (data set) üzerinde tanımlı olan çeşitli sınıflar arasında veriyi dağıtmaktır. Sınıflandırma algoritmaları, verilen eğitim kümesinden bu dağılım şeklini öğrenirler ve daha sonra sınıfının belirli olmadığı test verileri geldiğinde doğru şekilde sınıflandırmaya çalışırlar.

Öğrenme süreci Karar modellerinin öğrenilmesi için iki en önemli öğrenme yöntemi, Eğiticili-denetimli öğrenme (supervised learning) Eğiticisiz-denetimsiz öğrenme (unsupervised learning)

Eğiticili ve Eğiticisiz Öğrenme Eğiticili-denetimli öğrenme (supervised learning) : Sınıflandırma Sınıf sayısı ve bir grup örneğin hangi sınıfa ait olduğunu bilinir Eğiticisiz-denetimsiz öğrenme (unsupervised learning) : Kümeleme (Demetleme, öbekleme,…) Hangi nesnenin hangi sınıfa ait olduğu ve grup sayısı belirsizdir.

Eğiticili-denetimli öğrenme (supervised learning) Kırmızı hangi sınıftan?

Eğiticili-denetimli öğrenme (supervised learning)

Eğiticili-denetimli öğrenme (supervised learning)

Eğiticili-denetimli öğrenme (supervised learning)

Eğiticili-denetimli öğrenme (supervised learning)

Eğiticili-denetimli öğrenme (supervised learning) Denetimli öğrenme en çok yaygın öğrenme durumudur Olayların verileri ve bu verilere karşılık gelen çıktılar, sonuçlar, yada kararlar örnekleri bulunmaktadır Var olan olayların örnekleri kullanarak makine öğrenme sistemi genellemeye çalışmaktadır Önceden görülen olayın örnekleri kullanarak gelecek durumlar için sonuçlarını tahmin etmeye çalışmaktadır

Eğiticisiz-denetimsiz öğrenme (unsupervised learning) Eğiticili-Denetimli öğrenme Eğiticisiz-Denetimsiz öğrenme Sınıflar bilinir Sınıflar bilinmez

Eğiticisiz-denetimsiz öğrenme (unsupervised learning) Olayların örnekleri bilinir, ama onlara karşı gelen sonuçları bilinmez

Eğiticisiz-denetimsiz öğrenme (unsupervised learning) Kurulan Model kendi kendine çalışarak verilerin var olan yapısını bulması gerekiyor

Eğiticisiz-denetimsiz öğrenme (unsupervised learning) Bu sorunlara bazen “kümeleme” yada “clustering” denir, yani var olan olayların birkaç uygun küme/sınıfa konulması gerekiyor 1. sınıf 2. sınıf

Eğiticisiz-denetimsiz öğrenme (unsupervised learning) Kümeleme-Clustering

Eğiticisiz-denetimsiz öğrenme (unsupervised learning) Var olan verilere karşılık gelen çıktılar yok Algoritmanın kendi kendine verilerde var olan yapısını bulmasını gerekiyor “Verilerde yapı bulma” == “Kümeleme sorunu” (“clustering problemi”) Örnekler ne gibi uygun kümelere bölünebilir, veriler bu kümelere nasıl konulabilir, vb

Eğiticisiz-denetimsiz öğrenme (unsupervised learning) Uygulamalar, otomatik olarak haber sınıflandırma (örneğin news.google.com) benzer haberleri aynı kümelere koyup aynı başlangıçtan kullanıcılara sunmak Sosyal ağlar analizi; facebookta ilişki grafikler vb Pazar analizi; müşterilerin tercihleri açıklama Doğal verileri anlama; ekonomi, bioloji, vb

Öğrenmenin geleceği Öğrenme modülleri birçok uygulamaya girmiş durumda. Ticari olarak satılan (gerçek dünya için tasarlanmış) birçok ürün var. Bu tür ürün ve modüllerin sayısı giderek artmakta. Çözüm bekleyen ve büyük potansiyelleri olan birçok problem var.

Verilerin öğrenmede kullanımı Farklı türdeki pek çok veri işlemek gerek Sayısal Sayısal olmayan (kategorik, sözel, vb.) Veriyi sayısallaştırmak gerek

Verilerin sayısallaştırılması Resim: Resmin her bir pikselinin değeri 0–255 arası sayılara çevrilir. Renkli resimler 3 adet, siyah beyazlar 1 adet en*boy büyüklüğünde matrisle ifade edilir. Metin: Metindeki harfler, heceler ve kelimeler genelde frekanslarına göre kodlanarak sayılara çevrilir. Ses: Genlik ve frekansın zaman içindeki değişimiyle kodlanır.

Sınıflandırma Sınıflandırmanın temel kuralları: Sınıflandırma için öğrenme eğiticilidir Veri setinde bulunan her örneğin bir dizi özniteliği vardır ve bu niteliklerden biri de sınıf bilgisidir. Hangi sınıfa ait olduğu bilinen nesneler (öğrenme kümesi: training set) ile bir model oluşturulur Oluşturulan model öğrenme kümesinde yer almayan nesneler (deneme kümesi: test set) ile denenerek başarısı ölçülür.

Sınıflandırma Sınıflandırma, en basit anlamıyla, 2 aşamadan oluşur. Eğitim verisi üzerinden öğrenme Öğrenilen değerlerle test verisi üzerinde sınıflandırma

Eğiticili Sınıflandırma

Sınıflandırma Sınıflandırma (classification) problemi: nesnelerden oluşan veri kümesi (öğrenme kümesi): D={t1,t2,…,tn} her nesne niteliklerden oluşur, niteliklerden biri sınıf bilgisi Sınıf niteliğini belirlemek için diğer nitelikleri kullanarak bir model bulma Öğrenme kümesinde yer almayan nesneleri (test kümesi) mümkün olan en iyi şekilde doğru sınıflara atamak

Veri Kümesi (Öznitelikler-features) (Sınıf-Class) Yaş Boy Kilo Cinsiyet → 20 175 70 Erkek → 21 179 80 Erkek → 19 162 50 Kız → 22 169 55 Kız → 20 183 90 Erkek → 19 181 75 Erkek → 21 171 57 Kız →(Örnekler-samples)

Sınıflandırma Amaç: Bir niteliğin değerini diğer nitelikleri kullanarak belirlemek Verinin dağılımına göre bir model bulunur Bulunan model, başarımı belirlendikten sonra niteliğin gelecekteki ya da bilinmeyen değerini tahmin etmek için kullanılır Model başarımı: doğru sınıflandırılmış sınama kümesi örneklerinin oranı

Sınıflandırma Uygulamaları Kredi başvurusu değerlendirme Kredi kartı harcamasının sahtekarlık olup olmadığına karar verme Hastalık teşhisi Ses tanıma Karakter tanıma Gazete haberlerini konularına göre ayırma Kullanıcı davranışları belirleme …………….

Sınıflandırma için Veri Hazırlama Veri dönüşümü-Ayrıklaştırma(Discretisation) : Sürekli nitelik değeri ayrık hale getirilir Sayısal yaş {çocuk, genç, orta-yaş, yaşlı} Derece olarak sıcaklık {soğuk,serin,ılık,sıcak} Normalizasyon : ([-1,...,1], [0,...,1]) Veri temizleme: gürültüyü azaltma (Noise reduction) gereksiz nitelikleri silme

Sınıflandırma İşlemi Sınıflandırma işlemi üç aşamadan oluşur: Model oluşturma Model değerlendirme 3. Modeli kullanma

Sınıflandırma İşlemi: Model Oluşturma Her nesnenin sınıf etiketi olarak tanımlanan niteliğinin belirlediği bir sınıfta olduğu varsayılır Model oluşturmak için kullanılan nesnelerin oluşturduğu veri kümesi öğrenme kümesi (training set) olarak tanımlanır Model farklı biçimlerde ifade edilebilir IF – THEN – ELSE kuralları ile Karar ağaçları ile Matematiksel formüller ile

Sınıflandırma İşlemi: Model Değerlendirme Model Değerlendirme: Modelin başarımı (doğruluğu) test kümesi örnekleri kullanılarak belirlenir Sınıf etiketi bilinen bir test kümesi örneği model kullanılarak belirlenen sınıf etiketiyle karşılaştırılır Modelin doğruluğu, doğru sınıflandırılmış test kümesi örneklerinin toplam sınama kümesi örneklerine oranı olarak belirlenir Test kümesi model öğrenirken kullanılmaz. Test kümesi ile öğrenme kümesi bağımsız olmalı.

Sınıflandırma İşlemi: Modeli Kullanma Model daha önce görülmemiş örnekleri sınıflandırmak için kullanılır Örneklerin sınıf etiketlerini tahmin etme Bir niteliğin değerini tahmin etme

Sınıflandırma Metodunu Değerlendirme Doğruluk Sınıflandırıcı doğruluğu:sınıf etiketlerinin doğruluğu Tahmin doğruluğu: verinin değerinin tahmin doğruluğu Hız Modeli oluşturma süresi Sınıflandırma yapma süresi Kararlılık: verinin gürültülü yada eksik olması durumunda iyi sonuç vermesi Ölçeklenebilirlik: büyük boyutlu verilerle çalışabilmesi Anlaşılabilir olması: Kullanıcı tarafından yorumlanabilir olması

1. Adım: Model Oluşturma Sınıflandırma Algoritmaları Öğrenme Kümesi Sınıflandırıcı (Model) IF rank = ‘professor’ OR years > 6 THEN tenured = ‘yes’

2. Adım: Doğruluk değerlendirme Sınıflandırıcı IF rank = ‘professor’ OR years > 6 THEN tenured = ‘yes’ Sınama Kümesi 75% doğruluk

3. Adım : Modeli Kullanma Tenured? Sınıflandırıcı Yeni Veri (Jeff, Professor, 4) Tenured?

Sınıflandırma Yöntemleri: Yapay Sinir Ağları (Artificial Neural Networks) Karar Ağaçları (Decision Trees) Örnek Tabanlı Yöntemler (Instance Based Methods): k en yakın komşu (k nearest neighbor) Bayes Sınıflandırıcı (Bayes Classifier) Genetik Algoritmalar (Genetic Algorithms) …