Kümeleme Modeli (Clustering)

Slides:



Advertisements
Benzer bir sunumlar
Yrd. Doç. Dr. Mustafa Akkol
Advertisements

Unsupervised Learning (Kümeleme)
Prof.Dr.Şaban EREN Yasar Üniversitesi Fen-Edebiyat Fakültesi
BPR151 ALGORİTMA VE PROGRAMLAMA - I
Veri Madenciliğinde Kümeleme Slink Algoritması
RASTGELE SAYI ÜRETİMİ VE UYGULANAN TESTLER
SINIFLANDIRMA VE REGRESYON AĞAÇLARI (CART)
KARMA Ş IK SAYILAR Derse giriş için tıklayın... A. Tanım A. Tanım B. i nin Kuvvetleri B. i nin Kuvvetleri C. İki Karmaşık Sayının Eşitliği C. İki Karmaşık.
MIT563 Yapay Zeka ve Makine Öğrenmesi
Problemi Çözme Adımları
Diferansiyel Denklemler
YAPAY ZEKA ÖDEV - 2 Kenan KILIÇASLAN Trakya Üniversitesi Fen Bilimleri Enstitüsü Makina Mühendisliği Doktora Programı.
JEODEZİ I Doç.Dr. Ersoy ARSLAN.
MATEMATİKSEL PROGRAMLAMA
Sınıflandırma Modeli K-Nearest Neighbor Sınıflandırıcı /12.
Asansör Simülatörünün Ürettiği Sonuçlar Üzerinde Yapılan K-means++ Kümeleme Çalışması ile Trafik Türünün Tahmini M. Fatih ADAK Bilgisayar Mühendisliği.
Support Vector Machines
MUTO METODU İLE DEPREM HESABI
CLUSTERING USING REPRESENTATIVES Hazırlayan: Arzu ÇOLAK
Tanımlayıcı İstatistikler
Mustafa Seçkin DURMUŞ Serdar İPLİKÇİ
İçerik Ön Tanımlar En Kısa Yol Problemi Yol, Cevrim(çember)
Bellek Tabanlı Sınıflandırma
MIT503 Veri Yapıları ve algoritmalar En önemli graf problemleri
BELLEK TABANLI SINIFLANDIRMA
Karar Ağaçları.
Ekleyen: Netlen.weebly.com.
İleri İstatistik Teknikleri
5 KONUM VEKTÖRÜ M.Feridun Dengizek.
MATRİSLER ve DETERMİNANTLAR
BPR152 ALGORİTMA VE PROGRAMLAMA - II
Abdulkerim Karabiber Ozan Gül
Görelilik Teorisi 1905 yılında Einstein üç makale yayınladı.
KONİKLER Tanım:Sabit bir noktası F ve sabit bir doğrusu Δ olan bir Π düzleminin (P) = {P:|PF| = |PH| , Δ , F , P € Π } noktalarının kümesine parabol denir.
SINIFLANDIRMA VE REGRASYON AĞAÇLARI
BİYOİNFORMATİK NEDİR? BİYOİNFORMATİKTE KULLANILAN SINIFLAMA YÖNTEMLERİ
Problem Yaklaşım Temelleri, Algoritma ve Akış Şeması
ÇOK DEĞİŞKENLİ FONKSİYONLARDA
Orta Doğu Teknik Üniversitesi Çevre Mühendisliği Bölümü LIFE Projesi-Eğitim Semineri ODTÜ, 1-2 Nisan 2004 Ankara 1 İmisyon Ölçümleri HAZIRLAYANLAR: Prof.
YAPAY SİNİR AĞLARI VE BAYES SINIFLAYICI
M.Fatih AMASYALI Uzman Sistemler Ders Notları
KARTEZYEN ÇARPIM Sıralı İkili İki Kümenin Kartezyen Çarpımı
SONLU ELEMANLAR DERS 4.
Problem Yaklaşım Temelleri, Algoritma ve Akış Şeması
BİL 102 BİLGİSAYAR PROGRAMLAMA DERS 1. PROGRAM GELİŞTİRME AŞAMALARI 1- Probleme ilişkin veriler nelerdir? 2- Çözüm yöntemi nasıl olacaktır? 3- Çözüm sonucunda.
Algoritmalar ve Programlama I Ders 2: Akış Diyagramları
Objeler Arası Mesafe / Benzerlik
Demetleme (Clustering)
En Yakın k-komşu Algoritması Bellek Tabanlı Sınıflandırma
Kümeleme Algoritmaları
EE465: Introduction to Digital Image Processing Copyright Xin Li
Veri Madenciliği Kümeleme Analizi: Temel Tanımlar ve Algoritmalar
Veri Madenciliği Kümeleme Analizi: Temel Tanımlar ve Algoritmalar
Regresyon Analizi İki değişken arasında önemli bir ilişki bulunduğunda, değişkenlerden birisi belirli bir birim değiştiğinde, diğerinin nasıl bir değişim.
Floyd Algoritması Floyd Algoritması Dijkstra algoritmasının daha genel halidir. Çünkü şebekedeki herhangi iki düğüm arasındaki en kısa yolu belirler. Algoritma,
BİL551 – YAPAY ZEKA Kümeleme
PROGRAMLAMA TEMELLERİ Burak UZUN Bilişim Teknolojileri Öğretmeni Burak UZUN.
En kısa yol yön.alg. (shortes path routing alg.)
Kümeleme Modeli (Clustering)
Geriye Yayılım Algoritması (Back-Propagation Algorithm)
Tamsayılı Doğrusal Programlama Algoritmaları
Kümeleme ve Regresyon Problemleri için Kolektif Öğrenme
5.1 POLİNOMİNAL REGRESSİYON
EK BİLGİ Bazı Eniyileme (Optimizasyon) Teknikleri Eniyileme problemi
İleri Algoritma Analizi
Uzay ve Uzay Çalışmaları.
Problemi Çözme Adımları
DAVRANIŞ BİLİMLERİNDE İLERİ İSTATİSTİK DOKTORA
Mehmet Fatih KARACA Mustafa GÜNEL Akif Alkan TAŞTAN
Sunum transkripti:

Kümeleme Modeli (Clustering) K-Means Clustering Kümeleme Dr.Banu Diri-YTÜ /17

K-Means Kümeleme K-Mean Clustering (kümeleme) Nedir ?   Eğiticisiz bir yöntem olan K-Mean Clustering, eldeki verileri özelliklerine göre hiçbir sınıf bilgisi olmadan K sayıda kümeye gruplama işlemidir. Gruplama, ilgili cluster’ın centroid (merkez) değeri ile veri setindeki her objenin/nesnenin arasındaki farkın kareleri toplamının minimumu alınarak gerçekleştirilir. Objelerin sınıflandırılması işlemi gerçekleştikten sonra her bir sınıfa veya kümeye ilgili etiketin verilmesi uzman bir kişi tarafından yapılır. Dr.Banu Diri-YTÜ

K-Means Clustering Örnek: Eğitim setinizde 4 adet objenin olduğu ve her bir objenin iki özelliğe sahip olduğunu varsayalım. Nesne Özellik 1 (X) ağırlık indeksi Özellik 2 (Y) pH Medicine A 1 Medicine B 2 Medicine C 4 3 Medicine D 5 Öncelikle bilinmesi gereken objelerin kaç kümeye ayrılacağıdır (bu örnek için 2 olsun, Cluster 1 ve Cluster 2). Esas problem ise bu ilaç objelerinin hangisinin Cluster 1, hangisinin Cluster 2’ye ait olduğudur. Dr.Banu Diri-YTÜ

K-Means Kümeleme Algoritması Adımları-1 Öncelikle cluster (küme) sayısına karar verilir (k) Herbir cluster’ın centroid/merkez noktası belirlenir * Başlangıç centroid’leri olarak veri setinden rasgele k nokta seçilebilir veya * Veriler sıralanarak her k ve k’nın katlarında yer alan değerler centroid noktaları olarak alınabilir Dr.Banu Diri-YTÜ

K-Means Kümeleme Algoritması Adımları-2 Daha sonra K-means algoritmasında, cluster’lar içerisinde yer alan objeler hareketsiz kalıncaya kadar yani yer değiştirmeyinceye kadar üç aşamadan oluşan işlem tekrarlanır Centroid noktalarına karar verilir Her objenin centroid noktalarına olan uzaklıkları hesaplanır Her obje minimum uzaklığı sahip olduğu cluster’a atanır Dr.Banu Diri-YTÜ /17

Centroid değerlerinin hesaplanması Başla Sınıf sayısı Centroid değerlerinin hesaplanması Centroidlerin objelere olan uzaklığı Minimum uzaklığa göre gruplama Obje hareket etti mi? - + Bitir Dr.Banu Diri-YTÜ

Nesne Özellik 1 (X) ağırlık indeksi Özellik 2 (Y) pH Medicine A 1 Medicine B 2 Medicine C 4 3 Medicine D 5 Her bir objeyi (medicine) özellik uzayında (X,Y) olarak gösterecek olursak Dr.Banu Diri-YTÜ

Adım 1 : Başlangıç centroid değerleri : İterasyon 0: Adım 1 : Başlangıç centroid değerleri : İlk centroid değerleri olarak Medicine A ve Medicine B ’yi alalım. Centroid koordinatları C1=(1,1) ve C2=(2,1) olsun.                      Dr.Banu Diri-YTÜ

Adım 2 : Objelerin centroid’lere olan mesafesinin ölçülmesi : Herbir obje ile cluster centroid’i arasındaki mesafeyi ölçmek için Euclidean Distance kullanılır.  C1=(1,1) ve C2=(2,1) Medicine A (1,1) C1 C2 Medicine B (2,1) C1 C2 Medicine C (4,3) C1 C2 Medicine D (5,4) C1 C2 Dr.Banu Diri-YTÜ

Sıfırıncı iterasyonda elde edilen distance matrisi Adım 3 : Herbir objenin minimum değeri hangi cluster’a ait ise, o obje artık o cluster’a ait demektir. Dr.Banu Diri-YTÜ /17

Adım 1 : Herbir cluster için yeni centroid değerleri hesaplanır. İterasyon 1: Adım 1 : Herbir cluster için yeni centroid değerleri hesaplanır. Her cluster içerisinde yer olan objelerin ortalama değerleri alınır.            Birinci cluster içerisinde sadece Medicine A (1,1) olduğundan Cluster-1 ‘in yeni centroid değerleri C1(1,1) dir. Cluster-2 içerisinde Medicine B-C-D olduğundan Dr.Banu Diri-YTÜ

Adım 2 : Tüm objelerin yeni centroid değerlerine olan mesafeleri yeniden hesaplanır. C1=(1,1) ve C2=(3.67,2.67) Medicine A (1,1) C1 C2 Medicine B (2,1) C1 C2 Medicine C (4,3) C1 C2 Medicine D (5,4) C1 C2 Dr.Banu Diri-YTÜ

Birinci iterasyonda elde edilen distance matrisi Adım 3 : Herbir objenin minimum değeri hangi cluster’a ait ise, o obje artık o cluster’a ait demektir. Objelerin yerleri değiştiği için aynı iterasyona devam edilir. Dr.Banu Diri-YTÜ

Adım 1 : Herbir cluster için yeni centroid değerleri hesaplanır. İterasyon 2: Adım 1 : Herbir cluster için yeni centroid değerleri hesaplanır. Her cluster içerisinde yer olan objelerin ortalama değerleri alınır.            Birinci cluster içerisinde sadece Medicine A(1,1) ve B(2,1) olduğundan Cluster-1 ‘in yeni centroid değerleri C1 dir. Cluster-2 içerisinde Medicine C(4,3) ve D(5,4) olduğundan Dr.Banu Diri-YTÜ /17

Adım 2 : Tüm objelerin yeni centroid değerlerine olan mesafeleri yeniden hesaplanır. C1=(1.5,1) ve C2=(4.5,3.5) Medicine A (1,1) C1 C2 Medicine B (2,1) C1 C2 Medicine C (4,3) C1 C2 Medicine D (5,4) C1 C2 Dr.Banu Diri-YTÜ

İkinci iterasyonda elde edilen distance matrisi Adım 3 : Herbir objenin minimum değeri hangi cluster’a ait ise, o obje artık o cluster’a ait demektir. Objelerin yerleri değişmediği için işlem tamamlanmıştır. G2 = G1 Dr.Banu Diri-YTÜ

Nesne Özellik 1 (X) ağırlık indeksi Özellik 2 (Y) pH Medicine A 1 Medicine B 2 Medicine C 4 3 Medicine D 5 Cluster 1 2 Dr.Banu Diri-YTÜ /17