Kümeleme Modeli (Clustering)

Slides:



Advertisements
Benzer bir sunumlar
Unsupervised Learning (Kümeleme)
Advertisements

BPR151 ALGORİTMA VE PROGRAMLAMA - I
Veri Madenciliğinde Kümeleme Slink Algoritması
RASTGELE SAYI ÜRETİMİ VE UYGULANAN TESTLER
GEOMETRİYE MERHABA.
SINIFLANDIRMA VE REGRESYON AĞAÇLARI (CART)
MIT563 Yapay Zeka ve Makine Öğrenmesi
Problemi Çözme Adımları
HER GENÇ MATEMATİK ÖĞRENEBİLİR MURAT GÜNER KELKİT
Kümeleme Modeli (Clustering)
Prof. Dr. Halil İbrahim Karakaş Başkent Üniversitesi
Asansör Simülatörünün Ürettiği Sonuçlar Üzerinde Yapılan K-means++ Kümeleme Çalışması ile Trafik Türünün Tahmini M. Fatih ADAK Bilgisayar Mühendisliği.
Support Vector Machines
MUTO METODU İLE DEPREM HESABI
CLUSTERING USING REPRESENTATIVES Hazırlayan: Arzu ÇOLAK
Mustafa Seçkin DURMUŞ Serdar İPLİKÇİ
Bellek Tabanlı Sınıflandırma
MIT503 Veri Yapıları ve algoritmalar En önemli graf problemleri
Ekleyen: Netlen.weebly.com.
İleri İstatistik Teknikleri
5 KONUM VEKTÖRÜ M.Feridun Dengizek.
TBF - Genel Matematik I DERS – 8 : Grafik Çizimi
BPR152 ALGORİTMA VE PROGRAMLAMA - II
Abdulkerim Karabiber Ozan Gül
KONİKLER Tanım:Sabit bir noktası F ve sabit bir doğrusu Δ olan bir Π düzleminin (P) = {P:|PF| = |PH| , Δ , F , P € Π } noktalarının kümesine parabol denir.
SINIFLANDIRMA VE REGRASYON AĞAÇLARI
BİYOİNFORMATİK NEDİR? BİYOİNFORMATİKTE KULLANILAN SINIFLAMA YÖNTEMLERİ
YAPAY SİNİR AĞLARI VE BAYES SINIFLAYICI
PARÇACIĞIN KİNEMATİĞİ Düzlemde Eğrisel Hareket
M.Fatih AMASYALI Uzman Sistemler Ders Notları
Yrd. Doç. Dr. Mustafa Akkol
KARTEZYEN ÇARPIM Sıralı İkili İki Kümenin Kartezyen Çarpımı
Pİramİtler.
HER GENÇ MATEMATİK ÖĞRENEBİLİR MURAT GÜNER KELKİT
Makine Öğrenmesinde Yeni Problemler
SONLU ELEMANLAR DERS 4.
Problem Yaklaşım Temelleri, Algoritma ve Akış Şeması
İKİ DEĞİŞKENLİ FONKSİYONLARDA
ÇEMBERİN ANALİTİK İNCELENMESİ
BİL 102 BİLGİSAYAR PROGRAMLAMA DERS 1. PROGRAM GELİŞTİRME AŞAMALARI 1- Probleme ilişkin veriler nelerdir? 2- Çözüm yöntemi nasıl olacaktır? 3- Çözüm sonucunda.
Algoritmalar ve Programlama I Ders 2: Akış Diyagramları
Objeler Arası Mesafe / Benzerlik
Demetleme (Clustering)
En Yakın k-komşu Algoritması Bellek Tabanlı Sınıflandırma
Kümeleme Algoritmaları
EE465: Introduction to Digital Image Processing Copyright Xin Li
Veri Madenciliği Kümeleme Analizi: Temel Tanımlar ve Algoritmalar
Veri Madenciliği Kümeleme Analizi: Temel Tanımlar ve Algoritmalar
Regresyon Analizi İki değişken arasında önemli bir ilişki bulunduğunda, değişkenlerden birisi belirli bir birim değiştiğinde, diğerinin nasıl bir değişim.
Floyd Algoritması Floyd Algoritması Dijkstra algoritmasının daha genel halidir. Çünkü şebekedeki herhangi iki düğüm arasındaki en kısa yolu belirler. Algoritma,
BİL551 – YAPAY ZEKA Kümeleme
PROGRAMLAMA TEMELLERİ Burak UZUN Bilişim Teknolojileri Öğretmeni Burak UZUN.
YER FOTOGRAMETRİSİ (2014) SUNU III Doç. Dr. Eminnur Ayhan
ÇOK DEĞİŞKENLİ FONKSİYONLAR
En kısa yol yön.alg. (shortes path routing alg.)
VERİLERİN DERLENMESİ VE SUNUMU
Geriye Yayılım Algoritması (Back-Propagation Algorithm)
Tamsayılı Doğrusal Programlama Algoritmaları
Çok Katmanlı Algılayıcı-ÇKA (Multi-Layer Perceptron)
Kümeleme ve Regresyon Problemleri için Kolektif Öğrenme
5.1 POLİNOMİNAL REGRESSİYON
EK BİLGİ Bazı Eniyileme (Optimizasyon) Teknikleri Eniyileme problemi
İleri Algoritma Analizi
AÇILAR Açı Nedir? Aynı doğru üzerinde olmayan, başlangıç noktaları ortak olan iki ışının birleşim kümesine AÇI denir. Açı.
AÇILAR Açı Nedir? Aynı doğru üzerinde olmayan, başlangıç noktaları ortak olan iki ışının birleşim kümesine AÇI denir. Açı.
Uzay ve Uzay Çalışmaları.
Problemi Çözme Adımları
DAVRANIŞ BİLİMLERİNDE İLERİ İSTATİSTİK DOKTORA
Mehmet Fatih KARACA Mustafa GÜNEL Akif Alkan TAŞTAN
Sunum transkripti:

Kümeleme Modeli (Clustering) K-Means Clustering Kümeleme Dr.Banu Diri-YTÜ /17

K-Means Kümeleme K-Mean Clustering (kümeleme) Nedir ?   Eğiticisiz bir yöntem olan K-Mean Clustering, eldeki verileri özelliklerine göre hiçbir sınıf bilgisi olmadan K sayıda kümeye gruplama işlemidir. Gruplama, ilgili cluster’ın centroid (merkez) değeri ile veri setindeki her objenin/nesnenin arasındaki farkın kareleri toplamının minimumu alınarak gerçekleştirilir. Objelerin sınıflandırılması işlemi gerçekleştikten sonra her bir sınıfa veya kümeye ilgili etiketin verilmesi uzman bir kişi tarafından yapılır. Dr.Banu Diri-YTÜ

K-Means Clustering Örnek: Eğitim setinizde 4 adet objenin olduğu ve her bir objenin iki özelliğe sahip olduğunu varsayalım. Nesne Özellik 1 (X) ağırlık indeksi Özellik 2 (Y) pH Medicine A 1 Medicine B 2 Medicine C 4 3 Medicine D 5 Öncelikle bilinmesi gereken objelerin kaç kümeye ayrılacağıdır (bu örnek için 2 olsun, Cluster 1 ve Cluster 2). Esas problem ise bu ilaç objelerinin hangisinin Cluster 1, hangisinin Cluster 2’ye ait olduğudur. Dr.Banu Diri-YTÜ

K-Means Kümeleme Algoritması Adımları-1 Öncelikle cluster (küme) sayısına karar verilir (k) Herbir cluster’ın centroid/merkez noktası belirlenir * Başlangıç centroid’leri olarak veri setinden rasgele k nokta seçilebilir veya * Veriler sıralanarak her k ve k’nın katlarında yer alan değerler centroid noktaları olarak alınabilir Dr.Banu Diri-YTÜ

K-Means Kümeleme Algoritması Adımları-2 Daha sonra K-means algoritmasında, cluster’lar içerisinde yer alan objeler hareketsiz kalıncaya kadar yani yer değiştirmeyinceye kadar üç aşamadan oluşan işlem tekrarlanır Centroid noktalarına karar verilir Her objenin centroid noktalarına olan uzaklıkları hesaplanır Her obje minimum uzaklığı sahip olduğu cluster’a atanır Dr.Banu Diri-YTÜ /17

Centroid değerlerinin hesaplanması Başla Sınıf sayısı Centroid değerlerinin hesaplanması Centroidlerin objelere olan uzaklığı Minimum uzaklığa göre gruplama Obje hareket etti mi? E H Bitir Dr.Banu Diri-YTÜ

Nesne Özellik 1 (X) ağırlık indeksi Özellik 2 (Y) pH Medicine A 1 Medicine B 2 Medicine C 4 3 Medicine D 5 Her bir objeyi (medicine) özellik uzayında (X,Y) olarak gösterecek olursak Dr.Banu Diri-YTÜ

Adım 1 : Başlangıç centroid değerleri : İterasyon 0: Adım 1 : Başlangıç centroid değerleri : İlk centroid değerleri olarak Medicine A ve Medicine B ’yi alalım. Centroid koordinatları C1=(1,1) ve C2=(2,1) olsun.                      Dr.Banu Diri-YTÜ

Adım 2 : Objelerin centroid’lere olan mesafesinin ölçülmesi : Herbir obje ile cluster centroid’i arasındaki mesafeyi ölçmek için Euclidean Distance kullanılır.  C1=(1,1) ve C2=(2,1) Medicine A (1,1) C1 C2 Medicine B (2,1) C1 C2 Medicine C (4,3) C1 C2 Medicine D (5,4) C1 C2 Dr.Banu Diri-YTÜ

Sıfırıncı iterasyonda elde edilen distance matrisi Adım 3 : Herbir objenin minimum değeri hangi cluster’a ait ise, o obje artık o cluster’a ait demektir. Dr.Banu Diri-YTÜ /17

Adım 1 : Herbir cluster için yeni centroid değerleri hesaplanır. İterasyon 1: Adım 1 : Herbir cluster için yeni centroid değerleri hesaplanır. Her cluster içerisinde yer olan objelerin ortalama değerleri alınır.            Birinci cluster içerisinde sadece Medicine A (1,1) olduğundan Cluster-1 ‘in yeni centroid değerleri C1(1,1) dir. Cluster-2 içerisinde Medicine B-C-D olduğundan Dr.Banu Diri-YTÜ

Adım 2 : Tüm objelerin yeni centroid değerlerine olan mesafeleri yeniden hesaplanır. C1=(1,1) ve C2=(3.67,2.67) Medicine A (1,1) C1 C2 Medicine B (2,1) C1 C2 Medicine C (4,3) C1 C2 Medicine D (5,4) C1 C2 Dr.Banu Diri-YTÜ

Birinci iterasyonda elde edilen distance matrisi Adım 3 : Herbir objenin minimum değeri hangi cluster’a ait ise, o obje artık o cluster’a ait demektir. Objelerin yerleri değiştiği için aynı iterasyona devam edilir. Dr.Banu Diri-YTÜ

Adım 1 : Herbir cluster için yeni centroid değerleri hesaplanır. İterasyon 2: Adım 1 : Herbir cluster için yeni centroid değerleri hesaplanır. Her cluster içerisinde yer olan objelerin ortalama değerleri alınır.            Birinci cluster içerisinde sadece Medicine A(1,1) ve B(2,1) olduğundan Cluster-1 ‘in yeni centroid değerleri C1 dir. Cluster-2 içerisinde Medicine C(4,3) ve D(5,4) olduğundan Dr.Banu Diri-YTÜ /17

Adım 2 : Tüm objelerin yeni centroid değerlerine olan mesafeleri yeniden hesaplanır. C1=(1.5,1) ve C2=(4.5,3.5) Medicine A (1,1) C1 C2 Medicine B (2,1) C1 C2 Medicine C (4,3) C1 C2 Medicine D (5,4) C1 C2 Dr.Banu Diri-YTÜ

İkinci iterasyonda elde edilen distance matrisi Adım 3 : Herbir objenin minimum değeri hangi cluster’a ait ise, o obje artık o cluster’a ait demektir. Objelerin yerleri değişmediği için işlem tamamlanmıştır. G2 = G1 Dr.Banu Diri-YTÜ

Nesne Özellik 1 (X) ağırlık indeksi Özellik 2 (Y) pH Medicine A 1 Medicine B 2 Medicine C 4 3 Medicine D 5 Cluster 1 2 Dr.Banu Diri-YTÜ /17