Endüstride Veri Madenciliği Uygulamaları Yrd. Doç. Dr. Ayhan Demiriz 28/2/2006
Veri Madenciliği Geleneksel ve e-Ticarette yaygın bir şekilde kullanılmaktadır. Özellikle büyük kuruluşlar ve devleti ilgilendiren uygulamalarda otomatik olarak veri toplanmaktadır. Toplanan büyük ölçekli bu veriler “zeki” veri analizi yöntemlerine ihtiyaç duymaktadırlar. Başlıca kullanım alanları: Ticaret, Sigorta, Sağlık, Telekom, Finans ve Web sitesi analizleri
Çapraz Satış Mevcut müşterilerin başka ihtiyaçlarının kuruluş tarafından karşılanarak, ticari ilişkinin büyüklüğünü artırmak ve böylece müşteri memnuniyetine katkıda bulunmak. Dikkat! Çift taraflı kılıç olabilir. Ürün tavsiyesi önem kazanmaktadır.
Veri Madenciliği: Amazon.com Kişiselleştirme Ürün tavsiyesi Ürünlerin destelenmesi (bundling) Dinamik fiyatlandırma
Mevcut Müşteriyi Tutma Yeni bir müşteriyi kazanma maliyeti, mevcut bir müşteriyi elde tutmaktan daha fazladır. Ticari kuruluşlar, mevcut müşteri portföyünden ayrılma ihtimali olan müşterileri tahmin ederek önlem alabilirler. Daha önce kaybedilen müşterilerin profillerinden faydalanarak, mevcut müşterilerin ayrılma ihtimalleri hesaplanabilir.
Veri Madenciliği-Örnek Uygulamalar: Müşteri Kayıp Oranlarının Azaltılması Bir cep telefonu şirketi tipik olarak %25-%30 müşterisini her yıl kaybedebilir Problemin Tanımı: Geçmiş aylara ait (2 ila18 ay arasında) verilerin elde olduğu varsayılırsa, önümüzdeki bir yada iki ay içersinde terk edebilecek müşterilerin bulunması Müşteri değerinin hesaplanması Çözüm Aşamaları: Ayrılabilecek potansiyel müşterileri bul Bölgesel modeller geliştir Yeni kampanyaları kabul etme eğilimine sahip müşterileri hedefle Aylık yaklaşık %2 müşteri kaybını %1.5’düşür
Veri Madenciliği-Örnek Uygulamalar: Kredi Riski Kredi itibarı yüksek olan müşteriler krediye pek ihtiyaç duymayabilirler – Bu kesimin banka ile iş hacmi az olabilir Kredi ihtiyacı çok yüksek olan kişilerin ise kredi itibarları çok düşük olabilir – Kredilerin geri ödenmeme riski çok yüksektir Bir banka için en kazançlı müşteri kitlesi bu ikisi arasında olandır. Yani kredi kullanıp, kabul edilebilir bir risk ile zamanında ödeyebilen müşteri kitlesi
Genomic Microarrays – Örnek Uygulama Microarray (mikrodizin?) veri seti verilen örneklerin (hastaların): Teşhislerini doğru yapabilir miyiz? Verilen bir tedavinin sonucunu tahmin edebilir miyiz? En iyi tedaviyi hastaya tavsiye edebilir miyiz?
Örnek: ALL/AML Veri Seti 38 eğitim verisi, 34 test verisi, ~ 7,000 gen 2 Sınıf: Acute Lymphoblastic Leukemia (ALL) ile Acute Myeloid Leukemia (AML) Eğitim verisini kullanarak teşhis modeli kur. ALLAML Test veri setinin sonuçları: 33/34 doğru, 1 yanlış - belkide yanlış etiketlemeden ötürü
Arama Motorları Metin madenciliği İlgili dökümanların listelenmesi Metinlerin gruplanması – benzer metinleri gruplama Kullanıcı isteklerinin güncellenmesi Kullanıcı istekleri ve sonuçların ilişkilendirilmesi
Sepet Analizi Her müşterinin harcama listesi fiş kayıtlarından veya mağaza kartlarından elde edilebilir. Sık müşteriler kimlerdir? Sıklıkla alınan ürünler nelerdir? Sıklıkla birlikte alınan ürünler nelerdir? Bir ürünün alınması diğer ürünün satışını etkilemiş midir? Sepet büyüklüğü artırılabilir mi?