Sunuyu indir
Sunum yükleniyor. Lütfen bekleyiniz
1
VERİ MADENCİLİĞİ
2
VERİ MADENCİLİĞİ Daha önceden bilinmeyen, geçerli ve uygulanabilir bilgiler Veritabanları veya diğer bilgi depolarındaki bilgiler veri ambarlarındaki bilgiler
3
Veri Madenciliği İle Elde Edilen Bilgilere Ne Zaman Başvurulur?
Sorgulama Karar Verme Süreç Kontrol Bilgi Yönetimi
4
Kuruluşlardaki depolanmış verilerden faydalı bilgiler
Veri Madenciliği Kuruluşlardaki depolanmış verilerden faydalı bilgiler Sorgulama Karar Verme Süreç Vontrol Bilgi Yönetimi
5
Uygulama Alanları Bankacılık Ve Sigorta Dolandırıcılık Tespiti
Kredi Kartı Dolandırıcılığı Kara Para Aklama
6
Uygulama Alanları Sağlık Tanı İçin Karar Destek Sistemi Olarak
7
Uygulama Alanları Spor Futbol Ve Basketbol
8
Uygulama Alanları Telekominasyon Firmaları
Mevcut Müşterilerin Elde Tutulması (Churn) Dolandırıcılık Tespiti
9
Uygulama Alanları Astronomi Yeni Keşifler
10
Uygulama Alanları Üretim Tesisleri
Üretimden Kaynaklanan Hataların Altında Yatan Gizli Nedenleri Ortaya Koyma
11
Perakende Satış Sektörü
Müşterilerin Satın Alma Örüntüleri Çapraz Satış Pazar Sepeti Analizi
12
Satış Tahmini Fiyatlandırma ve İndirim Tahmini Üretim / Tedarik Kararı
13
Müşteri Profili Çıkarma
Müşterilerin demografik özellikleri ile satın aldıkları ürünler arasındaki ilişki Kaç tip müşterim var? Müşteri Değerlendirme Müşteri İlişkileri Yönetimi
14
Diğer Genetik Mühendisliği Sinyal İşleme
Telefon Görüşmelerindeki Kesintileri Tahmin Yöntemiyle Giderme
15
Özet Olarak Üretimimi nasıl planlarım?
Üretimde gözden kaçan hatam var mı? Mevcut müşterilerime nasıl daha fazla satış yaparım? Hangi müşterilerim, iyi, uzun dönemli ve değerli? Hangileri değil? Hangi müşterim beni dolandırabilir? Ödemesini aksatabilir? Bana maliyet getiren müşterim var mı? Stratejik ve büyük işletme planlarımı tahmin edebilir miyim? Hangi müşterilerimi rakiplerime daha kolay kaptırabilirim? Daha etkin bir satış tekniği nasıl uygulayabilirm Fiyatlarımı nasıl belirlerim Üretimimi nasıl planlarım? Yeni müşteri potansiyeli oluşturabilir miyim?
16
Kullanan Firmalardan Bazıları
17
Değerlendirme ve Sunuş Temizleme ve Bütünleme
Problemin belirlenmesi. Bilgi Değerlendirme ve Sunuş Önişlemler Sonuçlar (Kurallar) Verinin elde edilmesi Veri Madenciliği Seçme ve Dönüştürme Madencilik Veri Ambarı Temizleme ve Bütünleme Veri Tabanları Bilgi Keşfinde Veri Madenciliği Aşamaları ve Adımları
18
Değerlendirme ve Sunuş Temizleme ve Bütünleme
Bilgi Problemin belirlenmesi. Değerlendirme ve Sunuş Sonuçlar (Kurallar) Madencilik Önişlemler Veri Madenciliği Seçme ve Dönüştürme Veri Ambarı Temizleme ve Bütünleme Veri Tabanları Bilgi Keşfinde Veri Madenciliği Aşamaları ve Adımları
19
VERİ AMBARI Belirli bir döneme ait Birleştirilmiş ve sabitlenmiş
Dış çevreden elde edilen bilgiler Konu odaklı olarak düzenlenmiş Sadece okunabilir
20
Bilgiler kullanıma hazır hale getirilir.
İşletmelerde kullanılan işlemsel veritabanlarından ve dış veri kaynaklarından elde edilir Bilgiler kullanıma hazır hale getirilir. Veri analizi ve sorgulama işlemleri gerçekleştirilir Karar verme aşamasında başvurulur
21
OLTP (İşlemsel Veritabanları)
Ekle Güncelle OLTP Veritabanı Sil Oku Some Applications on Records
22
Veri Madenciliği teknikleri sayesinde Güncel Verilerin işlendiği veritabanlarındaki veriler Başvurulabilir Bilgi haline dönüştürülür
23
Güncel Verilerin işlendiği Veritabanı Sistemi
Özellik Güncel Verilerin işlendiği Veritabanı Sistemi OLTP Analiz ve Sorgulama Sistemi OLAP Nitelik Günlük işlemler Bilgi Elde Etme İşlemleri Yönlendirme İşlem Kullanıcı Çalışanlar, Veritabanı Yöneticileri ve uzmanları Yöneticiler, Analistler ve Diğer Karar Verici Kişiler Yükümlülük Belli bir döneme ait bilgiler Veri Güncellenebilir günlük bilgiler Geçmiş dönemi kapsayan bilgiler Erişim Okunabilir/Güncellenebilir Çoğunlukla sadece okunabilir Odaklanma Kaydedilen veri Elde edilen bilgi
24
Veritabanı1 Müşteriler Tablosu Veritabanı2 Çalışanlar Tablosu Veritabanı3 Ürünler Tablosu Veritabanı4 Satışlar Tablosu Veri Ambarı Kesiti
25
Veritabanı1 (Müşteriler) Veritabanı2 Veritabanı3 (Ürünler) Müşteri ID
İsim Soyad Doğum Tarihi 132 Anıl Arıkan 234 Selen Akın Veritabanı2 (Çalışanlar) Çalışan ID İsim Soyad Doğum Tarihi 1 Esra Güney 2 Erdem Erkin Veritabanı3 (Ürünler) Ürün ID Tür Renk Kumaş 5 Etek Lacivert Keten 8 Bluz Pembe İpek 11 Pantolon Kahverengi Gabardin
26
Veritabanı4 (Satışlar) Müşteri ID Ürün ID Çalışan ID Miktar Tarih 132
5 1 8 2 ? 234 11 3 --
27
Veri Ambarı Kesiti Burç Renk Gün Özel Gün E: evet H: hayır Sıcaklık
Ürün Toplam Ürün Sayısı Aslan lacivert Salı E 12 etek 3 Yengeç kahverengi Perşembe H 13 pantolon 5 pembe Pazar 8 bluz 2 6 1 --
28
Örnek Veri Ambarı ZAMAN ÜRÜN ZAMAN ID ÜRÜN ID GÜN MARKA CİNS YIL
ZAMAN ÜRÜN ZAMAN ID ÜRÜN ID GÜN MARKA CİNS YIL TEDARİKÇİ TİPİ HAFTANIN GÜNÜ SAAT ÖZEL GÜN MÜ ? KİŞİ SATIŞ ANA TABLO KİŞİ ID YAŞ BURÇ MESLEK YER ID YER ÜCRET DİLİMİ ORTALAMA SATIS (TL) CİNSİYET TOPLAM SATIS (ADET) CADDE ORT. SATIS (ADET) İLÇE HESAPLAMALAR İL
29
MUAYENE ANA TABLO ZAMAN ID KİŞİ ID TANI ID YER ID SEDİMANTASYON
TRIGLISERİT ERİTROSİT KİŞİ YAŞ BURÇ MESLEK KAN GRUBU CİNSİYET TANI BELİRTİLER YANETKİ KLINIK SOKAK YER CADDE İLÇE İL ZAMAN GÜN AY YIL HAFTANIN GÜNÜ SAAT 23:00 – 07:00 ARASI MI? HESAPLAMALAR MUAYENE ANA TABLO
30
MUAYENE ANA TABLO SEDİMANTASYON TRIGLISERİT ERİTROSİT KAN GRUBU
ZAMAN ID KİŞİ ID TANI ID YER ID SEDİMANTASYON TRIGLISERİT ERİTROSİT KİŞİ YAŞ BURÇ MESLEK KAN GRUBU CİNSİYET TANI BELİRTİ ID YANETKİ RECETE ID YER IL ID ZAMAN GÜN AY YIL HAFTANIN GÜNÜ SAAT 23:00 – 07:00 ARASI MI? HESAPLAMALAR REÇETE REÇETE ID ILAÇ ID İL İL ID İLÇE SEMT MUAYENE ANA TABLO BELİRTİ
31
MUAYENE ANA TABLO ATEŞ TANSİYON NABIZ SEDİMANTASYON TRIGLISERİT
BELİRTİ BELİRTİ ID ZAMAN ID KİŞİ ID BELİRTİ ID TANI ID ATEŞ TANSİYON NABIZ MUAYENE ANA TABLO TANI TANI ID BELİRTİ ID YANETKİ RECETE ID ZAMAN ID KİŞİ ID TANI ID YER ID SEDİMANTASYON TRIGLISERİT ERİTROSİT REÇETE REÇETE ID ILAÇ ID YER YER ID IL ID İL İL ID İLÇE SEMT HESAPLAMALAR
32
Veri Dönüşümü ve Bütünleştirme
Veri Ambarı Mimarisi Kaynak Kullanıcı Kaynak Veri Dönüşümü ve Bütünleştirme Veri Ambarı Kullanıcı Kaynak Kaynak Kullanıcı
33
Değerlendirme ve Sunuş Temizleme ve Bütünleme
Bilgi Değerlendirme ve Sunuş Sonuçlar (Kurallar) Madencilik Önişlemler Veri Madenciliği Seçme ve Dönüştürme Veri Ambarı Temizleme ve Bütünleme Veri Tabanları Bilgi Keşfinde Veri Madenciliği Aşamaları ve Adımları
34
Veri Madenciliği Modelleri
Sınıflandırma Satış Tahminleri Sipariş Tahminleri Üretim Hata Maliyetlerinin Tahmini ve Nedenleri Dolandırıcılık Tespiti Kümeleme Müşteri Profili Çıkarma Ürün Satış Profili Çıkarma Hata Yer ve Zamanlarının Kümelenmesi Birliktelik Analizi Pazar Sepeti Analizi Zamana Bağlı Ardışık Satış
35
Veri Madenciliği Modelleri
Algoritmaları Sınıflandırma C5 C&R Tree CHAID Kümeleme Analizi En Yakın Komşu Algoritması K-Mean Birliktelik Analizi Gri Appriori
36
Veri Madenciliği Modelleri
Veri tabanlarındaki gizli örüntülerin varlığını ortaya koyma Tahmin yapma Belirli ortak özelliklere göre verileri gruplara ayırma Sınıflandırma
37
Veri Madenciliği Modelleri
Veri Madenciliğinde Örüntü Nedir? Bir varlık hakkında sayısal ortamda kayıtlı olan gözlemlenebilir ve ölçülebilir bilgilerdir.
38
Veri Madenciliği Modelleri
Örüntü Tanıma İşlemi Ele alınan bir örüntünün veritabanlarındaki benzerlerini araştırmaktır. Örüntü tanımada yapılan işlemler bir çeşit sınıflandırmadır.
39
Sınıflandırma Yöntemleri
Karar Ağaçlarına Dayalı Algoritmalar İstatistiğe Dayalı Algoritmalar - Bayesyen Sınıflandırma - Regresyon Mesafeye Dayalı Algoritmalar - K-En Yakın Komşu Algoritması Yapay Sinir Ağları
40
Classification Process
Renk A Kahve Pembe Burç Ürün B C Aslan Yengeç Bluz Etek D E F G 2 ürün Satış 2 ürün Satış 1 ürün satış 3 ürün Satış
41
Karar Ağacı İle Çıkartılan
Kural Örnekleri Kural 1: If renk = kahverengi Then If burç=“aslan” Then karar = 3 ürün satış ; if burç = “yengeç” then karar = 2 ürün satış; Kural 2: If renk =pembe Then If ürün=“Bluz” Then If ürün=“Etek” Then karar = 1 ürün satış;
42
Kümeleme Kümeleme, veriyi benzerlikleri ile doğru oranda kümelere ayırma işlemidir. benzerlik benzemezlik
43
Kümeleme Tekniğinin Kullanıldığı Alanlar
İstatistik Biyoloji Makine Öğrenimi Astronomi Grupların Alışveriş Örüntüleri Farklı Müşteri Grupları Coğrafik Yerleşim
44
KullanılanYöntemler:
Kümeleme Tekniği KullanılanYöntemler: Çeşitli uzaklık ölçüleri kullanılarak benzerlikler ortaya konur. “ İzmit bölgesinde yaşayan kişiler giyim tercihi açısından Karadeniz Bölgesinde yaşayan kişilere Yalova’da yaşayan kişilerden daha çok benzerler.”
45
Veri Madenciliği Modelleri
Birliktelik Kuralları (İlişki Analizi) Veritabanındaki bir dizi bilgi ya da kaydın diğer kayıtlarla olan bağlantısını açıklayan işlemlerdir.
46
Birliktelik Kuralları
Pazar – Sepet Çözümlemesi Müşterilerin bir alışverişte satın aldığı tüm ürünleri ele alarak, satın alma eğilimini ortaya koyan bir uygulamadır. “Çocuk bezi alan bir müşterinin, mama alma olasılığı diğer müşterilerden 3 kat daha fazladır.”
47
Kullanılan Programlardan Bazıları
SPSS Clementine (IBM Modeller) Weka Data Miner KNIME Answer Tree SEE5 Oracle Business Suite SQL Server Business Intelligence Module
48
Örnek Uygulama Problem:
Üretim planı ve promosyon çalışmalarının piyasa beklentileriyle uyum göstermemesi Amaç: Satışı yapılan ürünlerin, hangi renk ve hangi parça olmalarının belli bir kurala bağlı olup olmadığının araştırılması Veriler? İşletmenin elindeki klasik ilişkisel veri tabanını veri ambarı haline dönüştürdük. Kullanılan parametreler şöyledir.
49
Veri Ambarı Gün Özel Gün Özel Gün Öncesi Ürün Renk Beden Sıcaklık
Alınan Ürün Sayısı X Dizisindeki Ana Renk Pazar E 1 Etek Siyah M 12 BEYAZ Cuma 3 Ceket Erkek 2 Salı H 300 Hırka kadın yeşil S 15 YEŞİL ......
Benzer bir sunumlar
© 2024 SlidePlayer.biz.tr Inc.
All rights reserved.