Veri Madenciliğine Giriş

Slides:



Advertisements
Benzer bir sunumlar
Bankacılık ve Teknoloji
Advertisements

Bilgisayar Ağları ve İnternet
Dört Bölüm 1.Tanıtım ve Mevcut Durum 2.Hedefler 4.Demo 3.Yeni Sürüm Planlaması.
Performans, etkinlik, erişim ve fiyat önemli ise...
TÜTÜN KULLANIMI “EKONOMİK KAYIPLAR” Dilek ASLAN HÜTF Halk Sağlığı AD.
IT503 Veri Yapıları ve algoritmalar
VERİ MADENCİLİĞİNE BAKIŞ
GÜVENLİ İNTERNET ve SOSYAL MEDYA
Çevik Kurumlar Oluşturabilmek İçin Bulutta İş Uygulamaları Kutlay E. Şimşek Genel Müdür İstanbul, 12 Şubat 2013.
Yeni İş Platformunuz! Yönetim Bilişim Sistemleri Boğaziçi Üniversitesi.
Bilişim Sistemleri Mühendisliği Bölümü
INTERNET TABANLI HASTA KAYDI PAYLAŞIMI VE TELEKONSÜLTASYON PLATFORMU
MÜŞTERİ İLİŞKİLERİ YÖNETİMİ
ELEKTRONİK ORTAMLARDA PAZARLAMA
1/8 Bologna Sürecinde Yönetişim Kırklareli Üniversitesi 3 Ekim 2012 Yrd.Doç.Dr. Mustafa Turan
Girişimcilik.
WEB OF SCIENCE İLE ATIF TABANLI ARAŞTIRMA DEĞERLENDİRMESİ Eğitmen: Metin TUNÇ This presentation is an introduction to InCites - the new web-based.
Bilgi Teknolojisinin Temel Kavramları
KIRKLARELİ ÜNİVERSİTESİ BABAESKİ MESLEK YÜKSEKOKULU DERS:E-TİCARET KONU:ELEKTRONİK TİCARETİN GELİŞİMİ VE GELENEKSEL TİCARET İLE KARŞILAŞTIRILMASI HAZIRLAYAN:DİLEK.
BBY Bilgi Teknolojisi ve Yönetimi
Veri Madenciliği Temel Bilgiler
İstatistiksel Sınıflandırma
Telekomünikasyon Sektörü ve Vergi Düzenlemelerinin Etkileri Turkcell İletişim Hizmetleri A.Ş. 30 Ekim 2007 Gazi Üniversitesi İİBF Ankara.
KURUMSAL BANKACILIK TÜRKİYE İŞ BANKASI A.Ş. 3 MAYIS 2010.
Şirket Tanıtım Sunumu.
FİNANS SEKTÖRÜNDE YABANCI SERMAYE ARALIK TSPAKB 2 İSTİKRAR  Siyasi istikrar Uluslararası yatırımcıların güvenini sağlayan tek parti hükümeti 
Kümeleme ve Yöntemleri Arş.Grv İlyas AKKUŞ İnönü Üniversitesi B.Ö.T.E
PAZARLAMA ARAŞTIRMALARI Prof. Dr. İsmail Üstel.
Endüstride Veri Madenciliği Uygulamaları Yrd. Doç. Dr. Ayhan Demiriz 28/2/2006.
ORTA DOĞU TEKNİK ÜNİVERSİTESİ Sürekli Eğitim Merkezi www. sem. metu
E-Ticaret (Rakamlarla Giriş) Sunu İçerik Kaynağı: İyiler, Z. (2009). Elektronik Ticaret ve Pazarlama, T.C. BAŞBAKANLIK Dış Ticaret Müsteşarlığı İhracatı.
Bilişim Sistemleri Mühendisliği nedir? Neden ihtiyaç vardır?
PAZARLAMA BİLGİ YÖNETİMİ
İ.İ.B.F. İngilizce İşletme Bölümü
Yrd. Doç. Dr. Ayhan Demiriz
PAZARLAMA BİLGİ YÖNETİMİ
Engineering Village Platformu Foksiyonlar ve Arama fırsatları Tübitak - Ekual Mayıs,2008 Emre Bilinç ITS.
Kavramlar, Dünyada ve Türkiye’deki Uygulamaları
BİYOİNFORMATİK NEDİR? BİYOİNFORMATİKTE KULLANILAN SINIFLAMA YÖNTEMLERİ
Yapay Zeka Teknikleriyle Tıbbi Verilerin İşlenmesi: VERİ MADENCİLİĞİ
Fonksiyonel Bakış Açısıyla Sistemler
CUSTOMER RELATIONSHIP MANAGEMENT
BİLGİ OKURYAZARLIĞI EĞİTİM PROGRAMI TASARIMI ÇALIŞTAYI
Bilgehan Arslan, Süreyya Gülnar
Makİne Öğrenmesİ İle Ürün SInIflandIrma İncelemesi
VERİ AMBARI & VERİ MADENCİLİĞİ
Türkiye Internet'i Büyüme Eğilimleri Y.Doç.Dr. Kürşat Çağıltay, ODTÜ
Karar Bilimi 1. Bölüm.
Finansal Eğitim Merkezi ve Eğitim Teknolojileri 2014 – 2015 Dönemi Değerlendirmesi Mesleki Gelişim ve Eğitim Bölümü Temmuz 2015.
TELEKOMÜNİKASYON SEKTÖRÜ
Veri Madenciliği Giriş.
İnternet Nedir? Hazırlayan: Fatih ARIKAN Bilişim Teknolojileri Öğrt.
BİLGİSAYAR NEDİR?.
Veritabanı Yönetim Sistemleri
Veri Madenciligi . Sınıflandırma ve Regresyon Ağaçları ( CART )
BİL3112 Makine Öğrenimi (Machine Learning)
Bekir Sami NALBANTOĞLU
TEMEL KAVRAMLAR İnternet ve İnternet Bankacılığı
Bölüm 4 : VERİ MADENCİLİĞİ
Temel Bilgi Teknolojileri
WEB TABANLI DESTEK.
FACTORING Dr. ÇAĞATAY ORÇUn.
Otizm Farkındalık Araştırması
BİLİŞİM TEKNOLOJİLERİ VE YAZILIM
Yrd. Doç. Dr. Abdullah BAYKAL Konuşmacı : Cengiz Coşkun
NİŞANTAŞI ÜNİVERSİTESİ
PAZARLAMA BİLGİ YÖNETİMİ
Elektronik-Ticaret’te Arama Motoru Optimizasyonu ve Sosyal Medya
Hastane Bilgi Sistemlerinde Veri Madenciliği
Klinik Bilgi Sistemleri
Sunum transkripti:

Veri Madenciliğine Giriş Yrd. Doç. Dr. Ayhan Demiriz D8 - 403 ademiriz@sakarya.edu.tr www.sakarya.edu.tr/~ademiriz

Veri Madenciliğine Giriş Dersin Tanımı: Bu ders veri madenciliğinin istatiksel, makine öğrenimi ve veri tabanı yönünden temellerini içermektedir.Ders üç kısımdan oluşmaktadır. Birinci kısım veri madenciliği için istatistik ve makine öğrenimi yaklaşımının temelleri hakkındadır. İkinci kısımda Online Analitik İşlem, ilişki kuralları ve gruplama gibi işlemler için temel veri madenciliği ve algoritmalar işleyeceğiz. Dersin son kısmı metin madenciliği, birliktelik filtresi, bağlanti analizi ve biyoinformatik gibi alanlarda araştırmalar üzerine odaklanmaktadir (zaman müsait olursa). Tavsiye Edilen Kitaplar (Opsiyonel): Data Mining Techniques For Marketing, Sales and Customer Support. M. J. A. Berry and G. Linoff. Wiley. Principles of Data Mining. D. J. Hand, H. Mannila, P. Smyth. The MIT Press.

Veri Madenciliğine Giriş

Bilgi Keşfi: Aşamalar

Veri Madenciliği Nedir? Büyük hacimli veri içerisinden; anlamlı, gizli kalmış ve kuruluşun karar destek sistemi için potansiyel olarak faydalı olabilecek bilgilerin çıkarıldığı ve geri planında istatistik, yapay zeka ve veritabanlarının bulunduğu veri analiz tekniğine Veri Madenciliği (Data Mining) adı verilir. Veri madenciliği, potansiyel olarak faydalı, yeni ve mantıklı bilgi elde etmek için büyük veri tabanları üzerinde birden fazla basamaktan oluşan bir analiz yapmaktır.Veri madenciliğinin amacı, veritabanlarında saklı olan ilişkileri ortaya koymaktır.

Veri Madenciliği: Anlamlı örüntüler(bağımsız değişkenleri içeren genel ifadeler-ingilizcede pattern) ve kurallar çıkarmak amacıyla, büyük miktarda verilerin analizi ve araştırmasıdır. Bir bilgi çıkarma aktivitesidir. Ham verileri kullanarak önemli ilişkileri çıkarmaktır. Yüksek miktarda verilerin analizini gerçekleştir-mek için geliştirilen güçlü teknikleri içerir. Sadece bir tane veri madenciliği yaklaşımı olmayıp, daha ziyade bu tekniklerin kombinasyonları kullanılmak-tadır.

VTYS, OLAP ve Veri Madenciliği Alan VTYS OLAP Veri Madenciliği Görev Detaylı ve özet bilginin çıkarılması Özetler, trendler ve tahminler Saklı bilgilerin ve sezgilerin keşfi Sonuç Tipi Bilgi Analiz Tahmin ve Sezgi Metot Tümdengelim (Soruyu sor, veriyle soruştur) Çok boyutlu veri modelleme, İstatistik Tümevarım (Model kur, yeni veriye uy-gula, sonucu elde et) Örnek Soru Son 3 yılda ortak fonları kim satın aldı? Yıl ve bölge başına, ortalama fon geliri nedir? Önümüzdeki 6 ay içerisinde kimler fon alabilir ve neden?

Veri Seli Gelişen teknoloji ile toplanan verilerin çeşiti ve miktarı artmıştır. Örneğin bir banka, bilgisayar teknolojisi tanıtılmadan önce müşterileri ile ilgili çok kısıtlı bir veriyi tutarken, gelişen teknoloji ile ATMlerde yapılan tüm işlemler ve hatta internet şubelerinde yapılan işlemler de kayıt altında tutulmaktadır. Özellikle enformasyon teknolojilerindeki gelişmeler ile bankacılık, haberleşme, uzay bilimleri, web teknolojileri ve uzaktan algılama sistemleri alanlarında toplanan verilerin artması. UC Berkeley Profesörleri Lyman ve Varian’a göre sadece Web’te 2002 yılında 5 exabayt (5 Milyon Terabayt) veri depolanmıştır. Yine bu çalışmaya göre Web’in büyüme oranı yaklaşık %30’dur.

Veri Seli 2003’te en büyük veritabanları Ticari veritabanları, Winter Corp. 2003 Araştırması: Fransa Telekom en büyük karar destek veritabanına sahiptir, ~ 30TB; AT&T şirketi, ~ 26 TB Web Alexa internet arşivi : 7 yıllık veri; 500 TB(TeraByte) Google arama motoru : 3.3 Milyar sayfa (4 Milyar sayfa – 2004 yılı itibarıyla), ? TB IBM WebFountain : 160 TB (2003) Internet Arşivi (www.archive.org): ~ 300 TB

Veri Madenciliği Uygulama Alanları Bilim Astronomi Biyoinformatik İlaç keşfi İş Hayatı Reklam CRM (Müşteri İlişkileri Yönetimi) ve müşteri modelleme e-Ticaret Yatırım değerlendirme ve karşılaştırma Sağlık Üretim Spor/eğlence Telekom (telefon ve iletişim) Hedef pazarlama Web Metin Madenciliği (haber grubu, e-mail, dokümanlar) Web analizi Arama Motorları Devlet Terörle Mücadele Kanun yaptırımı Vergi Kaçakçılarının Profilinin Çıkarılması

Veri Madenciliği-Örnek Uygulamalar: Müşteri Kayıp Oranlarının Azaltılması Bir cep telefonu şirketi tipik olarak %25-%30 müşterisini her yıl kaybedebilir Problemin Tanımı: Geçmiş aylara ait (2 ila18 ay arasında) verilerin elde olduğu varsayılırsa, önümüzdeki bir yada iki ay içersinde terk edebilecek müşterilerin bulunması Müşteri değerinin hesaplanması Çözüm Aşamaları: Ayrılabilecek potansiyel müşterileri bul Bölgesel modeller geliştir Yeni kampanyaları kabul etme eğilimine sahip müşterileri hedefle Aylık yaklaşık %2 müşteri kaybını %1.5’düşür

Veri Madenciliği-Örnek Uygulamalar: Kredi Riski Kredi itibarı yüksek olan müşteriler krediye pek ihtiyaç duymayabilirler – Bu kesimin banka ile iş hacmi az olabilir Kredi ihtiyacı çok yüksek olan kişilerin ise kredi itibarları çok düşük olabilir – Kredilerin geri ödenmeme riski çok yüksektir Bir banka için en kazançlı müşteri kitlesi bu ikisi arasında olandır. Yani kredi kullanıp, kabul edilebilir bir risk ile zamanında ödeyebilen müşteri kitlesi

Veri Madenciliği: Amazon.com Kişiselleştirme Ürün tavsiyesi Ürünlerin destelenmesi (bundling) Dinamik fiyatlandırma

Veri Madenciliği: Uygun Problemler Bilgi tabanlı kararlara ihtiyaç duyulan Değişen bir çevreye sahip olan Hali hazırda tam-optimum olmayan çözümleri olan Erişilebilir, yeterli ve ilgili veriye sahip olan Doğru karar verildiğinde yüksek getiriye sahip olan