Veri madenciliği, günümüzde karar verme sürecine ihtiyaç duyulan bir çok alanda uygulanmaktadır

Slides:



Advertisements
Benzer bir sunumlar
Zeki Veri Madenciliği Ethem Alpaydın Bilgisayar Mühendisliği Bölümü
Advertisements

Oktay ERBEY CRM & B2B Ürün Satış Hizmet Yöneticisi
KARAR TEORİSİ.
Elektronik ticarette güvenlik konusunda değerlendirilmesi gereken diğer bir konu da alıcıların elektronik ticaret sitelerinden alışveriş yapmak için vermek.
NOKTA, DOĞRU, DOĞRU PARÇASI, IŞIN, DÜZLEMDEKİ DOĞRULAR
İKTİSAT FAKÜLTESİ İKTİSAT BÖLÜMÜ Para Teorisi ve Politikası
Chapter 5 Learning Objectives
Konu Başlıkları Müfredat Oluşturulurken Dikkat Edilmesi Gereken Hususlar Çalışmalardaki Olumsuz Örnekler ve İstatistiksel Bilgiler Anket Çalışmaları Teknik.
BİLGİSAYARLI MUHASEBE I
Dünya Ekonomisine İlişkin Göstergeler
Veri ve Veri Yapıları Genel olarak bilgisayarlar.
ÇALIŞMA VE DİNLENME SÜRELERİ
TÜRKİYE EKONOMİSİNE GENEL BAKIŞ VE SON GELİŞMELER KEMAL UNAKITAN MALİYE BAKANI 05 Eylül 2008 T.C. MALİYE BAKANLIĞI.
FİNANSAL PLANLAMA BAŞABAŞ NOKTASI ANALİZİ FİNANSAL DENETİM
Nicel / Nitel Verilerde Konum ve Değişim Ölçüleri
Acikogretimx.com Açıköğretim sistemi hakkında temel bilgiler 2009.
Verimli Ders Çalışma Teknikleri.
Meslektaşlarımızın Ücret Almadan Hizmete Devam Etmesi. Haksız Rekabette Sorunlar.
Meslektaşlarımızın Ücret Almadan Hizmete Devam Etmesi. Haksız Rekabette Sorunlar.
İstatistiksel Sınıflandırma
Chapter 1 Learning Objectives
ARALARINDA ASAL SAYILAR
Gün Kitabın Adı ve Yazarı Okuduğu sayfa sayısı
TÜRKİYE KAMU HASTANELERİ KURUMU
1 YASED BAROMETRE 18 MART 2008 İSTANBUL.
KONU KESİRLER BASİT KESİR GJFX BİLEŞİK KESİR.
Matematik 2 Örüntü Alıştırmaları.
22 Eylül 2006 TBB BANKACILIK ALT ÇALIŞMA GRUBU Nurhan Aydoğdu
TÜRKİYE İSTATİSTİK KURUMU İzmir Bölge Müdürlüğü 1/25.
TÜRKİYE EKONOMİSİNE GENEL BAKIŞ VE SON GELİŞMELER KEMAL UNAKITAN MALİYE BAKANI 5 Eylül 2008 T.C. MALİYE BAKANLIĞI.
Tam sayılarda bölme ve çarpma işlemi
iPara Üyeliksiz Ödeme Altyapısı
FİNANSAL PLANLAMA BAŞABAŞ NOKTASI ANALİZİ FİNANSAL DENETİM
Endüstride Veri Madenciliği Uygulamaları Yrd. Doç. Dr. Ayhan Demiriz 28/2/2006.
2 ve 1’in toplamı 3 eder..
HABTEKUS' HABTEKUS'08 3.
THY ANALİZLERİ Ki – Kare Testi
Kıyı Tesisleri Deniz Kirliliği Zorunlu Mali Sorumluluk Sigortası 19/10/2010, İstanbul 19/10/2010, İstanbul.
1 Van Kadın Derneği 2008 Yılı Verileri. sınıflandırma Yüzyüze ve/veya telefonla 805 başvuru 1262 neden 350 Türkiyeli Kadın 525 nedenle 455 Sığınmacı ve.
Küresel Kriz Sonrası Türkiye’de Finansal Sistem “Bankacılık Sektörü” Ekrem Keskin Mayıs 2010.
İKİNCİ DERECEDEN FONKSİYONLAR ve GRAFİKLER
VERİLERİN DERLENMESİ VE SUNUMU
FAİZ PROBLEMLERİ FAİZ YÜZDESİ FAİZ FAİZ YÜZDESİ ANA PARA ANA PARA
Diferansiyel Denklemler
Bireysel Finansman KREDİ KARTLARI
DENEY TASARIMI VE ANALİZİ (DESIGN AND ANALYSIS OF EXPERIMENTS)
Bankacılık sektörü 2010 Ocak-Aralık dönemindeki gelişmeler Ocak 2011.
Bankacılık sektörü 2010 yılının ilk yarısındaki gelişmeler “Temmuz 2010”
SÜLEYMAN DEMİREL ÜNİVERSİTESİ TEKNOLOJİ FAKÜLTESİ
Çocuklar,sayılar arasındaki İlişkiyi fark ettiniz mi?
İSMİN HALLERİ.
1 Kısa Vadeli Kredi Maliyetlerinin Tahmini Yıllık Yüzdesel Maliyet  Farklı vadelerdeki kredileri karşılaştırabilmek için kredi maliyetlerinin belirlenmesinde.
Toplama Yapalım Hikmet Sırma 1-A sınıfı.
1 ŞEKERBANK BİREYSEL BANKACILIK Kasım/ TÜRKİYE’DE BİREYSEL BANKACILIK-İLKLER.
Türkiye Bankalar Birliği 49. Genel Kurulu 1 Türkiye Ekonomisi ve Bankacılık Sistemindeki Gelişmeler Ersin Özince Türkiye Bankalar Birliği Yönetim Kurulu.
TÜRKİYE EKONOMİSİNE GENEL BAKIŞ VE SON GELİŞMELER KEMAL UNAKITAN MALİYE BAKANI 15 Ekim 2008 T.C. MALİYE BAKANLIĞI.
YAPAY SİNİR AĞLARI VE BAYES SINIFLAYICI
BTP102 VERİTABANI YÖNETİM SİSTEMLERİ 1
Diferansiyel Denklemler
YATIRIM KARARLARINDA PARANIN ZAMAN DEĞERİ
Veri Madenciliği Rümeysa İhvan
Veri Madenciliği Giriş.
Veri Madenciligi . Sınıflandırma ve Regresyon Ağaçları ( CART )
1 Ziraat Sigorta A.Ş.. 2 Ziraat Sigorta A.Ş. TIBBİ KÖTÜ UYGULAMAYA İLİŞKİN ZORUNLU MALİ MESULİYET SİGORTASI (HSS)
Mühendislik Ekonomisi
Bölüm 4 : VERİ MADENCİLİĞİ
FİNANSAL KİRALAMA İŞLEMİ VE MUHASEBE KAYDI
İSTATİSTİK II BAĞIMSIZLIK TESTLERİ VE İYİ UYUM TESTLERİ “ c2 Kİ- KARE TESTLERİ “
NET NAKİT AKIŞLARININ HESAPLANMASI
Çalışma Soruları.
Sunum transkripti:

Alman Kredi Analizi Veri Kümesinin Veri Madenciliği Teknikleri ile İncelenmesi

Veri madenciliği, günümüzde karar verme sürecine ihtiyaç duyulan bir çok alanda uygulanmaktadır Özellikle, pazarlama bankacılık ve sigortacılık sektörlerinde yaygın olarak kullanılmaktadır.

Bankacılık Sigortacılık Farklı finansal göstergeler arasında gizli korelasyonların bulunması, Kredi kartı dolandırıcılıklarının tespiti, Kredi kartı harcamalarına göre müşteri gruplarının belirlenmesi, Kredi taleplerinin değerlendirilmesi. Sigortacılık Yeni poliçe talep edecek müşterilerin tahmin edilmesi, Sigorta dolandırıcılıklarının tespiti, Riskli müşteri örüntülerinin belirlenmesi.

Kredi Skor Hesabı Kredi, bir finansal kurum tarafından bir müşteriye ödünç verilen ve faiz eklendikten sonra genelde düzenli aralıklı taksitler halinde geri ödenmesi gereken paradır. Bir kredi başvurusunda müşterinin krediyi geri ödeyememesi olasılığını hesaplamaya kredi skorlama denir. Skorlama yaparak yüksek riskli müşterilere kredi vermeyi reddetmek finansal kurumun olası zararını azaltacak, düşük riskli müşterilere kredi vermek ise firma kârını arttıracaktır. Üstelik skorlama ile müşterilerin ödeyemeyecekleri kredilerden dolayı firmada oluşabilecek rahatsızlık azalacaktır.

Kredi Skor Hesabı Skorkartı (score-card) denilen bir istatistiksel model, müşterinin başvuru formundaki bilgilere ve diğer —örneğin kredi izleme bürosundan gelen— bilgilere dayanarak kredinin geriye ödenememesi olasılığını hesaplar Bu değer uygun bir eşik değeri ile karşılaştırılarak kredi talebi kabul veya red edilir. Skorkartı geçmiş müşterilerin verilerinden oluşturulur ve genelde basit bir ağırlıklı toplamadır.

Skorkartında tipik olarak kullanılan alanlar şunlardır: • İkamet adresinde oturduğu zaman: 0-1, 1-2, 3-4, 5+ yıl • Ev durumu: Sahip, kiracı, diğer • Postakodu: Kodlanmış • Telefon: Evet, hayır • Yıllık gelir: Kodlanmış • Kredi kartı: Evet, hayır • Yaş: 18-25, 26-40, 41-55, 55+ yıl • Meslek: Memur, işçi, serbest, işsiz, • Medeni hali: Evli, bekar, diğer • Bankanın müşterisi olduğu zaman: yıl • Çalıştığı kurumda çalışma zamanı: yıl

Skorkart Skorkartının oluşturulabilmesi için geçmiş müşterilerin iyi risk ve kötü risk olarak guruplanabilmesi gerekir. İyi risk, örneğin hiç geç ödemesi olmayan müşteri, kötü risk de örneğin üç veya daha fazla arka arkaya geç ödeme yapmış müşteriler olabilir; bir veya iki defa arka arkaya geç ödemesi olan müşteriler belirsizdir ve skor kartı oluşturmada kullanılmaz. Kötü riski tanımlamak kolay değildir; belki geç ödemeler daha yüksek faiz nedeniyle kurum için kârlı olabilir. Gerçekte tanımlamak istediğimiz, zarara neden olan müşteridir.

Skorcard Yapılmak istenen kârlı ve zararlı müşterileri birbirinden ayırabilmektir. kârlı ve zararlı müşterilerin bilgileri iki gurup olarak verildikten sonra genelde doğrusal regresyon veya doğrusal ayırıcı (linear discriminant) kullanılarak alanların ağırlıkları hesaplanır. Bu ağırlıklar hesaplandıktan sonra kabul/red eşiği hesaplanır. Bunun için her iyi müşterinin kuruma kaç birim kârlı, her kötü müşterinin kuruma kaç birim zararlı olduğunun verilebilmesi gerekir. Hangi değerin üstünde beklenen toplam kâr beklenen toplam zararı aşarsa o değer eşik olarak kabul edilir.

Alman Kredi Veri Kümesi Alman Kredi veri kümesi, 1000 kişiye ait 30 öznitelikten oluşan bir veri kümesidir. Bu 30 öznitelik sınıflandırma yapmak için kullanılacak olan tahmin değişkenleridir. Her bir kredi başvuranı krediskor kartlarındaki verilere göre iyi risk ve kötü risk olarak sınıflandırılmıştır. İyi riske ait 700, kötü riske ait 300 kayıt bulunmaktadır.

Veri

Çalışmanın amacı İyi ve kötü risk taşıyan kayıtların en doğru şekilde sınıflandırılması, Firmada yanlış sınıflandırılmadan ötürü oluşacak kayıpların en aza indirgenmesi.

İzlenen Adımlar

Sınıflayıcılar i) Karar Ağaçları ii)MLP iii)Logistic regression

Tahmin Parametrelerinin İncelenmesi 30 tahminözniteliğinin hepsi sınıflama için eşit önem derecesine sahip değildir. Bu önem derecelerini tespit etmek için özellik seçim algoritmaları kullanılmaktadır: GainRatio vb. Bu şekilde algoritmaların çalışma süresi kısalır ve çoğu zaman özellik sayısının azalması algoritma performansını arttırır.

Gain Ratio Uygulaması Tps : Tahmin Paremetre Sayısı Tps1 : Bu durumda 13,26,28 nolu tahmin parametreleri alınmadı Tps2: Bu durumda 16,6,19,24,4,18,12,14,15,9,29,27,13,26,28 nolu tahmin prametreleri alınmadı. Tps3: En yüksek kazanç değerine sahip  altı özellik alındı. 

Confusion Martis ve Net Kazançlar: