Bahçeşehir Üniversitesi İş Zekasına Giriş Erdem Alparslan Bahçeşehir Üniversitesi
İçerik Karar alma süreci İş zekasına giriş İş Zekası(BI) için motivasyon unsuru İş zekasına giriş Tanımlar BI, DW, OLTP, OLAP BI süreci Karar destek sistemleri ve mimarileri OLTP – OLAP kıyaslaması BI’da veri madenciliğinin yeri
Karar alma süreci Farklı seviyelerde karar alma Operasyonel Taktiksel Kısa vadeli geri dönüşler sağlayacak günlük kararlar Genelde alt seviye yöneticilerin karar almaları Taktiksel Orta seviye yöneticilerin aldığı stratejiye uygun orta vade hamleler Stratejik Üst yönetim tarafından alınan, yapısal olmayan, soyut kararlar
Karar alma süreci Karar alma süreci Problem tanımı Alternatif çözümlerin araştırılması Seçim yapılması Aşamalarını içerir. Bilgi ve tecrübe karar almanın omurgasını oluşturur
Karar alma İşlenmiş Bilgi Ham veri Bilgi Aksiyonlar
Var olan bilgi türleri Uzman bilgisi Örgütsel bilgi Bilgi elde etme Bir konunun uzmanı olan kişinin kişisel çalışma ve tecrübeleri Uzun yıllar iş tecrübesi, ilgi, konsantrasyon Örgütsel bilgi Kurum bileşenleri arasındaki karmaşık ilişkiyi tanımlar Kurum içinde gizli insan kaynağı bilgisini temsil eder Bilgi elde etme Bilgi toplama (uzmanlardan) Bilgi keşfetme (ham veriden)
Bilgi keşfetme avantaj ve dezavantajlar Sadece bir ya da birkaç uzmana bağımlı değil Anlık performansa dayalı İnsanın tespit edemeyeceği ilişkili verilere ulaşma Objektif Teori ve pratik olarak tanınırlığı iyi düzeyde Dezavantajlar Kullanılan veriye oldukça bağımlı (veri kirliliği) Tarihsel veri gerektirir ve oldukça bağımlı (trend değişiklikleri)
Motivasyon – Karar desteği niçin? Karar desteği: Bilgiye ihtiyaç duyan varlıklara (stratejik lider, yönetici ya da analist ) BT yardımıyla bilgi sağlama Ham verideki gizli ilişkilerin tespit edilmesi Çok büyük veri yığınlarının kişisel çaba ile incelenmesinin zorluğu Daha tutarlı ve güvenilir sonuç isteği Rekabette geri kalmama, hızlı aksiyon olma ve öncü olma isteği
Temel kavramlar İş zekası Veri ambarı OLTP OLAP Data mart Data küp ….. ………
İş Zekası nedir Geçmişi anlamaya geleceği öngörmeye yarayan teknoloji Veriyi yakalayan, saklayan, erişen ve analiz eden İş performansını ölçülebilir veriler üzerinden belirleyen Uygulama Karar destek sistemi Sorgu ve raporlama Anlık analitik süreç (OLAP) İstatistiksel süreç, veri madenciliği ve öngörü
Veri ambarı Kurumun operasyonel veritabanından tamamiyle ayrılan karar destek veri tabanı Farklı kaynaklardaki bilgiyi tekilleştirerek ilişkilendiren bir bakış açısı Konsolide edilmiş ve tarihsel veriyi analiz amacıyla işleyen mimari Çok boyutlu veri modeli üzerinde veriye farklı bakış açılarından bakmaolanağı
Veri ambarı – İlişkisel veritabanı Online işlem işleyici (OLTP) İlişkisel veritabanlarının birincil işi Tüm gündelik operasyonel veriler Veri tutarlılığı çok önemli, hızlı yanıt verebilme kabiliyeti Online analiz işleyici (OLAP) Veri ambarlarının birincil işi Ver analizi ve karar verme amaçlı Büyük hacimli verilerin çok boyutlu incelenmesi amaçlanır
Veri ambarı – İlişkisel veritabanı Birbirinden ayrılan yönleri Kullanıcı ya da sistem yönelimlilik İçerdiği veri (anlık, tarihi, özet, detay) Veritabanı tasarımı (ER, star, snowflake …) Erişim şekilleri (sadece SELECT ya da SELECT-UPDATE-INSERT) Görünüm (anlık, geçmiş, evrimsel, bütünsel)
OLTP - OLAP Kullanıcı İşlemci, BT çalışanı Bilgi işçisi Fonksiyon Günlük operasyonlar Karar desteği VT Tasarımı Uygulama yönelimli Amaç yönelimli Veri Anlık, izole Tarihsel, bütünleşik Görünüm Detaylı,düz ilişkisel Özet, çok boyutlu Kullanım Yapısal, tekrarlı Ad hoc İş Birimi Kısa ve basit işlem Karmaşık sorgu Erişim Okuma / yazma Okuma Operasyon İndeksler üzerinde Sıralı aramlarla Erişilen kayıt sayısı Onlar Milyonlar Boyut 100MB-GB 100GB-TB-PB Kullanıcı sayısı Binler Yüzler
SQL – OLAP – Veri Madenciliği Görev Detaylı ve özet veri çıkarma Özet, trend analizi ve öngörü Veri çıkarsama Sonuç çeşidi Bilgi Analiz Öngörü Metod Soru-cevap Çok boyutlu modelleme, istatistik Model öğretme ve yeni veriye uygulama Örnek soru Ortak fonları son 3 yılda kimler satın aldı? Ortak fonları satın alanların bölge ve yıllara göre ortalama geliri ne kadardır? Önümüzdeki 6 ayda ortak fonları hangi müşterilerimiz satın alacaklar? Neden?
Örnek
Örnek - inceleme Yukarıdaki tabloyu DBMS mantığı ile sorgulayarak şu sorulara cevap bulabiliriz: Güneşli günlerdeki hava sıcaklığı ne? Hangi günler nem oranı 65 in altında? Hangi günler sıcaklı 70 in üzerinde iken nem 70 in altında? OLAP yardımı ile çok boyutlu model oluşturabiliriz (data küp) Gün, durum ve piknik kullanılarak şu model oluşturulabilir: Veri madenciliği kullanılarak aşağıdaki karar ağacı elde edilebilir: Durum = sunny Nem=yüksek piknik yok Nem=Normal piknik var Durum=overcast piknik var Durum=yağışlı Rüzgar var hayır Rüzgar yok evet
İş Zekası Perspektifinden Karar Destek Sistemleri
Çok katmanlı karar destek sistemleri Veriambarı sunucusu Genellikle ilişkisel veritabanı sistemleri, nadiren dosya sist. OLAP sunucular İlişkisel OLAP (ROLAP): İlişkisel veritabanlarının operasyon verilerini analiz için çok boyutlu mantığa uyarlanışı Çok boyutlu OLAP (MOLAP): Çok boyutlu OLAP hesaplamaları için tasarlanmış dedike sunucu İstemciler Sorgu ve raporlama araçları Analiz araçları Veri madenciliği araçları
Veri ambarı VS Datamartlar Kurumsal veriambarı: Tüm kurumu ilgilendiren varlıklar ile ilgili bilgiyi barındırır Çok kapsamlı iş modellemesi gerektirir (yıllar alabilir) Datamartlar: Belirli bir iş için departman bünyesinde oluşturulmuş bakış açıları Pazarlama datamartı: müşteri-ürün-satış Hızlı oluşturma geç adaptasyon Sanal veriambarı: Diğer veritabanlarına görünümler Efektif sorgular için diğer verikaynaklarına görünüm atma Kullanımı kolay ancak operasyonel veritabanına yük bindirir
Metaveri havuzu Metaveri veri ambarı nesnelerini tanımlamak için kullanılır. Şu şekillerde olabilir: Veriambarının yapısını belirtir Operasyonel metaveri içerebilir Özetleme için kullanılmış olan algoritmalar Operasyonel veritabanından veriambarına nasıl aktarıldığı Sistem performansı için gerekli veri İş sahibi verisi (terimler, tanımlar, kısıtlamalar)
İş zekası – eski tanım
İş zekası – yeni tanım