Yapay Zeka Teknikleriyle Tıbbi Verilerin İşlenmesi: VERİ MADENCİLİĞİ
VERİ NEDİR ? Bilgisayar disklerinde biriktirilen, aktif olarak kullanılan veya ileride kullanılması düşünülen ilişkisel büyüklüklerdir Tahminen: Yeryüzünde biriktirilen veri miktarı birkaç yılda bir ikiye katlanarak artmaktadır
VERİ ÇEŞİTLERİ Tıbbi veriler Uydulardan gelen veriler Finans verileri Alışveriş verileri İnsan kaynakları verileri Otomasyon verileri E-kütüphaneler ………………..
Tıbbi veriler Metin veriler Raporlar Tahlil sonuçları v.b. Örüntü verileri Filmler mikroskop verileri ultrason verileri Kamera verileri v.b. örüntüler Otomasyon verileri
VERİ ZENGİNİ – BİLGİ FAKİRİ
Bilginin kullanımı Karar destek sistemlerinde Strateji belirlemede Finans ve alışverişte kar amaçlı veya zarar tespitinde Bilimsel analizlerde Akıllı robotlar ve cihazlar geliştirmede Tahmin etmede ………………
VERİ MADENCİLİĞİ Veri toplulukları içerisinde bulunan bilginin keşfedilmesi Veri toplulukları içerisindeki veri modellerini ve eğilimlerini ortaya çıkarmak için yapay zeka tekniklerinin kullanılması
VERİ MADENCİLİĞİ BİRÇOK DİSİPLİNİN ORTAK BULUŞMA NOKTASIDIR istatistik Veri tabanı teknolojileri Görsel Bilimler VERİ MADENCİLİĞİ Diğer disiplinler Enformasyon bilimleri Makine öğrenmesi
Veri madenciliği ve istatistiksel analiz arasındaki fark nedir ? Veri madenciliği sonucu ortaya çıkan bilgiler içerisinde hiç beklenilmeyen, olması tahmin bile edilemeyen ilginç hatta şaşırtıcı sonuçlar bulunmasıdır
Temel örnek: Veri madenciliği teknikleri ile sepet analizi sonucu: Çocuk bezi alanların %30 u bira da alır
Bazı veri madenciliği modelleri Kavram tanımlama Birliktelik kuralları keşfi Sınıflandırma ve tanıma Kümeleme
Veri madenciliği hangi yapay zeka tekniklerini kullanır Yapay sinir ağları Genetik algoritmalar İstatistiksel yaklaşımlar Karar ağaçları Bayes teorisi Bulanık mantık torisi Kaba küme teorisi Yapay bağışıklık sistemleri Destek vektör makinaları ……………………………
Veri madenciliği için izlenilen yol Değerlendirme Veri madenciliği Veri Ambarı Temizleme ve bütünleştirme Ver Tabanı Veri Tabanı Dosyalar
Tıbbi verilerin farklılıkları Veri boyutları çok büyüktür ve çok fazla çeşitlilik gösterir (metin, çeşitli örüntüler) Veri dinamiktir Eksik veri bulunabilir Gürültü içerir Geçersiz veri olabilir Önemsiz veri olabilir Yönetimle ilgili veriler bulunabilir Verinin gizlilik özelliği vardır Hastahane verileri tam olarak disklere yerleştirilememiş durumdadır.
Örnek: Birliktelik kurallarının keşfi No İlgili öğeler 1 2 3 4 5 6 7 8 9 I1,I2,I5 I2,I4 I2,I3 I1,I2,I4 I1,I3 I1,I2,I3,I5 I1,I2,I3 Öğe Destek sayısı I1 I2 I3 I4 I5 6 7 2 Öğe I1 I2 I3 I4 I5
öğe öğe öğe I1,I2 I1,I3 I1,I4 I1,!5 I2,I3 I2,I4 I2,I5 I3,I4 I3,I5 Destek sayısı I1,I2 I1,I3 I1,I4 I1,I5 I2,I3 I2,I4 I2,I5 I3,I4 I3,I5 I4,I5 4 1 2 öğe Destek sayısı I1,I2 I1,I3 I1,I5 I2,I3 I2,I4 I2,I5 4 2 Minimum destek =2
öğe öğe öğe I1,I2,I3 I1,I2,I5 Destek sayısı I1,I2,I3 I1,I2,I5 2 Minimum destek =2
{I1,I2,I5} öğelerinden elde edilen birliktelik kuralları Altkümeler: {I1,I2}, {I1,I5}, {I2,I5}, {I1}, {I2}, {I5} Birliktelik Kuralları: I1&I2 I5 Güven= 2/4 = %50 I1&I5 I2 Güven= 2/2 = %100 I2&I5 I1 Güven= 2/2 = %100 I1 I2&I5 Güven= 2/6 = %33 I2 I1&I5 Güven= 2/7 = %29 I5 I1&I2 Güven= 2/2 = %100
{I1,I2,I5} öğelerinden elde edilen birliktelik kuralları I1 & I5 I2 Güven= 2/2 = %100 I2 & I5 I1 Güven= 2/2 = %100 I5 I1 & I2 Güven= 2/2 = %100 ( Güven > %70 için )
Kalp kapakçığı hastalıklarının belirlenmesi Dopler ses sinyali Sınıflandırılmış Çıkışlar Sınıflandırma Özellik çıkarma Eğiticili Öğrenme Veri madenciliği
Sistem veri kaynakları 95 normal ve 120 normal olmayan vaka sinyali ile çalışılmıştır Yaşları 15 ile 80 arasında değişen yaş ortalaması 48.77 olan 132 erkek ve 83 kadın üzerinde çalışılmıştır 92 sinyal sistemin eğitilmesi için kullanılmıştır 123 sinyal test amacıyla kullanılmıştır
Çalışma sonucu 31 40 19 33 26 16 30 5 3 Kalp aort kapakcığı Normal Normal Değil Kalp mitral kapakcığı Normal Normal Denenen örnekler 31 40 19 33 Doğru sınıflandırma 26 16 30 Yanlış sınıflandırma 5 3 Normal değerleri tanıma oranı %84 Normal olmayanları tanıma oranı %96
İsokinetik ölçüm düzeneği
Ölçülen test sinyalleri
Çalışma sonucu Sistem Uzman Hekim Uzman olmayan Hekim 15 problemli vaka 15 ide tanındı 2 si tanınamadı 5 problemsiz vaka dördü tanındı beşi tanındı Üçü tanındı
Yapılan bazı çalışmalar Ontolojide genler üzerine: İfade profillerinden gen fonksiyonlarını tahmin etme Kanser teşhisinde hücre sınıflandırma İnsan üzerinde glikoz ve insilünün etkilerini belirleme Mikroskobik görüntülerin analiz edilmesi ........................................
Sonuç Veri madenciliği birçok alanda kaçınılmaz olarak kullanılması gereken bir yaklaşımdır Gelişmiş ülkelerde birçok kurum ve kuruluş artık yol haritalarını veri madenciliği teknikleri ile belirlemektedirler ve sadece bu işle ilgili personel istihdam etmeye başlamışlardır
Hekim ve bilim adamlarının karar vermelerinde destek sistemi olarak veri madenciliği uzman sistemleri yoğun şekilde kullanılmaya başlanmıştır Tıbbi cihazlar veri madenciliği yazılım ve donanımları ile üretilir duruma gelmiştir Bazı hastalıklar ve nedenleri veri madenciliği teknikleri ile daha kolay analiz edilir ve tanınır duruma gelmiştir