Hastane Bilgi Sistemlerinde Veri Madenciliği Pınar YILDIRIM Çankaya Üniversitesi Bilgisayar Mühendisliği Ankara Mahmut ULUDAĞ European Bioinformatics Institute Cambridge, UK Abdülkadir GÖRÜR 31.01.2008
Hastane Bilgi Sistemleri Sağlık ve tıp çağımızın en önemli araştırma alanlarıdır. Hastane bilgi sistemleri de araştırmalar için önemli veri kaynaklarıdır.
Hastane Bilgi Sistemleri Bilgi ve iletişim sistemlerindeki gelişmeler Bilgi modelleme ve tanı araçlarında gelişmeler Elektronik ortamda saklanabilen birçok veri Hasta demografik bilgileri Hastalık ve tedavi durumları Yapılan tetkikler Faturalama ve idari işlere ait veriler ve diğerleri
Veri Madenciliği ve Tıp Alanında Tarihçesi Veri madenciliği ve Bilgi Keşfi tanımı: Verilerde daha önceden bilinmeyen, anlamlı ve değerli bilgiler elde etme işlemleridir. Uzman sistemler (1970 ler), yaygınlaşamama nedenleri: Verilerin hızlı değişmesi Uzmanlar arasındaki görüş ayrılıkları Yapay Sinir Ağları(1990 lar) Hastaların gelecekteki sağlık durumlarının tahmini Maliyet tahminleri
Veri Madenciliği Teknikleri Temel aşamaları: Veri seçimi Önişleme Dönüştürme Veri madenciliği algoritmalarının uygulanması Yorumlama/değerlendirme
Veri Madenciliği Aşamaları
Veri Madenciliği Teknikleri Veri seçme işlemi Üzerinde çalışılacak verilerin seçilmesi Önişleme ve dönüştürme Eksik veya hatalı veriler Kategorize etme Boyut azaltma
Veri Madenciliği Teknikleri Veri madenciliği algoritmaları Tahmin edici modeller Sınıflandırma(classification) Zaman serileri(Time Series) Regresyon(Regression) Tanımlayıcı modeller Kümeleme(clustering) Özetleme(summariation) İlişkisel kural madenciliği(association rule mining)
İleri Veri Madenciliği Teknikleri İlişkisel veri madenciliği Çoklu ilişkisel karar ağaçları(Multi-relational decision trees) Çoklu ilişkisel kurallar(multi association rules)
İleri Veri Madenciliği Teknikleri Metin Madenciliği Yapısal olmayan metinlerden bilgi keşfi yapmak amacıyla geliştirilmiştir. Aynı konuda yazılmış belgeler Birbiriyle ilişkili belgeler ve kavramlar
İleri Veri Madenciliği Teknikleri Metin madenciliği disiplinlerarası bir araştırma alanıdır: Doğal Dil İşleme(Natural Language Processing) Bilişsel Bilimler(Cognitive Sciences) Makine Öğrenmesi(Machine Learning) İstatistik
Sağlık Alanında Veri Madenciliği Uygulamaları Belirli bir hastalığa sahip hastaların ortak özelliklerinin tahmin edilmesi Tıbbi tedavilerinin sonuçlarının tahmin edilmesi Hastane maliyetlerinin tahmin edilmesi Ölüm oranları ve salgın hastalıkların tahmin edilmesi
Sağlık Alanında Veri Madenciliği Uygulamaları Hastalık Sınıflandırma Veri Seti Örnek kurallar: Kural 1:IF Yas = 25 THEN Hastalık = Var Kural 2: IF Tansiyon = Normal AND Sigara Kullanımı = Bazen THEN Hastalık = Yok
Sağlık Alanında Veri Madenciliği Uygulamaları Hastalıkların Yönetimi Hastalıkların durumları(Karar ağaçları kullanılmış) Yaş Cinsiyet ve Diğer özellikler kullanılarak hastalıklara ait bilgilerin keşfedilmesi Maliyet modelleme
Sağlık Alanında Veri Madenciliği Uygulamaları Hastaların sürekli doktor değiştirmelerinin nedenleri (ilişkisel kural analizi yöntemi ile araştırılmış) Demografik bilgiler İşlemsel veriler analiz edilmiş Etki eden faktörler Yaş Cinsiyet Kronik hastalıklar Hastanelerin olanaklarının etkili olduğu ortaya çıkmıştır.
Sağlık Alanında Veri Madenciliği Uygulamaları Hastaların hastanelerdeki kalış süreleri araştırılmış (yapay sinir ağları kullanılmış) Kalış süresine etki eden faktörler Demografik Çevresel bilgiler Şehirlerde yaşayan hastalar 40 yaşından büyük hastalar Alkol ve sigara bağımlılığı
Sağlık Alanında Veri Madenciliği Uygulamaları Hile Tespiti çalışmaları (Genellikle kümeleme yöntemleri) Hasta, tetkik ve doktor bilgileri analiz edilip anormal veriler Ortalama maliyetlerin üzerindeki tetkik ve tedaviler incelenmiş
Sağlık Alanında Veri Madenciliği Uygulamaları İlaçların yan etkileri (Metin madenciliği yöntemleri kullanılmış) Web üzerindeki tıbbi yayınlar analiz edilerek, daha önceden tanımlanmamış yan etkileri araştırılmaktadır.
Tıp ve Biyoinformatik Alanlarında Veri Madenciliği Çalışmaları Tıp ve sağlık alanındaki yapısal olmayan dokümanlar için metin madenciliği çalışmaları Tanı, tedavi bilgileri Klinik dökümanlar Bilimsel makaleler
Tıp ve Biyoinformatik Alanlarında Veri Madenciliği Çalışmaları Avrupa Biyoenformatik Enstitüsü metin madenciliği araştırma grubu bilimsel makalelerden bilgi keşfi yapmak için araştırmalar yapmaktadır. Birçok yazılım sistemi ve aracı geliştirmiştir: EBIMEd Whatizit
Tıp ve Biyoinformatik Alanlarında Veri Madenciliği Çalışmaları Biyolojik araştırmalar tıbbi gelişmelere önemli katkılar sağlar. BIOMART İlişkisel veriler için geliştirilen veri madenciliği sistemidir. OMIM(Online Mendelian Inheritance in Man) National Center for Biotechnology Information(NCBI) tarafından geliştirilmiştir Genetik bozukluklarla ilgili bilinen hastalıkların saklandığı veritabanıdır.
Tıp ve Biyoinformatik Alanlarında Veri Madenciliği Çalışmaları İnsan Genom projesinin tamamlanması ile birlikte genom bilgileri ile klinik bilgiler arasında bağ kurabilmek için projeler ve veritabanları geliştirildi: HapMap Projesi DECIPHER Projesi
Hacettepe Üniversitesi Hastanelerinde Yapılacak Çalışma Radyoloji Bilgi Sisteminde Hastalar Tetkikler İşakışları ile ilgili bilgiler Ve diğer bilgiler saklanmaktadır.
Hacettepe Üniversitesi Hastanelerinde Yapılacak Çalışma Kaynakların doğru planlanması Gelecek planlarının yapılabilmesi Tıbbi açıdan yapılan çalışmalara katkı sağlanması için Radyoloji veritabanı üzerinde ilişkisel veri madenciliği çalışmaları yapılacak ve değerli bilgiler keşfedilmeye çalışılacaktır.
Teşekkürler Pınar YILDIRIM Mahmut ULUDAĞ Abdülkadir GÖRÜR 31.01.2008 Çankaya Üniversitesi Bilgisayar Mühendisliği Ankara Mahmut ULUDAĞ European Bioinformatics Institute Cambridge, UK Abdülkadir GÖRÜR 31.01.2008