BİYOİNFORMATİK NEDİR? BİYOİNFORMATİKTE KULLANILAN SINIFLAMA YÖNTEMLERİ Yrd.Doç.Dr.Lale Özyılmaz
İÇERİK Biyoinformatik Nedir? Yapay Sinir Ağları Bayes Sınıflama Karar Ağaçları
BİYOİNFORMATİK NEDİR?-1 Genetik bilgiyi analiz etmek ve anlamak için bilgisayar bilimleri, bilgi teknolojileri ve genetik bilim dallarından oluşan bir kombinasyondur. Amacı: -DNA, RNA ve protein dizilerinin yapılarını ve fonksiyonlarını araştırmak -Hastalıklara ve genetik bozukluklara çare üretebilmek -Genetik hastalıkları tedavi edebilecek ilaçları üretebilmek
BİYOİNFORMATİK NEDİR?-2 Matematik ve İstatistik Bilgisayar bilimleri Biyoloji
BİYOİNFORMATİK NEDİR?-3 İlgilenilen 2 temel konu 1)Bir türün genetik özellikleri incelenerek o türün özelliklerinin araştırılması 2)Farklı türlerin karşılaştırılması
YAPAY SİNİR AĞLARI (YSA) Genel olarak insan beyninin ya da merkezi sinir sisteminin çalışma prensiplerini taklit eden bilgi işleme sistemleridir. YSA yapay sinir hücrelerinden meydana gelir ve katmanlar halinde oluşturulur.
BİYOLOJİK VE YAPAY SİNİR SİSTEMİ Biyolojik Sinir Sistemi YSA Sistemi Nöron İşlem Elemanı Dendrit Birleştirme Fonksiyonu Hücre Gövdesi Transfer Fonksiyonu Akson İşlem Elemanı Çıkışı Sinapslar Ağırlıklar
İŞLEM ELEMANININ YAPISI
YAPAY SİNİR AĞLARININ YAPISI-1
YAPAY SİNİR AĞLARININ YAPISI-2 Yapay sinir ağları, yapay sinir hücrelerinin birbirine bağlanmasıyla oluşan yapılardır. Yapay sinir ağları üç ana bölümde incelenir; giriş, ara (gizli) ve çıkış katmanları.
YAPAY SİNİR AĞLARININ YAPISI-3 Giriş Katmanı:Yapay sinir ağına dış dünyadan girişlerin geldiği katmandır. Genelde girişler herhangi bir işleme uğramadan ara katmanlara iletilmektedir.
YAPAY SİNİR AĞLARININ YAPISI-4 Ara (Gizli Katman) Katman: Giriş katmanından çıkan bilgiler bu katmana gelir. Ara katman sayısı ağdan ağa değişebilir. Bazı yapay sinir ağlarında ara katman bulunmadığı gibi bazı yapay sinir ağlarında ise birden fazla ara katman bulunmaktadır. Ara katmanlardaki nöron sayıları giriş ve çıkış sayısından bağımsızdır.
YAPAY SİNİR AĞLARININ YAPISI-5 Çıkış Katmanı: Ara katmanlardan gelen bilgiyi işleyerek, giriş katmanından gelen verilere karşılık olan çıkışları üreten katmandır. Bu katmanda üretilen çıkışlar dış dünyaya gönderilir.
YSA’NIN TEMEL BAZI ÖZELLİKLERİ Öğrenme: İstenen çıkış(lar)ı elde etmek için bağlantı ağırlıklarının ayarlanmasıdır. Genelleme: YSA’nın eğitim sırasında karşılaşmadığı test örnekleri için de istenen çıkışı üretmesidir. Adaptiflik: Ele alınan problemdeki değişikliklere göre ağırlıkların tekrar ayarlanmasıdır.
YSA’LARIN YAPILARINA GÖRE SINIFLANDIRILMASI-1 İleri Beslemeli Ağ:
YSA’LARIN YAPILARINA GÖRE SINIFLANDIRILMASI-2 Geri Beslemeli Ağ: Çıkışlar Z-1 : gecikme operatörü Girişler
YSA’LARIN ÖĞRENME ALGORİTMALARINA GÖRE SINIFLANDIRILMASI Eğiticili (Denetimli) Öğrenme: Çıkış katmanında ağın üretmesi gereken sonuçlar yani hedef (istenen) çıkışlar YSA’ya verilir. Eğiticisiz (Denetimsiz) Öğrenme: Örneklerden elde edilen çıkış bilgisine göre YSA, girişleri kümelere ayırır.
YAPAY SİNİR AĞININ EĞİTİMİNDE ÖNEMLİ BAZI KRİTERLER Eğitme örneklerinin seçilmesi Ağ yapısının belirlenmesi Durdurma kriterlerinin seçimi
BAYES SINIFLAMA İstatistiksel bir sınıflandırıcıdır. Sınıf üyelik olasılıklarını öngörür. İstatistikteki Bayes Teoremine dayanır. Basit bir yöntemdir.
BASİT BAYES SINIFLANDIRMA YÖNTEMİ Giriş : Öğrenme seti C1, C2, …, Cm adlı m sınıfımız olsun . Sınıflandırma maksimum posteriori olasılığını bulmaya dayanır. P(X) is bütün sınıflar için sabittir. olasılığının maksimum değeri bulunmalıdır. Yeni bir örnek X, maximum P(X|Ci)*P(Ci) değerine sahip olan sınıfa atanır.
P(xi|C) DEĞERLERİNİN BULUNMASI Özellik 1 P(1|A) = 3/5 P(1|B) = 2/9 P(2|A) = 0 P(2|B) = 4/9 P(3|A) = 2/5 P(3|B) = 3/9 Özellik 2 P(1|A) = 2/5 P(2|A) = 2/5 P(3|A) = 1/5 Özellik 3 P(1|A) = 4/5 P(1|B) = 3/9 P(2|A) = 1/5 P(2|B) = 6/9 Özellik 4 P(1|B) = 6/9 P(2|A) = 3/5 P(2|B) = 3/9 P(A) = 5/14 P(B) = 9/14
YENİ X ÖRNEĞİNİN SINIFLANDIRILMASI Yeni örnek X = <özellik1, özellik2, özellik3, özellik4>=<3, 1, 1, 1> P(X|A)·P(A) = P(3|A)·P(1|A)·P(1|A)·P(1|A)·P(A) = 2/5·2/5·4/5·2/5·5/14 = 0.018286 P(X|B)·P(B) = P(3|B)·P(1|B)·P(1|B)·P(1|B)·P(B) = 3/9·2/9·3/9·6/9·9/14 = 0.010582 Örnek X’in sınıfı A olarak öngörülür.
KARAR AĞACI-1 Sınıflandırma, kümeleme ve tahmin modellerinde kullanılan bir teknikdir. Ağaçtaki her düğüm bir özellikteki testi gösterir. Düğüm dalları testin sonucunu belirtir. Ağaç yaprakları sınıf etiketlerini içerir. Karar ağacı iki aşamadan oluşur Ağaç inşası Başlangıçta bütün öğrenme örnekleri kök düğümdedir. Ağaç Temizleme Gürültü ve istisna kararları içeren dallar belirlenir ve kaldırılır. Karar ağacı kullanımı: Yeni bilinmeyen örneğin sınıflandırılması Bilinmeyen örneğin özellikleri karar ağacında test edilerek sınıfı bulunur.
KARAR AĞACI-2 Karar ağaçlarında kök ve her düğüm bir soruyla etiketlenir. Düğümlerden ayrılan dallar ise ilgili sorunun olası yanıtlarını belirtir. Her dal düğümü de söz konusu sorunun çözümüne yönelik bir tahmini temsil eder.
TEŞEKKÜRLER ... Yrd.Doç.Dr. LALE ÖZYILMAZ YILDIZ TEKNİK ÜNİVERSİTESİ ELEKTRONİK ve HABERLEŞME MÜHENDİSLİĞİ BÖLÜMÜ www.yildiz.edu.tr/~ozyilmaz ozyilmaz@yildiz.edu.tr