BİYOİNFORMATİK
İçerik Biyoinformatik nedir Tarihçe Önemi Amaçları Uygulama alanları Veritabanları ve programları Biyoinformatik merkezleri
Biyoinformatik Nedir?
Tanım Bilgisayarların moleküler biyolojide kullanımı Moleküllerin üç boyutlu grafik temsili Moleküler dizilimler Üç boyutlu yapı moleküler veritabanları Kısa sürede yüksek miktarda veri üretilmesi Protein-protein ilişkileri Biyolojik olarak aktif moleküllerin araştırılması Bakteri, maya, insan, hayvan, bitki genom projelerinden elde edilen bilgiler
Biyoinformatik Biyoinformatik İstatistik Bilgisayar Bilimleri Biyoloji Matematik
Biyoinformatik Araçları Veri bankası Mevcut veriler 1986’da 3939 iken 1999’da 80.000’e çıkmış 2004 yılında kayıtlara göre yaklaşık 160.000 veriye ulaşmıştır. Günümüzde yaklaşık 300.000’i geçmiştir. 10 yıldır Biyoinformatik dalı ayrı bir bilim dalı olarak tanınıyor.
Biyoinformatik Araçlarının Kullanıldığı Metodolojik Çalışmalar DNA sıra ve dizilimi araştırmaları Protein sıra ve dizilimi araştırmaları Makromoleküler yapıların üç boyutlu dizilim araştırmaları Küçük moleküllerin ligandlarıyla etkileşiminin araştırılması Heterojen biyolojik veritabanlarının entegrasyonu Biyolojik enformasyon paylaşımının kolaylaştırılması Bilgisayar ile otomize edilmiş veri analizi ve iletimi Etkileşimde bulunan gen ürünleri için bilgi ağları oluşturulması Kimyasal reaksiyonlardan hücrelerarası iletişime kadar pek çok biyolojik faaliyet sürecinin simülasyonu Büyük çaplı biyolojik deneylerden (GENOM projeleri gibi) çıkan sonuçların analizi
Biyoinformatik Araçlarının Kullanıldığı Biyolojik Çalışmalar Protein yapı ve fonksiyonunun belirlenmesi Her hangi bir biyolojik fonksiyonu artıran veya azaltan moleküllerin tasarlanması Karmaşık genetik fonksiyon veya regülasyonun tanımlanması Tıbbi ya da endüstriyel amaçlı yeni makro moleküller üretmek Genetik faktörlerin hastalık yatkınlığına etkilerinin ortaya çıkarmak
Kapsamı Biyolojik bilgiler ile ilgili veritabanı oluşturulup yönetilmesi Genom ve dizi analizleri İşlevsel genomik ve ilgili veri analizi Birincil protein dizisinden protein 3 boyutlu tahmini Hücresel olayların modellenip insliko gerçekleştirilmesi
Veri Tabanları
Veri Tabanı Programları Tablolar Formlar Sorgular Raporlar
Biyolojik Çeşitlilik Bacteria Yeast Fruit Fly Human
Biyoloji Veritabanları GenBank (Gen Bankası; ABD-Maryland-Bethesda) http://www.ncbi.nlm.nih.gov/Genbank/ EMBL (Avrupa Moleküler Biyoloji Laboratuvarı; İngiltere-Hinxton) http://www.ebi.ac.uk/embl/ DDJB (DNA Japonya Veritabanı; Japonya-Mishima) http://www.ddbj.nig.ac.jp/
Gen ekspresyonu = Protein üretimi DNA
Gen ekspresyonu = Protein üretimi Nucleotides sequence Protein DNA
Protein dizi verileri ile ilgili başlıca hizmet sağlayıcılar GenBank EMBL PIR International Swiss-Prot
Sık Kullanılan Veritabanları Sınıf Veri Tabanları Nükleik Asit Dizilişleri (DNA) EMBL GenBank Protein Dizilişleri (Protein) PDBSTR Swiss-Prot PIR PRF 3 Boyutlu Yapılar PDB Diziliş Motifleri EPD TRANSFAC PROSITE Enzimler ve Bileşikler LIGAND Protein Etkileşimleri BRITE Biyokimyasal Yollar PATHWAY Gen Katalogları GENES Genetik Hastalıklar OMIM Protein Mutasyonları PMD Amino acid indices AAindex Protein/peptid Literatürü LITDB Biyotıp Literatürü MEDLINE
Protein Dizisinden Yapısına APRKFFVGGNWKMNGDKK SLGELIHTLNGAKLSADT EVVCGAPSIYLDFARQKL DAKIGVAAQNCYKVPKGA FTGEISPAMIKDIGAAWV ILGHSERRHVFGESDELI GQKVAHALAEGLGVIACI GEKLDEREAGITEKVVFE QTKAIADNVKDWSKVVLA YEPVWAIGTGKTATPQQA QEVHEKLRGWLKSHVSDA VAQSTRIIYGGSVTGGNC KELASQHDVDGFLVGGAS LKPEFVDIINAKH
Pockets in Ribonuclease A
Dizi karşılaştırma 1: MYTAILORISRICH 2: MONTAILLEURESTRICHE ¦x ¦¦¦¦ x¦x¦ ¦¦¦¦ 2: MONTAILLEURESTRICHE ¦ = Identity x = Mismatch - = Insertion / Deletion 1: TAILO RICH ¦¦¦¦x ¦¦¦¦ 2: TAILL RICHE Global Alignment Two Local Alignments
Multiple Sequence Alignment (MSA) Programlar: CLUSTALW T_COFFEE HBA_CHICK VL-SAADKNNVKGIFTKIAGHAEEYGAETLERMFTTYPPTKTYFPHF-DL 48 HBAD_CHICK ML-TAEDKKLIQQAWEKAASHQEEFGAEALTRMFTTYPQTKTYFPHF-DL 48 HBPI_CHICK AL-TQAEKAAVTTIWAKVATQIESIGLESLERLFASYPQTKTYFPHF-DV 48 HBB_CHICK VHWTAEEKQLITGLWGKV--NVAECGAEALARLLIVYPWTQRFFASFGNL 48 HBE_CHICK VHWSAEEKQLITSVWSKV--NVEECGAEALARLLIVYPWTQRFFASFGNL 48 HBRH_CHICK VHWSAEEKQLITSVWSKV--NVEECGAEALARLLIVYPWTQRFFDNFGNL 48 MYG_CHICK GL-SDQEWQQVLTIWGKVEADIAGHGHEVLMRLFHDHPETLDRFDKFKGL 49 .... . ..* . .. * * * *.. .* * * * .. HBA_CHICK SH-----GSAQIKGHGKKVVAALIEAANHIDDIAGTLSKLSDLHAHKLRV 93 HBAD_CHICK SP-----GSDQVRGHGKKVLGALGNAVKNVDNLSQAMAELSNLHAYNLRV 93 HBPI_CHICK SQ-----GSVQLRGHGSKVLNAIGEAVKNIDDIRGALAKLSELHAYILRV 93 HBB_CHICK SSPTAILGNPMVRAHGKKVLTSFGDAVKNLDNIKNTFSQLSELHCDKLHV 98 HBE_CHICK SSPTAIMGNPRVRAHGKKVLSSFGEAVKNLDNIKNTYAKLSELHCDKLHV 98 HBRH_CHICK SSPTAIIGNPKVRAHGKKVLSSFGEAVKNLDNIKNTYAKLSELHCEKLHV 98 MYG_CHICK KTPDQMKGSEDLKKHGATVLTQLGKILKQKGNHESELKPLAQTHATKHKI 99 . *. .. ** .*.. . . .. .. . *.. * .. HBA_CHICK DPVNFKLLGQCFLVVVAIHHPAALTPEVHASLDKFLCAVGTVLTAKYR-- 141 HBAD_CHICK DPVNFKLLSQCIQVVLAVHMGKDYTPEVHAAFDKFLSAVSAVLAEKYR-- 141 HBPI_CHICK DPVNFKLLSHCILCSVAARYPSDFTPEVHAEWDKFLSSISSVLTEKYR-- 141 HBB_CHICK DPENFRLLGDILIIVLAAHFSKDFTPECQAAWQKLVRVVAHALARKYH-- 146 HBE_CHICK DPENFRLLGDILIIVLASHFARDFTPACQFAWQKLVNVVAHALARKYH-- 146 HBRH_CHICK DPENFRLLGNILIIVLAAHFTKDFTPTCQAVWQKLVSVVAHALAYKYH-- 146 MYG_CHICK PVKYLEFISEVIIKVIAEKHAADFGADSQAAMKKALELFRNDMASKYKEF 149 . .... . .* . . ... . .* . .. **. HBA_CHICK ---- 141 HBAD_CHICK ---- 141 HBPI_CHICK ---- 141 HBB_CHICK ---- 146 HBE_CHICK ---- 146 HBRH_CHICK ---- 146 MYG_CHICK GFQG 153 Consensus length: 154; Identity : 19 ( 12.3%); Similarity: 51 ( 33.1%) Character to show that a position in the alignment is perfectly conserved: '*' Character to show that a position is well conserved: '.' Multiple Sequence Alignment (MSA) Programlar: CLUSTALW T_COFFEE MULTALIGN
Tıp ve Farmakoloji Uygulamaları Biyoinformatiğin önemli bir fonksiyonu, biyolojik olayların moleküler düzeyde açıklanmasına yardımcı olmasıdır. Patojen enzimleri veya mutasyona uğratılmış doğal enzimler, homoloji sayesinde modellenebilir ve bu modeller moleküler biyolojik olarak belirlenen etkilerin açıklanmasında kullanılabilir. Gen ekspresyon analizleri ile farklı hastalıklardan etkilenen hücrelerin ekspresyonları derlenerek, sağlıklı hücrelerinki ile kıyaslanmakta ve aradaki farklılıklardan hastalık teşhisi ve hedef ilaç dizaynında yararlanılmaktadır. Kişilerin gelecekteki sağlık durumları hakkında tahminde bulunmaya olanak verebilecektir.
Tıp ve Farmakoloji Uygulamaları Düzeltilmiş mutasyon analizleri (CMA) zincir çiftlerindeki ko-varisyasyonları bularak protein katlanma probleminin çözümünde kullanılabileceğini düşünmüşlerdir. Biyoinformatik sayesinde hastalıkların önlenmesinde önemli gelişmeler sağlanacaktır. Nükleotid dizilerinden translasyon yazılımı kullanılarak mümkün olan aminoasit dizileri belirlenebilir. Daha sonra model organizmalarda dizilim arama teknikleri yardımı ile homolog bölgeler belirlenir ve dizi benzerliklerinden yararlanılarak deneysel olarak karakterize edilmiş olan yapılar üzerinden insan proteinleri modellendirilebilir. Algoritma ile model yapıya bağlanabilen, gerçek proteinde biyolojik aktivitenin test edilebildiği molekülle ilaçlar tasarlanır.
Sonuç