BİYOİNFORMATİK.

BİYOİNFORMATİK

Günümüzde en popüler ve akademik ve endüstriyel sektörlerin başında gelmekte olan biyoinformatik ,İnsan Genom Projesi ile birlikte doğadaki diğer canlıları derinlemesine inceleme ve büyük miktarlarda veriyi bilgisayarlarda tutma yaklaşımıdır.Biyoinformatik teknikler biyolojik moleküllerin dizilimlerinin oluşturulması ,üç boyutlu yapılarının tasarlanması,verilerin analizi,depolanması,bilgilerinin paylaşıma sunulması için bilgisayar ile otomize edilmiş olarak kullanılmaktadır.

BİYOİNFORMATİK NEDİR? Modern biyolojide araştırmacılar için büyük kolaylıklar sağlayan ve oldukça genç bir bilim dalı olan biyoinformatik son yıllarda hızlı bir şekilde gelişmektedir. NIH(The Instutıes Of Health )a göre biyoinformatik;biyolojik,tıbbi,davranışsal ya da sağlık verilerinin kullanımını genişletmek ve bu verileri elde etmek ,depolamak ,organize etmek,arşivlemek,analiz etmek ya da görselleştirmek için bilgisayara dayalı araçlar ve yaklaşımların araştırılması ,geliştirilmesi ve uygulanmasıdır.

Yale üniversitesinden Luscombe ve ark
Yale üniversitesinden Luscombe ve ark.tarafından biyoinformatik ,biyolojiyi moleküller açısından kavramsallaştıran (fizikokimya anlamında) ve uygulamalı matematik,bilgisayar bilimi ve istatistik gibi alanlardan türeyen informatik tekniklere uygulayan bir bilim dalı olarak tanımlanmaktadır.Özellikle moleküler biyoloji için başvurulan ve önemli bir bilim dalı olan biyoinformatiğin pek çok pratik uygulama alanı vardır.

Biyoinformatiğin Amaçları
Biyoinformatiğin 3 amaçlarından bahsedebilirz 1-bilimsel verileri organize etmek; Araştırmacılara,sanal ortamda varolan bilgiye erişmek ve yine onların ürettikleri yeni girdileri bildirmek için dataların düzenlenmesi ve veri bankalarında saklanmasını sağlamak. 2-verilerin analiz edilmesine yardımcı olacak araçlar ve kaynaklar geliştirmek: Belli bir genin dizi analizini yapabilmek için onu öncellikle karakteristik dizisiyle karşılaştırmak gerekir.Bu uygulamada FASTA,BLAST ve ClustalW gibi araçlara ihtiyaç vardır.

3-Biyolojik çalışma sonuçlarını yorumlamak ve bilgiyi analiz etmek için geliştirilen araçları kullanmak

BİYOİNFORMATİĞİN TARİHÇESİ
Biyoinformatik biliminin gelişimi,bilgisayarların yerel ağ sistemi olarak kullanılması ve biyoteknolojideki gen ve protein verilerinin birikmesiyle başlamıştır.Bu bilim dalının başlangıcı,DNA ve protein dizi analizinin otomize edebildiği ve biyoteknolojiyle uğraşan araştırmacıların genler ve proteinlerle ilgili büyük miktarlarda ve çok çeşitli veriler elde etmeye başladığı tarihler olan 1970’lere dayanmaktadır.Bu disiplin,bilgisayarların kullanıcılar tarafından veri saklama ve erişimi için çok popüler olduğu dönem olan 1980’lerin ortalarında gelişmeye devam etmiştir.Aynı dönemde bilgisayarlardan bilgiye erişim,yönetim ve depolama için çeşitli araçlar geliştirilmiştir.

Moleküler biyolojide elde edilen bilgilerin hızla artması,veri bankalarının daha uygun bir şekilde kullanılması ihtiyacını ortaya çıkarmıştır.Bu anlamda geliştirilen pek çok yeni teknik,biyoinformatiğin daha fazla gelişmesine neden olmuştur.Örn: California da Intelli Genetics firması tarafından PC/GENE olarak isimlendirilen bir paket program üretilmiştir.Bu program,belli bir gen dizisini proteine ve ikincil yapısının tahmin edildiği ürününe çevirebilmekteydi.

Biyoinformatikle ilgili tarihsel gelişimi şu şekilde sıralayabiliriz;
1965:Margaret Dayhoff tarafından protein dizi atlasının oluşturulması 1969:Amerika ‘ da ARPA (The Advanced Research Projects Agency) nın kurulması.Bir network sistemiyle UCSB (University of California ,Santa Barbara),Utah üniversitesi ve UCLA (University of California,Los Angeles)üniversitelerinin birbirine bağlanması 1970:Dizi karşılaştırmaları için Needleman –wunch algoritmasının yayınlanması 1975:Bill Gates ve Paul Allen tarafından Microsoft un kurulması

1977-staden tarafından DNA dizileme programı hazırlanması
1980-DNA ve protein dizi analizi yapan IntelliGenetics firmasının kurulması 1988-National Center for Biotechnology Information (NCBI)kurulması,Pearson ve Lupman tarafından FASTA algoritmasının bulunması 1990:BLAST algoritmasının oluşturulması

1991:EST(expressed sequence tags) tanımlanması
1992:TIGR(The Institue for genomic research) veri bankasının kurulması 1994:EMBL(The European Molecular Biology Laboratory)-european bioinformatics Instıtute nin kurulması 1995:Haemophilus influenzea genomunun dizi analizinin yapılması 1996:saccharomyces cerevisiae genomunun dizi analizinin yapılması 1997:escherichia coli genomunun dizi analizinin yapılması

1999:drosophila melanogaster genomunun dizi analizinin yapılması
2001:insan genomunun dizi analizinin yapılması

BİYOİNFORMATİĞİN BAŞLICA ÇALIŞMA ALANLARI
Biyoinformatik,modern biyolojiden gelen iki temel bilgi akışını kapsamaktadır.Bunlardan birincisi ,bir organizmanın DNA ‘sının incelenmesiyle ortaya çıkan özelliklerden ,aynı organizma türünün oluşturduğu toplulukların karakteristik özelliklerine kadar olan ‘genetik bilgi akışı’ dır.Diğeri ise,biyolojik olayların gözlemlenmesiyle elde edilen bilgilerin yeni deneyler ile test edilerek ggelen deneysel bilgi akışıdır.

Biyoinformatiğin başlıca çalışma alanlarını şu şekilde sıralayabiliriz:
1-genler ve proteinler için sekans analizi araştırmaları:Binlerce organizmasının DNA sekansları veri bankalarında kodlanmakta ve depolanmaktadır.Bu sekans bilgileri:polipeptidleri,RNA yı ,regülatör dizileri,yapısal motifleri ve repetitif (tekrarlanan)dizileri kodlayan genleri içermektedir. 2-gen ekspresyonu analizi çalışmaları:Genlerin ekspresyonu çeşitli tekniklerle (mikroarray,EST,SAGE)gibi mRNA düzeyleri ölçülerek tespit edilebilmektedir.

3-Protein ekspresyonu çalışmaları:Biyolojik bir örnektekiproteinlerin varlığı,protein mikroarray ve yüksek duyarlıkta kütle spektrofotometresi yöntemleriyle gösterebilmektedir. 4-Protein yapılarının tahmin edilmesi araştırmaları:Biyoinformatiğin bir başka önemli uygulama alanıdır.Primer yapı olarak isimlendirilen bir proteinin amino asit dizisi,onu kodlayan gen dizisinden kolaylıkla tespit edilebilmektedir.Protein yapı tahmini tıpta(örn:ilaç tasarımı) ve biyoteknolojide(örn:yeni enzimlerin tasarımında )oldukça önemlidir.

5-Protein Docking(doklama):Bu çalışma alanı proteinlerin üç boyutlu yapılarının,biyoinformatikte kullanılan araçlar üzerinden,modelleme çalışmalarıdır.Doklama çalışmasının amacı canlı bir organizmada bulunduğu şekliyle ilgili protein kompleksinin üç boyutlu yapısının tahmin edilmesidir. 6-Karşılaştırmalı genomik araştırmalar:Bu araştırmalar farklı biyolojik türler ile genom yapı ve fonksiyonları arasındaki karşılaştırma çalışmalarını içerir

7-Evrim araştırmaları:Biyoinformatik araçlar,özellikle filogenetik analizler ve populasyon çalışmalarında kullanılmaktadır. 8-Genom anlamlandırması:Genomda,bir DNA dizisinde bulunan genleri ve diğer biyolojik özellikleri işaretleme sürecidir.Gen bulma için biyoinformatikte kullanılan araçlara örnek olarak BLAST verilebilir.

9-Regülasyon Analizi:Regülasyon,hücre dışı bir sinyalle başlayan karışık olaylardır.Biyoinformatik teknikler bu süreçte bulunan çeşitli adamları incelemek için uygulanmaktadır. 10-Kanserde mutasyon analizi araştırmalar:Kanserde çeşitli genlerdeki bilinmeyen nokta mutasyonlarını tespit etmek için yoğun çabalar sarfedilebilmektedir.Biyoinformatikçiler dizi bilgilerinin tamamını oluşturabilmek için özelleşmiş otomize sistemleri üretmeye devam etmektedirler.

11-Biyolojik sistemlerin modellemesi:Sistem biylojisi ve matematiksel biyolojinin önemli bir işi olan modellemeler arasında;hücresel,protein katlanması,immün sistem,ekolojik,enfeksiyon hastalık modellemeleri verilebilir.

BİYOLOJİK VERİ BANKASI NEDİR?
Moleküler biyoloji,biyoinformatik,biyomoleküller,moleküler evrim ve genetik alanında her gün yüzlerce çalışmanın sonucu yayınlanmaktadır.Biyolojik verilerin farklı dosya biçiminde ,farklı veri depolama yaklaşımlarıyla çok sayıda veri kaynaklarında depolanarak,sanal ortamlar şeklinde araştırmacılar tarafından kullanılması sağlanmaktadır.

Günümüzde en çok kullanılan nükleotid ve protein veri bankaları:
Ensembl Genom Veri Bankası NCBI(National Center for Biotechnology Information)Genom Veri Bankası UCSC(University of california santa cruz)Genom Veri Bankası DDBJ(DNA Data Bank Of Japan)Genom Veri Bankası JCVI(J.CRAIG Venter Instıtute)Veri Bankası Gene ontology (GO)Veri Bankası KEGG(Kyoto Encyclopedia of Genes and Genomes)Veri Bankası

ExPASy (Expert protein anlysis System ) Veri Bankası
PIR(protein Information Resource ) Veri Bankası

ENSEMBL GENOM VERİ BANKASI
Genetik alanında çalışan bilim insanları tarafından yoğun bir şekilde kullanılan oldukça kapsamlı bir veri bankasıdır.Bu veri bankası EMBL-EBI(European Molecular Biology Kaboratory –Eurpean Bioinfırmatics Institute) ve Sanger Enstitüsünün İngiltere ‘ de bulunan ve zamanın en büyük hayır kurumu olan Welcome Trust tarafından desteklenen ortak bir projesidir.EMBL,NCBI ve DDBJ veri bankaları,1982 den beri birbirleriyle bağlantılı olarak çalışmaktadır.24 saat boyunca dünyanın herhangi bir bölgesinden gelen yeni dizi bilgileri her üç veri bankasında da aynı anda otomatik olarak güncellenmektedir.

Veri bankası incelendiğinde farklı yollar kullanılarak aranılan bilgiye ulaşılabilmektedir.Bunlardan bazıları Search Ensembl,Sequence Search ve Mine Ensembl with BioMart dır.

Search Ensembl Ana sayfanın üst kısmında yer alan bu opsiyon ile Ensembl ‘ da bulunan canlı türlerinin,herhangi bir gen ya da kromozomu araştırılabilir.Bunun için ya üç anahtar sözcükten oluşan kelime grubu ,örneğin’’human HER2 gene ‘’ ya da araştırılmak istenen canlı türü seçilir.Ardından aranılan gen ya da kromozom adı yazılarak istenilen bilgiye ulaşılır.İlk aşamada seçtiğimiz tür ve gen sayısı görüntülenecektir.Buradan ‘’Gene (1)’’ butonuna basılarak ilgilenilen genin tanımlanmış tüm kayıtları ekrana gelecektir.Koyu olarak yazılmış üst satırdabulunan Enseml ID numarası tıklandığı zaman,b gene ait daha detaylı bilgilere ulaşabilmektedir.Gelen bilgi sayfasında uzun ve detaylı bilgiler verilmektedir.Bunlar ;genin tam olarak adı,sembolleri,kromozom üzerindeki pozisyonu ,

Transkriptleri,sayfanın sol kısmında ise genin özeti,dizinin tamamı,gen ağaçları,ortologları,parologları,genetik varsyasyonları vs.görülmektedir.Sayfanın üst kısmında transkrşptlerle ilgili olan tabloda transcrıpt ID leri sütunundan herhangi birine tıklandığında açılan sayfada ilgilenilen genin ekson sayısı,transkript ve translasyon uzunlukları öğrenebilmektedir.

Açılan sayfanın solunda aranılan gen ile ilgili daha detaylı bilgilere ulaşılabilmektedir.Örn: exsons butonuna tıklandığında genin bütün eksonları baz düzeyinde görülmektedir.Protein butonuna tıklandığında ise genin amino asit dizisi karşımıza çıkmaktadır.

Search For a DNA or Protein Sequence
Ensembl ana sayfasında bulunan bu opsiyon ile BLAST analizi yapılmaktadır.Yani ilgilendiğimiz bir nükleotid ya da protein dizisinin,genomda bulunduğu pozisyonu ve benzerlik gösterdiği diğer bölgeleri ekrana getirmektedir.Dizi FASTA formatında girilmeli sayfada uygun seçenekler işaretlenmeli ve RUN butonuna basılmalıdır.

Sonuç sayfasında ekrana gelen ilk bölümde,elimizdeki dizinin genomda bulunduğu muhtemel lokasyonları yani en iyi benzeştiği bölgeler,kırmızı ok işareti ile gösterilir.Ancak en büyük olasılıkla bulunduğu yer kırmızı ok kare içine alınarak belirtilir.İkinci bölümde ilgilendiğimiz dizinin diğer dizilerle kendi aralarındaki benzerlikleri sunulur.Son bölümde ise bilgiler daha detaylı olarak liste şeklinde ekrana gelir.

Mine Ensembl with Biomart
Ensembl ana sayfasında bulunan bu araç ile ilgilendiğimiz kromozom ya da genomik bölgenin sınırlarını,ilgili butonları kullanarak kendimiz belirleriz.Bu şekilde istediğimiz bilgilerle ilgili daha detaylı veriler elde edebiliriz.

NCBI(National Center for Biotechnology Information)Genom Veri Bankası
NCBI veri bankası 4 Kasım 1988 tarihinde National Institues of Health a bağlı olan National Library of Medicine nin bir parçası olarak kurulmuştur.NCBI herkese açık çok geniş bir veri bankasıdır.NIH NCBI ile sunmuş olduğu birleşik araştırma bileşenleri ve herkese açık,çok geniş veri tabanı sayesinde dünyadaki en kapsamlı biyomedikal araştırmalar kurumu özelliğini kazanmıştır.NCBI sağlık ve hastalık durumlarını kontrol eden temel moleküler ve genetik sistemlerin daha iyi anlaşılması için yeni bilgi teknolojilerini geliştirmeyi kendisine görev edinmiştir.Bu misyonunu yerine getirebilmek için daha özel olarak :

Moleküler biyoloji,biyokimya ve genetik alanlarında yeni bilgilerin analiz edilmesi ve depolanması için informatik sistemlerin yaratılması Ulusal ve uluslararası biyoteknolojik bilgileri toplamak için yapılan çalışmaların koordine edilmesi

NCBI da bulunan başlıca veri bankaları ve biyoinformatik araçlar aşağıdaki gibi sıralanabilr:
1-literatür veri bankası 2-DNA VE RNA Veri bankası 3-protein veri bankası 4-sekans analiz araçları 5-genler ve ekspresyon veri bankası 6-genom veri bankası 7-genom haritaları ve markırlar 8-moleküllerin 3d yapıları ve domainleri

9-genetik ve tıp kaynakları
10-taksonomi veri bankası 11-data ve software araçları 12-NCBI eğitim kaynakları 13-homotoloji veri bankası 14-küçük moleküller veri bankası 15-varyasyon veri bankası NCBI veri bankasında araştırma yapmadan önce bazı terimleri öğrenmek gerekir.

GENEBANK ID Oldukça yaygın olarak kullanılan bu veri bankası den daha fazla sayıda türe ait DNA dizileri içermektedir.Bu diziler geniş çapta dizi projeleri ve bireysel labarotuvarlar tarafından yapılan çalışmalardan elde edilmektedir.Tanımlanan tüm DNA dizileri,Genebank ID olarak kendilerine tahsis edilen bir tanımlama numarası ile kodlanarak depolanmaktadır.Bu ID numarası ile ilgili kayıt,veri bankasından çağrılarak görüntülenebilmektedir.Bir gene ait birden fazla GeneBank ID bulunabilir.Örn: GI:

NCBI Reference Sequences (RefSeq ID)
RefSEq veri bankası çeşitli canlılara ait genomik DNA,RNA ve proteinler için kapsamlı,entegre ve iyi açıklanmış bir dizi seti sunmaktadır.RefSeq genom açıklaması ,gen tanımı ve karakterizasyonu,mutasyon ve polimorfizm analizleri,ekspresyon çalışmaları ve karşılaştırmalı analizler için güvenilir bir referans sağlamaktadır.Bu veri bankasının koleksiyonunda plazmidler,organeller,virüsler,arkeler,bakteriler ve ökaryotlardan gelen kapsamlı ve standart bir dizi seti bulunmaktadır.Genbank ile arasındaki fark ,ana canlı grupları için bir biyolojik moleküle ait sadece tek bir DNA dizi kaydının bulunmasıdır.

NCBI ana sayfasında bir gen araştırması yapabilmek için genin sembolüne ya da GeneBank ID numarasına gerek duyulur.İlgilenilen genin sembolünü ya da ID numarası ,sayfanın hemen üst kısmında bulunan kutuya yazılıp SEARCH butonuna basılarak tarama başlatılabilir.Açılan sayfada herhangi bir gen kaydı için 38 farklı kategori sunulmakta ve hemen sol tarafında ilgili kategori için en son kayıt sayısı belirtilmektedir.Kayıtlar incelendiğinde,sıra numarası,tanımlandığı organizma ,genin tam adı,Refseq DNA ID ve GeneBank ID numarası kısa bir liste halinde ifade edilmektedir

NCBI BLAST NCBI da BLAST analizi,ilgilenilen bir genin nükleotid dizisinin,genomda nerede yer aldığı ve hangi bölgelerle ne kadar benzeştiği bilgilerine ulaşılmasını sağlamaktadır.Aynı zamanda BLAST analiziyle insan ile sıçan ya da diğer canlılar karşılaştırılarak komplementer bölgeler belirlenebilmektedir.

BLAST analizi yapılan sonuç sayfası dört bölüm içermektedir. 1
BLAST analizi yapılan sonuç sayfası dört bölüm içermektedir.1.bölüm yapılan analiz hakkında ,2 bölüm ilgilenilen dizinin genomdaki yeri ve diğer dizilerle benzerliği hakkında grafik olarak bilgi vermektedir.3.bölümde bilgiler liste halinde sıralanırken son bölümde blast analizi yapılan dizinin genomdaki benzerlikleri baz düzeyinde birebir karşılaştırmalı olarak sunulmaktadır.

DDBJ (DNA Data Bank of Japan)Genom Veri Bankası
DDBJ Asya da bulunan tek nükleotid veri bankasıdır.Çoğunlukla Japon araştırmacılar olmak üzere diğer ülkelerden gelen diziler de kabul edilmekte,nükleotid dizilerini bir tanımlama numarası ile veri bankasında depolamakta ve ileri düzeydeki biyoinformatik araçları ile veri analizi olanağı sunmaktadır.

UCSC(University of California Santa Cruz)Genom Veri Bankası
UCSC genom veri bankası University of California Santa Cruz yapısında yer alan Center for Biomolecula Science and Engineering içerisinde bulunan ve farklı alt bölümlerden oluşan Genom Biyoinformatik Grubu tarafından kurulmuştur.Bu site de diğer veri bankaları gibi çeşitli organizmalara ait genom bilgileri içermekte ve araştırmacılara bazı biyoinformatik araçşar sunmaktadır.

JCVI(J.Craig Venter Institute)Veri Bankası
JCVI 5 araştırma merkezinin Ekim 2006 da birleşmeleriyle kurulmuş bir merkezdir.Bu araştırma merkezleri TIGR(The Institute for Genomıc RESEARCH) TCAG(The Center for the Advancemet of Genomics) The J.Craig Venter Science Foundation The Joınt Technology Center IBEA (The Institute for Biological Energy Foundation Alternatives )

JCVI ana sayfasından özel olarak istenilen organizmaya ait genoma ulaşılabilir.Bunun için ana sayfanın sol menüsünde bulunan başlıklar kullanılır.

Gene Ontology (GO)Veri Bankası
Gene ontology veri bankası ilgilenilen gen ya da gen ürününün görev aldığı metabolik yolu hiyerarşik bir şekilde görme olanağı sağlamaktadır.Bu veri bankası ile gen ya da gen ürünlerinin görev aldığı metabolik yollar bulunabilmektedir.

KEGG (Kyoto Encyclopedia of Genes and Genomes)
KEGG veri bankası ile çeşitli organizmalara ait genomik ve moleküler bilgilere farklı kategorilerde ulaşmak mümkündür.Bu kategoriler Genler ve proteinler için KEGG GENES Metabolik yollar için KEGG PATHWAY Çeşitli biyolojik sistemlerde hiyerarşik yapıları açıklayan KEGG BRITE Biyolojik sistemlerde kimyasal yapıları açıklayan KEGG LİGAND

Tek gen hastalıkları,multifaktöriyel hastalıklar,enfeksiyöz hastalıklar gibi çeşitli tiplerde hastalıkları açıklayan KEGG DİSEASE Ortolog grupları açıklayan KEGG ORTHOLOGY İlaçları açıklayan KEGG DRUG gibi farklı yapı taşlarından oluşmaktadır. KEGG İle biyolojik sistemler bilgisayar ortamında moleküler ağlarla,grafiklerle organize edilerek sunulmaktadır.

ExPASy(Expert Protein Analysis System)Veri Bankası
ExPASy SIB (Swiss Institute of Bioinformatics )in veri tabanı olarak 1993 yılında kurulmuştur.Bu veri bankasında bulunan araçlarla proteinlerin tanımlanması,amino asit dizilerinin ve yapılarının analiz edilmesi,üç boyutlu yapılarının tahmin edilmesine yönelik çalışmalar yapılabilmektedir.

PIR (Protein Information Resource)Veri Bankası
PIR (Protein Bilgi Kaynağı)NBRF (The National Biomedical Research Foundation)tarafından protein dizilerinin tayin edilmesi ve yorumlanması konusunda araştırmacılara yardımcı olmak üzere 1984 yılında kurulmuştur.

BİYOİNFORMATİK.

Benzer bir sunumlar

... konulu sunumlar: "BİYOİNFORMATİK."— Sunum transkripti:

Benzer bir sunumlar

Proje hakkında

Geri bildirim

Giriş

Sosyal ağ üzerinden giriş yapmak:

BİYOİNFORMATİK.

Benzer bir sunumlar

... konulu sunumlar: "BİYOİNFORMATİK."— Sunum transkripti:

Benzer bir sunumlar

Proje hakkında

Geri bildirim