Protein-Protein Etkileşimlerinin Hesaplamalı Yöntemlerle Tahmin Edilmesi Attila Gürsoy Bilgisayar Mühendisliği Koç Üniversitesi
Özet Protein-protein etkileşimleri Yapısal benzerlik ve evrimsel korunmuş özellikleri kullanarak protein etkileşimlerinin tahmin edilmesi PRISM: protein-protein etkileşimleri için web tabanlı sunucu ve veritabanı Neden protein-protein etkileşimleri tahmin hesaplarını grid üzerine taşımak istiyoruz?
Protein-protein etkileşimleri Vücudumuzdaki birçok biyolojik olay proteinlerin birbirleri ile bağlanıp/ayrışmaları sonucunda geçekleşmektedir ( enzim/sübstrat, hormon/reseptör, antikor/antijen bağlanmaları, sinyal iletilmesi, maddelerin hücre içinde taşınması, RNA/DNA sentezlenmesi gibi ) Protein etkileşimlerinin oluşmasını sağlayan ana sebepleri anlamak moleküler seviyede bu olayların kontrolu için büyük bir adım olacaktır. İlaç tasarımı
Protein etkileşimleri karmaşık bir ağ oluşturur The first model organism interaction maps were generated for yeast, over 5600 interactions involving 69% of the yeast proteins
Protein etkileşimlerin bulunması/tahmini Deneysel Yeast 2 Hybrid Hesaplamalı Protein/Gen veri tabanları Dizi İkincil yapılar 3 boyutlu yapı Fonksiyonel anotasyonlar Etkileşim verileri Gen ifade dizileri
Protein Veri Bankası 3 boyutlu yapısı bilinen proteinler Şubat 2007: 40000’den fazla protein yapı biligisi Hızla artıyor Ayın proteini (Ocak 2007) İmportin : Taşıyıcı protein
Protein etkileşim arayüzü Proteinlerin etkileştiği yüzey bölgeleri. İki protein arayüzeyinin birbirine göre şekilsel ve kimyasal olarak uyumlu olması gerekmektedir. Ara yüzlerdeki bazı kritik ve evrim boyunca korunmuş amino asitlerde önemli.
Bilinen protein yapılarını kullanarak protein etkileşimlerini tahmin etmek Protein Veri Bankasında, protein arayüzlerini bulmamızı saylayacak protein kompleksleri var.(1) Bir arayüzün, başka bir yüzeye benzerliğini hesaplayarak (2) Geometrik benzerlik Kimyasal benzerlik Evrimsel korunum Bu arayüz üzerinden potansiyel olarak etkileşebilecek proteinler bulunabilir (3) … ILIL TLTL TRTR IRIR T L x T R
Arayüzey benzerlik tanımı Yapısal benzerlik Üç boyutlu uzayda en az farkı vercecek uygun transformasyonu bulmak “Geometrik hashing” Evrimsel bezerlik Arayüzler yapısal olarak hizalanıp, korunmuş “sıcak amino asitler” bulunabilir. Yüzey çıkarma: NACESS Yapısal hizalama: Multiprot S. Hubbard and J. Thornton. NACCESS v atomic solvent accessible area calculations, M. Shatsky, R. Nussinov, and H. J. Wolfson. MULTIPROT - a multiple protein structural alignment algorithm. In Lecture Notes in Computer Science, volume 2452, pages 235–250. Springer Verlag, 2002.
Sonuçlar: Tahmin edilen etkileşimler PVB’den 2002 yılından alınmış protein yapıları kullanarak 67 arayüzey 6000 hedef protein 1 işlemci kullanarak yaklaşık 1 ay hesaplama süresi
Doğrulanmış tahminler
Doğrulanmış bir etkileşim RAD50 - DNA double-strand break repair protein (1l8dB) ↔ BRCA1 - Breast cancer susceptibility protein (1miuA) via 1aq5AC Verfied in literature
MDM2 - P53 tumor supressor inhibitor (1ycqA) ↔ Growth factor receptor bound protein (1azeA) via 1azeAB Doğrulanmış bir başka etkileşim
Literatürde doğrulanmamış fakat yüksek olasıklı bir etkileşim Vitamin D binding protein (1et1[AB]) ↔ Parathyroid hormone 1kxpD via1cosAC Not directly verified literature but strong evidence exists
PRISM
PRISM: web tabanlı mimari Web Server (Apache) Relational Database (MySQL) PHP External Programs Client PRISM Server (
PRISM Arayüz veritabanı ve sorgulama Online Help System Navigation Menu Personal History Context Sensitive Help Arayüz detayları, 3d görüntüleme
PRISM Tahmin edilmiş protein etkileşimlerin sorgulanması Etkileşim algoritması yeni yapılar için çalıştırılarak, var olan arayüzeyler aracılığıyla etkileşmesi sorgulanabilir
PRISM Etkileşimlerin ağ olarak görüntülenmesi
Etkileşimlerin fonksiyonel benzerliklerine göre gruplama annotates annotation Parent_of
Neden Grid: Şu andaki sonuçlar: Yaklaşık 6000 protein yapısı ve 67 arayüzey için (2002 PVB), 1 aylık bir hesaplama zamanı gerekti. Biyolojik verilerde ve algoritmalarda devamlı iyileşmeler oluyor Şu anda PVB’de yapı var Daha fazla arayüzey Arayüzeyleri daha iyi kategorize etme imkanı (kristal, biyolojik) Benzerlik hesabının daha iyi yapılması protein, 2000 arayüz için bir CPU zamanı yaklaşık 240 gün Paralel versiyonu (MPI) süreyi önemli ölçüde kısaltıyor
Gride uyarlamanın avantajları Daha hızlı. Algoritmada bağımsız bir çok iş var Kullandığımız “yüzey çıkarma”, “dizi hizalama” ve “yapısal hizalama” hesapları Grid üzerinden servis olaraka alınabilir (yaygın). Yeni algoritmalar geliştirildikçe, otomatik olarak yeni algoritmaları kullanabilmek Protein yapı bilgisine uzaktan hesap sırasında erişebilmek Yeni data geldikçe güncelleme Hesaplanan etkileşim verileri diğer araştırmacılara grid üzerinden servis olarak verilebilir.
Bonn Presentation 24 Gride uyarlama G-PPI: Protein-protein Interaction Prediction Application Koç Universitesi Attila Gürsoy, Özlem Keskin, Cengiz Ulubaş Bilkent Üniversitesi Cevdet Aykanat, Eray Özkural Şu andaki durum Bir yerel bilgisayarda çalışan paralel versiyon Prototip grid uyarlaması
Interaction Prediction Service Similarity Scoring Service Protein Structure DB Protein Interface DB Surface DB Similarity Scores DB Storage Element Surface Extraction Service Computing Element Resource Broker Similarity Scoring Service Computing Element Surface Extraction Service Computing Element Results DB Prototip Mimari