Gene Set Enrichment Analysis (GSEA) Mehmet Emre Tuncer Refference:Daniel Gusenleitner gusef@jimmy.harvard.edu
Gen Hastalık İlişkisi Genler bize hastalıklarla ilgili ip uçları verebilmektedir. Bu bilgiler tek bir genden belirgin olarak elde edilebileceği gibi bir çok genin birbirleriyle olan ilişkileriyle de belirlenebilir Bir çok hastalık ya da fenetopik rahatsızlık sadece bir genle ifade edilemeyebilir.
Gen Hastalık İlişkisi Çoğu hastalık karmaşıktır ve birden çok geni kapsar. Genler genel olarak bağımsız çalışmazlar, bir bütünün fonksiyonel bir parça olarak çalışırlar.
Gen Setlerinin Tanımı Gen kümeleri kendi başlarına biyolojik mekanizmaları ya da karakteristikleri tanımlamada yeterli olmazlar Saf biyolojik bilgiyi temsil ederler, teorik ve deneysel araştırmalarda yardımcı olurlar
Gen Kümeleri Data-driven Veri Kümeleri Knowledge-driven Veri Kümeleri
Gen Kümeleri Data-driven Veri Kümeleri Genellikle yüksek verimli araştırmalarda ilişkili genleri tanımlamada ve türetmede kullanılırlar
Gen Kümeleri Knowledge-driven Veri Kümeleri Gen kümelerini oluşturmak için uzman gerekir. Bunlar genellikle araştırmanın konusuna özeldir. GSEA Knowledge Driven bir yaklaşımı destekler.
Gene Set Analysis (GSA) Analizleri bioloji odaklı yaklaşımlara kaydırır. Gen ifadesi data setlerini analiz etmek için fonksiyon ilişkili gen gruplarını kullanır. Tek bir genin analizinden daha güçlü(robust)
Gene Set Analysis (GSA) GSEA 3 adımdan oluşur: Enrichment skorunun hesaplanması Significance ın tahmin edilmesi Çoklu hipotez testi için düzenlemeler
Gene Set Enrichment Analysis (GSEA) Yapılan Çalışmalar Mootha et al. PGC-1α-responsive genes involved in oxidative phosphorylation are coordinately downregulated in human diabetes, Nature Genetics, 2003, 34-3 Subramanian et al. Gene set enrichment analysis: A knowledge-based approach for interpreting genome-wide expression profiles, PNAS, 2005, 102-43 Oron et al. Gene set enrichment analysis using linear models and diagnostics, Bioinformatics, 2008, 24-22 Bioconductor Package: GSEAlm - Linear Model Toolset for Gene Set Enrichment Analysis
GSEA’ nın Amaçları Test edilen iki sınıf içinde aşağı ya da yukarı düzenlenmiş gen kümelerine bakmak. Araştırılan gen kümesinin test edilmiş iki fenotipten farklı ya da aynı olma durumunu test etmektir.
Değişik Fenotiplerin Testi Clinical Data Sample Disease Type S1 Normal breast tissue S2 S3 S4 Low grade cancer (Luminal A) S5 S6 S7 High grade cancer (Basal) S8 S9 Gene Expression Data Pair-wise Tests: Normal versus Low grade Normal versus High grade Low grade versus High grade Combined Tests: Normal versus Low/High grade Normal/low grade versus High grade
Gene Set Enrichment Analysis (GSEA) I.)Genler t-test ya da lineer model kullanarak sıralanıyor.
Gene Set Enrichment Analysis (GSEA) II.) Gen kümesine üye bilgisi dahil ediliyor
Enrichment Score (ES) Sıralanmış Liste (L) nin sınırlarında yoğunlaşan sıralamaları yansıtır Skor L listesinde gezinirken hesaplanır Zenginleştirme skoru random gezinme sırasında sıfırdan en fazla sapmanın olduğu skor olarak belirlenir.
Gene Set Enrichment Analysis (GSEA)
Original (4) enrichment score behavior Original (4) enrichment score behavior. The distribution of three gene sets, from the C2 functional collection, in the list of genes in the male/female lymphoblastoid cell line example ranked by their correlation with gender: S1, a set of chromosome X inactivation genes; S2, a pathway describing vitamin c import into neurons; S3, related to chemokine receptors expressed by T helper cells. Shown are plots of the running sum for the three gene sets: S1 is significantly enriched in females as expected, S2 is randomly distributed and scores poorly, and S3 is not enriched at the top of the list but is nonrandom, so it scores well. Arrows show the location of the maximum enrichment score and the point where the correlation (signal-to-noise ratio) crosses zero. Table 1 compares the nominal P values for S1, S2, and S3 by using the original and new method. The new method reduces the significance of sets like S3. Subramanian A et al. PNAS 2005;102:15545-15550
Permütasyon Testi ES nin significence(önem) ı tahmin edilmelidir. Önem tahmini için Sınıf etiketli permütasyon işlemi yapılır ES için null dağıtım üreten permütasyon yapılır Gözlemlenmiş ES nin deneysel, nominal P değeri bu null dağıtıma göre hesaplanır Bu P değeri gerçek ES yi verir.
Gene Set Enrichment Analysis (GSEA)
Actual Enrichment Skorun Hesaplanması
Çoklu hipotez testi için düzenlemeler Öncelikle ES değeri normalize edilir. Bunun sonucunda NES oluşur. Daha sonra False positiveler kullanılarak FDR(False Discovery Rate) hesaplanır.
Farklı Gen Setleri için Sonuçlar
Teşekkürler