400100710021-Bitkilerde Fonksiyonel Genombilim http://biotek.ankara.edu.tr/ 400100710021-Bitkilerde Fonksiyonel Genombilim Prof. Dr. Ali ERGÜL Ankara Üniversitesi, Biyoteknoloji Enstitüsü
HAFTA-1 Bitki Genom Yapısı HAFTA-2 HAFTA-3 RNA İzolasyonu HAFTA-4 RNA İzolasyonu-UYGULAMA HAFTA-5 Bitkilerde Gen İfadesi ve Analizleri: Real Time PCR HAFTA-6 Real Time PCR-UYGULAMA HAFTA-7 HAFTA-8 Bitkilerde Gen İfadesi ve Analizleri: Mikroarray-RNA dizileme HAFTA-9 HAFTA-10 Bitkilerde Ters Genetik -miRNA HAFTA-11 Tüm Genom Dizileme Çalışmaları HAFTA-12 Bitki Genom Projelerine Genel Bakış HAFTA-13 Bitkilerde Genom Düzenlenmesi (CRISPR/Cas9) HAFTA-14 Moleküler Tarım
HAFTA 9: Bitkilerde Gen İfadesi ve Analizleri: Mikroarray-RNA dizileme
RNA Dizileme (RNA-Seq) Transkriptom, bir hücredeki transkriptlerin tamamı ve belirli gelişim evresinde yâda belirli bir fizyolojik durumdaki miktarlarıdır. Genomdaki fonksiyonel elementlerin çözülmesi ve hücre ve dokulardaki moleküler bileşenlerin açığa çıkarılmasında, transkriptomu anlamak önemlidir. Türlere ait transkriptlerin (mRNA’ların, kodlanmayan RNA’ların) ortaya çıkarılması ve gruplandırılması, genlere ait özgün transkriptomik düzenlerin ortaya çıkarılması, post transkripsiyonel modifikasyonların anlaşılması, splayzing mekanizmalarının aydınlatılması, transkriplere ait 5’ başlangıç ve 3’ sonlandırma bölgeleri ve transkriptlere ait farklı koşullarda ekspresyon seviyelerinin karşılaştırılması transkriptomda anahtar konular arasındadır.
RNA Dizileme (RNA-Seq) Son dönemlerde yeni nesil sekanslama teknolojilerinin transkriptom analizlerinde kullanılması ile transkriptom dizisi ve miktarı rahatlıkla belirlenebilmektedir. Bu yöntem RNA Sekanslama (RNA-Seq) olarak ifade edilmektedir ve fare insan hücresi, Arabidopsis thaliana gibi birçok ökaryot canlılarda RNA-Seq ile transkriptom analizleri gerçekleştirilmiştir. RNA-Seq yönteminde genel olarak total RNA cDNA kütüphanelerine dönüştürülür, cDNA fragmentlerine bağlanan adaptörler (bir yandan yada çift taraftan) ile her bir molekül PCR amplifikasyonu yada amplifikasyon olmadan yüksek işlem hacmine sahip yeni nesil sekanslama teknolojileri ile sekanslanmaktadır. RNA-Seq için genellikle yeni nesil sekanslama aletlerinden Illumina IG, Roche 454 ve SOLİD kullanılmaktadır.
RNA Dizileme (RNA-Seq) Sekanslama sonrası elde edilen okumalar referans genoma yada transkripte hizalanırlar yada transkripsiyonel yapı ve/veya her gen için ekspresyon seviyeleri içeren genom ölçeklendirme transkripsiyonel haritası oluşturmak için, genomik sekans kullanmadan de novo olarak yapılmaktadır. RNA-Seq bir çok avantajı birarada sunmaktadır.
RNA Dizileme (RNA-Seq) Diğer transkriptom metotları ile karşılaştırıldığında RNA-Seq avantajları Teknoloji Tilling Mikroarray cDNA/EST sekanslama RNA-Seq Teknoloji Özellikleri Prensip Hibridizasyon Sanger sekanslama High-throughput sekanslama Rezolüsyon Birkaç bazla 100bp arası Tek baz İşlem Hacmi Yüksek Düşük Genomik diziye güven Evet Hayır Bazı durumlarda Arkaplan gürültü Uygulama Eş zamanlı transkriptlerin dizilenmesi ve ekspresyon seviyelerinin belirlenmesi Gen ekspresyon için kısıtlı Gen ekspresyon ölçümünde dinamik kapasite Bikaç yüz kata kadar Pratik değil >8,000-kat Farklı izoformları ayırt etme yeteneği Kısıtlı Allelik ekspresyonları ayırt etme yeteneği Pratik sorunlar Gerek duyulan RNA miktarı Büyük genomlarda transkriptom analizi maliyeti Oldukça düşük
RNA Dizileme Avantajları İlk olarak hibridizasyon temelli yöntemlerden farklı olarak; transkript tanımlanmasında mevcut genomik sekanslara bağlı değildir. RNA-Seq tek baz rezolüsyonu ile transkripsiyon sınırlarının kesin lokasyonunu meydana çıkarmaktadır. Ayrıca RNA-Seq’ de meydana gelen 30 bazlık kısa okumalar iki ekzonun nasıl birleştiği hakkında bilgi vermektedir. RNA-Seq transkript bölgelerindeki sekans varyasyonlarını ortaya çıkarmaktadır (SNPs). RNA-Seq ekspresyon seviyesi bakımından geniş dinamik aralığa sahiptir. Elde edilen sekansların kuantifikasyonunda herhangi bir üst sınır bulunmamaktadır. DNA mikroarraylerde ekspresyon seviyeleri (~9.000’den fazla)daha küçük dinamik aralığa sahiptir (~birkaç yüz kat) Yapılan çalışmalarda, RNA-Seq sonuçları hem teknik hemde biyolojik replikalarda yüksek seviye amplifikason özellik göstermektedir.
RNA Dizileme Amaçları Transkript başlangıç bölgelerinin haritalanması Zincir spesifik (strand spesific) RNA-Seq Alternatif spliyzing modellerinin karakterizasyonu Gen fusion (gen birleşme yerlerinin) tanımlanması Hedef yaklaşımlarda RNA-Seq’in kullanımı Small RNA profilleme Direkt RNA Sekanslama Düşük miktar RNA örneklerinin profillenmesi
RNA-Seq Yöntemi (İllumina için) Tipik RNA-Seq Deneyi; Kısaca; uzun RNA ilk olarak cDNA fragmentlerini içeren kütüphanelere dönüştürülmektedir (RNA yada DNA fragmentasyonu ile). Sekanslama adaptörleri cDNA fragmentlerine eklenmekte ve her cDNA’dan high-throughput sekanslama teknolojileri yardımı ile kısa sekanslar elde edilmektedir. Elde edilen sekans okumaları referans genom yada transkriptom ile hizalandırılmaktadır. Sekans okumaları ekzon okumaları, bağlanma okumaları yada poly (A) sonu okumaları olmak üzere 3 ana gruba sınıflandırılmaktadır. Bu üç grup her gen için baz-rezolüsyonlu ekspresyon profillerinin oluşturulmasında kullanılmaktadır.
RNA-Seq Yöntemi Tru Seq İPLİKÇİK (STRANDED) TOPLAM RNA KÜTÜPHANE HAZIRLANMASI: Pürifikasyon ve mRNA Fragmentasyonu: Toplam RNA numunesinin içinde yer alan ribozomal RNA’lar Ribo-Zero kiti ile ortamdan uzaklaştırılmakta sonrasında, kalan RNA’lar pürifiye edilmektedir. RNA’lar fragmentlerine ayrıştırılarak cDNA sentezi için hazırlanmaktadır. cDNA 1. İplikçiğinin Sentezi: RNA fragmanlarının reverse transkripsiyon ve random hexamerleri (reverse transkriptaz ve random hexamerler kullanılarak) ile cDNA 1. İplikçiğinin sentezi gerçekleştirilmektedir. cDNA 2. İplikçiğinin Sentezi: RNA örneği ortamdan uzaklaştırılarak ve ikinci iplikçik sentezlenmektedir. Zincir üzerindeki dUTP’ler, dTTP ile değiştirilerek çift zincir cDNA sentezi gerçekleştirilmektedir. AMPure XP boncukları (beadleri) kullanılarak, çift zincir cDNA ürünleri, reaksiyonda kullanılan diğer kimyasallardan ayrıştırılmaktadır.
RNA-Seq Yöntemi Tamamlama (End Repair) İşlemi: Bu işlem, fragmentasyon sonucunda meydana gelen eşleşmeyen (overhang) bölgelere sahip cDNA’ların eksik kısımlarının tamamlama (End Repair) kimyasalları ile tamamlanmasını içermektedir. Bu basamakta kullanılan kimyasallarla, 3’ uç kısmındaki fazlalıklar kaldırılarak, 5’ uç bölgesindeki fazlalıklar doldurularak kapatılmaktadır. Sonuç olarak küt uç (blunt-end) cDNA’lar elde edilmektedir. 3’ Uç Kısmı Tekli Adenilasyon: Küt uç (Blunt-end) cDNA fragmanlarının her birinin 3’ kısımlarına Adenin nükleotidi eklenerek, cDNA’ların birbirine bağlanması engellenmektedir.
RNA-Seq Yöntemi Adaptör Ligasyonu: Bu basamakta, çoklu adaptörler, farklı örneklerde farklı kombinasyonlar oluşturacak şekilde cDNA kütüphanesinin uç kısmına bağlanmaktadır. DNA Fragmanlarının Zenginleştirilmesi: PCR kullanılan bu basamakta adaptörlerine bağlanmış olan cDNA fragmanları çoğaltılarak kütüphanenin büyütülmesi amaçlanmaktadır.PCR çalışmasında “PCR primer coctail” kimyasalı kullanılarak bu primerler cDNA’ların uç kısımlarındaki adaptör bölgelerine bağlandırılarak kütüphane hazır hale getirilmektedir. İllumina tarafından kullanılan Solexa dizileme yönteminde, DNA fragmanları öncelikle flow-cell adı verilen çipler üzerine yerleştirilmekte ve yerleştiği bölgede yüksek doğrulukta sinyal vermek için bölgesel olarak çoğaltılmaktadır (bridge-amplification) ve bunun sonucunda flow-cell üzerinde milyonlarca fragman kümeleri (cluster) oluşmaktadır. Flowcell üzerinde oluşan fragman kümeleri, her bir döngüde 1 baz okunacak şekilde dizilenmektedir.
RNA-Seq Yöntemi İllumina tarafından geliştirilen “Sequencing-by Synthesis= sentez yoluyla dizileme ” yöntemi ile her döngüde, DNA fragmanları 2 farklı boya ile işaretlenmiş 4 farklı dinükleotite maruz bırakılmaktadır. Her bir döngüde, uygun dinükleotitin bağlanmasını takiben floresans kamera ile o kümenin görseli alınmaktadır.Her bir kümeden gelen görseller birleştirilmekte ve sonuçta ilgili kümelerin ışıma karakterlerinden nükleotit dizileri çıkarılmaktadır. Bioinformatik Analizler Ön Analiz: Fastq Oluşturulması ve Demultiplexing: Çalışma sonunda, NextSeq 500 dizileme platformu okuma verileri, *.bcl formatında oluşturulmaktadır. Bu dosyalar, DNA kümelerinin flow-cell üzerindeki konum ve ID’lerini, ışıma karakterlerini içermektedir. Bu verilerden Bcl2fastq v.2.1 (illumina) programı kullanılarak *.fastq dosyaları elde edilmektedir. Aynı zamanda, fastq verileri, içerdiği index verilerine göre farklı örneklere ayrıştırılmaktadır (Demultiplexing).
RNA-Seq Yöntemi Bioinformatik Analizler Ön Analiz: Fastq Oluşturulması ve Demultiplexing: Çalışma sonunda, NextSeq 500 dizileme platformu okuma verileri, *.bcl formatında oluşturulmaktadır. Bu dosyalar, DNA kümelerinin flow-cell üzerindeki konum ve ID’lerini, ışıma karakterlerini içermektedir. Bu verilerden Bcl2fastq v.2.1 (illumina) programı kullanılarak *.fastq dosyaları elde edilmektedir. Aynı zamanda, fastq verileri, içerdiği index verilerine göre farklı örneklere ayrıştırılmaktadır (Demultiplexing).
RNA-Seq Yöntemi Kalite Kontrol: Kalite kontrol işlemleri, ham fastq verilerinin incelenerek dizileme çalışmasının etkinliğini ölçmede kullanılmaktadır. Böylelikle, çalışmada yaşanan herhangi bir sorun ve olası sebepleri hakkında bilgi edinilmiş olur. Bu amaçla FASTQC programı (www. bioinformatics. babraham. ac. uk) kullanılmaktadır. Okuma Filtreleri ve Trimming: Dizileme sürecinde, Fastq okuma verilerindeki düşük kalitedeki baz okumaları, sonraki analiz basamaklarında yanlış (false positif) sonuçlara neden olmaması için, okumalardan çıkarılmaktadır. Trimmomatic uygulaması: (http://www.usadellab.org/cms/?page=trimmomatic) Trinity:Broad Enstitüsü tarafından geliştirilen Trinity (http://trinityrnaseq.sourceforge.net/), RNA-Seq verilerinden transkriptom verilerinin de novo olarak hızlı ve etkili olarak oluşturulmasını sağlamak amacı ile kullanılmaktadır.
RNA-Seq Yöntemi RSEM-Tabanlı Oran-Miktar Tayini: RSEM (1.2.15) (http://deweylab.biostat.wisc.edu/rsem/), RNA-Seq verilerindeki transktriptlerin kantifikasyonunun sağlanması için kullanılan bir uygulamadır. Özellikle de novo transkriptom çalışmalarında tercih edilmektedir. Uygulama Trinity ile beraber çalışmakta ve RNA transkriptlerinin miktar ve oranlarının hesaplanmasında kullanılmaktadır. BlastX (Gene Ontolojisi): Bu program, RNA-Seq verilerinden elde edilen okumaların 3’lü çerçeveler üzerinden hangi aminoasitleri oluşturacağının ve bu aminoasit dizilerinin protein dizi veritabanlarında aratılmasında kullanılmaktadır
Örnek RNA Dizileme Bulguları GENEL VERİLER Ham verilerde ve kalite kontrol verilerinde bulunan kalite skorlarına (Q20 ve Q30) ait yüzdelerin yüksek olması (%93 ve üzeri) istenmektedir. RNA dizileme ham verilere ait örnek veriler
Örnek RNA Dizileme Bulguları RNA örneklerine ait kalite kontrol (Trimming) İşlemi sonrası elde edilen genel veriler Örnek Toplam Baz Okuma Sayısı GC Oranı (%) Q20 (%) Q30 (%) Kök Kontrol 16. 614. 779. 452 166. 973. 870 45.26 98.77 95.51 Kök Stres 17.634 573. 697 176. 699. 290 46.26 98.98 96.2 Yaprak Kontrol 20. 215. 572. 854 202. 490. 438 43.78 98.99 96.25 Yaprak Stres 16. 905. 192. 552 169. 273. 076 44.54
Örnek RNA Dizileme Bulguları Birleştirme (Assembly) işlemi sonrasına ait örnek genel veri TÜM transkript contig’ler Total trinity genleri 365. 086 Tüm trinity transkriptleri 500. 058 GC (%) 40 N50 960 Maksimum contig uzunluğu 26. 205 Minimum contig uzunluğu 201 Median contig uzunluğu 368 Ortalama contig uzunluğu 640 Toplam Assembly Edilen Baz 320. 100. 184
Örnek RNA Dizileme Bulguları N50 değeri özellikle genom birleştirme işleminde contig uzunluklarını refere etmekte ve birleştirme işleminin kalitesini tanımlamaktadır. Bu değer contig uzunluklarının ortalamasına benzer şekilde hesaplanmakta olup, hesaplamalarda daha uzun contiglere daha ön planda tutulmaktadır. Başka bir ifade ile N50 değeri genomun %50 sindeki en kısa dizi uzunluğunu ifade etmekte olup, RNA dizileme analizlerinde bulunan N50 değeri dizileme çalışmaları için uygun değerlerde bulunmalıdır.
Örnek RNA Dizileme Bulguları Örneklerin Karşılaştırılmasına Yönelik Analizler: Test - kontrol grupları ve analiz metotları Yaprak ve Kök dokusunda artan/azalan transkriptlerin sayısı İfade/Doku Yaprak Kök Artan 6289 2618 Azalan 6116 3575
Örnek RNA Dizileme Bulguları Örnek: Yaprak stres ile yaprak kontrol (N3/N4) ve Kök stres ile kök kontrol (N5/N6) örneklerinin karşılaştırılması sonrasında katsayı değişimi (fold-change) ve p-değerine göre ifadesi anlamlı derecede artan veya azalan transkriptler
Örnek RNA Dizileme Bulguları Örnek: Gen ontoloji analizleri sonucu ifadesi en çok artan/azalan transkriptler (Fold change: katsayı değişimi) Yaprak stres/kontrol Artan Tanım Protein Ailesi Protein 320,04 UNIPROTKB|O50054 CAP160 PF07918 Cold acclimation protein 303,16 Kök stres/kontrol 172,22 - 101,74 UNIPROTKB|Q4W9A9 AFUA_4G00860 Cell surface protein 96,35 40,86 UNIPROTKB|G8BBN8 CPAR2_801050 PF05022 hypothetical protein
Örnek RNA Dizileme Bulguları FPKM (Fragments Per Kilobase Of Exon Per Million Fragments Mapped) terimi: İlgili genin ekzonları üzerindeki her bin bazlık bölgeye kaç okuma düştüğü ve bu okuma sayısının 1 Milyon'a bölünmesi ile bulunmaktadır (Ekspresyon değeri ile doğru orantılıdır). Dağılımlarında örnekler için, FPKM değerine göre toplamda tespit edilen contig grubundan eleme yapılarak, kalan contig grubu üzerinden istatistik çalışmalar gerçekleştirilmektedir.
Örnek RNA Dizileme Bulguları Ekspresyon dağılımları boxplot olarak belirtilmektedir. Ham dağılım, log2 çevrimi yapılmış dağılım ve Quantile normalizasyon yapılmış örnek dağılım grafikleri
Örnek RNA Dizileme Bulguları Contig ekspresyon değerlerine ait yoğunluklar; ham yoğunluk, Log2 dönüşümü yapılmış yoğunluk ve Quantile normalizasyon sonrası örnek yoğunluk grafikleri
Örnek RNA Dizileme Bulguları Örnekler arasındaki benzerlik değeri log2(RPM+1) değerinin Pearson katsayısı üzerinden hesaplanmaktadır. -1 ile 1 arasındaki değerler arasından, 1 yaklaştıkça örnekler arasındaki benzerlik artmaktadır.
Örnek RNA Dizileme Bulguları Her bir örneğe ait log2(RPM+1) değerine göre, yüksek ekspresyon benzerlikleri gruplanmaktadır. Gruplamalara ait örnek hiyerarşik kümeleme grafiği (solda) ve 2 boyutlu grafik (sağda)
Örnek RNA Dizileme Bulguları RNA ekspresyon değerleri, dağılım (scatter) plot üzerinde gösterilmektedir. Örnek görüntüde, X ekseni kontrol, Y ekseni ise stres grubunun ortalama değerlerine normalize edilmiştir.
Örnek RNA Dizileme Bulguları Farklı karşılaştırma grupları arasındaki RNA’ların kat sayı değişim verilerinin log2 değerleri ve p-değerlerinin hacim-plot (volume plot) üzerindeki gösteriminde, her bir grubun ortalama verileri üzerinden normalizasyon gerçekleştirilmiştir.
Örnek RNA Dizileme Bulguları Heatmap grafiklerinde hiyerarşik kümeleme (cluster) analizi (Euclidean Distance, Complete Linkage ile) sonuçları
Ders Kapsamında Yararlanılan Kaynaklar Functional Plant Genomics (Editors:J.-F. Morot-Gaudry, P.Lea, J.-F.Briat) Genomics-Assisted Crop Improvement Volume 1 Genomics Approaches and Platforms (Editors:Rajeev K.Varshney, Roberto Tuberosa) Pant Functional Genomics (Editors:Erich Grotewold) Karkute, S.G., Singh, A.K., Gupta, O.P., Singh, P.M., Singh, B. 2017. "CRISPR/Cas9 mediated genome engineering for improvement of horticultural crops", Frontiers in plant science, 8, 1635. Obembe, O. O., Popoola, J. O., Leelavathi, S., & Reddy, S. V. (2011). Advances in plant molecular farming. Biotechnology advances, 29(2), 210-222.