400100710151-MOLEKÜLER MARKÖRLER VE BİTKİ ISLAHINDA KULLANIMI http://biotek.ankara.edu.tr/ 400100710151-MOLEKÜLER MARKÖRLER VE BİTKİ ISLAHINDA KULLANIMI Prof. Dr. Ali ERGÜL Ankara Üniversitesi, Biyoteknoloji Enstitüsü
Hafta-1 Tarım Bitkileri, Biyoçeşitlilik, Transgenik Bitkiler Hafta-2 Nükleik Asit İzolasyonu (DNA) Hafta-3 Nükleik Asit İzolasyonu (DNA)-UYGULAMA Hafta-4 PCR (Polimerase Chain Reaction) Hafta-5 PCR (Polimerase Chain Reaction)-UYGULAMA Hafta-6 Kapiller Elektroforez Hafta-7 Moleküler Markörler ve SSR (Simple Sequence Repeats) Hafta-8 Kapiller Elektroforez - UYGULAMA Hafta-9 SNP Markırlar, Yeni Nesil Sekanslama Teknikleri ve SNP Haplotiplemesi Hafta-10 DNA Barkodlama Hafta-11 Markıra Dayalı Seleksiyon (MAS) Hafta-12 Haritalama Yaklaşımları Hafta-13 Dizi Analizi Hafta-14 Dizi Analizi-UYGULAMA
Hafta 9: SNP MARKIRLAR, YENİ NESIL SEKANSLAMA TEKNİKLERİ VE SNP HAPLOTİPLEMESİ
SNP MARKIRLAR, YENİ NESIL SEKANSLAMA TEKNİKLERİ VE SNP HAPLOTİPLEMESİ Son yıllarda bitki biyoteknolojisi alanındaki çalışmalarda, gen kaynaklarının oluşturulmasında ve genomik alandaki tekniksel ilerlemelerde önemli aşamalar kaydedilmiştir. Bu alandaki çalışmalar artan dünya nüfusuna yönelik gelecekte gıda vb. taleplerinin karşılanmasındaki katkıyı hedeflerken, bu amaçla kullanılacak ıslah (seleksiyon, melezleme vb.) çalışmalarında koleksiyonların gelişen genomik teknolojilerle değerlendirilmesi önemli yararlar sağlamaktadır. Diğer taraftan bitki moleküler ıslahı alanında DNA markörlerin ıslahı hızlandırıcı katkıları günümüzde kabul edilir bir yaklaşım olarak görülmektedir.
Bununla birlikte klasik genetik haritalama yöntemleri ile, arzu edilen genlerin, QTL (Quantitative Trait Locus)’lerin belirlenmesi ve ıslah programlarında kullanılması kısıtlı sonuçlar doğurmuş ve bu nedenle başarılı olarak kullanılan MAS (Marker-Assisted Selection) markırları sınırlı sayıda kalmıştır.
Genetik çeşitlilik, genler ve QTL’s ve dizileme teknolojileri ve genotipleme ve biyoinformatik alanındaki gelişmeler, hızlı ve yüksek hacimli moleküler markır tespiti yaklaşımlarına olanak sağlamaktadır. Basit dizi tekrarları (SSR) sonrasında, SNP (SNP: Single Nucleotide Polymorphism; TNP: Tekli Nükleotid Polimorfizmi) markırların devreye girmesi ile önemli bitki türlerinde, genetik çeşitliliğin karakterizasyonunda, agronomik özelliklerin QTL haritalanmasında ve kilit rol oynayan genlerin klonlanmasında önemli başarılar sağlanmıştır.
Özellikle çeltik, mısır ve buğday gibi türlerde SNP markırlara dayalı fine mapping stratejileri ile genler klonlanmış ve istenilen özelliklerle ilgili genleri kontrol eden allellerin seçimine olanak sağlanmıştır Aynı şekilde, ilgilenilen kromozom bölgesinin daha hassas taranmasını sağlayan, Yeni Nesil Dizileme (NGS: Next Generation Sequencing) sistemlerindeki gelişmeler, genomda SNP tanımlanacak bölgelerdeki SNP haplotipini daha derinlemesine ortaya koyabilmektedir.
Diğer taraftan çok sayıdaki örneğin aynı anda hızlı (Ultra high-throughput) DNA ekstraksiyonu ve SNP genotipleme yaklaşımları (teknikleri) ıslahçılar için büyük çaplı çalışmalara fırsat sağlamaktadır. Genom-boyutlu seleksiyon yaklaşımlarının kullanılması ile sınırlı sayıda lokusa dayalı seleksiyonlar yerine, yüksek-yoğunlukta ve genom çapında seleksiyonlara olanak sağlanmıştır. NGS ve SNP genotiplendirme tekniklerindeki avantajlardan dolayı bu yaklaşımlar tohum firmaları başta olmak üzere birçok uygulama alanını hızla genişletmektedir.
Gene dayalı markır tespitinde, günümüze kadar en çok kullanılan kodominat SSR markırların genomda sınırlı sayıda olup, diğer taraftan lokuslarda çoklu allel içermeleri nedeniyle değişik platformlarda veriler birbirleri ile çakıştırılamamakta, jel ortamlarının zaman alıcı olması ve birçok kapiller fragment sistemlerinde (otomatik) etkin multiplex (çoklu) uygulamaların yapılamaması ve sınırlı bilgi içeriği gibi nedenler SSR markırların SNP markırlara göre dezavantajı olarak gösterilmektedir.
3-SNP MARKIRLAR, YENİ NESIL SEKANSLAMA TEKNİKLERİ VE SNP HAPLOTİPLEMESİ Son yıllarda bitki biyoteknolojisi alanındaki çalışmalarda, gen kaynaklarının oluşturulmasında ve genomik alandaki tekniksel ilerlemelerde önemli aşamalar kaydedilmiştir. Bu alandaki çalışmalar artan dünya nüfusuna yönelik gelecekte gıda vb. taleplerinin karşılanmasındaki katkıyı hedeflerken, bu amaçla kullanılacak ıslah (seleksiyon, melezleme vb.) çalışmalarında koleksiyonların gelişen genomik teknolojilerle değerlendirilmesi önemli yararlar sağlamaktadır (Alfred vd., 2014; Varshney vd., 2014). Diğer taraftan bitki moleküler ıslahı alanında DNA markörlerin ıslahı hızlandırıcı katkıları günümüzde kabul edilir bir yaklaşım olarak görülmektedir. Bununla birlikte klasik genetik haritalama yöntemleri ile, arzu edilen genlerin, QTL (Quantitative Trait Locus)’lerin belirlenmesi ve ıslah programlarında kullanılması kısıtlı sonuçlar doğurmuş ve bu nedenle başarılı olarak kullanılan MAS (Marker-Assisted Selection) markırları sınırlı sayıda kalmıştır (McCouch vd., 2010; Davey vd., 2011; Poland ve Rife, 2012) Genetik çeşitlilik, genler ve QTL’s ve dizileme teknolojileri ve genotipleme ve biyoinformatik alanındaki gelişmeler, hızlı ve yüksek hacimli moleküler markır tespiti yaklaşımlarına olanak sağlamaktadır. Basit dizi tekrarları (SSR) sonrasında, SNP (SNP: Single Nucleotide Polymorphism; TNP: Tekli Nükleotid Polimorfizmi) markırların devreye girmesi ile önemli bitki türlerinde, genetik çeşitliliğin karakterizasyonunda, agronomik özelliklerin QTL haritalanmasında ve kilit rol oynayan genlerin klonlanmasında önemli başarılar sağlanmıştır. Özellikle çeltik, mısır ve buğday gibi türlerde SNP markırlara dayalı fine mapping stratejileri ile genler klonlanmış ve istenilen özelliklerle ilgili genleri kontrol eden allellerin seçimine olanak sağlanmıştır (Lübberstedt vd., 2005; Van Damme vd., 2011; Miura vd., 2011; Liu vd., 2012). Aynı şekilde, ilgilenilen kromozom bölgesinin daha hassas taranmasını sağlayan, Yeni Nesil Dizileme (NGS: Next Generation Sequencing) sistemlerindeki gelişmeler, genomda SNP tanımlanacak bölgelerdeki SNP haplotipini daha derinlemesine ortaya koyabilmektedir (Chia vd., 2012). Diğer taraftan çok sayıdaki örneğin aynı anda hızlı (Ultra high-throughput) DNA ekstraksiyonu ve SNP genotipleme yaklaşımları (teknikleri) ıslahçılar için büyük çaplı çalışmalara fırsat sağlamaktadır. Genom-boyutlu seleksiyon yaklaşımlarının kullanılması ile sınırlı sayıda lokusa dayalı seleksiyonlar yerine, yüksek-yoğunlukta ve genom çapında seleksiyonlara olanak sağlanmıştır (Heffner vd., 2009; Bernardo 2010; Jannink vd., 2010). NGS ve SNP genotiplendirme tekniklerindeki avantajlardan dolayı bu yaklaşımlar tohum firmaları başta olmak üzere birçok uygulama alanını hızla genişletmektedir. Gene dayalı markır tespitinde, günümüze kadar en çok kullanılan kodominat SSR markırların genomda sınırlı sayıda olup, diğer taraftan lokuslarda çoklu allel içermeleri nedeniyle değişik platformlarda veriler birbirleri ile çakıştırılamamakta, jel ortamlarının zaman alıcı olması ve birçok kapiller fragment sistemlerinde (otomatik) etkin multiplex (çoklu) uygulamaların yapılamaması ve sınırlı bilgi içeriği gibi nedenler SSR markırların SNP markırlara göre dezavantajı olarak gösterilmektedir. SNP markörlerin başlıca avantajları ise; esneklik, hız, maliyet-düşüklüğü, hacimli veri ile birlikte veri yönetimi kolaylığı şeklinde sıralanmaktadır. Her lokusta iki allel içermeleri ve veri kalite kontrol analizleri gerçekleştirildikten sonra farklı genotiplendirme platformlarında aynı allel aramalarına olanak sağlaması nedeni ile bi allelik (iki allel içeren) SNP markırlar, gruplar arasında veri birleştirme ve markır bilgilerinden büyük veritabanları oluşturmaya açık olan güvenilir markırlar olarak bilinmektedir. Diğer taraftan yüksek kaliteli referans genomların bulunması durumunda, genom dizisi ve SNP markır verilerinin çakıştırılması ile bir bitki türü için SNP katalogları oluşumu mümkün olmaktadır (Andrews vd., 2016; Kim vd., 2016). Yeni nesil dizileme teknolojilerinin kullanıma girmesi ile birçok bitkide genom düzeyinde dizileme çalışmaları ile büyük ölçekli dizi verileri üretilmiş (Edwards vd., 2013; Bolger vd., 2014; Li vd., 2014) ve konudaki çalışmalar devam etmektedir. Bu amaçla Massively Parallel Short Read teknoloji sistemleri (Illumina, Ion Torrent (www.illumina.com; ww.lifetechnologies.com. vb.) genomlarda yeniden dizilemelerde (re-sequencing) kullanılırken, uzun okuma teknolojileri ile yüksek kaliteli referans genomlarının dizilemelerinde ise, Pacific Biosciences (www.pacificbiosciences.com) teknolojileri kullanılmaktadır. Diğer taraftan tüm genom yeniden dizilemelerde, verinin birleştirileceği (alignment edileceği), türe ait yüksek kalite referans genom dizilerinin bulunması son derece önem taşımaktadır. Yeni nesil dizileme bilgilerinden yararlı veriyi şecmek ve genom boyutunda SNP lokuslarını tamamlamak ve ilgilenilen genlerde SNP haplotiplerini ve allellerini tanımlamak için bioinformatik araçları devreye girmektedir (Thomson, 2014; Andrews vd., 2016). Fonksiyonel SNP markırı (genle ilişkili) eldesinde, genom dizisi SNP lokuslarının tespiti ve validasyonunu içeren bir dizi aşamadan geçirilmektedir. ilk aşamada; allel ayrımını sağlayan söz konusu spesifik SNP varyantından emin olmak için data filtrelenmeli, aynı SNP varyantı birkaç kez gözlenmeli ancak genomda tek kopya halinde bulunmalıdır, genomdaki yeni ise genom içersindeki değişken bölgelere yakın olmamalıdır. İkinci aşamada bulunan SNP’ler genotipler açısından populasyon bazlı filtreme yapılarak, SNP’in çalışılan bitki genotipleri (germplazmı) içinde ve arasında belirli bir eşiğin üzerinde minimum allel frekansına (minor allele frequency-MAF) sahip olup olmadığı yönünden test edilmektedir. Böylelikle dizileme hataları ve nadir bulunan SNP’ler elemine edilerek SNP markırların bilgi verme düzeyi ve polimorfik özelliği maksimum hale getirilmktedir (Thomson, 2014). Yine genom boyutunda bağlantı dengesizliği (LD: linkage disequilibrium) bloklarını temsil eden etiketli SNPs’lerin seçimi için SNP’ler arasındaki korelasyonlar araştırılmakta (Zhao vd., 2011; Chen vd., 2013), bazı durumlarda ıslahta kullanılacak hedeflenmiş fonksiyonel allelik varyasyon bilgileri birleştirilmektedir (Yu vd., 2014). Sonrasında, SNP validasyon aşamaları ile yüksek kalitede SNP markırların seçim süreci gerçekleştirilmektedir. Örneğin çeltik arrayinin oluşturulma aşamasında, 20 çeltik çeşidinin yeniden dizilenmesi ile 160.000 SNP lokusu tespit edilmiş (McNally vd., 2009), daha sonra bu veri, türe ait BAC-end dizileri ile karşılaştırılmış ve bu sayı 44,100 SNP lokusuna indirilmiştir. 384 çeltik genotipinin analizinde, 36.901 SNP valide edilirken (Zhao vd., 2011) bunlardan 384-SNP setinin birçok çeltik populasyonunda sonuçlar verdiği (Thomson vd., 2012) genetik varyasyon ve genom boyutlu analizlerde bunların çip geliştirmede kullanılabileceği belirtilmiştir (Tung vd., 2010). NGS büyük veri havuzları, ıslah uygulamalarında SNP haplotiplerin karakterize edilmesi istenilen allellerin izlenmesi açısından önem taşımaktadır. Günümüzde birçok gen ve QTL klonlanmış olup, ıslah populasyonlarından istenilen allelellerin seçiminde, fonksiyonel SNPs ve gene dayalı (gen-based) SNP’lerin seçimine yönelik çalışmalar devam etmektedir. Bu ise, ilgi duyulan allele bağlantılı markırların LD ‘ları hakkında bilginin yanında geni veya QTL aktarımını sağlayan (genetik donör) hakkında da bilgi edinilmesini sağlamaktadır. Özellikle çip dizaynı için, SNP seleksiyon aşamaları (zayıf performans gösteren veya monomorfik SNPs’lerin elemine edilmesi) büyük önem taşımaktadır (Thomson, 2014). SNP genotiplendirmelerinde, NGS yaklaşımları ile geliştirilen (GBS: Genotyping By Sequencing: Dizileme ile genotiplendirme) giderek popüler olmaktadır. Genom dizileme, SNP varyasyonlarının tespitine olanak sağlamakla birlikte, genotipleme amaçlı derinlemesine genom boyutlu dizilemeler günümüzde ekonomik görülmemektedir. Bu kapsamda ekonomik olarak ucuz NGS teknolojilerinin kullanıldığı (GBS gibi) rutin genotip tanımlamalarda kullanılanılacak yaklaşımlar geliştirilmiştir. Bu tür genotipleme sistemlerinde esas olarak düşük derinlikte (coverage) dizilemeler yapılırken, NGS cihazlarında değişik barkodlanmış DNA örneklerinin çoklu okumaları bir örnek gibi koşturulmakta ve maliyet düşürülmektedir (Andrews vd., 2016; Kim vd., 2016). Basitçe, GBS ‘genotyping by sequencing’ tekniğinde düşük derinlikte okumalar yapılmaktadır. Örneğin çeltikte harita populasyonu için bu derinlik 0.02X-0.13X iken, farklı genotipleri içeren türlerde ise, 1X derinlikte okumalar yapılmaktadır (Xu vd., 2010; Huang vd., 2012). Ancak bu dizilemeler/okumalar tüm genom boyunca yayılmakla birlikte, düşük derinlikteki okumalardan dolayı aranılan herhangi bir lokusta SNP tespiti güçleşebilmektedir. Bu nedenle ‘genotyping by sequencing’ (GBS) yaklaşımlarında dizi okumaları tüm genomda değilde, genomda alt bölgelere yönelik yapılmakta ve tercihen SNP tespitinde kullanılacak ayrık lokuslar tercih edilmektedir. Genotyping by sequencing (GBS) bir metodolojiyi ifade etmemekte olup değişik yaklaşımlar şeklinde uygulanabilmektedir (Restriksiyon bazlı teknikler olan Restriksiyon Bağlantılı DNA dizileme (Restriction site Associated DNA - RADseq), çift enzim RAD dizileme (double digest RAD - ddRADseq) ve Dizileme ile Genotipleme (Genotyping By Sequencing - GBS). vb). Bu tekniklerde sırasıyla; restriksiyon enzim (RE) kesimi, adaptör takımı, PCR ve dizileme protokolü takip edilmektedir. Restriksiyon bazlı ve NGS dizilemenin ilk olarak kullanıldığı metotoloji ise RAD seq (Restriction-Site Associated DNA Tags) tekniğidir ve spesifik barkod dizileme ile örnekler çoklu (multiplex) çalışılmaktadır (Baird vd., 2008; Andrews vd., 2016, Kim vd., 2016). RAD dizilemede, RE kesim bölgelerinin kenar dizilerine yoğunlaşılarak, SNP tespiti için çoklu örneklemelerle (multiplexing) derin okumalar sağanabilmektedir (Chutimanitsakun vd., 2011). RE-temelli GBS tekniği uygulamaları basitleştirilmiş kütüphane aşamalarını da içerecek şekilde 96 ve 384-örnek multiplexed olarak optimize edilerek, Illumina dizileme teknolojisi ile genom-çaplı uygulama yapılacak şekilde ilerletilmiştir (Elshire vd., 2011). GBS değişik türlerde SNP markır tespitine yönelik uygulanmıştır. Arpada genom boyutunda 24,186 SNP (Elshire vd., 2011), çamgillerde 56,807-63,388 SNPs (Chen vd., 2013), çeltikte yüksek kalitede 17,387 SNP (Spindel vd., 2013; Bandillo vd., 2013), mısır harita populasyonunda 54,455-97,190 bilgi verici SNP ile (Guimaraes vd., 2014; Ogugo vd., 2014) değişik mısır gen kaynaklarına sahip koleksiyonlardan genom boyutunda 681,257 SNP markır tespitine olanak sağlamıştır (Romay vd., 2013). Değişik bitki türlerinde, 96’ dan 384’e çok sayıda örneğin genomik SNP varyasyonunun araştırıldığı ve bu konuda servis sunan merkezler bulunmaktadır (http:// www. biotech. cornell.edu/brc/genomic- diversity). Orjinal olarak tek enzim kesimine dayanan GBS protokolü, iki-enzim sistemine modifiye edilmiş ve arpa, buğday, yulaf gibi bitkilerde başarı ile uygulanmıştır (Poland vd., 2012a; Poland vd., 2012b; Huang vd., 2014). Dizileme ile Genotipleme aracılığı ile tespit edilen SNP’lerin uygulamlarında ise platformlar çip ve PCR kökenli olmak üzere ikiye ayrılmaktadır. Projede GBS ile tespit edilen SNP uygulama platform ise Kompetitive Allel Specific PCR (KASP) teknolojisidir. Kompetitive Allel Specific PCR (KASP) teknolojisi; GBS teknikleri ile tespit edilen SNP’lerin uyguladığı platformlardan birisidir. Çift boya kullanılarak yapılan bir genotipleme tekniğidir. KASP iki adet kuyruklu olarak sentezlenen allele özgü ileri (forward) primer ile geri (reverse) primerden oluşan ortak primerin kullanımını esas almaktadır. KASP ekonomik, güvenilir, kolay tekrar edilebilir "Floresan işaretli Allel spesifik PCR" yöntemine dayalı, bir sistemdir. Singleplex TNP genotipleme için çok özel bir sistem olup nokta değişikliklerinde kolay bir şekilde başarı ile kullanılmaktadır. Genotiplemede bilinen, tanımlanmış değişiklikleri bu yöntemle göstermek mümkündür. SNP markörlerin başlıca avantajları ise; esneklik, hız, maliyet-düşüklüğü, hacimli veri ile birlikte veri yönetimi kolaylığı şeklinde sıralanmaktadır. Her lokusta iki allel içermeleri ve veri kalite kontrol analizleri gerçekleştirildikten sonra farklı genotiplendirme platformlarında aynı allel aramalarına olanak sağlaması nedeni ile bi allelik (iki allel içeren) SNP markırlar, gruplar arasında veri birleştirme ve markır bilgilerinden büyük veritabanları oluşturmaya açık olan güvenilir markırlar olarak bilinmektedir. Diğer taraftan yüksek kaliteli referans genomların bulunması durumunda, genom dizisi ve SNP markır verilerinin çakıştırılması ile bir bitki türü için SNP katalogları oluşumu mümkün olmaktadır.
3-SNP MARKIRLAR, YENİ NESIL SEKANSLAMA TEKNİKLERİ VE SNP HAPLOTİPLEMESİ Son yıllarda bitki biyoteknolojisi alanındaki çalışmalarda, gen kaynaklarının oluşturulmasında ve genomik alandaki tekniksel ilerlemelerde önemli aşamalar kaydedilmiştir. Bu alandaki çalışmalar artan dünya nüfusuna yönelik gelecekte gıda vb. taleplerinin karşılanmasındaki katkıyı hedeflerken, bu amaçla kullanılacak ıslah (seleksiyon, melezleme vb.) çalışmalarında koleksiyonların gelişen genomik teknolojilerle değerlendirilmesi önemli yararlar sağlamaktadır (Alfred vd., 2014; Varshney vd., 2014). Diğer taraftan bitki moleküler ıslahı alanında DNA markörlerin ıslahı hızlandırıcı katkıları günümüzde kabul edilir bir yaklaşım olarak görülmektedir. Bununla birlikte klasik genetik haritalama yöntemleri ile, arzu edilen genlerin, QTL (Quantitative Trait Locus)’lerin belirlenmesi ve ıslah programlarında kullanılması kısıtlı sonuçlar doğurmuş ve bu nedenle başarılı olarak kullanılan MAS (Marker-Assisted Selection) markırları sınırlı sayıda kalmıştır (McCouch vd., 2010; Davey vd., 2011; Poland ve Rife, 2012) Genetik çeşitlilik, genler ve QTL’s ve dizileme teknolojileri ve genotipleme ve biyoinformatik alanındaki gelişmeler, hızlı ve yüksek hacimli moleküler markır tespiti yaklaşımlarına olanak sağlamaktadır. Basit dizi tekrarları (SSR) sonrasında, SNP (SNP: Single Nucleotide Polymorphism; TNP: Tekli Nükleotid Polimorfizmi) markırların devreye girmesi ile önemli bitki türlerinde, genetik çeşitliliğin karakterizasyonunda, agronomik özelliklerin QTL haritalanmasında ve kilit rol oynayan genlerin klonlanmasında önemli başarılar sağlanmıştır. Özellikle çeltik, mısır ve buğday gibi türlerde SNP markırlara dayalı fine mapping stratejileri ile genler klonlanmış ve istenilen özelliklerle ilgili genleri kontrol eden allellerin seçimine olanak sağlanmıştır (Lübberstedt vd., 2005; Van Damme vd., 2011; Miura vd., 2011; Liu vd., 2012). Aynı şekilde, ilgilenilen kromozom bölgesinin daha hassas taranmasını sağlayan, Yeni Nesil Dizileme (NGS: Next Generation Sequencing) sistemlerindeki gelişmeler, genomda SNP tanımlanacak bölgelerdeki SNP haplotipini daha derinlemesine ortaya koyabilmektedir (Chia vd., 2012). Diğer taraftan çok sayıdaki örneğin aynı anda hızlı (Ultra high-throughput) DNA ekstraksiyonu ve SNP genotipleme yaklaşımları (teknikleri) ıslahçılar için büyük çaplı çalışmalara fırsat sağlamaktadır. Genom-boyutlu seleksiyon yaklaşımlarının kullanılması ile sınırlı sayıda lokusa dayalı seleksiyonlar yerine, yüksek-yoğunlukta ve genom çapında seleksiyonlara olanak sağlanmıştır (Heffner vd., 2009; Bernardo 2010; Jannink vd., 2010). NGS ve SNP genotiplendirme tekniklerindeki avantajlardan dolayı bu yaklaşımlar tohum firmaları başta olmak üzere birçok uygulama alanını hızla genişletmektedir. Gene dayalı markır tespitinde, günümüze kadar en çok kullanılan kodominat SSR markırların genomda sınırlı sayıda olup, diğer taraftan lokuslarda çoklu allel içermeleri nedeniyle değişik platformlarda veriler birbirleri ile çakıştırılamamakta, jel ortamlarının zaman alıcı olması ve birçok kapiller fragment sistemlerinde (otomatik) etkin multiplex (çoklu) uygulamaların yapılamaması ve sınırlı bilgi içeriği gibi nedenler SSR markırların SNP markırlara göre dezavantajı olarak gösterilmektedir. SNP markörlerin başlıca avantajları ise; esneklik, hız, maliyet-düşüklüğü, hacimli veri ile birlikte veri yönetimi kolaylığı şeklinde sıralanmaktadır. Her lokusta iki allel içermeleri ve veri kalite kontrol analizleri gerçekleştirildikten sonra farklı genotiplendirme platformlarında aynı allel aramalarına olanak sağlaması nedeni ile bi allelik (iki allel içeren) SNP markırlar, gruplar arasında veri birleştirme ve markır bilgilerinden büyük veritabanları oluşturmaya açık olan güvenilir markırlar olarak bilinmektedir. Diğer taraftan yüksek kaliteli referans genomların bulunması durumunda, genom dizisi ve SNP markır verilerinin çakıştırılması ile bir bitki türü için SNP katalogları oluşumu mümkün olmaktadır (Andrews vd., 2016; Kim vd., 2016). Yeni nesil dizileme teknolojilerinin kullanıma girmesi ile birçok bitkide genom düzeyinde dizileme çalışmaları ile büyük ölçekli dizi verileri üretilmiş (Edwards vd., 2013; Bolger vd., 2014; Li vd., 2014) ve konudaki çalışmalar devam etmektedir. Bu amaçla Massively Parallel Short Read teknoloji sistemleri (Illumina, Ion Torrent (www.illumina.com; ww.lifetechnologies.com. vb.) genomlarda yeniden dizilemelerde (re-sequencing) kullanılırken, uzun okuma teknolojileri ile yüksek kaliteli referans genomlarının dizilemelerinde ise, Pacific Biosciences (www.pacificbiosciences.com) teknolojileri kullanılmaktadır. Diğer taraftan tüm genom yeniden dizilemelerde, verinin birleştirileceği (alignment edileceği), türe ait yüksek kalite referans genom dizilerinin bulunması son derece önem taşımaktadır. Yeni nesil dizileme bilgilerinden yararlı veriyi şecmek ve genom boyutunda SNP lokuslarını tamamlamak ve ilgilenilen genlerde SNP haplotiplerini ve allellerini tanımlamak için bioinformatik araçları devreye girmektedir (Thomson, 2014; Andrews vd., 2016). Fonksiyonel SNP markırı (genle ilişkili) eldesinde, genom dizisi SNP lokuslarının tespiti ve validasyonunu içeren bir dizi aşamadan geçirilmektedir. ilk aşamada; allel ayrımını sağlayan söz konusu spesifik SNP varyantından emin olmak için data filtrelenmeli, aynı SNP varyantı birkaç kez gözlenmeli ancak genomda tek kopya halinde bulunmalıdır, genomdaki yeni ise genom içersindeki değişken bölgelere yakın olmamalıdır. İkinci aşamada bulunan SNP’ler genotipler açısından populasyon bazlı filtreme yapılarak, SNP’in çalışılan bitki genotipleri (germplazmı) içinde ve arasında belirli bir eşiğin üzerinde minimum allel frekansına (minor allele frequency-MAF) sahip olup olmadığı yönünden test edilmektedir. Böylelikle dizileme hataları ve nadir bulunan SNP’ler elemine edilerek SNP markırların bilgi verme düzeyi ve polimorfik özelliği maksimum hale getirilmktedir (Thomson, 2014). Yine genom boyutunda bağlantı dengesizliği (LD: linkage disequilibrium) bloklarını temsil eden etiketli SNPs’lerin seçimi için SNP’ler arasındaki korelasyonlar araştırılmakta (Zhao vd., 2011; Chen vd., 2013), bazı durumlarda ıslahta kullanılacak hedeflenmiş fonksiyonel allelik varyasyon bilgileri birleştirilmektedir (Yu vd., 2014). Sonrasında, SNP validasyon aşamaları ile yüksek kalitede SNP markırların seçim süreci gerçekleştirilmektedir. Örneğin çeltik arrayinin oluşturulma aşamasında, 20 çeltik çeşidinin yeniden dizilenmesi ile 160.000 SNP lokusu tespit edilmiş (McNally vd., 2009), daha sonra bu veri, türe ait BAC-end dizileri ile karşılaştırılmış ve bu sayı 44,100 SNP lokusuna indirilmiştir. 384 çeltik genotipinin analizinde, 36.901 SNP valide edilirken (Zhao vd., 2011) bunlardan 384-SNP setinin birçok çeltik populasyonunda sonuçlar verdiği (Thomson vd., 2012) genetik varyasyon ve genom boyutlu analizlerde bunların çip geliştirmede kullanılabileceği belirtilmiştir (Tung vd., 2010). NGS büyük veri havuzları, ıslah uygulamalarında SNP haplotiplerin karakterize edilmesi istenilen allellerin izlenmesi açısından önem taşımaktadır. Günümüzde birçok gen ve QTL klonlanmış olup, ıslah populasyonlarından istenilen allelellerin seçiminde, fonksiyonel SNPs ve gene dayalı (gen-based) SNP’lerin seçimine yönelik çalışmalar devam etmektedir. Bu ise, ilgi duyulan allele bağlantılı markırların LD ‘ları hakkında bilginin yanında geni veya QTL aktarımını sağlayan (genetik donör) hakkında da bilgi edinilmesini sağlamaktadır. Özellikle çip dizaynı için, SNP seleksiyon aşamaları (zayıf performans gösteren veya monomorfik SNPs’lerin elemine edilmesi) büyük önem taşımaktadır (Thomson, 2014). SNP genotiplendirmelerinde, NGS yaklaşımları ile geliştirilen (GBS: Genotyping By Sequencing: Dizileme ile genotiplendirme) giderek popüler olmaktadır. Genom dizileme, SNP varyasyonlarının tespitine olanak sağlamakla birlikte, genotipleme amaçlı derinlemesine genom boyutlu dizilemeler günümüzde ekonomik görülmemektedir. Bu kapsamda ekonomik olarak ucuz NGS teknolojilerinin kullanıldığı (GBS gibi) rutin genotip tanımlamalarda kullanılanılacak yaklaşımlar geliştirilmiştir. Bu tür genotipleme sistemlerinde esas olarak düşük derinlikte (coverage) dizilemeler yapılırken, NGS cihazlarında değişik barkodlanmış DNA örneklerinin çoklu okumaları bir örnek gibi koşturulmakta ve maliyet düşürülmektedir (Andrews vd., 2016; Kim vd., 2016). Basitçe, GBS ‘genotyping by sequencing’ tekniğinde düşük derinlikte okumalar yapılmaktadır. Örneğin çeltikte harita populasyonu için bu derinlik 0.02X-0.13X iken, farklı genotipleri içeren türlerde ise, 1X derinlikte okumalar yapılmaktadır (Xu vd., 2010; Huang vd., 2012). Ancak bu dizilemeler/okumalar tüm genom boyunca yayılmakla birlikte, düşük derinlikteki okumalardan dolayı aranılan herhangi bir lokusta SNP tespiti güçleşebilmektedir. Bu nedenle ‘genotyping by sequencing’ (GBS) yaklaşımlarında dizi okumaları tüm genomda değilde, genomda alt bölgelere yönelik yapılmakta ve tercihen SNP tespitinde kullanılacak ayrık lokuslar tercih edilmektedir. Genotyping by sequencing (GBS) bir metodolojiyi ifade etmemekte olup değişik yaklaşımlar şeklinde uygulanabilmektedir (Restriksiyon bazlı teknikler olan Restriksiyon Bağlantılı DNA dizileme (Restriction site Associated DNA - RADseq), çift enzim RAD dizileme (double digest RAD - ddRADseq) ve Dizileme ile Genotipleme (Genotyping By Sequencing - GBS). vb). Bu tekniklerde sırasıyla; restriksiyon enzim (RE) kesimi, adaptör takımı, PCR ve dizileme protokolü takip edilmektedir. Restriksiyon bazlı ve NGS dizilemenin ilk olarak kullanıldığı metotoloji ise RAD seq (Restriction-Site Associated DNA Tags) tekniğidir ve spesifik barkod dizileme ile örnekler çoklu (multiplex) çalışılmaktadır (Baird vd., 2008; Andrews vd., 2016, Kim vd., 2016). RAD dizilemede, RE kesim bölgelerinin kenar dizilerine yoğunlaşılarak, SNP tespiti için çoklu örneklemelerle (multiplexing) derin okumalar sağanabilmektedir (Chutimanitsakun vd., 2011). RE-temelli GBS tekniği uygulamaları basitleştirilmiş kütüphane aşamalarını da içerecek şekilde 96 ve 384-örnek multiplexed olarak optimize edilerek, Illumina dizileme teknolojisi ile genom-çaplı uygulama yapılacak şekilde ilerletilmiştir (Elshire vd., 2011). GBS değişik türlerde SNP markır tespitine yönelik uygulanmıştır. Arpada genom boyutunda 24,186 SNP (Elshire vd., 2011), çamgillerde 56,807-63,388 SNPs (Chen vd., 2013), çeltikte yüksek kalitede 17,387 SNP (Spindel vd., 2013; Bandillo vd., 2013), mısır harita populasyonunda 54,455-97,190 bilgi verici SNP ile (Guimaraes vd., 2014; Ogugo vd., 2014) değişik mısır gen kaynaklarına sahip koleksiyonlardan genom boyutunda 681,257 SNP markır tespitine olanak sağlamıştır (Romay vd., 2013). Değişik bitki türlerinde, 96’ dan 384’e çok sayıda örneğin genomik SNP varyasyonunun araştırıldığı ve bu konuda servis sunan merkezler bulunmaktadır (http:// www. biotech. cornell.edu/brc/genomic- diversity). Orjinal olarak tek enzim kesimine dayanan GBS protokolü, iki-enzim sistemine modifiye edilmiş ve arpa, buğday, yulaf gibi bitkilerde başarı ile uygulanmıştır (Poland vd., 2012a; Poland vd., 2012b; Huang vd., 2014). Dizileme ile Genotipleme aracılığı ile tespit edilen SNP’lerin uygulamlarında ise platformlar çip ve PCR kökenli olmak üzere ikiye ayrılmaktadır. Projede GBS ile tespit edilen SNP uygulama platform ise Kompetitive Allel Specific PCR (KASP) teknolojisidir. Kompetitive Allel Specific PCR (KASP) teknolojisi; GBS teknikleri ile tespit edilen SNP’lerin uyguladığı platformlardan birisidir. Çift boya kullanılarak yapılan bir genotipleme tekniğidir. KASP iki adet kuyruklu olarak sentezlenen allele özgü ileri (forward) primer ile geri (reverse) primerden oluşan ortak primerin kullanımını esas almaktadır. KASP ekonomik, güvenilir, kolay tekrar edilebilir "Floresan işaretli Allel spesifik PCR" yöntemine dayalı, bir sistemdir. Singleplex TNP genotipleme için çok özel bir sistem olup nokta değişikliklerinde kolay bir şekilde başarı ile kullanılmaktadır. Genotiplemede bilinen, tanımlanmış değişiklikleri bu yöntemle göstermek mümkündür. Yeni nesil dizileme teknolojilerinin kullanıma girmesi ile birçok bitkide genom düzeyinde dizileme çalışmaları ile büyük ölçekli dizi verileri üretilmiş ve konudaki çalışmalar devam etmektedir. Bu amaçla Massively Parallel Short Read teknoloji sistemleri (Illumina, Ion Torrent (www.illumina.com; ww.lifetechnologies.com. vb.) genomlarda yeniden dizilemelerde (re-sequencing) kullanılırken, uzun okuma teknolojileri ile yüksek kaliteli referans genomlarının dizilemelerinde ise, Pacific Biosciences (www.pacificbiosciences.com) teknolojileri kullanılmaktadır.
3-SNP MARKIRLAR, YENİ NESIL SEKANSLAMA TEKNİKLERİ VE SNP HAPLOTİPLEMESİ Son yıllarda bitki biyoteknolojisi alanındaki çalışmalarda, gen kaynaklarının oluşturulmasında ve genomik alandaki tekniksel ilerlemelerde önemli aşamalar kaydedilmiştir. Bu alandaki çalışmalar artan dünya nüfusuna yönelik gelecekte gıda vb. taleplerinin karşılanmasındaki katkıyı hedeflerken, bu amaçla kullanılacak ıslah (seleksiyon, melezleme vb.) çalışmalarında koleksiyonların gelişen genomik teknolojilerle değerlendirilmesi önemli yararlar sağlamaktadır (Alfred vd., 2014; Varshney vd., 2014). Diğer taraftan bitki moleküler ıslahı alanında DNA markörlerin ıslahı hızlandırıcı katkıları günümüzde kabul edilir bir yaklaşım olarak görülmektedir. Bununla birlikte klasik genetik haritalama yöntemleri ile, arzu edilen genlerin, QTL (Quantitative Trait Locus)’lerin belirlenmesi ve ıslah programlarında kullanılması kısıtlı sonuçlar doğurmuş ve bu nedenle başarılı olarak kullanılan MAS (Marker-Assisted Selection) markırları sınırlı sayıda kalmıştır (McCouch vd., 2010; Davey vd., 2011; Poland ve Rife, 2012) Genetik çeşitlilik, genler ve QTL’s ve dizileme teknolojileri ve genotipleme ve biyoinformatik alanındaki gelişmeler, hızlı ve yüksek hacimli moleküler markır tespiti yaklaşımlarına olanak sağlamaktadır. Basit dizi tekrarları (SSR) sonrasında, SNP (SNP: Single Nucleotide Polymorphism; TNP: Tekli Nükleotid Polimorfizmi) markırların devreye girmesi ile önemli bitki türlerinde, genetik çeşitliliğin karakterizasyonunda, agronomik özelliklerin QTL haritalanmasında ve kilit rol oynayan genlerin klonlanmasında önemli başarılar sağlanmıştır. Özellikle çeltik, mısır ve buğday gibi türlerde SNP markırlara dayalı fine mapping stratejileri ile genler klonlanmış ve istenilen özelliklerle ilgili genleri kontrol eden allellerin seçimine olanak sağlanmıştır (Lübberstedt vd., 2005; Van Damme vd., 2011; Miura vd., 2011; Liu vd., 2012). Aynı şekilde, ilgilenilen kromozom bölgesinin daha hassas taranmasını sağlayan, Yeni Nesil Dizileme (NGS: Next Generation Sequencing) sistemlerindeki gelişmeler, genomda SNP tanımlanacak bölgelerdeki SNP haplotipini daha derinlemesine ortaya koyabilmektedir (Chia vd., 2012). Diğer taraftan çok sayıdaki örneğin aynı anda hızlı (Ultra high-throughput) DNA ekstraksiyonu ve SNP genotipleme yaklaşımları (teknikleri) ıslahçılar için büyük çaplı çalışmalara fırsat sağlamaktadır. Genom-boyutlu seleksiyon yaklaşımlarının kullanılması ile sınırlı sayıda lokusa dayalı seleksiyonlar yerine, yüksek-yoğunlukta ve genom çapında seleksiyonlara olanak sağlanmıştır (Heffner vd., 2009; Bernardo 2010; Jannink vd., 2010). NGS ve SNP genotiplendirme tekniklerindeki avantajlardan dolayı bu yaklaşımlar tohum firmaları başta olmak üzere birçok uygulama alanını hızla genişletmektedir. Gene dayalı markır tespitinde, günümüze kadar en çok kullanılan kodominat SSR markırların genomda sınırlı sayıda olup, diğer taraftan lokuslarda çoklu allel içermeleri nedeniyle değişik platformlarda veriler birbirleri ile çakıştırılamamakta, jel ortamlarının zaman alıcı olması ve birçok kapiller fragment sistemlerinde (otomatik) etkin multiplex (çoklu) uygulamaların yapılamaması ve sınırlı bilgi içeriği gibi nedenler SSR markırların SNP markırlara göre dezavantajı olarak gösterilmektedir. SNP markörlerin başlıca avantajları ise; esneklik, hız, maliyet-düşüklüğü, hacimli veri ile birlikte veri yönetimi kolaylığı şeklinde sıralanmaktadır. Her lokusta iki allel içermeleri ve veri kalite kontrol analizleri gerçekleştirildikten sonra farklı genotiplendirme platformlarında aynı allel aramalarına olanak sağlaması nedeni ile bi allelik (iki allel içeren) SNP markırlar, gruplar arasında veri birleştirme ve markır bilgilerinden büyük veritabanları oluşturmaya açık olan güvenilir markırlar olarak bilinmektedir. Diğer taraftan yüksek kaliteli referans genomların bulunması durumunda, genom dizisi ve SNP markır verilerinin çakıştırılması ile bir bitki türü için SNP katalogları oluşumu mümkün olmaktadır (Andrews vd., 2016; Kim vd., 2016). Yeni nesil dizileme teknolojilerinin kullanıma girmesi ile birçok bitkide genom düzeyinde dizileme çalışmaları ile büyük ölçekli dizi verileri üretilmiş (Edwards vd., 2013; Bolger vd., 2014; Li vd., 2014) ve konudaki çalışmalar devam etmektedir. Bu amaçla Massively Parallel Short Read teknoloji sistemleri (Illumina, Ion Torrent (www.illumina.com; ww.lifetechnologies.com. vb.) genomlarda yeniden dizilemelerde (re-sequencing) kullanılırken, uzun okuma teknolojileri ile yüksek kaliteli referans genomlarının dizilemelerinde ise, Pacific Biosciences (www.pacificbiosciences.com) teknolojileri kullanılmaktadır. Diğer taraftan tüm genom yeniden dizilemelerde, verinin birleştirileceği (alignment edileceği), türe ait yüksek kalite referans genom dizilerinin bulunması son derece önem taşımaktadır. Yeni nesil dizileme bilgilerinden yararlı veriyi şecmek ve genom boyutunda SNP lokuslarını tamamlamak ve ilgilenilen genlerde SNP haplotiplerini ve allellerini tanımlamak için bioinformatik araçları devreye girmektedir (Thomson, 2014; Andrews vd., 2016). Fonksiyonel SNP markırı (genle ilişkili) eldesinde, genom dizisi SNP lokuslarının tespiti ve validasyonunu içeren bir dizi aşamadan geçirilmektedir. ilk aşamada; allel ayrımını sağlayan söz konusu spesifik SNP varyantından emin olmak için data filtrelenmeli, aynı SNP varyantı birkaç kez gözlenmeli ancak genomda tek kopya halinde bulunmalıdır, genomdaki yeni ise genom içersindeki değişken bölgelere yakın olmamalıdır. İkinci aşamada bulunan SNP’ler genotipler açısından populasyon bazlı filtreme yapılarak, SNP’in çalışılan bitki genotipleri (germplazmı) içinde ve arasında belirli bir eşiğin üzerinde minimum allel frekansına (minor allele frequency-MAF) sahip olup olmadığı yönünden test edilmektedir. Böylelikle dizileme hataları ve nadir bulunan SNP’ler elemine edilerek SNP markırların bilgi verme düzeyi ve polimorfik özelliği maksimum hale getirilmktedir (Thomson, 2014). Yine genom boyutunda bağlantı dengesizliği (LD: linkage disequilibrium) bloklarını temsil eden etiketli SNPs’lerin seçimi için SNP’ler arasındaki korelasyonlar araştırılmakta (Zhao vd., 2011; Chen vd., 2013), bazı durumlarda ıslahta kullanılacak hedeflenmiş fonksiyonel allelik varyasyon bilgileri birleştirilmektedir (Yu vd., 2014). Sonrasında, SNP validasyon aşamaları ile yüksek kalitede SNP markırların seçim süreci gerçekleştirilmektedir. Örneğin çeltik arrayinin oluşturulma aşamasında, 20 çeltik çeşidinin yeniden dizilenmesi ile 160.000 SNP lokusu tespit edilmiş (McNally vd., 2009), daha sonra bu veri, türe ait BAC-end dizileri ile karşılaştırılmış ve bu sayı 44,100 SNP lokusuna indirilmiştir. 384 çeltik genotipinin analizinde, 36.901 SNP valide edilirken (Zhao vd., 2011) bunlardan 384-SNP setinin birçok çeltik populasyonunda sonuçlar verdiği (Thomson vd., 2012) genetik varyasyon ve genom boyutlu analizlerde bunların çip geliştirmede kullanılabileceği belirtilmiştir (Tung vd., 2010). NGS büyük veri havuzları, ıslah uygulamalarında SNP haplotiplerin karakterize edilmesi istenilen allellerin izlenmesi açısından önem taşımaktadır. Günümüzde birçok gen ve QTL klonlanmış olup, ıslah populasyonlarından istenilen allelellerin seçiminde, fonksiyonel SNPs ve gene dayalı (gen-based) SNP’lerin seçimine yönelik çalışmalar devam etmektedir. Bu ise, ilgi duyulan allele bağlantılı markırların LD ‘ları hakkında bilginin yanında geni veya QTL aktarımını sağlayan (genetik donör) hakkında da bilgi edinilmesini sağlamaktadır. Özellikle çip dizaynı için, SNP seleksiyon aşamaları (zayıf performans gösteren veya monomorfik SNPs’lerin elemine edilmesi) büyük önem taşımaktadır (Thomson, 2014). SNP genotiplendirmelerinde, NGS yaklaşımları ile geliştirilen (GBS: Genotyping By Sequencing: Dizileme ile genotiplendirme) giderek popüler olmaktadır. Genom dizileme, SNP varyasyonlarının tespitine olanak sağlamakla birlikte, genotipleme amaçlı derinlemesine genom boyutlu dizilemeler günümüzde ekonomik görülmemektedir. Bu kapsamda ekonomik olarak ucuz NGS teknolojilerinin kullanıldığı (GBS gibi) rutin genotip tanımlamalarda kullanılanılacak yaklaşımlar geliştirilmiştir. Bu tür genotipleme sistemlerinde esas olarak düşük derinlikte (coverage) dizilemeler yapılırken, NGS cihazlarında değişik barkodlanmış DNA örneklerinin çoklu okumaları bir örnek gibi koşturulmakta ve maliyet düşürülmektedir (Andrews vd., 2016; Kim vd., 2016). Basitçe, GBS ‘genotyping by sequencing’ tekniğinde düşük derinlikte okumalar yapılmaktadır. Örneğin çeltikte harita populasyonu için bu derinlik 0.02X-0.13X iken, farklı genotipleri içeren türlerde ise, 1X derinlikte okumalar yapılmaktadır (Xu vd., 2010; Huang vd., 2012). Ancak bu dizilemeler/okumalar tüm genom boyunca yayılmakla birlikte, düşük derinlikteki okumalardan dolayı aranılan herhangi bir lokusta SNP tespiti güçleşebilmektedir. Bu nedenle ‘genotyping by sequencing’ (GBS) yaklaşımlarında dizi okumaları tüm genomda değilde, genomda alt bölgelere yönelik yapılmakta ve tercihen SNP tespitinde kullanılacak ayrık lokuslar tercih edilmektedir. Genotyping by sequencing (GBS) bir metodolojiyi ifade etmemekte olup değişik yaklaşımlar şeklinde uygulanabilmektedir (Restriksiyon bazlı teknikler olan Restriksiyon Bağlantılı DNA dizileme (Restriction site Associated DNA - RADseq), çift enzim RAD dizileme (double digest RAD - ddRADseq) ve Dizileme ile Genotipleme (Genotyping By Sequencing - GBS). vb). Bu tekniklerde sırasıyla; restriksiyon enzim (RE) kesimi, adaptör takımı, PCR ve dizileme protokolü takip edilmektedir. Restriksiyon bazlı ve NGS dizilemenin ilk olarak kullanıldığı metotoloji ise RAD seq (Restriction-Site Associated DNA Tags) tekniğidir ve spesifik barkod dizileme ile örnekler çoklu (multiplex) çalışılmaktadır (Baird vd., 2008; Andrews vd., 2016, Kim vd., 2016). RAD dizilemede, RE kesim bölgelerinin kenar dizilerine yoğunlaşılarak, SNP tespiti için çoklu örneklemelerle (multiplexing) derin okumalar sağanabilmektedir (Chutimanitsakun vd., 2011). RE-temelli GBS tekniği uygulamaları basitleştirilmiş kütüphane aşamalarını da içerecek şekilde 96 ve 384-örnek multiplexed olarak optimize edilerek, Illumina dizileme teknolojisi ile genom-çaplı uygulama yapılacak şekilde ilerletilmiştir (Elshire vd., 2011). GBS değişik türlerde SNP markır tespitine yönelik uygulanmıştır. Arpada genom boyutunda 24,186 SNP (Elshire vd., 2011), çamgillerde 56,807-63,388 SNPs (Chen vd., 2013), çeltikte yüksek kalitede 17,387 SNP (Spindel vd., 2013; Bandillo vd., 2013), mısır harita populasyonunda 54,455-97,190 bilgi verici SNP ile (Guimaraes vd., 2014; Ogugo vd., 2014) değişik mısır gen kaynaklarına sahip koleksiyonlardan genom boyutunda 681,257 SNP markır tespitine olanak sağlamıştır (Romay vd., 2013). Değişik bitki türlerinde, 96’ dan 384’e çok sayıda örneğin genomik SNP varyasyonunun araştırıldığı ve bu konuda servis sunan merkezler bulunmaktadır (http:// www. biotech. cornell.edu/brc/genomic- diversity). Orjinal olarak tek enzim kesimine dayanan GBS protokolü, iki-enzim sistemine modifiye edilmiş ve arpa, buğday, yulaf gibi bitkilerde başarı ile uygulanmıştır (Poland vd., 2012a; Poland vd., 2012b; Huang vd., 2014). Dizileme ile Genotipleme aracılığı ile tespit edilen SNP’lerin uygulamlarında ise platformlar çip ve PCR kökenli olmak üzere ikiye ayrılmaktadır. Projede GBS ile tespit edilen SNP uygulama platform ise Kompetitive Allel Specific PCR (KASP) teknolojisidir. Kompetitive Allel Specific PCR (KASP) teknolojisi; GBS teknikleri ile tespit edilen SNP’lerin uyguladığı platformlardan birisidir. Çift boya kullanılarak yapılan bir genotipleme tekniğidir. KASP iki adet kuyruklu olarak sentezlenen allele özgü ileri (forward) primer ile geri (reverse) primerden oluşan ortak primerin kullanımını esas almaktadır. KASP ekonomik, güvenilir, kolay tekrar edilebilir "Floresan işaretli Allel spesifik PCR" yöntemine dayalı, bir sistemdir. Singleplex TNP genotipleme için çok özel bir sistem olup nokta değişikliklerinde kolay bir şekilde başarı ile kullanılmaktadır. Genotiplemede bilinen, tanımlanmış değişiklikleri bu yöntemle göstermek mümkündür. Diğer taraftan tüm genom yeniden dizilemelerde, verinin birleştirileceği (alignment edileceği), türe ait yüksek kalite referans genom dizilerinin bulunması son derece önem taşımaktadır. Yeni nesil dizileme bilgilerinden yararlı veriyi şecmek ve genom boyutunda SNP lokuslarını tamamlamak ve ilgilenilen genlerde SNP haplotiplerini ve allellerini tanımlamak için bioinformatik araçları devreye girmektedir.
3-SNP MARKIRLAR, YENİ NESIL SEKANSLAMA TEKNİKLERİ VE SNP HAPLOTİPLEMESİ Son yıllarda bitki biyoteknolojisi alanındaki çalışmalarda, gen kaynaklarının oluşturulmasında ve genomik alandaki tekniksel ilerlemelerde önemli aşamalar kaydedilmiştir. Bu alandaki çalışmalar artan dünya nüfusuna yönelik gelecekte gıda vb. taleplerinin karşılanmasındaki katkıyı hedeflerken, bu amaçla kullanılacak ıslah (seleksiyon, melezleme vb.) çalışmalarında koleksiyonların gelişen genomik teknolojilerle değerlendirilmesi önemli yararlar sağlamaktadır (Alfred vd., 2014; Varshney vd., 2014). Diğer taraftan bitki moleküler ıslahı alanında DNA markörlerin ıslahı hızlandırıcı katkıları günümüzde kabul edilir bir yaklaşım olarak görülmektedir. Bununla birlikte klasik genetik haritalama yöntemleri ile, arzu edilen genlerin, QTL (Quantitative Trait Locus)’lerin belirlenmesi ve ıslah programlarında kullanılması kısıtlı sonuçlar doğurmuş ve bu nedenle başarılı olarak kullanılan MAS (Marker-Assisted Selection) markırları sınırlı sayıda kalmıştır (McCouch vd., 2010; Davey vd., 2011; Poland ve Rife, 2012) Genetik çeşitlilik, genler ve QTL’s ve dizileme teknolojileri ve genotipleme ve biyoinformatik alanındaki gelişmeler, hızlı ve yüksek hacimli moleküler markır tespiti yaklaşımlarına olanak sağlamaktadır. Basit dizi tekrarları (SSR) sonrasında, SNP (SNP: Single Nucleotide Polymorphism; TNP: Tekli Nükleotid Polimorfizmi) markırların devreye girmesi ile önemli bitki türlerinde, genetik çeşitliliğin karakterizasyonunda, agronomik özelliklerin QTL haritalanmasında ve kilit rol oynayan genlerin klonlanmasında önemli başarılar sağlanmıştır. Özellikle çeltik, mısır ve buğday gibi türlerde SNP markırlara dayalı fine mapping stratejileri ile genler klonlanmış ve istenilen özelliklerle ilgili genleri kontrol eden allellerin seçimine olanak sağlanmıştır (Lübberstedt vd., 2005; Van Damme vd., 2011; Miura vd., 2011; Liu vd., 2012). Aynı şekilde, ilgilenilen kromozom bölgesinin daha hassas taranmasını sağlayan, Yeni Nesil Dizileme (NGS: Next Generation Sequencing) sistemlerindeki gelişmeler, genomda SNP tanımlanacak bölgelerdeki SNP haplotipini daha derinlemesine ortaya koyabilmektedir (Chia vd., 2012). Diğer taraftan çok sayıdaki örneğin aynı anda hızlı (Ultra high-throughput) DNA ekstraksiyonu ve SNP genotipleme yaklaşımları (teknikleri) ıslahçılar için büyük çaplı çalışmalara fırsat sağlamaktadır. Genom-boyutlu seleksiyon yaklaşımlarının kullanılması ile sınırlı sayıda lokusa dayalı seleksiyonlar yerine, yüksek-yoğunlukta ve genom çapında seleksiyonlara olanak sağlanmıştır (Heffner vd., 2009; Bernardo 2010; Jannink vd., 2010). NGS ve SNP genotiplendirme tekniklerindeki avantajlardan dolayı bu yaklaşımlar tohum firmaları başta olmak üzere birçok uygulama alanını hızla genişletmektedir. Gene dayalı markır tespitinde, günümüze kadar en çok kullanılan kodominat SSR markırların genomda sınırlı sayıda olup, diğer taraftan lokuslarda çoklu allel içermeleri nedeniyle değişik platformlarda veriler birbirleri ile çakıştırılamamakta, jel ortamlarının zaman alıcı olması ve birçok kapiller fragment sistemlerinde (otomatik) etkin multiplex (çoklu) uygulamaların yapılamaması ve sınırlı bilgi içeriği gibi nedenler SSR markırların SNP markırlara göre dezavantajı olarak gösterilmektedir. SNP markörlerin başlıca avantajları ise; esneklik, hız, maliyet-düşüklüğü, hacimli veri ile birlikte veri yönetimi kolaylığı şeklinde sıralanmaktadır. Her lokusta iki allel içermeleri ve veri kalite kontrol analizleri gerçekleştirildikten sonra farklı genotiplendirme platformlarında aynı allel aramalarına olanak sağlaması nedeni ile bi allelik (iki allel içeren) SNP markırlar, gruplar arasında veri birleştirme ve markır bilgilerinden büyük veritabanları oluşturmaya açık olan güvenilir markırlar olarak bilinmektedir. Diğer taraftan yüksek kaliteli referans genomların bulunması durumunda, genom dizisi ve SNP markır verilerinin çakıştırılması ile bir bitki türü için SNP katalogları oluşumu mümkün olmaktadır (Andrews vd., 2016; Kim vd., 2016). Yeni nesil dizileme teknolojilerinin kullanıma girmesi ile birçok bitkide genom düzeyinde dizileme çalışmaları ile büyük ölçekli dizi verileri üretilmiş (Edwards vd., 2013; Bolger vd., 2014; Li vd., 2014) ve konudaki çalışmalar devam etmektedir. Bu amaçla Massively Parallel Short Read teknoloji sistemleri (Illumina, Ion Torrent (www.illumina.com; ww.lifetechnologies.com. vb.) genomlarda yeniden dizilemelerde (re-sequencing) kullanılırken, uzun okuma teknolojileri ile yüksek kaliteli referans genomlarının dizilemelerinde ise, Pacific Biosciences (www.pacificbiosciences.com) teknolojileri kullanılmaktadır. Diğer taraftan tüm genom yeniden dizilemelerde, verinin birleştirileceği (alignment edileceği), türe ait yüksek kalite referans genom dizilerinin bulunması son derece önem taşımaktadır. Yeni nesil dizileme bilgilerinden yararlı veriyi şecmek ve genom boyutunda SNP lokuslarını tamamlamak ve ilgilenilen genlerde SNP haplotiplerini ve allellerini tanımlamak için bioinformatik araçları devreye girmektedir (Thomson, 2014; Andrews vd., 2016). Fonksiyonel SNP markırı (genle ilişkili) eldesinde, genom dizisi SNP lokuslarının tespiti ve validasyonunu içeren bir dizi aşamadan geçirilmektedir. ilk aşamada; allel ayrımını sağlayan söz konusu spesifik SNP varyantından emin olmak için data filtrelenmeli, aynı SNP varyantı birkaç kez gözlenmeli ancak genomda tek kopya halinde bulunmalıdır, genomdaki yeni ise genom içersindeki değişken bölgelere yakın olmamalıdır. İkinci aşamada bulunan SNP’ler genotipler açısından populasyon bazlı filtreme yapılarak, SNP’in çalışılan bitki genotipleri (germplazmı) içinde ve arasında belirli bir eşiğin üzerinde minimum allel frekansına (minor allele frequency-MAF) sahip olup olmadığı yönünden test edilmektedir. Böylelikle dizileme hataları ve nadir bulunan SNP’ler elemine edilerek SNP markırların bilgi verme düzeyi ve polimorfik özelliği maksimum hale getirilmktedir (Thomson, 2014). Yine genom boyutunda bağlantı dengesizliği (LD: linkage disequilibrium) bloklarını temsil eden etiketli SNPs’lerin seçimi için SNP’ler arasındaki korelasyonlar araştırılmakta (Zhao vd., 2011; Chen vd., 2013), bazı durumlarda ıslahta kullanılacak hedeflenmiş fonksiyonel allelik varyasyon bilgileri birleştirilmektedir (Yu vd., 2014). Sonrasında, SNP validasyon aşamaları ile yüksek kalitede SNP markırların seçim süreci gerçekleştirilmektedir. Örneğin çeltik arrayinin oluşturulma aşamasında, 20 çeltik çeşidinin yeniden dizilenmesi ile 160.000 SNP lokusu tespit edilmiş (McNally vd., 2009), daha sonra bu veri, türe ait BAC-end dizileri ile karşılaştırılmış ve bu sayı 44,100 SNP lokusuna indirilmiştir. 384 çeltik genotipinin analizinde, 36.901 SNP valide edilirken (Zhao vd., 2011) bunlardan 384-SNP setinin birçok çeltik populasyonunda sonuçlar verdiği (Thomson vd., 2012) genetik varyasyon ve genom boyutlu analizlerde bunların çip geliştirmede kullanılabileceği belirtilmiştir (Tung vd., 2010). NGS büyük veri havuzları, ıslah uygulamalarında SNP haplotiplerin karakterize edilmesi istenilen allellerin izlenmesi açısından önem taşımaktadır. Günümüzde birçok gen ve QTL klonlanmış olup, ıslah populasyonlarından istenilen allelellerin seçiminde, fonksiyonel SNPs ve gene dayalı (gen-based) SNP’lerin seçimine yönelik çalışmalar devam etmektedir. Bu ise, ilgi duyulan allele bağlantılı markırların LD ‘ları hakkında bilginin yanında geni veya QTL aktarımını sağlayan (genetik donör) hakkında da bilgi edinilmesini sağlamaktadır. Özellikle çip dizaynı için, SNP seleksiyon aşamaları (zayıf performans gösteren veya monomorfik SNPs’lerin elemine edilmesi) büyük önem taşımaktadır (Thomson, 2014). SNP genotiplendirmelerinde, NGS yaklaşımları ile geliştirilen (GBS: Genotyping By Sequencing: Dizileme ile genotiplendirme) giderek popüler olmaktadır. Genom dizileme, SNP varyasyonlarının tespitine olanak sağlamakla birlikte, genotipleme amaçlı derinlemesine genom boyutlu dizilemeler günümüzde ekonomik görülmemektedir. Bu kapsamda ekonomik olarak ucuz NGS teknolojilerinin kullanıldığı (GBS gibi) rutin genotip tanımlamalarda kullanılanılacak yaklaşımlar geliştirilmiştir. Bu tür genotipleme sistemlerinde esas olarak düşük derinlikte (coverage) dizilemeler yapılırken, NGS cihazlarında değişik barkodlanmış DNA örneklerinin çoklu okumaları bir örnek gibi koşturulmakta ve maliyet düşürülmektedir (Andrews vd., 2016; Kim vd., 2016). Basitçe, GBS ‘genotyping by sequencing’ tekniğinde düşük derinlikte okumalar yapılmaktadır. Örneğin çeltikte harita populasyonu için bu derinlik 0.02X-0.13X iken, farklı genotipleri içeren türlerde ise, 1X derinlikte okumalar yapılmaktadır (Xu vd., 2010; Huang vd., 2012). Ancak bu dizilemeler/okumalar tüm genom boyunca yayılmakla birlikte, düşük derinlikteki okumalardan dolayı aranılan herhangi bir lokusta SNP tespiti güçleşebilmektedir. Bu nedenle ‘genotyping by sequencing’ (GBS) yaklaşımlarında dizi okumaları tüm genomda değilde, genomda alt bölgelere yönelik yapılmakta ve tercihen SNP tespitinde kullanılacak ayrık lokuslar tercih edilmektedir. Genotyping by sequencing (GBS) bir metodolojiyi ifade etmemekte olup değişik yaklaşımlar şeklinde uygulanabilmektedir (Restriksiyon bazlı teknikler olan Restriksiyon Bağlantılı DNA dizileme (Restriction site Associated DNA - RADseq), çift enzim RAD dizileme (double digest RAD - ddRADseq) ve Dizileme ile Genotipleme (Genotyping By Sequencing - GBS). vb). Bu tekniklerde sırasıyla; restriksiyon enzim (RE) kesimi, adaptör takımı, PCR ve dizileme protokolü takip edilmektedir. Restriksiyon bazlı ve NGS dizilemenin ilk olarak kullanıldığı metotoloji ise RAD seq (Restriction-Site Associated DNA Tags) tekniğidir ve spesifik barkod dizileme ile örnekler çoklu (multiplex) çalışılmaktadır (Baird vd., 2008; Andrews vd., 2016, Kim vd., 2016). RAD dizilemede, RE kesim bölgelerinin kenar dizilerine yoğunlaşılarak, SNP tespiti için çoklu örneklemelerle (multiplexing) derin okumalar sağanabilmektedir (Chutimanitsakun vd., 2011). RE-temelli GBS tekniği uygulamaları basitleştirilmiş kütüphane aşamalarını da içerecek şekilde 96 ve 384-örnek multiplexed olarak optimize edilerek, Illumina dizileme teknolojisi ile genom-çaplı uygulama yapılacak şekilde ilerletilmiştir (Elshire vd., 2011). GBS değişik türlerde SNP markır tespitine yönelik uygulanmıştır. Arpada genom boyutunda 24,186 SNP (Elshire vd., 2011), çamgillerde 56,807-63,388 SNPs (Chen vd., 2013), çeltikte yüksek kalitede 17,387 SNP (Spindel vd., 2013; Bandillo vd., 2013), mısır harita populasyonunda 54,455-97,190 bilgi verici SNP ile (Guimaraes vd., 2014; Ogugo vd., 2014) değişik mısır gen kaynaklarına sahip koleksiyonlardan genom boyutunda 681,257 SNP markır tespitine olanak sağlamıştır (Romay vd., 2013). Değişik bitki türlerinde, 96’ dan 384’e çok sayıda örneğin genomik SNP varyasyonunun araştırıldığı ve bu konuda servis sunan merkezler bulunmaktadır (http:// www. biotech. cornell.edu/brc/genomic- diversity). Orjinal olarak tek enzim kesimine dayanan GBS protokolü, iki-enzim sistemine modifiye edilmiş ve arpa, buğday, yulaf gibi bitkilerde başarı ile uygulanmıştır (Poland vd., 2012a; Poland vd., 2012b; Huang vd., 2014). Dizileme ile Genotipleme aracılığı ile tespit edilen SNP’lerin uygulamlarında ise platformlar çip ve PCR kökenli olmak üzere ikiye ayrılmaktadır. Projede GBS ile tespit edilen SNP uygulama platform ise Kompetitive Allel Specific PCR (KASP) teknolojisidir. Kompetitive Allel Specific PCR (KASP) teknolojisi; GBS teknikleri ile tespit edilen SNP’lerin uyguladığı platformlardan birisidir. Çift boya kullanılarak yapılan bir genotipleme tekniğidir. KASP iki adet kuyruklu olarak sentezlenen allele özgü ileri (forward) primer ile geri (reverse) primerden oluşan ortak primerin kullanımını esas almaktadır. KASP ekonomik, güvenilir, kolay tekrar edilebilir "Floresan işaretli Allel spesifik PCR" yöntemine dayalı, bir sistemdir. Singleplex TNP genotipleme için çok özel bir sistem olup nokta değişikliklerinde kolay bir şekilde başarı ile kullanılmaktadır. Genotiplemede bilinen, tanımlanmış değişiklikleri bu yöntemle göstermek mümkündür. Fonksiyonel SNP markırı (genle ilişkili) eldesinde, genom dizisi SNP lokuslarının tespiti ve validasyonunu içeren bir dizi aşamadan geçirilmektedir. İlk aşamada; allel ayrımını sağlayan söz konusu spesifik SNP varyantından emin olmak için data filtrelenmeli, aynı SNP varyantı birkaç kez gözlenmeli ancak genomda tek kopya halinde bulunmalıdır, genomdaki yeni ise genom içerisindeki değişken bölgelere yakın olmamalıdır.
3-SNP MARKIRLAR, YENİ NESIL SEKANSLAMA TEKNİKLERİ VE SNP HAPLOTİPLEMESİ Son yıllarda bitki biyoteknolojisi alanındaki çalışmalarda, gen kaynaklarının oluşturulmasında ve genomik alandaki tekniksel ilerlemelerde önemli aşamalar kaydedilmiştir. Bu alandaki çalışmalar artan dünya nüfusuna yönelik gelecekte gıda vb. taleplerinin karşılanmasındaki katkıyı hedeflerken, bu amaçla kullanılacak ıslah (seleksiyon, melezleme vb.) çalışmalarında koleksiyonların gelişen genomik teknolojilerle değerlendirilmesi önemli yararlar sağlamaktadır (Alfred vd., 2014; Varshney vd., 2014). Diğer taraftan bitki moleküler ıslahı alanında DNA markörlerin ıslahı hızlandırıcı katkıları günümüzde kabul edilir bir yaklaşım olarak görülmektedir. Bununla birlikte klasik genetik haritalama yöntemleri ile, arzu edilen genlerin, QTL (Quantitative Trait Locus)’lerin belirlenmesi ve ıslah programlarında kullanılması kısıtlı sonuçlar doğurmuş ve bu nedenle başarılı olarak kullanılan MAS (Marker-Assisted Selection) markırları sınırlı sayıda kalmıştır (McCouch vd., 2010; Davey vd., 2011; Poland ve Rife, 2012) Genetik çeşitlilik, genler ve QTL’s ve dizileme teknolojileri ve genotipleme ve biyoinformatik alanındaki gelişmeler, hızlı ve yüksek hacimli moleküler markır tespiti yaklaşımlarına olanak sağlamaktadır. Basit dizi tekrarları (SSR) sonrasında, SNP (SNP: Single Nucleotide Polymorphism; TNP: Tekli Nükleotid Polimorfizmi) markırların devreye girmesi ile önemli bitki türlerinde, genetik çeşitliliğin karakterizasyonunda, agronomik özelliklerin QTL haritalanmasında ve kilit rol oynayan genlerin klonlanmasında önemli başarılar sağlanmıştır. Özellikle çeltik, mısır ve buğday gibi türlerde SNP markırlara dayalı fine mapping stratejileri ile genler klonlanmış ve istenilen özelliklerle ilgili genleri kontrol eden allellerin seçimine olanak sağlanmıştır (Lübberstedt vd., 2005; Van Damme vd., 2011; Miura vd., 2011; Liu vd., 2012). Aynı şekilde, ilgilenilen kromozom bölgesinin daha hassas taranmasını sağlayan, Yeni Nesil Dizileme (NGS: Next Generation Sequencing) sistemlerindeki gelişmeler, genomda SNP tanımlanacak bölgelerdeki SNP haplotipini daha derinlemesine ortaya koyabilmektedir (Chia vd., 2012). Diğer taraftan çok sayıdaki örneğin aynı anda hızlı (Ultra high-throughput) DNA ekstraksiyonu ve SNP genotipleme yaklaşımları (teknikleri) ıslahçılar için büyük çaplı çalışmalara fırsat sağlamaktadır. Genom-boyutlu seleksiyon yaklaşımlarının kullanılması ile sınırlı sayıda lokusa dayalı seleksiyonlar yerine, yüksek-yoğunlukta ve genom çapında seleksiyonlara olanak sağlanmıştır (Heffner vd., 2009; Bernardo 2010; Jannink vd., 2010). NGS ve SNP genotiplendirme tekniklerindeki avantajlardan dolayı bu yaklaşımlar tohum firmaları başta olmak üzere birçok uygulama alanını hızla genişletmektedir. Gene dayalı markır tespitinde, günümüze kadar en çok kullanılan kodominat SSR markırların genomda sınırlı sayıda olup, diğer taraftan lokuslarda çoklu allel içermeleri nedeniyle değişik platformlarda veriler birbirleri ile çakıştırılamamakta, jel ortamlarının zaman alıcı olması ve birçok kapiller fragment sistemlerinde (otomatik) etkin multiplex (çoklu) uygulamaların yapılamaması ve sınırlı bilgi içeriği gibi nedenler SSR markırların SNP markırlara göre dezavantajı olarak gösterilmektedir. SNP markörlerin başlıca avantajları ise; esneklik, hız, maliyet-düşüklüğü, hacimli veri ile birlikte veri yönetimi kolaylığı şeklinde sıralanmaktadır. Her lokusta iki allel içermeleri ve veri kalite kontrol analizleri gerçekleştirildikten sonra farklı genotiplendirme platformlarında aynı allel aramalarına olanak sağlaması nedeni ile bi allelik (iki allel içeren) SNP markırlar, gruplar arasında veri birleştirme ve markır bilgilerinden büyük veritabanları oluşturmaya açık olan güvenilir markırlar olarak bilinmektedir. Diğer taraftan yüksek kaliteli referans genomların bulunması durumunda, genom dizisi ve SNP markır verilerinin çakıştırılması ile bir bitki türü için SNP katalogları oluşumu mümkün olmaktadır (Andrews vd., 2016; Kim vd., 2016). Yeni nesil dizileme teknolojilerinin kullanıma girmesi ile birçok bitkide genom düzeyinde dizileme çalışmaları ile büyük ölçekli dizi verileri üretilmiş (Edwards vd., 2013; Bolger vd., 2014; Li vd., 2014) ve konudaki çalışmalar devam etmektedir. Bu amaçla Massively Parallel Short Read teknoloji sistemleri (Illumina, Ion Torrent (www.illumina.com; ww.lifetechnologies.com. vb.) genomlarda yeniden dizilemelerde (re-sequencing) kullanılırken, uzun okuma teknolojileri ile yüksek kaliteli referans genomlarının dizilemelerinde ise, Pacific Biosciences (www.pacificbiosciences.com) teknolojileri kullanılmaktadır. Diğer taraftan tüm genom yeniden dizilemelerde, verinin birleştirileceği (alignment edileceği), türe ait yüksek kalite referans genom dizilerinin bulunması son derece önem taşımaktadır. Yeni nesil dizileme bilgilerinden yararlı veriyi şecmek ve genom boyutunda SNP lokuslarını tamamlamak ve ilgilenilen genlerde SNP haplotiplerini ve allellerini tanımlamak için bioinformatik araçları devreye girmektedir (Thomson, 2014; Andrews vd., 2016). Fonksiyonel SNP markırı (genle ilişkili) eldesinde, genom dizisi SNP lokuslarının tespiti ve validasyonunu içeren bir dizi aşamadan geçirilmektedir. ilk aşamada; allel ayrımını sağlayan söz konusu spesifik SNP varyantından emin olmak için data filtrelenmeli, aynı SNP varyantı birkaç kez gözlenmeli ancak genomda tek kopya halinde bulunmalıdır, genomdaki yeni ise genom içersindeki değişken bölgelere yakın olmamalıdır. İkinci aşamada bulunan SNP’ler genotipler açısından populasyon bazlı filtreme yapılarak, SNP’in çalışılan bitki genotipleri (germplazmı) içinde ve arasında belirli bir eşiğin üzerinde minimum allel frekansına (minor allele frequency-MAF) sahip olup olmadığı yönünden test edilmektedir. Böylelikle dizileme hataları ve nadir bulunan SNP’ler elemine edilerek SNP markırların bilgi verme düzeyi ve polimorfik özelliği maksimum hale getirilmktedir (Thomson, 2014). Yine genom boyutunda bağlantı dengesizliği (LD: linkage disequilibrium) bloklarını temsil eden etiketli SNPs’lerin seçimi için SNP’ler arasındaki korelasyonlar araştırılmakta (Zhao vd., 2011; Chen vd., 2013), bazı durumlarda ıslahta kullanılacak hedeflenmiş fonksiyonel allelik varyasyon bilgileri birleştirilmektedir (Yu vd., 2014). Sonrasında, SNP validasyon aşamaları ile yüksek kalitede SNP markırların seçim süreci gerçekleştirilmektedir. Örneğin çeltik arrayinin oluşturulma aşamasında, 20 çeltik çeşidinin yeniden dizilenmesi ile 160.000 SNP lokusu tespit edilmiş (McNally vd., 2009), daha sonra bu veri, türe ait BAC-end dizileri ile karşılaştırılmış ve bu sayı 44,100 SNP lokusuna indirilmiştir. 384 çeltik genotipinin analizinde, 36.901 SNP valide edilirken (Zhao vd., 2011) bunlardan 384-SNP setinin birçok çeltik populasyonunda sonuçlar verdiği (Thomson vd., 2012) genetik varyasyon ve genom boyutlu analizlerde bunların çip geliştirmede kullanılabileceği belirtilmiştir (Tung vd., 2010). NGS büyük veri havuzları, ıslah uygulamalarında SNP haplotiplerin karakterize edilmesi istenilen allellerin izlenmesi açısından önem taşımaktadır. Günümüzde birçok gen ve QTL klonlanmış olup, ıslah populasyonlarından istenilen allelellerin seçiminde, fonksiyonel SNPs ve gene dayalı (gen-based) SNP’lerin seçimine yönelik çalışmalar devam etmektedir. Bu ise, ilgi duyulan allele bağlantılı markırların LD ‘ları hakkında bilginin yanında geni veya QTL aktarımını sağlayan (genetik donör) hakkında da bilgi edinilmesini sağlamaktadır. Özellikle çip dizaynı için, SNP seleksiyon aşamaları (zayıf performans gösteren veya monomorfik SNPs’lerin elemine edilmesi) büyük önem taşımaktadır (Thomson, 2014). SNP genotiplendirmelerinde, NGS yaklaşımları ile geliştirilen (GBS: Genotyping By Sequencing: Dizileme ile genotiplendirme) giderek popüler olmaktadır. Genom dizileme, SNP varyasyonlarının tespitine olanak sağlamakla birlikte, genotipleme amaçlı derinlemesine genom boyutlu dizilemeler günümüzde ekonomik görülmemektedir. Bu kapsamda ekonomik olarak ucuz NGS teknolojilerinin kullanıldığı (GBS gibi) rutin genotip tanımlamalarda kullanılanılacak yaklaşımlar geliştirilmiştir. Bu tür genotipleme sistemlerinde esas olarak düşük derinlikte (coverage) dizilemeler yapılırken, NGS cihazlarında değişik barkodlanmış DNA örneklerinin çoklu okumaları bir örnek gibi koşturulmakta ve maliyet düşürülmektedir (Andrews vd., 2016; Kim vd., 2016). Basitçe, GBS ‘genotyping by sequencing’ tekniğinde düşük derinlikte okumalar yapılmaktadır. Örneğin çeltikte harita populasyonu için bu derinlik 0.02X-0.13X iken, farklı genotipleri içeren türlerde ise, 1X derinlikte okumalar yapılmaktadır (Xu vd., 2010; Huang vd., 2012). Ancak bu dizilemeler/okumalar tüm genom boyunca yayılmakla birlikte, düşük derinlikteki okumalardan dolayı aranılan herhangi bir lokusta SNP tespiti güçleşebilmektedir. Bu nedenle ‘genotyping by sequencing’ (GBS) yaklaşımlarında dizi okumaları tüm genomda değilde, genomda alt bölgelere yönelik yapılmakta ve tercihen SNP tespitinde kullanılacak ayrık lokuslar tercih edilmektedir. Genotyping by sequencing (GBS) bir metodolojiyi ifade etmemekte olup değişik yaklaşımlar şeklinde uygulanabilmektedir (Restriksiyon bazlı teknikler olan Restriksiyon Bağlantılı DNA dizileme (Restriction site Associated DNA - RADseq), çift enzim RAD dizileme (double digest RAD - ddRADseq) ve Dizileme ile Genotipleme (Genotyping By Sequencing - GBS). vb). Bu tekniklerde sırasıyla; restriksiyon enzim (RE) kesimi, adaptör takımı, PCR ve dizileme protokolü takip edilmektedir. Restriksiyon bazlı ve NGS dizilemenin ilk olarak kullanıldığı metotoloji ise RAD seq (Restriction-Site Associated DNA Tags) tekniğidir ve spesifik barkod dizileme ile örnekler çoklu (multiplex) çalışılmaktadır (Baird vd., 2008; Andrews vd., 2016, Kim vd., 2016). RAD dizilemede, RE kesim bölgelerinin kenar dizilerine yoğunlaşılarak, SNP tespiti için çoklu örneklemelerle (multiplexing) derin okumalar sağanabilmektedir (Chutimanitsakun vd., 2011). RE-temelli GBS tekniği uygulamaları basitleştirilmiş kütüphane aşamalarını da içerecek şekilde 96 ve 384-örnek multiplexed olarak optimize edilerek, Illumina dizileme teknolojisi ile genom-çaplı uygulama yapılacak şekilde ilerletilmiştir (Elshire vd., 2011). GBS değişik türlerde SNP markır tespitine yönelik uygulanmıştır. Arpada genom boyutunda 24,186 SNP (Elshire vd., 2011), çamgillerde 56,807-63,388 SNPs (Chen vd., 2013), çeltikte yüksek kalitede 17,387 SNP (Spindel vd., 2013; Bandillo vd., 2013), mısır harita populasyonunda 54,455-97,190 bilgi verici SNP ile (Guimaraes vd., 2014; Ogugo vd., 2014) değişik mısır gen kaynaklarına sahip koleksiyonlardan genom boyutunda 681,257 SNP markır tespitine olanak sağlamıştır (Romay vd., 2013). Değişik bitki türlerinde, 96’ dan 384’e çok sayıda örneğin genomik SNP varyasyonunun araştırıldığı ve bu konuda servis sunan merkezler bulunmaktadır (http:// www. biotech. cornell.edu/brc/genomic- diversity). Orjinal olarak tek enzim kesimine dayanan GBS protokolü, iki-enzim sistemine modifiye edilmiş ve arpa, buğday, yulaf gibi bitkilerde başarı ile uygulanmıştır (Poland vd., 2012a; Poland vd., 2012b; Huang vd., 2014). Dizileme ile Genotipleme aracılığı ile tespit edilen SNP’lerin uygulamlarında ise platformlar çip ve PCR kökenli olmak üzere ikiye ayrılmaktadır. Projede GBS ile tespit edilen SNP uygulama platform ise Kompetitive Allel Specific PCR (KASP) teknolojisidir. Kompetitive Allel Specific PCR (KASP) teknolojisi; GBS teknikleri ile tespit edilen SNP’lerin uyguladığı platformlardan birisidir. Çift boya kullanılarak yapılan bir genotipleme tekniğidir. KASP iki adet kuyruklu olarak sentezlenen allele özgü ileri (forward) primer ile geri (reverse) primerden oluşan ortak primerin kullanımını esas almaktadır. KASP ekonomik, güvenilir, kolay tekrar edilebilir "Floresan işaretli Allel spesifik PCR" yöntemine dayalı, bir sistemdir. Singleplex TNP genotipleme için çok özel bir sistem olup nokta değişikliklerinde kolay bir şekilde başarı ile kullanılmaktadır. Genotiplemede bilinen, tanımlanmış değişiklikleri bu yöntemle göstermek mümkündür. İkinci aşamada bulunan SNP’ler genotipler açısından populasyon bazlı filtreme yapılarak, SNP’in çalışılan bitki genotipleri (germplazmı) içinde ve arasında belirli bir eşiğin üzerinde minimum allel frekansına (minor allele frequency-MAF) sahip olup olmadığı yönünden test edilmektedir. Böylelikle dizileme hataları ve nadir bulunan SNP’ler elemine edilerek SNP markırların bilgi verme düzeyi ve polimorfik özelliği maksimum hale getirilmektedir.
3-SNP MARKIRLAR, YENİ NESIL SEKANSLAMA TEKNİKLERİ VE SNP HAPLOTİPLEMESİ Son yıllarda bitki biyoteknolojisi alanındaki çalışmalarda, gen kaynaklarının oluşturulmasında ve genomik alandaki tekniksel ilerlemelerde önemli aşamalar kaydedilmiştir. Bu alandaki çalışmalar artan dünya nüfusuna yönelik gelecekte gıda vb. taleplerinin karşılanmasındaki katkıyı hedeflerken, bu amaçla kullanılacak ıslah (seleksiyon, melezleme vb.) çalışmalarında koleksiyonların gelişen genomik teknolojilerle değerlendirilmesi önemli yararlar sağlamaktadır (Alfred vd., 2014; Varshney vd., 2014). Diğer taraftan bitki moleküler ıslahı alanında DNA markörlerin ıslahı hızlandırıcı katkıları günümüzde kabul edilir bir yaklaşım olarak görülmektedir. Bununla birlikte klasik genetik haritalama yöntemleri ile, arzu edilen genlerin, QTL (Quantitative Trait Locus)’lerin belirlenmesi ve ıslah programlarında kullanılması kısıtlı sonuçlar doğurmuş ve bu nedenle başarılı olarak kullanılan MAS (Marker-Assisted Selection) markırları sınırlı sayıda kalmıştır (McCouch vd., 2010; Davey vd., 2011; Poland ve Rife, 2012) Genetik çeşitlilik, genler ve QTL’s ve dizileme teknolojileri ve genotipleme ve biyoinformatik alanındaki gelişmeler, hızlı ve yüksek hacimli moleküler markır tespiti yaklaşımlarına olanak sağlamaktadır. Basit dizi tekrarları (SSR) sonrasında, SNP (SNP: Single Nucleotide Polymorphism; TNP: Tekli Nükleotid Polimorfizmi) markırların devreye girmesi ile önemli bitki türlerinde, genetik çeşitliliğin karakterizasyonunda, agronomik özelliklerin QTL haritalanmasında ve kilit rol oynayan genlerin klonlanmasında önemli başarılar sağlanmıştır. Özellikle çeltik, mısır ve buğday gibi türlerde SNP markırlara dayalı fine mapping stratejileri ile genler klonlanmış ve istenilen özelliklerle ilgili genleri kontrol eden allellerin seçimine olanak sağlanmıştır (Lübberstedt vd., 2005; Van Damme vd., 2011; Miura vd., 2011; Liu vd., 2012). Aynı şekilde, ilgilenilen kromozom bölgesinin daha hassas taranmasını sağlayan, Yeni Nesil Dizileme (NGS: Next Generation Sequencing) sistemlerindeki gelişmeler, genomda SNP tanımlanacak bölgelerdeki SNP haplotipini daha derinlemesine ortaya koyabilmektedir (Chia vd., 2012). Diğer taraftan çok sayıdaki örneğin aynı anda hızlı (Ultra high-throughput) DNA ekstraksiyonu ve SNP genotipleme yaklaşımları (teknikleri) ıslahçılar için büyük çaplı çalışmalara fırsat sağlamaktadır. Genom-boyutlu seleksiyon yaklaşımlarının kullanılması ile sınırlı sayıda lokusa dayalı seleksiyonlar yerine, yüksek-yoğunlukta ve genom çapında seleksiyonlara olanak sağlanmıştır (Heffner vd., 2009; Bernardo 2010; Jannink vd., 2010). NGS ve SNP genotiplendirme tekniklerindeki avantajlardan dolayı bu yaklaşımlar tohum firmaları başta olmak üzere birçok uygulama alanını hızla genişletmektedir. Gene dayalı markır tespitinde, günümüze kadar en çok kullanılan kodominat SSR markırların genomda sınırlı sayıda olup, diğer taraftan lokuslarda çoklu allel içermeleri nedeniyle değişik platformlarda veriler birbirleri ile çakıştırılamamakta, jel ortamlarının zaman alıcı olması ve birçok kapiller fragment sistemlerinde (otomatik) etkin multiplex (çoklu) uygulamaların yapılamaması ve sınırlı bilgi içeriği gibi nedenler SSR markırların SNP markırlara göre dezavantajı olarak gösterilmektedir. SNP markörlerin başlıca avantajları ise; esneklik, hız, maliyet-düşüklüğü, hacimli veri ile birlikte veri yönetimi kolaylığı şeklinde sıralanmaktadır. Her lokusta iki allel içermeleri ve veri kalite kontrol analizleri gerçekleştirildikten sonra farklı genotiplendirme platformlarında aynı allel aramalarına olanak sağlaması nedeni ile bi allelik (iki allel içeren) SNP markırlar, gruplar arasında veri birleştirme ve markır bilgilerinden büyük veritabanları oluşturmaya açık olan güvenilir markırlar olarak bilinmektedir. Diğer taraftan yüksek kaliteli referans genomların bulunması durumunda, genom dizisi ve SNP markır verilerinin çakıştırılması ile bir bitki türü için SNP katalogları oluşumu mümkün olmaktadır (Andrews vd., 2016; Kim vd., 2016). Yeni nesil dizileme teknolojilerinin kullanıma girmesi ile birçok bitkide genom düzeyinde dizileme çalışmaları ile büyük ölçekli dizi verileri üretilmiş (Edwards vd., 2013; Bolger vd., 2014; Li vd., 2014) ve konudaki çalışmalar devam etmektedir. Bu amaçla Massively Parallel Short Read teknoloji sistemleri (Illumina, Ion Torrent (www.illumina.com; ww.lifetechnologies.com. vb.) genomlarda yeniden dizilemelerde (re-sequencing) kullanılırken, uzun okuma teknolojileri ile yüksek kaliteli referans genomlarının dizilemelerinde ise, Pacific Biosciences (www.pacificbiosciences.com) teknolojileri kullanılmaktadır. Diğer taraftan tüm genom yeniden dizilemelerde, verinin birleştirileceği (alignment edileceği), türe ait yüksek kalite referans genom dizilerinin bulunması son derece önem taşımaktadır. Yeni nesil dizileme bilgilerinden yararlı veriyi şecmek ve genom boyutunda SNP lokuslarını tamamlamak ve ilgilenilen genlerde SNP haplotiplerini ve allellerini tanımlamak için bioinformatik araçları devreye girmektedir (Thomson, 2014; Andrews vd., 2016). Fonksiyonel SNP markırı (genle ilişkili) eldesinde, genom dizisi SNP lokuslarının tespiti ve validasyonunu içeren bir dizi aşamadan geçirilmektedir. ilk aşamada; allel ayrımını sağlayan söz konusu spesifik SNP varyantından emin olmak için data filtrelenmeli, aynı SNP varyantı birkaç kez gözlenmeli ancak genomda tek kopya halinde bulunmalıdır, genomdaki yeni ise genom içersindeki değişken bölgelere yakın olmamalıdır. İkinci aşamada bulunan SNP’ler genotipler açısından populasyon bazlı filtreme yapılarak, SNP’in çalışılan bitki genotipleri (germplazmı) içinde ve arasında belirli bir eşiğin üzerinde minimum allel frekansına (minor allele frequency-MAF) sahip olup olmadığı yönünden test edilmektedir. Böylelikle dizileme hataları ve nadir bulunan SNP’ler elemine edilerek SNP markırların bilgi verme düzeyi ve polimorfik özelliği maksimum hale getirilmktedir (Thomson, 2014). Yine genom boyutunda bağlantı dengesizliği (LD: linkage disequilibrium) bloklarını temsil eden etiketli SNPs’lerin seçimi için SNP’ler arasındaki korelasyonlar araştırılmakta (Zhao vd., 2011; Chen vd., 2013), bazı durumlarda ıslahta kullanılacak hedeflenmiş fonksiyonel allelik varyasyon bilgileri birleştirilmektedir (Yu vd., 2014). Sonrasında, SNP validasyon aşamaları ile yüksek kalitede SNP markırların seçim süreci gerçekleştirilmektedir. Örneğin çeltik arrayinin oluşturulma aşamasında, 20 çeltik çeşidinin yeniden dizilenmesi ile 160.000 SNP lokusu tespit edilmiş (McNally vd., 2009), daha sonra bu veri, türe ait BAC-end dizileri ile karşılaştırılmış ve bu sayı 44,100 SNP lokusuna indirilmiştir. 384 çeltik genotipinin analizinde, 36.901 SNP valide edilirken (Zhao vd., 2011) bunlardan 384-SNP setinin birçok çeltik populasyonunda sonuçlar verdiği (Thomson vd., 2012) genetik varyasyon ve genom boyutlu analizlerde bunların çip geliştirmede kullanılabileceği belirtilmiştir (Tung vd., 2010). NGS büyük veri havuzları, ıslah uygulamalarında SNP haplotiplerin karakterize edilmesi istenilen allellerin izlenmesi açısından önem taşımaktadır. Günümüzde birçok gen ve QTL klonlanmış olup, ıslah populasyonlarından istenilen allelellerin seçiminde, fonksiyonel SNPs ve gene dayalı (gen-based) SNP’lerin seçimine yönelik çalışmalar devam etmektedir. Bu ise, ilgi duyulan allele bağlantılı markırların LD ‘ları hakkında bilginin yanında geni veya QTL aktarımını sağlayan (genetik donör) hakkında da bilgi edinilmesini sağlamaktadır. Özellikle çip dizaynı için, SNP seleksiyon aşamaları (zayıf performans gösteren veya monomorfik SNPs’lerin elemine edilmesi) büyük önem taşımaktadır (Thomson, 2014). SNP genotiplendirmelerinde, NGS yaklaşımları ile geliştirilen (GBS: Genotyping By Sequencing: Dizileme ile genotiplendirme) giderek popüler olmaktadır. Genom dizileme, SNP varyasyonlarının tespitine olanak sağlamakla birlikte, genotipleme amaçlı derinlemesine genom boyutlu dizilemeler günümüzde ekonomik görülmemektedir. Bu kapsamda ekonomik olarak ucuz NGS teknolojilerinin kullanıldığı (GBS gibi) rutin genotip tanımlamalarda kullanılanılacak yaklaşımlar geliştirilmiştir. Bu tür genotipleme sistemlerinde esas olarak düşük derinlikte (coverage) dizilemeler yapılırken, NGS cihazlarında değişik barkodlanmış DNA örneklerinin çoklu okumaları bir örnek gibi koşturulmakta ve maliyet düşürülmektedir (Andrews vd., 2016; Kim vd., 2016). Basitçe, GBS ‘genotyping by sequencing’ tekniğinde düşük derinlikte okumalar yapılmaktadır. Örneğin çeltikte harita populasyonu için bu derinlik 0.02X-0.13X iken, farklı genotipleri içeren türlerde ise, 1X derinlikte okumalar yapılmaktadır (Xu vd., 2010; Huang vd., 2012). Ancak bu dizilemeler/okumalar tüm genom boyunca yayılmakla birlikte, düşük derinlikteki okumalardan dolayı aranılan herhangi bir lokusta SNP tespiti güçleşebilmektedir. Bu nedenle ‘genotyping by sequencing’ (GBS) yaklaşımlarında dizi okumaları tüm genomda değilde, genomda alt bölgelere yönelik yapılmakta ve tercihen SNP tespitinde kullanılacak ayrık lokuslar tercih edilmektedir. Genotyping by sequencing (GBS) bir metodolojiyi ifade etmemekte olup değişik yaklaşımlar şeklinde uygulanabilmektedir (Restriksiyon bazlı teknikler olan Restriksiyon Bağlantılı DNA dizileme (Restriction site Associated DNA - RADseq), çift enzim RAD dizileme (double digest RAD - ddRADseq) ve Dizileme ile Genotipleme (Genotyping By Sequencing - GBS). vb). Bu tekniklerde sırasıyla; restriksiyon enzim (RE) kesimi, adaptör takımı, PCR ve dizileme protokolü takip edilmektedir. Restriksiyon bazlı ve NGS dizilemenin ilk olarak kullanıldığı metotoloji ise RAD seq (Restriction-Site Associated DNA Tags) tekniğidir ve spesifik barkod dizileme ile örnekler çoklu (multiplex) çalışılmaktadır (Baird vd., 2008; Andrews vd., 2016, Kim vd., 2016). RAD dizilemede, RE kesim bölgelerinin kenar dizilerine yoğunlaşılarak, SNP tespiti için çoklu örneklemelerle (multiplexing) derin okumalar sağanabilmektedir (Chutimanitsakun vd., 2011). RE-temelli GBS tekniği uygulamaları basitleştirilmiş kütüphane aşamalarını da içerecek şekilde 96 ve 384-örnek multiplexed olarak optimize edilerek, Illumina dizileme teknolojisi ile genom-çaplı uygulama yapılacak şekilde ilerletilmiştir (Elshire vd., 2011). GBS değişik türlerde SNP markır tespitine yönelik uygulanmıştır. Arpada genom boyutunda 24,186 SNP (Elshire vd., 2011), çamgillerde 56,807-63,388 SNPs (Chen vd., 2013), çeltikte yüksek kalitede 17,387 SNP (Spindel vd., 2013; Bandillo vd., 2013), mısır harita populasyonunda 54,455-97,190 bilgi verici SNP ile (Guimaraes vd., 2014; Ogugo vd., 2014) değişik mısır gen kaynaklarına sahip koleksiyonlardan genom boyutunda 681,257 SNP markır tespitine olanak sağlamıştır (Romay vd., 2013). Değişik bitki türlerinde, 96’ dan 384’e çok sayıda örneğin genomik SNP varyasyonunun araştırıldığı ve bu konuda servis sunan merkezler bulunmaktadır (http:// www. biotech. cornell.edu/brc/genomic- diversity). Orjinal olarak tek enzim kesimine dayanan GBS protokolü, iki-enzim sistemine modifiye edilmiş ve arpa, buğday, yulaf gibi bitkilerde başarı ile uygulanmıştır (Poland vd., 2012a; Poland vd., 2012b; Huang vd., 2014). Dizileme ile Genotipleme aracılığı ile tespit edilen SNP’lerin uygulamlarında ise platformlar çip ve PCR kökenli olmak üzere ikiye ayrılmaktadır. Projede GBS ile tespit edilen SNP uygulama platform ise Kompetitive Allel Specific PCR (KASP) teknolojisidir. Kompetitive Allel Specific PCR (KASP) teknolojisi; GBS teknikleri ile tespit edilen SNP’lerin uyguladığı platformlardan birisidir. Çift boya kullanılarak yapılan bir genotipleme tekniğidir. KASP iki adet kuyruklu olarak sentezlenen allele özgü ileri (forward) primer ile geri (reverse) primerden oluşan ortak primerin kullanımını esas almaktadır. KASP ekonomik, güvenilir, kolay tekrar edilebilir "Floresan işaretli Allel spesifik PCR" yöntemine dayalı, bir sistemdir. Singleplex TNP genotipleme için çok özel bir sistem olup nokta değişikliklerinde kolay bir şekilde başarı ile kullanılmaktadır. Genotiplemede bilinen, tanımlanmış değişiklikleri bu yöntemle göstermek mümkündür. Yine genom boyutunda bağlantı dengesizliği (LD: linkage disequilibrium) bloklarını temsil eden etiketli SNPs’lerin seçimi için SNP’ler arasındaki korelasyonlar araştırılmakta, bazı durumlarda ıslahta kullanılacak hedeflenmiş fonksiyonel allelik varyasyon bilgileri birleştirilmektedir. Sonrasında, SNP validasyon aşamaları ile yüksek kalitede SNP markırların seçim süreci gerçekleştirilmektedir. Örneğin çeltik arrayinin oluşturulma aşamasında, 20 çeltik çeşidinin yeniden dizilenmesi ile 160.000 SNP lokusu tespit edilmiş daha sonra bu veri, türe ait BAC-end dizileri ile karşılaştırılmış ve bu sayı 44,100 SNP lokusuna indirilmiştir. 384 çeltik genotipinin analizinde, 36.901 SNP valide edilirken bunlardan 384-SNP setinin birçok çeltik populasyonunda sonuçlar verdiği genetik varyasyon ve genom boyutlu analizlerde bunların çip geliştirmede kullanılabileceği belirtilmiştir
3-SNP MARKIRLAR, YENİ NESIL SEKANSLAMA TEKNİKLERİ VE SNP HAPLOTİPLEMESİ Son yıllarda bitki biyoteknolojisi alanındaki çalışmalarda, gen kaynaklarının oluşturulmasında ve genomik alandaki tekniksel ilerlemelerde önemli aşamalar kaydedilmiştir. Bu alandaki çalışmalar artan dünya nüfusuna yönelik gelecekte gıda vb. taleplerinin karşılanmasındaki katkıyı hedeflerken, bu amaçla kullanılacak ıslah (seleksiyon, melezleme vb.) çalışmalarında koleksiyonların gelişen genomik teknolojilerle değerlendirilmesi önemli yararlar sağlamaktadır (Alfred vd., 2014; Varshney vd., 2014). Diğer taraftan bitki moleküler ıslahı alanında DNA markörlerin ıslahı hızlandırıcı katkıları günümüzde kabul edilir bir yaklaşım olarak görülmektedir. Bununla birlikte klasik genetik haritalama yöntemleri ile, arzu edilen genlerin, QTL (Quantitative Trait Locus)’lerin belirlenmesi ve ıslah programlarında kullanılması kısıtlı sonuçlar doğurmuş ve bu nedenle başarılı olarak kullanılan MAS (Marker-Assisted Selection) markırları sınırlı sayıda kalmıştır (McCouch vd., 2010; Davey vd., 2011; Poland ve Rife, 2012) Genetik çeşitlilik, genler ve QTL’s ve dizileme teknolojileri ve genotipleme ve biyoinformatik alanındaki gelişmeler, hızlı ve yüksek hacimli moleküler markır tespiti yaklaşımlarına olanak sağlamaktadır. Basit dizi tekrarları (SSR) sonrasında, SNP (SNP: Single Nucleotide Polymorphism; TNP: Tekli Nükleotid Polimorfizmi) markırların devreye girmesi ile önemli bitki türlerinde, genetik çeşitliliğin karakterizasyonunda, agronomik özelliklerin QTL haritalanmasında ve kilit rol oynayan genlerin klonlanmasında önemli başarılar sağlanmıştır. Özellikle çeltik, mısır ve buğday gibi türlerde SNP markırlara dayalı fine mapping stratejileri ile genler klonlanmış ve istenilen özelliklerle ilgili genleri kontrol eden allellerin seçimine olanak sağlanmıştır (Lübberstedt vd., 2005; Van Damme vd., 2011; Miura vd., 2011; Liu vd., 2012). Aynı şekilde, ilgilenilen kromozom bölgesinin daha hassas taranmasını sağlayan, Yeni Nesil Dizileme (NGS: Next Generation Sequencing) sistemlerindeki gelişmeler, genomda SNP tanımlanacak bölgelerdeki SNP haplotipini daha derinlemesine ortaya koyabilmektedir (Chia vd., 2012). Diğer taraftan çok sayıdaki örneğin aynı anda hızlı (Ultra high-throughput) DNA ekstraksiyonu ve SNP genotipleme yaklaşımları (teknikleri) ıslahçılar için büyük çaplı çalışmalara fırsat sağlamaktadır. Genom-boyutlu seleksiyon yaklaşımlarının kullanılması ile sınırlı sayıda lokusa dayalı seleksiyonlar yerine, yüksek-yoğunlukta ve genom çapında seleksiyonlara olanak sağlanmıştır (Heffner vd., 2009; Bernardo 2010; Jannink vd., 2010). NGS ve SNP genotiplendirme tekniklerindeki avantajlardan dolayı bu yaklaşımlar tohum firmaları başta olmak üzere birçok uygulama alanını hızla genişletmektedir. Gene dayalı markır tespitinde, günümüze kadar en çok kullanılan kodominat SSR markırların genomda sınırlı sayıda olup, diğer taraftan lokuslarda çoklu allel içermeleri nedeniyle değişik platformlarda veriler birbirleri ile çakıştırılamamakta, jel ortamlarının zaman alıcı olması ve birçok kapiller fragment sistemlerinde (otomatik) etkin multiplex (çoklu) uygulamaların yapılamaması ve sınırlı bilgi içeriği gibi nedenler SSR markırların SNP markırlara göre dezavantajı olarak gösterilmektedir. SNP markörlerin başlıca avantajları ise; esneklik, hız, maliyet-düşüklüğü, hacimli veri ile birlikte veri yönetimi kolaylığı şeklinde sıralanmaktadır. Her lokusta iki allel içermeleri ve veri kalite kontrol analizleri gerçekleştirildikten sonra farklı genotiplendirme platformlarında aynı allel aramalarına olanak sağlaması nedeni ile bi allelik (iki allel içeren) SNP markırlar, gruplar arasında veri birleştirme ve markır bilgilerinden büyük veritabanları oluşturmaya açık olan güvenilir markırlar olarak bilinmektedir. Diğer taraftan yüksek kaliteli referans genomların bulunması durumunda, genom dizisi ve SNP markır verilerinin çakıştırılması ile bir bitki türü için SNP katalogları oluşumu mümkün olmaktadır (Andrews vd., 2016; Kim vd., 2016). Yeni nesil dizileme teknolojilerinin kullanıma girmesi ile birçok bitkide genom düzeyinde dizileme çalışmaları ile büyük ölçekli dizi verileri üretilmiş (Edwards vd., 2013; Bolger vd., 2014; Li vd., 2014) ve konudaki çalışmalar devam etmektedir. Bu amaçla Massively Parallel Short Read teknoloji sistemleri (Illumina, Ion Torrent (www.illumina.com; ww.lifetechnologies.com. vb.) genomlarda yeniden dizilemelerde (re-sequencing) kullanılırken, uzun okuma teknolojileri ile yüksek kaliteli referans genomlarının dizilemelerinde ise, Pacific Biosciences (www.pacificbiosciences.com) teknolojileri kullanılmaktadır. Diğer taraftan tüm genom yeniden dizilemelerde, verinin birleştirileceği (alignment edileceği), türe ait yüksek kalite referans genom dizilerinin bulunması son derece önem taşımaktadır. Yeni nesil dizileme bilgilerinden yararlı veriyi şecmek ve genom boyutunda SNP lokuslarını tamamlamak ve ilgilenilen genlerde SNP haplotiplerini ve allellerini tanımlamak için bioinformatik araçları devreye girmektedir (Thomson, 2014; Andrews vd., 2016). Fonksiyonel SNP markırı (genle ilişkili) eldesinde, genom dizisi SNP lokuslarının tespiti ve validasyonunu içeren bir dizi aşamadan geçirilmektedir. ilk aşamada; allel ayrımını sağlayan söz konusu spesifik SNP varyantından emin olmak için data filtrelenmeli, aynı SNP varyantı birkaç kez gözlenmeli ancak genomda tek kopya halinde bulunmalıdır, genomdaki yeni ise genom içersindeki değişken bölgelere yakın olmamalıdır. İkinci aşamada bulunan SNP’ler genotipler açısından populasyon bazlı filtreme yapılarak, SNP’in çalışılan bitki genotipleri (germplazmı) içinde ve arasında belirli bir eşiğin üzerinde minimum allel frekansına (minor allele frequency-MAF) sahip olup olmadığı yönünden test edilmektedir. Böylelikle dizileme hataları ve nadir bulunan SNP’ler elemine edilerek SNP markırların bilgi verme düzeyi ve polimorfik özelliği maksimum hale getirilmktedir (Thomson, 2014). Yine genom boyutunda bağlantı dengesizliği (LD: linkage disequilibrium) bloklarını temsil eden etiketli SNPs’lerin seçimi için SNP’ler arasındaki korelasyonlar araştırılmakta (Zhao vd., 2011; Chen vd., 2013), bazı durumlarda ıslahta kullanılacak hedeflenmiş fonksiyonel allelik varyasyon bilgileri birleştirilmektedir (Yu vd., 2014). Sonrasında, SNP validasyon aşamaları ile yüksek kalitede SNP markırların seçim süreci gerçekleştirilmektedir. Örneğin çeltik arrayinin oluşturulma aşamasında, 20 çeltik çeşidinin yeniden dizilenmesi ile 160.000 SNP lokusu tespit edilmiş (McNally vd., 2009), daha sonra bu veri, türe ait BAC-end dizileri ile karşılaştırılmış ve bu sayı 44,100 SNP lokusuna indirilmiştir. 384 çeltik genotipinin analizinde, 36.901 SNP valide edilirken (Zhao vd., 2011) bunlardan 384-SNP setinin birçok çeltik populasyonunda sonuçlar verdiği (Thomson vd., 2012) genetik varyasyon ve genom boyutlu analizlerde bunların çip geliştirmede kullanılabileceği belirtilmiştir (Tung vd., 2010). NGS büyük veri havuzları, ıslah uygulamalarında SNP haplotiplerin karakterize edilmesi istenilen allellerin izlenmesi açısından önem taşımaktadır. Günümüzde birçok gen ve QTL klonlanmış olup, ıslah populasyonlarından istenilen allelellerin seçiminde, fonksiyonel SNPs ve gene dayalı (gen-based) SNP’lerin seçimine yönelik çalışmalar devam etmektedir. Bu ise, ilgi duyulan allele bağlantılı markırların LD ‘ları hakkında bilginin yanında geni veya QTL aktarımını sağlayan (genetik donör) hakkında da bilgi edinilmesini sağlamaktadır. Özellikle çip dizaynı için, SNP seleksiyon aşamaları (zayıf performans gösteren veya monomorfik SNPs’lerin elemine edilmesi) büyük önem taşımaktadır (Thomson, 2014). SNP genotiplendirmelerinde, NGS yaklaşımları ile geliştirilen (GBS: Genotyping By Sequencing: Dizileme ile genotiplendirme) giderek popüler olmaktadır. Genom dizileme, SNP varyasyonlarının tespitine olanak sağlamakla birlikte, genotipleme amaçlı derinlemesine genom boyutlu dizilemeler günümüzde ekonomik görülmemektedir. Bu kapsamda ekonomik olarak ucuz NGS teknolojilerinin kullanıldığı (GBS gibi) rutin genotip tanımlamalarda kullanılanılacak yaklaşımlar geliştirilmiştir. Bu tür genotipleme sistemlerinde esas olarak düşük derinlikte (coverage) dizilemeler yapılırken, NGS cihazlarında değişik barkodlanmış DNA örneklerinin çoklu okumaları bir örnek gibi koşturulmakta ve maliyet düşürülmektedir (Andrews vd., 2016; Kim vd., 2016). Basitçe, GBS ‘genotyping by sequencing’ tekniğinde düşük derinlikte okumalar yapılmaktadır. Örneğin çeltikte harita populasyonu için bu derinlik 0.02X-0.13X iken, farklı genotipleri içeren türlerde ise, 1X derinlikte okumalar yapılmaktadır (Xu vd., 2010; Huang vd., 2012). Ancak bu dizilemeler/okumalar tüm genom boyunca yayılmakla birlikte, düşük derinlikteki okumalardan dolayı aranılan herhangi bir lokusta SNP tespiti güçleşebilmektedir. Bu nedenle ‘genotyping by sequencing’ (GBS) yaklaşımlarında dizi okumaları tüm genomda değilde, genomda alt bölgelere yönelik yapılmakta ve tercihen SNP tespitinde kullanılacak ayrık lokuslar tercih edilmektedir. Genotyping by sequencing (GBS) bir metodolojiyi ifade etmemekte olup değişik yaklaşımlar şeklinde uygulanabilmektedir (Restriksiyon bazlı teknikler olan Restriksiyon Bağlantılı DNA dizileme (Restriction site Associated DNA - RADseq), çift enzim RAD dizileme (double digest RAD - ddRADseq) ve Dizileme ile Genotipleme (Genotyping By Sequencing - GBS). vb). Bu tekniklerde sırasıyla; restriksiyon enzim (RE) kesimi, adaptör takımı, PCR ve dizileme protokolü takip edilmektedir. Restriksiyon bazlı ve NGS dizilemenin ilk olarak kullanıldığı metotoloji ise RAD seq (Restriction-Site Associated DNA Tags) tekniğidir ve spesifik barkod dizileme ile örnekler çoklu (multiplex) çalışılmaktadır (Baird vd., 2008; Andrews vd., 2016, Kim vd., 2016). RAD dizilemede, RE kesim bölgelerinin kenar dizilerine yoğunlaşılarak, SNP tespiti için çoklu örneklemelerle (multiplexing) derin okumalar sağanabilmektedir (Chutimanitsakun vd., 2011). RE-temelli GBS tekniği uygulamaları basitleştirilmiş kütüphane aşamalarını da içerecek şekilde 96 ve 384-örnek multiplexed olarak optimize edilerek, Illumina dizileme teknolojisi ile genom-çaplı uygulama yapılacak şekilde ilerletilmiştir (Elshire vd., 2011). GBS değişik türlerde SNP markır tespitine yönelik uygulanmıştır. Arpada genom boyutunda 24,186 SNP (Elshire vd., 2011), çamgillerde 56,807-63,388 SNPs (Chen vd., 2013), çeltikte yüksek kalitede 17,387 SNP (Spindel vd., 2013; Bandillo vd., 2013), mısır harita populasyonunda 54,455-97,190 bilgi verici SNP ile (Guimaraes vd., 2014; Ogugo vd., 2014) değişik mısır gen kaynaklarına sahip koleksiyonlardan genom boyutunda 681,257 SNP markır tespitine olanak sağlamıştır (Romay vd., 2013). Değişik bitki türlerinde, 96’ dan 384’e çok sayıda örneğin genomik SNP varyasyonunun araştırıldığı ve bu konuda servis sunan merkezler bulunmaktadır (http:// www. biotech. cornell.edu/brc/genomic- diversity). Orjinal olarak tek enzim kesimine dayanan GBS protokolü, iki-enzim sistemine modifiye edilmiş ve arpa, buğday, yulaf gibi bitkilerde başarı ile uygulanmıştır (Poland vd., 2012a; Poland vd., 2012b; Huang vd., 2014). Dizileme ile Genotipleme aracılığı ile tespit edilen SNP’lerin uygulamlarında ise platformlar çip ve PCR kökenli olmak üzere ikiye ayrılmaktadır. Projede GBS ile tespit edilen SNP uygulama platform ise Kompetitive Allel Specific PCR (KASP) teknolojisidir. Kompetitive Allel Specific PCR (KASP) teknolojisi; GBS teknikleri ile tespit edilen SNP’lerin uyguladığı platformlardan birisidir. Çift boya kullanılarak yapılan bir genotipleme tekniğidir. KASP iki adet kuyruklu olarak sentezlenen allele özgü ileri (forward) primer ile geri (reverse) primerden oluşan ortak primerin kullanımını esas almaktadır. KASP ekonomik, güvenilir, kolay tekrar edilebilir "Floresan işaretli Allel spesifik PCR" yöntemine dayalı, bir sistemdir. Singleplex TNP genotipleme için çok özel bir sistem olup nokta değişikliklerinde kolay bir şekilde başarı ile kullanılmaktadır. Genotiplemede bilinen, tanımlanmış değişiklikleri bu yöntemle göstermek mümkündür. NGS büyük veri havuzları, ıslah uygulamalarında SNP haplotiplerin karakterize edilmesi istenilen allellerin izlenmesi açısından önem taşımaktadır. Günümüzde birçok gen ve QTL klonlanmış olup, ıslah populasyonlarından istenilen allelellerin seçiminde, fonksiyonel SNPs ve gene dayalı (gen-based) SNP’lerin seçimine yönelik çalışmalar devam etmektedir. Bu ise, ilgi duyulan allele bağlantılı markırların LD ‘ları hakkında bilginin yanında geni veya QTL aktarımını sağlayan (genetik donör) hakkında da bilgi edinilmesini sağlamaktadır. Özellikle çip dizaynı için, SNP seleksiyon aşamaları (zayıf performans gösteren veya monomorfik SNPs’lerin elemine edilmesi) büyük önem taşımaktadır.
3-SNP MARKIRLAR, YENİ NESIL SEKANSLAMA TEKNİKLERİ VE SNP HAPLOTİPLEMESİ Son yıllarda bitki biyoteknolojisi alanındaki çalışmalarda, gen kaynaklarının oluşturulmasında ve genomik alandaki tekniksel ilerlemelerde önemli aşamalar kaydedilmiştir. Bu alandaki çalışmalar artan dünya nüfusuna yönelik gelecekte gıda vb. taleplerinin karşılanmasındaki katkıyı hedeflerken, bu amaçla kullanılacak ıslah (seleksiyon, melezleme vb.) çalışmalarında koleksiyonların gelişen genomik teknolojilerle değerlendirilmesi önemli yararlar sağlamaktadır (Alfred vd., 2014; Varshney vd., 2014). Diğer taraftan bitki moleküler ıslahı alanında DNA markörlerin ıslahı hızlandırıcı katkıları günümüzde kabul edilir bir yaklaşım olarak görülmektedir. Bununla birlikte klasik genetik haritalama yöntemleri ile, arzu edilen genlerin, QTL (Quantitative Trait Locus)’lerin belirlenmesi ve ıslah programlarında kullanılması kısıtlı sonuçlar doğurmuş ve bu nedenle başarılı olarak kullanılan MAS (Marker-Assisted Selection) markırları sınırlı sayıda kalmıştır (McCouch vd., 2010; Davey vd., 2011; Poland ve Rife, 2012) Genetik çeşitlilik, genler ve QTL’s ve dizileme teknolojileri ve genotipleme ve biyoinformatik alanındaki gelişmeler, hızlı ve yüksek hacimli moleküler markır tespiti yaklaşımlarına olanak sağlamaktadır. Basit dizi tekrarları (SSR) sonrasında, SNP (SNP: Single Nucleotide Polymorphism; TNP: Tekli Nükleotid Polimorfizmi) markırların devreye girmesi ile önemli bitki türlerinde, genetik çeşitliliğin karakterizasyonunda, agronomik özelliklerin QTL haritalanmasında ve kilit rol oynayan genlerin klonlanmasında önemli başarılar sağlanmıştır. Özellikle çeltik, mısır ve buğday gibi türlerde SNP markırlara dayalı fine mapping stratejileri ile genler klonlanmış ve istenilen özelliklerle ilgili genleri kontrol eden allellerin seçimine olanak sağlanmıştır (Lübberstedt vd., 2005; Van Damme vd., 2011; Miura vd., 2011; Liu vd., 2012). Aynı şekilde, ilgilenilen kromozom bölgesinin daha hassas taranmasını sağlayan, Yeni Nesil Dizileme (NGS: Next Generation Sequencing) sistemlerindeki gelişmeler, genomda SNP tanımlanacak bölgelerdeki SNP haplotipini daha derinlemesine ortaya koyabilmektedir (Chia vd., 2012). Diğer taraftan çok sayıdaki örneğin aynı anda hızlı (Ultra high-throughput) DNA ekstraksiyonu ve SNP genotipleme yaklaşımları (teknikleri) ıslahçılar için büyük çaplı çalışmalara fırsat sağlamaktadır. Genom-boyutlu seleksiyon yaklaşımlarının kullanılması ile sınırlı sayıda lokusa dayalı seleksiyonlar yerine, yüksek-yoğunlukta ve genom çapında seleksiyonlara olanak sağlanmıştır (Heffner vd., 2009; Bernardo 2010; Jannink vd., 2010). NGS ve SNP genotiplendirme tekniklerindeki avantajlardan dolayı bu yaklaşımlar tohum firmaları başta olmak üzere birçok uygulama alanını hızla genişletmektedir. Gene dayalı markır tespitinde, günümüze kadar en çok kullanılan kodominat SSR markırların genomda sınırlı sayıda olup, diğer taraftan lokuslarda çoklu allel içermeleri nedeniyle değişik platformlarda veriler birbirleri ile çakıştırılamamakta, jel ortamlarının zaman alıcı olması ve birçok kapiller fragment sistemlerinde (otomatik) etkin multiplex (çoklu) uygulamaların yapılamaması ve sınırlı bilgi içeriği gibi nedenler SSR markırların SNP markırlara göre dezavantajı olarak gösterilmektedir. SNP markörlerin başlıca avantajları ise; esneklik, hız, maliyet-düşüklüğü, hacimli veri ile birlikte veri yönetimi kolaylığı şeklinde sıralanmaktadır. Her lokusta iki allel içermeleri ve veri kalite kontrol analizleri gerçekleştirildikten sonra farklı genotiplendirme platformlarında aynı allel aramalarına olanak sağlaması nedeni ile bi allelik (iki allel içeren) SNP markırlar, gruplar arasında veri birleştirme ve markır bilgilerinden büyük veritabanları oluşturmaya açık olan güvenilir markırlar olarak bilinmektedir. Diğer taraftan yüksek kaliteli referans genomların bulunması durumunda, genom dizisi ve SNP markır verilerinin çakıştırılması ile bir bitki türü için SNP katalogları oluşumu mümkün olmaktadır (Andrews vd., 2016; Kim vd., 2016). Yeni nesil dizileme teknolojilerinin kullanıma girmesi ile birçok bitkide genom düzeyinde dizileme çalışmaları ile büyük ölçekli dizi verileri üretilmiş (Edwards vd., 2013; Bolger vd., 2014; Li vd., 2014) ve konudaki çalışmalar devam etmektedir. Bu amaçla Massively Parallel Short Read teknoloji sistemleri (Illumina, Ion Torrent (www.illumina.com; ww.lifetechnologies.com. vb.) genomlarda yeniden dizilemelerde (re-sequencing) kullanılırken, uzun okuma teknolojileri ile yüksek kaliteli referans genomlarının dizilemelerinde ise, Pacific Biosciences (www.pacificbiosciences.com) teknolojileri kullanılmaktadır. Diğer taraftan tüm genom yeniden dizilemelerde, verinin birleştirileceği (alignment edileceği), türe ait yüksek kalite referans genom dizilerinin bulunması son derece önem taşımaktadır. Yeni nesil dizileme bilgilerinden yararlı veriyi şecmek ve genom boyutunda SNP lokuslarını tamamlamak ve ilgilenilen genlerde SNP haplotiplerini ve allellerini tanımlamak için bioinformatik araçları devreye girmektedir (Thomson, 2014; Andrews vd., 2016). Fonksiyonel SNP markırı (genle ilişkili) eldesinde, genom dizisi SNP lokuslarının tespiti ve validasyonunu içeren bir dizi aşamadan geçirilmektedir. ilk aşamada; allel ayrımını sağlayan söz konusu spesifik SNP varyantından emin olmak için data filtrelenmeli, aynı SNP varyantı birkaç kez gözlenmeli ancak genomda tek kopya halinde bulunmalıdır, genomdaki yeni ise genom içersindeki değişken bölgelere yakın olmamalıdır. İkinci aşamada bulunan SNP’ler genotipler açısından populasyon bazlı filtreme yapılarak, SNP’in çalışılan bitki genotipleri (germplazmı) içinde ve arasında belirli bir eşiğin üzerinde minimum allel frekansına (minor allele frequency-MAF) sahip olup olmadığı yönünden test edilmektedir. Böylelikle dizileme hataları ve nadir bulunan SNP’ler elemine edilerek SNP markırların bilgi verme düzeyi ve polimorfik özelliği maksimum hale getirilmktedir (Thomson, 2014). Yine genom boyutunda bağlantı dengesizliği (LD: linkage disequilibrium) bloklarını temsil eden etiketli SNPs’lerin seçimi için SNP’ler arasındaki korelasyonlar araştırılmakta (Zhao vd., 2011; Chen vd., 2013), bazı durumlarda ıslahta kullanılacak hedeflenmiş fonksiyonel allelik varyasyon bilgileri birleştirilmektedir (Yu vd., 2014). Sonrasında, SNP validasyon aşamaları ile yüksek kalitede SNP markırların seçim süreci gerçekleştirilmektedir. Örneğin çeltik arrayinin oluşturulma aşamasında, 20 çeltik çeşidinin yeniden dizilenmesi ile 160.000 SNP lokusu tespit edilmiş (McNally vd., 2009), daha sonra bu veri, türe ait BAC-end dizileri ile karşılaştırılmış ve bu sayı 44,100 SNP lokusuna indirilmiştir. 384 çeltik genotipinin analizinde, 36.901 SNP valide edilirken (Zhao vd., 2011) bunlardan 384-SNP setinin birçok çeltik populasyonunda sonuçlar verdiği (Thomson vd., 2012) genetik varyasyon ve genom boyutlu analizlerde bunların çip geliştirmede kullanılabileceği belirtilmiştir (Tung vd., 2010). NGS büyük veri havuzları, ıslah uygulamalarında SNP haplotiplerin karakterize edilmesi istenilen allellerin izlenmesi açısından önem taşımaktadır. Günümüzde birçok gen ve QTL klonlanmış olup, ıslah populasyonlarından istenilen allelellerin seçiminde, fonksiyonel SNPs ve gene dayalı (gen-based) SNP’lerin seçimine yönelik çalışmalar devam etmektedir. Bu ise, ilgi duyulan allele bağlantılı markırların LD ‘ları hakkında bilginin yanında geni veya QTL aktarımını sağlayan (genetik donör) hakkında da bilgi edinilmesini sağlamaktadır. Özellikle çip dizaynı için, SNP seleksiyon aşamaları (zayıf performans gösteren veya monomorfik SNPs’lerin elemine edilmesi) büyük önem taşımaktadır (Thomson, 2014). SNP genotiplendirmelerinde, NGS yaklaşımları ile geliştirilen (GBS: Genotyping By Sequencing: Dizileme ile genotiplendirme) giderek popüler olmaktadır. Genom dizileme, SNP varyasyonlarının tespitine olanak sağlamakla birlikte, genotipleme amaçlı derinlemesine genom boyutlu dizilemeler günümüzde ekonomik görülmemektedir. Bu kapsamda ekonomik olarak ucuz NGS teknolojilerinin kullanıldığı (GBS gibi) rutin genotip tanımlamalarda kullanılanılacak yaklaşımlar geliştirilmiştir. Bu tür genotipleme sistemlerinde esas olarak düşük derinlikte (coverage) dizilemeler yapılırken, NGS cihazlarında değişik barkodlanmış DNA örneklerinin çoklu okumaları bir örnek gibi koşturulmakta ve maliyet düşürülmektedir (Andrews vd., 2016; Kim vd., 2016). Basitçe, GBS ‘genotyping by sequencing’ tekniğinde düşük derinlikte okumalar yapılmaktadır. Örneğin çeltikte harita populasyonu için bu derinlik 0.02X-0.13X iken, farklı genotipleri içeren türlerde ise, 1X derinlikte okumalar yapılmaktadır (Xu vd., 2010; Huang vd., 2012). Ancak bu dizilemeler/okumalar tüm genom boyunca yayılmakla birlikte, düşük derinlikteki okumalardan dolayı aranılan herhangi bir lokusta SNP tespiti güçleşebilmektedir. Bu nedenle ‘genotyping by sequencing’ (GBS) yaklaşımlarında dizi okumaları tüm genomda değilde, genomda alt bölgelere yönelik yapılmakta ve tercihen SNP tespitinde kullanılacak ayrık lokuslar tercih edilmektedir. Genotyping by sequencing (GBS) bir metodolojiyi ifade etmemekte olup değişik yaklaşımlar şeklinde uygulanabilmektedir (Restriksiyon bazlı teknikler olan Restriksiyon Bağlantılı DNA dizileme (Restriction site Associated DNA - RADseq), çift enzim RAD dizileme (double digest RAD - ddRADseq) ve Dizileme ile Genotipleme (Genotyping By Sequencing - GBS). vb). Bu tekniklerde sırasıyla; restriksiyon enzim (RE) kesimi, adaptör takımı, PCR ve dizileme protokolü takip edilmektedir. Restriksiyon bazlı ve NGS dizilemenin ilk olarak kullanıldığı metotoloji ise RAD seq (Restriction-Site Associated DNA Tags) tekniğidir ve spesifik barkod dizileme ile örnekler çoklu (multiplex) çalışılmaktadır (Baird vd., 2008; Andrews vd., 2016, Kim vd., 2016). RAD dizilemede, RE kesim bölgelerinin kenar dizilerine yoğunlaşılarak, SNP tespiti için çoklu örneklemelerle (multiplexing) derin okumalar sağanabilmektedir (Chutimanitsakun vd., 2011). RE-temelli GBS tekniği uygulamaları basitleştirilmiş kütüphane aşamalarını da içerecek şekilde 96 ve 384-örnek multiplexed olarak optimize edilerek, Illumina dizileme teknolojisi ile genom-çaplı uygulama yapılacak şekilde ilerletilmiştir (Elshire vd., 2011). GBS değişik türlerde SNP markır tespitine yönelik uygulanmıştır. Arpada genom boyutunda 24,186 SNP (Elshire vd., 2011), çamgillerde 56,807-63,388 SNPs (Chen vd., 2013), çeltikte yüksek kalitede 17,387 SNP (Spindel vd., 2013; Bandillo vd., 2013), mısır harita populasyonunda 54,455-97,190 bilgi verici SNP ile (Guimaraes vd., 2014; Ogugo vd., 2014) değişik mısır gen kaynaklarına sahip koleksiyonlardan genom boyutunda 681,257 SNP markır tespitine olanak sağlamıştır (Romay vd., 2013). Değişik bitki türlerinde, 96’ dan 384’e çok sayıda örneğin genomik SNP varyasyonunun araştırıldığı ve bu konuda servis sunan merkezler bulunmaktadır (http:// www. biotech. cornell.edu/brc/genomic- diversity). Orjinal olarak tek enzim kesimine dayanan GBS protokolü, iki-enzim sistemine modifiye edilmiş ve arpa, buğday, yulaf gibi bitkilerde başarı ile uygulanmıştır (Poland vd., 2012a; Poland vd., 2012b; Huang vd., 2014). Dizileme ile Genotipleme aracılığı ile tespit edilen SNP’lerin uygulamlarında ise platformlar çip ve PCR kökenli olmak üzere ikiye ayrılmaktadır. Projede GBS ile tespit edilen SNP uygulama platform ise Kompetitive Allel Specific PCR (KASP) teknolojisidir. Kompetitive Allel Specific PCR (KASP) teknolojisi; GBS teknikleri ile tespit edilen SNP’lerin uyguladığı platformlardan birisidir. Çift boya kullanılarak yapılan bir genotipleme tekniğidir. KASP iki adet kuyruklu olarak sentezlenen allele özgü ileri (forward) primer ile geri (reverse) primerden oluşan ortak primerin kullanımını esas almaktadır. KASP ekonomik, güvenilir, kolay tekrar edilebilir "Floresan işaretli Allel spesifik PCR" yöntemine dayalı, bir sistemdir. Singleplex TNP genotipleme için çok özel bir sistem olup nokta değişikliklerinde kolay bir şekilde başarı ile kullanılmaktadır. Genotiplemede bilinen, tanımlanmış değişiklikleri bu yöntemle göstermek mümkündür. SNP genotiplendirmelerinde, NGS yaklaşımları ile geliştirilen (GBS: Genotyping By Sequencing: Dizileme ile genotiplendirme) giderek popüler olmaktadır. Genom dizileme, SNP varyasyonlarının tespitine olanak sağlamakla birlikte, genotipleme amaçlı derinlemesine genom boyutlu dizilemeler günümüzde ekonomik görülmemektedir. Bu kapsamda ekonomik olarak ucuz NGS teknolojilerinin kullanıldığı (GBS gibi) rutin genotip tanımlamalarda kullanılanılacak yaklaşımlar geliştirilmiştir. Bu tür genotipleme sistemlerinde esas olarak düşük derinlikte (coverage) dizilemeler yapılırken, NGS cihazlarında değişik barkodlanmış DNA örneklerinin çoklu okumaları bir örnek gibi koşturulmakta ve maliyet düşürülmektedir.
3-SNP MARKIRLAR, YENİ NESIL SEKANSLAMA TEKNİKLERİ VE SNP HAPLOTİPLEMESİ Son yıllarda bitki biyoteknolojisi alanındaki çalışmalarda, gen kaynaklarının oluşturulmasında ve genomik alandaki tekniksel ilerlemelerde önemli aşamalar kaydedilmiştir. Bu alandaki çalışmalar artan dünya nüfusuna yönelik gelecekte gıda vb. taleplerinin karşılanmasındaki katkıyı hedeflerken, bu amaçla kullanılacak ıslah (seleksiyon, melezleme vb.) çalışmalarında koleksiyonların gelişen genomik teknolojilerle değerlendirilmesi önemli yararlar sağlamaktadır (Alfred vd., 2014; Varshney vd., 2014). Diğer taraftan bitki moleküler ıslahı alanında DNA markörlerin ıslahı hızlandırıcı katkıları günümüzde kabul edilir bir yaklaşım olarak görülmektedir. Bununla birlikte klasik genetik haritalama yöntemleri ile, arzu edilen genlerin, QTL (Quantitative Trait Locus)’lerin belirlenmesi ve ıslah programlarında kullanılması kısıtlı sonuçlar doğurmuş ve bu nedenle başarılı olarak kullanılan MAS (Marker-Assisted Selection) markırları sınırlı sayıda kalmıştır (McCouch vd., 2010; Davey vd., 2011; Poland ve Rife, 2012) Genetik çeşitlilik, genler ve QTL’s ve dizileme teknolojileri ve genotipleme ve biyoinformatik alanındaki gelişmeler, hızlı ve yüksek hacimli moleküler markır tespiti yaklaşımlarına olanak sağlamaktadır. Basit dizi tekrarları (SSR) sonrasında, SNP (SNP: Single Nucleotide Polymorphism; TNP: Tekli Nükleotid Polimorfizmi) markırların devreye girmesi ile önemli bitki türlerinde, genetik çeşitliliğin karakterizasyonunda, agronomik özelliklerin QTL haritalanmasında ve kilit rol oynayan genlerin klonlanmasında önemli başarılar sağlanmıştır. Özellikle çeltik, mısır ve buğday gibi türlerde SNP markırlara dayalı fine mapping stratejileri ile genler klonlanmış ve istenilen özelliklerle ilgili genleri kontrol eden allellerin seçimine olanak sağlanmıştır (Lübberstedt vd., 2005; Van Damme vd., 2011; Miura vd., 2011; Liu vd., 2012). Aynı şekilde, ilgilenilen kromozom bölgesinin daha hassas taranmasını sağlayan, Yeni Nesil Dizileme (NGS: Next Generation Sequencing) sistemlerindeki gelişmeler, genomda SNP tanımlanacak bölgelerdeki SNP haplotipini daha derinlemesine ortaya koyabilmektedir (Chia vd., 2012). Diğer taraftan çok sayıdaki örneğin aynı anda hızlı (Ultra high-throughput) DNA ekstraksiyonu ve SNP genotipleme yaklaşımları (teknikleri) ıslahçılar için büyük çaplı çalışmalara fırsat sağlamaktadır. Genom-boyutlu seleksiyon yaklaşımlarının kullanılması ile sınırlı sayıda lokusa dayalı seleksiyonlar yerine, yüksek-yoğunlukta ve genom çapında seleksiyonlara olanak sağlanmıştır (Heffner vd., 2009; Bernardo 2010; Jannink vd., 2010). NGS ve SNP genotiplendirme tekniklerindeki avantajlardan dolayı bu yaklaşımlar tohum firmaları başta olmak üzere birçok uygulama alanını hızla genişletmektedir. Gene dayalı markır tespitinde, günümüze kadar en çok kullanılan kodominat SSR markırların genomda sınırlı sayıda olup, diğer taraftan lokuslarda çoklu allel içermeleri nedeniyle değişik platformlarda veriler birbirleri ile çakıştırılamamakta, jel ortamlarının zaman alıcı olması ve birçok kapiller fragment sistemlerinde (otomatik) etkin multiplex (çoklu) uygulamaların yapılamaması ve sınırlı bilgi içeriği gibi nedenler SSR markırların SNP markırlara göre dezavantajı olarak gösterilmektedir. SNP markörlerin başlıca avantajları ise; esneklik, hız, maliyet-düşüklüğü, hacimli veri ile birlikte veri yönetimi kolaylığı şeklinde sıralanmaktadır. Her lokusta iki allel içermeleri ve veri kalite kontrol analizleri gerçekleştirildikten sonra farklı genotiplendirme platformlarında aynı allel aramalarına olanak sağlaması nedeni ile bi allelik (iki allel içeren) SNP markırlar, gruplar arasında veri birleştirme ve markır bilgilerinden büyük veritabanları oluşturmaya açık olan güvenilir markırlar olarak bilinmektedir. Diğer taraftan yüksek kaliteli referans genomların bulunması durumunda, genom dizisi ve SNP markır verilerinin çakıştırılması ile bir bitki türü için SNP katalogları oluşumu mümkün olmaktadır (Andrews vd., 2016; Kim vd., 2016). Yeni nesil dizileme teknolojilerinin kullanıma girmesi ile birçok bitkide genom düzeyinde dizileme çalışmaları ile büyük ölçekli dizi verileri üretilmiş (Edwards vd., 2013; Bolger vd., 2014; Li vd., 2014) ve konudaki çalışmalar devam etmektedir. Bu amaçla Massively Parallel Short Read teknoloji sistemleri (Illumina, Ion Torrent (www.illumina.com; ww.lifetechnologies.com. vb.) genomlarda yeniden dizilemelerde (re-sequencing) kullanılırken, uzun okuma teknolojileri ile yüksek kaliteli referans genomlarının dizilemelerinde ise, Pacific Biosciences (www.pacificbiosciences.com) teknolojileri kullanılmaktadır. Diğer taraftan tüm genom yeniden dizilemelerde, verinin birleştirileceği (alignment edileceği), türe ait yüksek kalite referans genom dizilerinin bulunması son derece önem taşımaktadır. Yeni nesil dizileme bilgilerinden yararlı veriyi şecmek ve genom boyutunda SNP lokuslarını tamamlamak ve ilgilenilen genlerde SNP haplotiplerini ve allellerini tanımlamak için bioinformatik araçları devreye girmektedir (Thomson, 2014; Andrews vd., 2016). Fonksiyonel SNP markırı (genle ilişkili) eldesinde, genom dizisi SNP lokuslarının tespiti ve validasyonunu içeren bir dizi aşamadan geçirilmektedir. ilk aşamada; allel ayrımını sağlayan söz konusu spesifik SNP varyantından emin olmak için data filtrelenmeli, aynı SNP varyantı birkaç kez gözlenmeli ancak genomda tek kopya halinde bulunmalıdır, genomdaki yeni ise genom içersindeki değişken bölgelere yakın olmamalıdır. İkinci aşamada bulunan SNP’ler genotipler açısından populasyon bazlı filtreme yapılarak, SNP’in çalışılan bitki genotipleri (germplazmı) içinde ve arasında belirli bir eşiğin üzerinde minimum allel frekansına (minor allele frequency-MAF) sahip olup olmadığı yönünden test edilmektedir. Böylelikle dizileme hataları ve nadir bulunan SNP’ler elemine edilerek SNP markırların bilgi verme düzeyi ve polimorfik özelliği maksimum hale getirilmktedir (Thomson, 2014). Yine genom boyutunda bağlantı dengesizliği (LD: linkage disequilibrium) bloklarını temsil eden etiketli SNPs’lerin seçimi için SNP’ler arasındaki korelasyonlar araştırılmakta (Zhao vd., 2011; Chen vd., 2013), bazı durumlarda ıslahta kullanılacak hedeflenmiş fonksiyonel allelik varyasyon bilgileri birleştirilmektedir (Yu vd., 2014). Sonrasında, SNP validasyon aşamaları ile yüksek kalitede SNP markırların seçim süreci gerçekleştirilmektedir. Örneğin çeltik arrayinin oluşturulma aşamasında, 20 çeltik çeşidinin yeniden dizilenmesi ile 160.000 SNP lokusu tespit edilmiş (McNally vd., 2009), daha sonra bu veri, türe ait BAC-end dizileri ile karşılaştırılmış ve bu sayı 44,100 SNP lokusuna indirilmiştir. 384 çeltik genotipinin analizinde, 36.901 SNP valide edilirken (Zhao vd., 2011) bunlardan 384-SNP setinin birçok çeltik populasyonunda sonuçlar verdiği (Thomson vd., 2012) genetik varyasyon ve genom boyutlu analizlerde bunların çip geliştirmede kullanılabileceği belirtilmiştir (Tung vd., 2010). NGS büyük veri havuzları, ıslah uygulamalarında SNP haplotiplerin karakterize edilmesi istenilen allellerin izlenmesi açısından önem taşımaktadır. Günümüzde birçok gen ve QTL klonlanmış olup, ıslah populasyonlarından istenilen allelellerin seçiminde, fonksiyonel SNPs ve gene dayalı (gen-based) SNP’lerin seçimine yönelik çalışmalar devam etmektedir. Bu ise, ilgi duyulan allele bağlantılı markırların LD ‘ları hakkında bilginin yanında geni veya QTL aktarımını sağlayan (genetik donör) hakkında da bilgi edinilmesini sağlamaktadır. Özellikle çip dizaynı için, SNP seleksiyon aşamaları (zayıf performans gösteren veya monomorfik SNPs’lerin elemine edilmesi) büyük önem taşımaktadır (Thomson, 2014). SNP genotiplendirmelerinde, NGS yaklaşımları ile geliştirilen (GBS: Genotyping By Sequencing: Dizileme ile genotiplendirme) giderek popüler olmaktadır. Genom dizileme, SNP varyasyonlarının tespitine olanak sağlamakla birlikte, genotipleme amaçlı derinlemesine genom boyutlu dizilemeler günümüzde ekonomik görülmemektedir. Bu kapsamda ekonomik olarak ucuz NGS teknolojilerinin kullanıldığı (GBS gibi) rutin genotip tanımlamalarda kullanılanılacak yaklaşımlar geliştirilmiştir. Bu tür genotipleme sistemlerinde esas olarak düşük derinlikte (coverage) dizilemeler yapılırken, NGS cihazlarında değişik barkodlanmış DNA örneklerinin çoklu okumaları bir örnek gibi koşturulmakta ve maliyet düşürülmektedir (Andrews vd., 2016; Kim vd., 2016). Basitçe, GBS ‘genotyping by sequencing’ tekniğinde düşük derinlikte okumalar yapılmaktadır. Örneğin çeltikte harita populasyonu için bu derinlik 0.02X-0.13X iken, farklı genotipleri içeren türlerde ise, 1X derinlikte okumalar yapılmaktadır (Xu vd., 2010; Huang vd., 2012). Ancak bu dizilemeler/okumalar tüm genom boyunca yayılmakla birlikte, düşük derinlikteki okumalardan dolayı aranılan herhangi bir lokusta SNP tespiti güçleşebilmektedir. Bu nedenle ‘genotyping by sequencing’ (GBS) yaklaşımlarında dizi okumaları tüm genomda değilde, genomda alt bölgelere yönelik yapılmakta ve tercihen SNP tespitinde kullanılacak ayrık lokuslar tercih edilmektedir. Genotyping by sequencing (GBS) bir metodolojiyi ifade etmemekte olup değişik yaklaşımlar şeklinde uygulanabilmektedir (Restriksiyon bazlı teknikler olan Restriksiyon Bağlantılı DNA dizileme (Restriction site Associated DNA - RADseq), çift enzim RAD dizileme (double digest RAD - ddRADseq) ve Dizileme ile Genotipleme (Genotyping By Sequencing - GBS). vb). Bu tekniklerde sırasıyla; restriksiyon enzim (RE) kesimi, adaptör takımı, PCR ve dizileme protokolü takip edilmektedir. Restriksiyon bazlı ve NGS dizilemenin ilk olarak kullanıldığı metotoloji ise RAD seq (Restriction-Site Associated DNA Tags) tekniğidir ve spesifik barkod dizileme ile örnekler çoklu (multiplex) çalışılmaktadır (Baird vd., 2008; Andrews vd., 2016, Kim vd., 2016). RAD dizilemede, RE kesim bölgelerinin kenar dizilerine yoğunlaşılarak, SNP tespiti için çoklu örneklemelerle (multiplexing) derin okumalar sağanabilmektedir (Chutimanitsakun vd., 2011). RE-temelli GBS tekniği uygulamaları basitleştirilmiş kütüphane aşamalarını da içerecek şekilde 96 ve 384-örnek multiplexed olarak optimize edilerek, Illumina dizileme teknolojisi ile genom-çaplı uygulama yapılacak şekilde ilerletilmiştir (Elshire vd., 2011). GBS değişik türlerde SNP markır tespitine yönelik uygulanmıştır. Arpada genom boyutunda 24,186 SNP (Elshire vd., 2011), çamgillerde 56,807-63,388 SNPs (Chen vd., 2013), çeltikte yüksek kalitede 17,387 SNP (Spindel vd., 2013; Bandillo vd., 2013), mısır harita populasyonunda 54,455-97,190 bilgi verici SNP ile (Guimaraes vd., 2014; Ogugo vd., 2014) değişik mısır gen kaynaklarına sahip koleksiyonlardan genom boyutunda 681,257 SNP markır tespitine olanak sağlamıştır (Romay vd., 2013). Değişik bitki türlerinde, 96’ dan 384’e çok sayıda örneğin genomik SNP varyasyonunun araştırıldığı ve bu konuda servis sunan merkezler bulunmaktadır (http:// www. biotech. cornell.edu/brc/genomic- diversity). Orjinal olarak tek enzim kesimine dayanan GBS protokolü, iki-enzim sistemine modifiye edilmiş ve arpa, buğday, yulaf gibi bitkilerde başarı ile uygulanmıştır (Poland vd., 2012a; Poland vd., 2012b; Huang vd., 2014). Dizileme ile Genotipleme aracılığı ile tespit edilen SNP’lerin uygulamlarında ise platformlar çip ve PCR kökenli olmak üzere ikiye ayrılmaktadır. Projede GBS ile tespit edilen SNP uygulama platform ise Kompetitive Allel Specific PCR (KASP) teknolojisidir. Kompetitive Allel Specific PCR (KASP) teknolojisi; GBS teknikleri ile tespit edilen SNP’lerin uyguladığı platformlardan birisidir. Çift boya kullanılarak yapılan bir genotipleme tekniğidir. KASP iki adet kuyruklu olarak sentezlenen allele özgü ileri (forward) primer ile geri (reverse) primerden oluşan ortak primerin kullanımını esas almaktadır. KASP ekonomik, güvenilir, kolay tekrar edilebilir "Floresan işaretli Allel spesifik PCR" yöntemine dayalı, bir sistemdir. Singleplex TNP genotipleme için çok özel bir sistem olup nokta değişikliklerinde kolay bir şekilde başarı ile kullanılmaktadır. Genotiplemede bilinen, tanımlanmış değişiklikleri bu yöntemle göstermek mümkündür. Basitçe, GBS ‘genotyping by sequencing’ tekniğinde düşük derinlikte okumalar yapılmaktadır. Örneğin çeltikte harita populasyonu için bu derinlik 0.02X-0.13X iken, farklı genotipleri içeren türlerde ise, 1X derinlikte okumalar yapılmaktadır. Ancak bu dizilemeler/okumalar tüm genom boyunca yayılmakla birlikte, düşük derinlikteki okumalardan dolayı aranılan herhangi bir lokusta SNP tespiti güçleşebilmektedir. Bu nedenle ‘genotyping by sequencing’ (GBS) yaklaşımlarında dizi okumaları tüm genomda değilde, genomda alt bölgelere yönelik yapılmakta ve tercihen SNP tespitinde kullanılacak ayrık lokuslar tercih edilmektedir.
3-SNP MARKIRLAR, YENİ NESIL SEKANSLAMA TEKNİKLERİ VE SNP HAPLOTİPLEMESİ Son yıllarda bitki biyoteknolojisi alanındaki çalışmalarda, gen kaynaklarının oluşturulmasında ve genomik alandaki tekniksel ilerlemelerde önemli aşamalar kaydedilmiştir. Bu alandaki çalışmalar artan dünya nüfusuna yönelik gelecekte gıda vb. taleplerinin karşılanmasındaki katkıyı hedeflerken, bu amaçla kullanılacak ıslah (seleksiyon, melezleme vb.) çalışmalarında koleksiyonların gelişen genomik teknolojilerle değerlendirilmesi önemli yararlar sağlamaktadır (Alfred vd., 2014; Varshney vd., 2014). Diğer taraftan bitki moleküler ıslahı alanında DNA markörlerin ıslahı hızlandırıcı katkıları günümüzde kabul edilir bir yaklaşım olarak görülmektedir. Bununla birlikte klasik genetik haritalama yöntemleri ile, arzu edilen genlerin, QTL (Quantitative Trait Locus)’lerin belirlenmesi ve ıslah programlarında kullanılması kısıtlı sonuçlar doğurmuş ve bu nedenle başarılı olarak kullanılan MAS (Marker-Assisted Selection) markırları sınırlı sayıda kalmıştır (McCouch vd., 2010; Davey vd., 2011; Poland ve Rife, 2012) Genetik çeşitlilik, genler ve QTL’s ve dizileme teknolojileri ve genotipleme ve biyoinformatik alanındaki gelişmeler, hızlı ve yüksek hacimli moleküler markır tespiti yaklaşımlarına olanak sağlamaktadır. Basit dizi tekrarları (SSR) sonrasında, SNP (SNP: Single Nucleotide Polymorphism; TNP: Tekli Nükleotid Polimorfizmi) markırların devreye girmesi ile önemli bitki türlerinde, genetik çeşitliliğin karakterizasyonunda, agronomik özelliklerin QTL haritalanmasında ve kilit rol oynayan genlerin klonlanmasında önemli başarılar sağlanmıştır. Özellikle çeltik, mısır ve buğday gibi türlerde SNP markırlara dayalı fine mapping stratejileri ile genler klonlanmış ve istenilen özelliklerle ilgili genleri kontrol eden allellerin seçimine olanak sağlanmıştır (Lübberstedt vd., 2005; Van Damme vd., 2011; Miura vd., 2011; Liu vd., 2012). Aynı şekilde, ilgilenilen kromozom bölgesinin daha hassas taranmasını sağlayan, Yeni Nesil Dizileme (NGS: Next Generation Sequencing) sistemlerindeki gelişmeler, genomda SNP tanımlanacak bölgelerdeki SNP haplotipini daha derinlemesine ortaya koyabilmektedir (Chia vd., 2012). Diğer taraftan çok sayıdaki örneğin aynı anda hızlı (Ultra high-throughput) DNA ekstraksiyonu ve SNP genotipleme yaklaşımları (teknikleri) ıslahçılar için büyük çaplı çalışmalara fırsat sağlamaktadır. Genom-boyutlu seleksiyon yaklaşımlarının kullanılması ile sınırlı sayıda lokusa dayalı seleksiyonlar yerine, yüksek-yoğunlukta ve genom çapında seleksiyonlara olanak sağlanmıştır (Heffner vd., 2009; Bernardo 2010; Jannink vd., 2010). NGS ve SNP genotiplendirme tekniklerindeki avantajlardan dolayı bu yaklaşımlar tohum firmaları başta olmak üzere birçok uygulama alanını hızla genişletmektedir. Gene dayalı markır tespitinde, günümüze kadar en çok kullanılan kodominat SSR markırların genomda sınırlı sayıda olup, diğer taraftan lokuslarda çoklu allel içermeleri nedeniyle değişik platformlarda veriler birbirleri ile çakıştırılamamakta, jel ortamlarının zaman alıcı olması ve birçok kapiller fragment sistemlerinde (otomatik) etkin multiplex (çoklu) uygulamaların yapılamaması ve sınırlı bilgi içeriği gibi nedenler SSR markırların SNP markırlara göre dezavantajı olarak gösterilmektedir. SNP markörlerin başlıca avantajları ise; esneklik, hız, maliyet-düşüklüğü, hacimli veri ile birlikte veri yönetimi kolaylığı şeklinde sıralanmaktadır. Her lokusta iki allel içermeleri ve veri kalite kontrol analizleri gerçekleştirildikten sonra farklı genotiplendirme platformlarında aynı allel aramalarına olanak sağlaması nedeni ile bi allelik (iki allel içeren) SNP markırlar, gruplar arasında veri birleştirme ve markır bilgilerinden büyük veritabanları oluşturmaya açık olan güvenilir markırlar olarak bilinmektedir. Diğer taraftan yüksek kaliteli referans genomların bulunması durumunda, genom dizisi ve SNP markır verilerinin çakıştırılması ile bir bitki türü için SNP katalogları oluşumu mümkün olmaktadır (Andrews vd., 2016; Kim vd., 2016). Yeni nesil dizileme teknolojilerinin kullanıma girmesi ile birçok bitkide genom düzeyinde dizileme çalışmaları ile büyük ölçekli dizi verileri üretilmiş (Edwards vd., 2013; Bolger vd., 2014; Li vd., 2014) ve konudaki çalışmalar devam etmektedir. Bu amaçla Massively Parallel Short Read teknoloji sistemleri (Illumina, Ion Torrent (www.illumina.com; ww.lifetechnologies.com. vb.) genomlarda yeniden dizilemelerde (re-sequencing) kullanılırken, uzun okuma teknolojileri ile yüksek kaliteli referans genomlarının dizilemelerinde ise, Pacific Biosciences (www.pacificbiosciences.com) teknolojileri kullanılmaktadır. Diğer taraftan tüm genom yeniden dizilemelerde, verinin birleştirileceği (alignment edileceği), türe ait yüksek kalite referans genom dizilerinin bulunması son derece önem taşımaktadır. Yeni nesil dizileme bilgilerinden yararlı veriyi şecmek ve genom boyutunda SNP lokuslarını tamamlamak ve ilgilenilen genlerde SNP haplotiplerini ve allellerini tanımlamak için bioinformatik araçları devreye girmektedir (Thomson, 2014; Andrews vd., 2016). Fonksiyonel SNP markırı (genle ilişkili) eldesinde, genom dizisi SNP lokuslarının tespiti ve validasyonunu içeren bir dizi aşamadan geçirilmektedir. ilk aşamada; allel ayrımını sağlayan söz konusu spesifik SNP varyantından emin olmak için data filtrelenmeli, aynı SNP varyantı birkaç kez gözlenmeli ancak genomda tek kopya halinde bulunmalıdır, genomdaki yeni ise genom içersindeki değişken bölgelere yakın olmamalıdır. İkinci aşamada bulunan SNP’ler genotipler açısından populasyon bazlı filtreme yapılarak, SNP’in çalışılan bitki genotipleri (germplazmı) içinde ve arasında belirli bir eşiğin üzerinde minimum allel frekansına (minor allele frequency-MAF) sahip olup olmadığı yönünden test edilmektedir. Böylelikle dizileme hataları ve nadir bulunan SNP’ler elemine edilerek SNP markırların bilgi verme düzeyi ve polimorfik özelliği maksimum hale getirilmktedir (Thomson, 2014). Yine genom boyutunda bağlantı dengesizliği (LD: linkage disequilibrium) bloklarını temsil eden etiketli SNPs’lerin seçimi için SNP’ler arasındaki korelasyonlar araştırılmakta (Zhao vd., 2011; Chen vd., 2013), bazı durumlarda ıslahta kullanılacak hedeflenmiş fonksiyonel allelik varyasyon bilgileri birleştirilmektedir (Yu vd., 2014). Sonrasında, SNP validasyon aşamaları ile yüksek kalitede SNP markırların seçim süreci gerçekleştirilmektedir. Örneğin çeltik arrayinin oluşturulma aşamasında, 20 çeltik çeşidinin yeniden dizilenmesi ile 160.000 SNP lokusu tespit edilmiş (McNally vd., 2009), daha sonra bu veri, türe ait BAC-end dizileri ile karşılaştırılmış ve bu sayı 44,100 SNP lokusuna indirilmiştir. 384 çeltik genotipinin analizinde, 36.901 SNP valide edilirken (Zhao vd., 2011) bunlardan 384-SNP setinin birçok çeltik populasyonunda sonuçlar verdiği (Thomson vd., 2012) genetik varyasyon ve genom boyutlu analizlerde bunların çip geliştirmede kullanılabileceği belirtilmiştir (Tung vd., 2010). NGS büyük veri havuzları, ıslah uygulamalarında SNP haplotiplerin karakterize edilmesi istenilen allellerin izlenmesi açısından önem taşımaktadır. Günümüzde birçok gen ve QTL klonlanmış olup, ıslah populasyonlarından istenilen allelellerin seçiminde, fonksiyonel SNPs ve gene dayalı (gen-based) SNP’lerin seçimine yönelik çalışmalar devam etmektedir. Bu ise, ilgi duyulan allele bağlantılı markırların LD ‘ları hakkında bilginin yanında geni veya QTL aktarımını sağlayan (genetik donör) hakkında da bilgi edinilmesini sağlamaktadır. Özellikle çip dizaynı için, SNP seleksiyon aşamaları (zayıf performans gösteren veya monomorfik SNPs’lerin elemine edilmesi) büyük önem taşımaktadır (Thomson, 2014). SNP genotiplendirmelerinde, NGS yaklaşımları ile geliştirilen (GBS: Genotyping By Sequencing: Dizileme ile genotiplendirme) giderek popüler olmaktadır. Genom dizileme, SNP varyasyonlarının tespitine olanak sağlamakla birlikte, genotipleme amaçlı derinlemesine genom boyutlu dizilemeler günümüzde ekonomik görülmemektedir. Bu kapsamda ekonomik olarak ucuz NGS teknolojilerinin kullanıldığı (GBS gibi) rutin genotip tanımlamalarda kullanılanılacak yaklaşımlar geliştirilmiştir. Bu tür genotipleme sistemlerinde esas olarak düşük derinlikte (coverage) dizilemeler yapılırken, NGS cihazlarında değişik barkodlanmış DNA örneklerinin çoklu okumaları bir örnek gibi koşturulmakta ve maliyet düşürülmektedir (Andrews vd., 2016; Kim vd., 2016). Basitçe, GBS ‘genotyping by sequencing’ tekniğinde düşük derinlikte okumalar yapılmaktadır. Örneğin çeltikte harita populasyonu için bu derinlik 0.02X-0.13X iken, farklı genotipleri içeren türlerde ise, 1X derinlikte okumalar yapılmaktadır (Xu vd., 2010; Huang vd., 2012). Ancak bu dizilemeler/okumalar tüm genom boyunca yayılmakla birlikte, düşük derinlikteki okumalardan dolayı aranılan herhangi bir lokusta SNP tespiti güçleşebilmektedir. Bu nedenle ‘genotyping by sequencing’ (GBS) yaklaşımlarında dizi okumaları tüm genomda değilde, genomda alt bölgelere yönelik yapılmakta ve tercihen SNP tespitinde kullanılacak ayrık lokuslar tercih edilmektedir. Genotyping by sequencing (GBS) bir metodolojiyi ifade etmemekte olup değişik yaklaşımlar şeklinde uygulanabilmektedir (Restriksiyon bazlı teknikler olan Restriksiyon Bağlantılı DNA dizileme (Restriction site Associated DNA - RADseq), çift enzim RAD dizileme (double digest RAD - ddRADseq) ve Dizileme ile Genotipleme (Genotyping By Sequencing - GBS). vb). Bu tekniklerde sırasıyla; restriksiyon enzim (RE) kesimi, adaptör takımı, PCR ve dizileme protokolü takip edilmektedir. Restriksiyon bazlı ve NGS dizilemenin ilk olarak kullanıldığı metotoloji ise RAD seq (Restriction-Site Associated DNA Tags) tekniğidir ve spesifik barkod dizileme ile örnekler çoklu (multiplex) çalışılmaktadır (Baird vd., 2008; Andrews vd., 2016, Kim vd., 2016). RAD dizilemede, RE kesim bölgelerinin kenar dizilerine yoğunlaşılarak, SNP tespiti için çoklu örneklemelerle (multiplexing) derin okumalar sağanabilmektedir (Chutimanitsakun vd., 2011). RE-temelli GBS tekniği uygulamaları basitleştirilmiş kütüphane aşamalarını da içerecek şekilde 96 ve 384-örnek multiplexed olarak optimize edilerek, Illumina dizileme teknolojisi ile genom-çaplı uygulama yapılacak şekilde ilerletilmiştir (Elshire vd., 2011). GBS değişik türlerde SNP markır tespitine yönelik uygulanmıştır. Arpada genom boyutunda 24,186 SNP (Elshire vd., 2011), çamgillerde 56,807-63,388 SNPs (Chen vd., 2013), çeltikte yüksek kalitede 17,387 SNP (Spindel vd., 2013; Bandillo vd., 2013), mısır harita populasyonunda 54,455-97,190 bilgi verici SNP ile (Guimaraes vd., 2014; Ogugo vd., 2014) değişik mısır gen kaynaklarına sahip koleksiyonlardan genom boyutunda 681,257 SNP markır tespitine olanak sağlamıştır (Romay vd., 2013). Değişik bitki türlerinde, 96’ dan 384’e çok sayıda örneğin genomik SNP varyasyonunun araştırıldığı ve bu konuda servis sunan merkezler bulunmaktadır (http:// www. biotech. cornell.edu/brc/genomic- diversity). Orjinal olarak tek enzim kesimine dayanan GBS protokolü, iki-enzim sistemine modifiye edilmiş ve arpa, buğday, yulaf gibi bitkilerde başarı ile uygulanmıştır (Poland vd., 2012a; Poland vd., 2012b; Huang vd., 2014). Dizileme ile Genotipleme aracılığı ile tespit edilen SNP’lerin uygulamlarında ise platformlar çip ve PCR kökenli olmak üzere ikiye ayrılmaktadır. Projede GBS ile tespit edilen SNP uygulama platform ise Kompetitive Allel Specific PCR (KASP) teknolojisidir. Kompetitive Allel Specific PCR (KASP) teknolojisi; GBS teknikleri ile tespit edilen SNP’lerin uyguladığı platformlardan birisidir. Çift boya kullanılarak yapılan bir genotipleme tekniğidir. KASP iki adet kuyruklu olarak sentezlenen allele özgü ileri (forward) primer ile geri (reverse) primerden oluşan ortak primerin kullanımını esas almaktadır. KASP ekonomik, güvenilir, kolay tekrar edilebilir "Floresan işaretli Allel spesifik PCR" yöntemine dayalı, bir sistemdir. Singleplex TNP genotipleme için çok özel bir sistem olup nokta değişikliklerinde kolay bir şekilde başarı ile kullanılmaktadır. Genotiplemede bilinen, tanımlanmış değişiklikleri bu yöntemle göstermek mümkündür. Genotyping by sequencing (GBS) bir metodolojiyi ifade etmemekte olup değişik yaklaşımlar şeklinde uygulanabilmektedir (Restriksiyon bazlı teknikler olan Restriksiyon Bağlantılı DNA dizileme (Restriction site Associated DNA - RADseq), çift enzim RAD dizileme (double digest RAD - ddRADseq) ve Dizileme ile Genotipleme (Genotyping By Sequencing - GBS). vb). Bu tekniklerde sırasıyla; restriksiyon enzim (RE) kesimi, adaptör takımı, PCR ve dizileme protokolü takip edilmektedir. Restriksiyon bazlı ve NGS dizilemenin ilk olarak kullanıldığı metotoloji ise RAD seq (Restriction-Site Associated DNA Tags) tekniğidir ve spesifik barkod dizileme ile örnekler çoklu (multiplex) çalışılmaktadır RAD dizilemede, RE kesim bölgelerinin kenar dizilerine yoğunlaşılarak, SNP tespiti için çoklu örneklemelerle (multiplexing) derin okumalar sağanabilmektedir
3-SNP MARKIRLAR, YENİ NESIL SEKANSLAMA TEKNİKLERİ VE SNP HAPLOTİPLEMESİ Son yıllarda bitki biyoteknolojisi alanındaki çalışmalarda, gen kaynaklarının oluşturulmasında ve genomik alandaki tekniksel ilerlemelerde önemli aşamalar kaydedilmiştir. Bu alandaki çalışmalar artan dünya nüfusuna yönelik gelecekte gıda vb. taleplerinin karşılanmasındaki katkıyı hedeflerken, bu amaçla kullanılacak ıslah (seleksiyon, melezleme vb.) çalışmalarında koleksiyonların gelişen genomik teknolojilerle değerlendirilmesi önemli yararlar sağlamaktadır (Alfred vd., 2014; Varshney vd., 2014). Diğer taraftan bitki moleküler ıslahı alanında DNA markörlerin ıslahı hızlandırıcı katkıları günümüzde kabul edilir bir yaklaşım olarak görülmektedir. Bununla birlikte klasik genetik haritalama yöntemleri ile, arzu edilen genlerin, QTL (Quantitative Trait Locus)’lerin belirlenmesi ve ıslah programlarında kullanılması kısıtlı sonuçlar doğurmuş ve bu nedenle başarılı olarak kullanılan MAS (Marker-Assisted Selection) markırları sınırlı sayıda kalmıştır (McCouch vd., 2010; Davey vd., 2011; Poland ve Rife, 2012) Genetik çeşitlilik, genler ve QTL’s ve dizileme teknolojileri ve genotipleme ve biyoinformatik alanındaki gelişmeler, hızlı ve yüksek hacimli moleküler markır tespiti yaklaşımlarına olanak sağlamaktadır. Basit dizi tekrarları (SSR) sonrasında, SNP (SNP: Single Nucleotide Polymorphism; TNP: Tekli Nükleotid Polimorfizmi) markırların devreye girmesi ile önemli bitki türlerinde, genetik çeşitliliğin karakterizasyonunda, agronomik özelliklerin QTL haritalanmasında ve kilit rol oynayan genlerin klonlanmasında önemli başarılar sağlanmıştır. Özellikle çeltik, mısır ve buğday gibi türlerde SNP markırlara dayalı fine mapping stratejileri ile genler klonlanmış ve istenilen özelliklerle ilgili genleri kontrol eden allellerin seçimine olanak sağlanmıştır (Lübberstedt vd., 2005; Van Damme vd., 2011; Miura vd., 2011; Liu vd., 2012). Aynı şekilde, ilgilenilen kromozom bölgesinin daha hassas taranmasını sağlayan, Yeni Nesil Dizileme (NGS: Next Generation Sequencing) sistemlerindeki gelişmeler, genomda SNP tanımlanacak bölgelerdeki SNP haplotipini daha derinlemesine ortaya koyabilmektedir (Chia vd., 2012). Diğer taraftan çok sayıdaki örneğin aynı anda hızlı (Ultra high-throughput) DNA ekstraksiyonu ve SNP genotipleme yaklaşımları (teknikleri) ıslahçılar için büyük çaplı çalışmalara fırsat sağlamaktadır. Genom-boyutlu seleksiyon yaklaşımlarının kullanılması ile sınırlı sayıda lokusa dayalı seleksiyonlar yerine, yüksek-yoğunlukta ve genom çapında seleksiyonlara olanak sağlanmıştır (Heffner vd., 2009; Bernardo 2010; Jannink vd., 2010). NGS ve SNP genotiplendirme tekniklerindeki avantajlardan dolayı bu yaklaşımlar tohum firmaları başta olmak üzere birçok uygulama alanını hızla genişletmektedir. Gene dayalı markır tespitinde, günümüze kadar en çok kullanılan kodominat SSR markırların genomda sınırlı sayıda olup, diğer taraftan lokuslarda çoklu allel içermeleri nedeniyle değişik platformlarda veriler birbirleri ile çakıştırılamamakta, jel ortamlarının zaman alıcı olması ve birçok kapiller fragment sistemlerinde (otomatik) etkin multiplex (çoklu) uygulamaların yapılamaması ve sınırlı bilgi içeriği gibi nedenler SSR markırların SNP markırlara göre dezavantajı olarak gösterilmektedir. SNP markörlerin başlıca avantajları ise; esneklik, hız, maliyet-düşüklüğü, hacimli veri ile birlikte veri yönetimi kolaylığı şeklinde sıralanmaktadır. Her lokusta iki allel içermeleri ve veri kalite kontrol analizleri gerçekleştirildikten sonra farklı genotiplendirme platformlarında aynı allel aramalarına olanak sağlaması nedeni ile bi allelik (iki allel içeren) SNP markırlar, gruplar arasında veri birleştirme ve markır bilgilerinden büyük veritabanları oluşturmaya açık olan güvenilir markırlar olarak bilinmektedir. Diğer taraftan yüksek kaliteli referans genomların bulunması durumunda, genom dizisi ve SNP markır verilerinin çakıştırılması ile bir bitki türü için SNP katalogları oluşumu mümkün olmaktadır (Andrews vd., 2016; Kim vd., 2016). Yeni nesil dizileme teknolojilerinin kullanıma girmesi ile birçok bitkide genom düzeyinde dizileme çalışmaları ile büyük ölçekli dizi verileri üretilmiş (Edwards vd., 2013; Bolger vd., 2014; Li vd., 2014) ve konudaki çalışmalar devam etmektedir. Bu amaçla Massively Parallel Short Read teknoloji sistemleri (Illumina, Ion Torrent (www.illumina.com; ww.lifetechnologies.com. vb.) genomlarda yeniden dizilemelerde (re-sequencing) kullanılırken, uzun okuma teknolojileri ile yüksek kaliteli referans genomlarının dizilemelerinde ise, Pacific Biosciences (www.pacificbiosciences.com) teknolojileri kullanılmaktadır. Diğer taraftan tüm genom yeniden dizilemelerde, verinin birleştirileceği (alignment edileceği), türe ait yüksek kalite referans genom dizilerinin bulunması son derece önem taşımaktadır. Yeni nesil dizileme bilgilerinden yararlı veriyi şecmek ve genom boyutunda SNP lokuslarını tamamlamak ve ilgilenilen genlerde SNP haplotiplerini ve allellerini tanımlamak için bioinformatik araçları devreye girmektedir (Thomson, 2014; Andrews vd., 2016). Fonksiyonel SNP markırı (genle ilişkili) eldesinde, genom dizisi SNP lokuslarının tespiti ve validasyonunu içeren bir dizi aşamadan geçirilmektedir. ilk aşamada; allel ayrımını sağlayan söz konusu spesifik SNP varyantından emin olmak için data filtrelenmeli, aynı SNP varyantı birkaç kez gözlenmeli ancak genomda tek kopya halinde bulunmalıdır, genomdaki yeni ise genom içersindeki değişken bölgelere yakın olmamalıdır. İkinci aşamada bulunan SNP’ler genotipler açısından populasyon bazlı filtreme yapılarak, SNP’in çalışılan bitki genotipleri (germplazmı) içinde ve arasında belirli bir eşiğin üzerinde minimum allel frekansına (minor allele frequency-MAF) sahip olup olmadığı yönünden test edilmektedir. Böylelikle dizileme hataları ve nadir bulunan SNP’ler elemine edilerek SNP markırların bilgi verme düzeyi ve polimorfik özelliği maksimum hale getirilmktedir (Thomson, 2014). Yine genom boyutunda bağlantı dengesizliği (LD: linkage disequilibrium) bloklarını temsil eden etiketli SNPs’lerin seçimi için SNP’ler arasındaki korelasyonlar araştırılmakta (Zhao vd., 2011; Chen vd., 2013), bazı durumlarda ıslahta kullanılacak hedeflenmiş fonksiyonel allelik varyasyon bilgileri birleştirilmektedir (Yu vd., 2014). Sonrasında, SNP validasyon aşamaları ile yüksek kalitede SNP markırların seçim süreci gerçekleştirilmektedir. Örneğin çeltik arrayinin oluşturulma aşamasında, 20 çeltik çeşidinin yeniden dizilenmesi ile 160.000 SNP lokusu tespit edilmiş (McNally vd., 2009), daha sonra bu veri, türe ait BAC-end dizileri ile karşılaştırılmış ve bu sayı 44,100 SNP lokusuna indirilmiştir. 384 çeltik genotipinin analizinde, 36.901 SNP valide edilirken (Zhao vd., 2011) bunlardan 384-SNP setinin birçok çeltik populasyonunda sonuçlar verdiği (Thomson vd., 2012) genetik varyasyon ve genom boyutlu analizlerde bunların çip geliştirmede kullanılabileceği belirtilmiştir (Tung vd., 2010). NGS büyük veri havuzları, ıslah uygulamalarında SNP haplotiplerin karakterize edilmesi istenilen allellerin izlenmesi açısından önem taşımaktadır. Günümüzde birçok gen ve QTL klonlanmış olup, ıslah populasyonlarından istenilen allelellerin seçiminde, fonksiyonel SNPs ve gene dayalı (gen-based) SNP’lerin seçimine yönelik çalışmalar devam etmektedir. Bu ise, ilgi duyulan allele bağlantılı markırların LD ‘ları hakkında bilginin yanında geni veya QTL aktarımını sağlayan (genetik donör) hakkında da bilgi edinilmesini sağlamaktadır. Özellikle çip dizaynı için, SNP seleksiyon aşamaları (zayıf performans gösteren veya monomorfik SNPs’lerin elemine edilmesi) büyük önem taşımaktadır (Thomson, 2014). SNP genotiplendirmelerinde, NGS yaklaşımları ile geliştirilen (GBS: Genotyping By Sequencing: Dizileme ile genotiplendirme) giderek popüler olmaktadır. Genom dizileme, SNP varyasyonlarının tespitine olanak sağlamakla birlikte, genotipleme amaçlı derinlemesine genom boyutlu dizilemeler günümüzde ekonomik görülmemektedir. Bu kapsamda ekonomik olarak ucuz NGS teknolojilerinin kullanıldığı (GBS gibi) rutin genotip tanımlamalarda kullanılanılacak yaklaşımlar geliştirilmiştir. Bu tür genotipleme sistemlerinde esas olarak düşük derinlikte (coverage) dizilemeler yapılırken, NGS cihazlarında değişik barkodlanmış DNA örneklerinin çoklu okumaları bir örnek gibi koşturulmakta ve maliyet düşürülmektedir (Andrews vd., 2016; Kim vd., 2016). Basitçe, GBS ‘genotyping by sequencing’ tekniğinde düşük derinlikte okumalar yapılmaktadır. Örneğin çeltikte harita populasyonu için bu derinlik 0.02X-0.13X iken, farklı genotipleri içeren türlerde ise, 1X derinlikte okumalar yapılmaktadır (Xu vd., 2010; Huang vd., 2012). Ancak bu dizilemeler/okumalar tüm genom boyunca yayılmakla birlikte, düşük derinlikteki okumalardan dolayı aranılan herhangi bir lokusta SNP tespiti güçleşebilmektedir. Bu nedenle ‘genotyping by sequencing’ (GBS) yaklaşımlarında dizi okumaları tüm genomda değilde, genomda alt bölgelere yönelik yapılmakta ve tercihen SNP tespitinde kullanılacak ayrık lokuslar tercih edilmektedir. Genotyping by sequencing (GBS) bir metodolojiyi ifade etmemekte olup değişik yaklaşımlar şeklinde uygulanabilmektedir (Restriksiyon bazlı teknikler olan Restriksiyon Bağlantılı DNA dizileme (Restriction site Associated DNA - RADseq), çift enzim RAD dizileme (double digest RAD - ddRADseq) ve Dizileme ile Genotipleme (Genotyping By Sequencing - GBS). vb). Bu tekniklerde sırasıyla; restriksiyon enzim (RE) kesimi, adaptör takımı, PCR ve dizileme protokolü takip edilmektedir. Restriksiyon bazlı ve NGS dizilemenin ilk olarak kullanıldığı metotoloji ise RAD seq (Restriction-Site Associated DNA Tags) tekniğidir ve spesifik barkod dizileme ile örnekler çoklu (multiplex) çalışılmaktadır (Baird vd., 2008; Andrews vd., 2016, Kim vd., 2016). RAD dizilemede, RE kesim bölgelerinin kenar dizilerine yoğunlaşılarak, SNP tespiti için çoklu örneklemelerle (multiplexing) derin okumalar sağanabilmektedir (Chutimanitsakun vd., 2011). RE-temelli GBS tekniği uygulamaları basitleştirilmiş kütüphane aşamalarını da içerecek şekilde 96 ve 384-örnek multiplexed olarak optimize edilerek, Illumina dizileme teknolojisi ile genom-çaplı uygulama yapılacak şekilde ilerletilmiştir (Elshire vd., 2011). GBS değişik türlerde SNP markır tespitine yönelik uygulanmıştır. Arpada genom boyutunda 24,186 SNP (Elshire vd., 2011), çamgillerde 56,807-63,388 SNPs (Chen vd., 2013), çeltikte yüksek kalitede 17,387 SNP (Spindel vd., 2013; Bandillo vd., 2013), mısır harita populasyonunda 54,455-97,190 bilgi verici SNP ile (Guimaraes vd., 2014; Ogugo vd., 2014) değişik mısır gen kaynaklarına sahip koleksiyonlardan genom boyutunda 681,257 SNP markır tespitine olanak sağlamıştır (Romay vd., 2013). Değişik bitki türlerinde, 96’ dan 384’e çok sayıda örneğin genomik SNP varyasyonunun araştırıldığı ve bu konuda servis sunan merkezler bulunmaktadır (http:// www. biotech. cornell.edu/brc/genomic- diversity). Orjinal olarak tek enzim kesimine dayanan GBS protokolü, iki-enzim sistemine modifiye edilmiş ve arpa, buğday, yulaf gibi bitkilerde başarı ile uygulanmıştır (Poland vd., 2012a; Poland vd., 2012b; Huang vd., 2014). Dizileme ile Genotipleme aracılığı ile tespit edilen SNP’lerin uygulamlarında ise platformlar çip ve PCR kökenli olmak üzere ikiye ayrılmaktadır. Projede GBS ile tespit edilen SNP uygulama platform ise Kompetitive Allel Specific PCR (KASP) teknolojisidir. Kompetitive Allel Specific PCR (KASP) teknolojisi; GBS teknikleri ile tespit edilen SNP’lerin uyguladığı platformlardan birisidir. Çift boya kullanılarak yapılan bir genotipleme tekniğidir. KASP iki adet kuyruklu olarak sentezlenen allele özgü ileri (forward) primer ile geri (reverse) primerden oluşan ortak primerin kullanımını esas almaktadır. KASP ekonomik, güvenilir, kolay tekrar edilebilir "Floresan işaretli Allel spesifik PCR" yöntemine dayalı, bir sistemdir. Singleplex TNP genotipleme için çok özel bir sistem olup nokta değişikliklerinde kolay bir şekilde başarı ile kullanılmaktadır. Genotiplemede bilinen, tanımlanmış değişiklikleri bu yöntemle göstermek mümkündür. RE-temelli GBS tekniği uygulamaları basitleştirilmiş kütüphane aşamalarını da içerecek şekilde 96 ve 384-örnek multiplexed olarak optimize edilerek, Illumina dizileme teknolojisi ile genom-çaplı uygulama yapılacak şekilde ilerletilmiştir. GBS değişik türlerde SNP markır tespitine yönelik uygulanmıştır. Arpada genom boyutunda 24,186 SNP, çamgillerde 56,807-63,388 SNPs, çeltikte yüksek kalitede 17,387 SNP, mısır harita populasyonunda 54,455-97,190 bilgi verici SNP ile değişik mısır gen kaynaklarına sahip koleksiyonlardan genom boyutunda 681,257 SNP markır tespitine olanak sağlamıştır.
3-SNP MARKIRLAR, YENİ NESIL SEKANSLAMA TEKNİKLERİ VE SNP HAPLOTİPLEMESİ Son yıllarda bitki biyoteknolojisi alanındaki çalışmalarda, gen kaynaklarının oluşturulmasında ve genomik alandaki tekniksel ilerlemelerde önemli aşamalar kaydedilmiştir. Bu alandaki çalışmalar artan dünya nüfusuna yönelik gelecekte gıda vb. taleplerinin karşılanmasındaki katkıyı hedeflerken, bu amaçla kullanılacak ıslah (seleksiyon, melezleme vb.) çalışmalarında koleksiyonların gelişen genomik teknolojilerle değerlendirilmesi önemli yararlar sağlamaktadır (Alfred vd., 2014; Varshney vd., 2014). Diğer taraftan bitki moleküler ıslahı alanında DNA markörlerin ıslahı hızlandırıcı katkıları günümüzde kabul edilir bir yaklaşım olarak görülmektedir. Bununla birlikte klasik genetik haritalama yöntemleri ile, arzu edilen genlerin, QTL (Quantitative Trait Locus)’lerin belirlenmesi ve ıslah programlarında kullanılması kısıtlı sonuçlar doğurmuş ve bu nedenle başarılı olarak kullanılan MAS (Marker-Assisted Selection) markırları sınırlı sayıda kalmıştır (McCouch vd., 2010; Davey vd., 2011; Poland ve Rife, 2012) Genetik çeşitlilik, genler ve QTL’s ve dizileme teknolojileri ve genotipleme ve biyoinformatik alanındaki gelişmeler, hızlı ve yüksek hacimli moleküler markır tespiti yaklaşımlarına olanak sağlamaktadır. Basit dizi tekrarları (SSR) sonrasında, SNP (SNP: Single Nucleotide Polymorphism; TNP: Tekli Nükleotid Polimorfizmi) markırların devreye girmesi ile önemli bitki türlerinde, genetik çeşitliliğin karakterizasyonunda, agronomik özelliklerin QTL haritalanmasında ve kilit rol oynayan genlerin klonlanmasında önemli başarılar sağlanmıştır. Özellikle çeltik, mısır ve buğday gibi türlerde SNP markırlara dayalı fine mapping stratejileri ile genler klonlanmış ve istenilen özelliklerle ilgili genleri kontrol eden allellerin seçimine olanak sağlanmıştır (Lübberstedt vd., 2005; Van Damme vd., 2011; Miura vd., 2011; Liu vd., 2012). Aynı şekilde, ilgilenilen kromozom bölgesinin daha hassas taranmasını sağlayan, Yeni Nesil Dizileme (NGS: Next Generation Sequencing) sistemlerindeki gelişmeler, genomda SNP tanımlanacak bölgelerdeki SNP haplotipini daha derinlemesine ortaya koyabilmektedir (Chia vd., 2012). Diğer taraftan çok sayıdaki örneğin aynı anda hızlı (Ultra high-throughput) DNA ekstraksiyonu ve SNP genotipleme yaklaşımları (teknikleri) ıslahçılar için büyük çaplı çalışmalara fırsat sağlamaktadır. Genom-boyutlu seleksiyon yaklaşımlarının kullanılması ile sınırlı sayıda lokusa dayalı seleksiyonlar yerine, yüksek-yoğunlukta ve genom çapında seleksiyonlara olanak sağlanmıştır (Heffner vd., 2009; Bernardo 2010; Jannink vd., 2010). NGS ve SNP genotiplendirme tekniklerindeki avantajlardan dolayı bu yaklaşımlar tohum firmaları başta olmak üzere birçok uygulama alanını hızla genişletmektedir. Gene dayalı markır tespitinde, günümüze kadar en çok kullanılan kodominat SSR markırların genomda sınırlı sayıda olup, diğer taraftan lokuslarda çoklu allel içermeleri nedeniyle değişik platformlarda veriler birbirleri ile çakıştırılamamakta, jel ortamlarının zaman alıcı olması ve birçok kapiller fragment sistemlerinde (otomatik) etkin multiplex (çoklu) uygulamaların yapılamaması ve sınırlı bilgi içeriği gibi nedenler SSR markırların SNP markırlara göre dezavantajı olarak gösterilmektedir. SNP markörlerin başlıca avantajları ise; esneklik, hız, maliyet-düşüklüğü, hacimli veri ile birlikte veri yönetimi kolaylığı şeklinde sıralanmaktadır. Her lokusta iki allel içermeleri ve veri kalite kontrol analizleri gerçekleştirildikten sonra farklı genotiplendirme platformlarında aynı allel aramalarına olanak sağlaması nedeni ile bi allelik (iki allel içeren) SNP markırlar, gruplar arasında veri birleştirme ve markır bilgilerinden büyük veritabanları oluşturmaya açık olan güvenilir markırlar olarak bilinmektedir. Diğer taraftan yüksek kaliteli referans genomların bulunması durumunda, genom dizisi ve SNP markır verilerinin çakıştırılması ile bir bitki türü için SNP katalogları oluşumu mümkün olmaktadır (Andrews vd., 2016; Kim vd., 2016). Yeni nesil dizileme teknolojilerinin kullanıma girmesi ile birçok bitkide genom düzeyinde dizileme çalışmaları ile büyük ölçekli dizi verileri üretilmiş (Edwards vd., 2013; Bolger vd., 2014; Li vd., 2014) ve konudaki çalışmalar devam etmektedir. Bu amaçla Massively Parallel Short Read teknoloji sistemleri (Illumina, Ion Torrent (www.illumina.com; ww.lifetechnologies.com. vb.) genomlarda yeniden dizilemelerde (re-sequencing) kullanılırken, uzun okuma teknolojileri ile yüksek kaliteli referans genomlarının dizilemelerinde ise, Pacific Biosciences (www.pacificbiosciences.com) teknolojileri kullanılmaktadır. Diğer taraftan tüm genom yeniden dizilemelerde, verinin birleştirileceği (alignment edileceği), türe ait yüksek kalite referans genom dizilerinin bulunması son derece önem taşımaktadır. Yeni nesil dizileme bilgilerinden yararlı veriyi şecmek ve genom boyutunda SNP lokuslarını tamamlamak ve ilgilenilen genlerde SNP haplotiplerini ve allellerini tanımlamak için bioinformatik araçları devreye girmektedir (Thomson, 2014; Andrews vd., 2016). Fonksiyonel SNP markırı (genle ilişkili) eldesinde, genom dizisi SNP lokuslarının tespiti ve validasyonunu içeren bir dizi aşamadan geçirilmektedir. ilk aşamada; allel ayrımını sağlayan söz konusu spesifik SNP varyantından emin olmak için data filtrelenmeli, aynı SNP varyantı birkaç kez gözlenmeli ancak genomda tek kopya halinde bulunmalıdır, genomdaki yeni ise genom içersindeki değişken bölgelere yakın olmamalıdır. İkinci aşamada bulunan SNP’ler genotipler açısından populasyon bazlı filtreme yapılarak, SNP’in çalışılan bitki genotipleri (germplazmı) içinde ve arasında belirli bir eşiğin üzerinde minimum allel frekansına (minor allele frequency-MAF) sahip olup olmadığı yönünden test edilmektedir. Böylelikle dizileme hataları ve nadir bulunan SNP’ler elemine edilerek SNP markırların bilgi verme düzeyi ve polimorfik özelliği maksimum hale getirilmktedir (Thomson, 2014). Yine genom boyutunda bağlantı dengesizliği (LD: linkage disequilibrium) bloklarını temsil eden etiketli SNPs’lerin seçimi için SNP’ler arasındaki korelasyonlar araştırılmakta (Zhao vd., 2011; Chen vd., 2013), bazı durumlarda ıslahta kullanılacak hedeflenmiş fonksiyonel allelik varyasyon bilgileri birleştirilmektedir (Yu vd., 2014). Sonrasında, SNP validasyon aşamaları ile yüksek kalitede SNP markırların seçim süreci gerçekleştirilmektedir. Örneğin çeltik arrayinin oluşturulma aşamasında, 20 çeltik çeşidinin yeniden dizilenmesi ile 160.000 SNP lokusu tespit edilmiş (McNally vd., 2009), daha sonra bu veri, türe ait BAC-end dizileri ile karşılaştırılmış ve bu sayı 44,100 SNP lokusuna indirilmiştir. 384 çeltik genotipinin analizinde, 36.901 SNP valide edilirken (Zhao vd., 2011) bunlardan 384-SNP setinin birçok çeltik populasyonunda sonuçlar verdiği (Thomson vd., 2012) genetik varyasyon ve genom boyutlu analizlerde bunların çip geliştirmede kullanılabileceği belirtilmiştir (Tung vd., 2010). NGS büyük veri havuzları, ıslah uygulamalarında SNP haplotiplerin karakterize edilmesi istenilen allellerin izlenmesi açısından önem taşımaktadır. Günümüzde birçok gen ve QTL klonlanmış olup, ıslah populasyonlarından istenilen allelellerin seçiminde, fonksiyonel SNPs ve gene dayalı (gen-based) SNP’lerin seçimine yönelik çalışmalar devam etmektedir. Bu ise, ilgi duyulan allele bağlantılı markırların LD ‘ları hakkında bilginin yanında geni veya QTL aktarımını sağlayan (genetik donör) hakkında da bilgi edinilmesini sağlamaktadır. Özellikle çip dizaynı için, SNP seleksiyon aşamaları (zayıf performans gösteren veya monomorfik SNPs’lerin elemine edilmesi) büyük önem taşımaktadır (Thomson, 2014). SNP genotiplendirmelerinde, NGS yaklaşımları ile geliştirilen (GBS: Genotyping By Sequencing: Dizileme ile genotiplendirme) giderek popüler olmaktadır. Genom dizileme, SNP varyasyonlarının tespitine olanak sağlamakla birlikte, genotipleme amaçlı derinlemesine genom boyutlu dizilemeler günümüzde ekonomik görülmemektedir. Bu kapsamda ekonomik olarak ucuz NGS teknolojilerinin kullanıldığı (GBS gibi) rutin genotip tanımlamalarda kullanılanılacak yaklaşımlar geliştirilmiştir. Bu tür genotipleme sistemlerinde esas olarak düşük derinlikte (coverage) dizilemeler yapılırken, NGS cihazlarında değişik barkodlanmış DNA örneklerinin çoklu okumaları bir örnek gibi koşturulmakta ve maliyet düşürülmektedir (Andrews vd., 2016; Kim vd., 2016). Basitçe, GBS ‘genotyping by sequencing’ tekniğinde düşük derinlikte okumalar yapılmaktadır. Örneğin çeltikte harita populasyonu için bu derinlik 0.02X-0.13X iken, farklı genotipleri içeren türlerde ise, 1X derinlikte okumalar yapılmaktadır (Xu vd., 2010; Huang vd., 2012). Ancak bu dizilemeler/okumalar tüm genom boyunca yayılmakla birlikte, düşük derinlikteki okumalardan dolayı aranılan herhangi bir lokusta SNP tespiti güçleşebilmektedir. Bu nedenle ‘genotyping by sequencing’ (GBS) yaklaşımlarında dizi okumaları tüm genomda değilde, genomda alt bölgelere yönelik yapılmakta ve tercihen SNP tespitinde kullanılacak ayrık lokuslar tercih edilmektedir. Genotyping by sequencing (GBS) bir metodolojiyi ifade etmemekte olup değişik yaklaşımlar şeklinde uygulanabilmektedir (Restriksiyon bazlı teknikler olan Restriksiyon Bağlantılı DNA dizileme (Restriction site Associated DNA - RADseq), çift enzim RAD dizileme (double digest RAD - ddRADseq) ve Dizileme ile Genotipleme (Genotyping By Sequencing - GBS). vb). Bu tekniklerde sırasıyla; restriksiyon enzim (RE) kesimi, adaptör takımı, PCR ve dizileme protokolü takip edilmektedir. Restriksiyon bazlı ve NGS dizilemenin ilk olarak kullanıldığı metotoloji ise RAD seq (Restriction-Site Associated DNA Tags) tekniğidir ve spesifik barkod dizileme ile örnekler çoklu (multiplex) çalışılmaktadır (Baird vd., 2008; Andrews vd., 2016, Kim vd., 2016). RAD dizilemede, RE kesim bölgelerinin kenar dizilerine yoğunlaşılarak, SNP tespiti için çoklu örneklemelerle (multiplexing) derin okumalar sağanabilmektedir (Chutimanitsakun vd., 2011). RE-temelli GBS tekniği uygulamaları basitleştirilmiş kütüphane aşamalarını da içerecek şekilde 96 ve 384-örnek multiplexed olarak optimize edilerek, Illumina dizileme teknolojisi ile genom-çaplı uygulama yapılacak şekilde ilerletilmiştir (Elshire vd., 2011). GBS değişik türlerde SNP markır tespitine yönelik uygulanmıştır. Arpada genom boyutunda 24,186 SNP (Elshire vd., 2011), çamgillerde 56,807-63,388 SNPs (Chen vd., 2013), çeltikte yüksek kalitede 17,387 SNP (Spindel vd., 2013; Bandillo vd., 2013), mısır harita populasyonunda 54,455-97,190 bilgi verici SNP ile (Guimaraes vd., 2014; Ogugo vd., 2014) değişik mısır gen kaynaklarına sahip koleksiyonlardan genom boyutunda 681,257 SNP markır tespitine olanak sağlamıştır (Romay vd., 2013). Değişik bitki türlerinde, 96’ dan 384’e çok sayıda örneğin genomik SNP varyasyonunun araştırıldığı ve bu konuda servis sunan merkezler bulunmaktadır (http:// www. biotech. cornell.edu/brc/genomic- diversity). Orjinal olarak tek enzim kesimine dayanan GBS protokolü, iki-enzim sistemine modifiye edilmiş ve arpa, buğday, yulaf gibi bitkilerde başarı ile uygulanmıştır (Poland vd., 2012a; Poland vd., 2012b; Huang vd., 2014). Dizileme ile Genotipleme aracılığı ile tespit edilen SNP’lerin uygulamlarında ise platformlar çip ve PCR kökenli olmak üzere ikiye ayrılmaktadır. Projede GBS ile tespit edilen SNP uygulama platform ise Kompetitive Allel Specific PCR (KASP) teknolojisidir. Kompetitive Allel Specific PCR (KASP) teknolojisi; GBS teknikleri ile tespit edilen SNP’lerin uyguladığı platformlardan birisidir. Çift boya kullanılarak yapılan bir genotipleme tekniğidir. KASP iki adet kuyruklu olarak sentezlenen allele özgü ileri (forward) primer ile geri (reverse) primerden oluşan ortak primerin kullanımını esas almaktadır. KASP ekonomik, güvenilir, kolay tekrar edilebilir "Floresan işaretli Allel spesifik PCR" yöntemine dayalı, bir sistemdir. Singleplex TNP genotipleme için çok özel bir sistem olup nokta değişikliklerinde kolay bir şekilde başarı ile kullanılmaktadır. Genotiplemede bilinen, tanımlanmış değişiklikleri bu yöntemle göstermek mümkündür. Değişik bitki türlerinde, 96’ dan 384’e çok sayıda örneğin genomik SNP varyasyonunun araştırıldığı ve bu konuda servis sunan merkezler bulunmaktadır (http:// www. biotech. cornell.edu/brc/genomic- diversity). Orjinal olarak tek enzim kesimine dayanan GBS protokolü, iki-enzim sistemine modifiye edilmiş ve arpa, buğday, yulaf gibi bitkilerde başarı ile uygulanmıştır. Dizileme ile Genotipleme aracılığı ile tespit edilen SNP’lerin uygulamlarında ise platformlar çip ve PCR kökenli olmak üzere ikiye ayrılmaktadır.
Ders KapsamındaYaralanılan Kaynaklar Andrews, K. R., Good, J. M., Miller, M. R., Luikart, G. ve Hohenlohe, P. A. 2016. “Harnessing the power of RADseq for ecological and evolutionary genomics”, Nature Reviews Genetics, 17(2), 81. Biotechnology of Fruits and Nut Crops (Editor:R. E. Litz)(2005) Genome Mapping and Molecular Breeding in Plants(Fruits and Nuts) (Editor:Chittaranjan Kole)(2007) Genomics-Assisted Crop Improvement, Volume 1(Editor: Rajeev K. Varshney, Roberto Tuberosa) (2007) Model Plants and Crop Improvement(Editors: R. K. Varshey, R. M. D. Koebner)(2007). Plant Molecular Breeding (Editor: H. John Newbury)(2003) Thomson, M. J., Zhao, K., Wright, M., McNally, K. L., Rey, J., Tung, C. W., Reynolds, A., Scheffler, B., Eizenga, G., McClung et.al. 2012. “High-throughput single nucleotide polymorphism genotyping for breeding applications in rice using the BeadXpress platform”, Mol. Breed., 29, 875-886.