Sunuyu indir
Sunum yükleniyor. Lütfen bekleyiniz
1
Araş. Gör. Dinçer göksülük
Heterojen tek hücreli örneklerden elde edilen RNA-seq verisinin kümelenmesi (TUBITAK-2214, Clustering of RNA-seq data from heteregenous and single-cell samples) Araş. Gör. Dinçer göksülük
2
Sunum Planı Giriş Problemin tanımı Materyal ve metot
RNA-dizileme Tek hücre analizleri Problemin tanımı Araştırma soruları Araştırmanın önemi Amaçlar ve Hedefler Materyal ve metot Literatür taraması Yöntem (Kümeleme, RNA-dizileme) Genel değerlendirme Görüş ve öneriler
3
Giriş RNA-dizileme RNA-dizileme teknolojisi canlı bir organizmaya ait genetik bilgiyi RNA (mRNA, microRNA) düzeyinde ölçen ve gen aktivasyonlarına yönelik bilgiler veren bir teknolojidir. Hastalık alt gruplarının belirlenmesi (Kümeleme) Hastalık durumunun belirlenmesi (Sınıflama)
4
Giriş RNA-dizileme
5
Giriş Tek hücre analizleri
Hücre, dokunun fonksiyonel yapısını belirleyen temel birimidir. Hücrelerin işlevinin kısmen/tamamen kaybolması -> dokuda fonksiyon bozukluğu Tek hücre analizleri ile dokunun en temel birimine yönelik tedaviler Tek hücre genomu -> Hücre yapısı ve işlevi
6
Giriş Tek hücre analizleri
Tek hücre RNA-dizileme teknolojisi: Heterojen bir doku (binlerce farklı hücre türü) Tek hücre gen ekspresyon verisi Her tek hücre bir gözlem olarak el alınır. On binlerce gözlem ve gen bölgesine ait (n x p) boyutlu veri matrisi
7
Problemin Tanımı Güncel teknolojiler ve deneysel kısıtlamalar nedeniyle aynı anda bir kaç bin tek hücrenin RNA-dizileme verilerinin analizi yapılabilmektedir. Daha heterojen dokular -> Daha büyük çaplı tek hücre incelemesi (on binlerce) Daha fazla tek hücre incelemesi -> Daha yüksek maliyet Büyük boyutlu veri -> Yüksek sınıflama/kümeleme performansı + hızlı sonuç veren algoritmalar
8
Problemin Tanımı Araştırma soruları
Aynı anda analiz edilebilecek tek hücre sayısının daha da yukarılara çıkartılması (yüz binler) mümkün müdür? Mümkün ise bu boyutta verilerin analizi için mevcut algoritmalar kullanılabilir mi? Literatürde kullanılan ve kabul görmüş olan kümeleme algoritmaları yüksek boyutlu tek hücre RNA-dizileme verilerinin analizinde yüksek performans gösterebilir mi? Kesikli veri yapısına uyan kümeleme algoritmalarını kullanmak kümeleme performansını arttırır mı?
9
Problemin Tanımı Araştırmanın önemi
Hücre yapıları ve işlevlerinin bilinmesi durumunda dokuya yönelik tedavilerin geliştirilmesi Dokunun işlevini bozan kanserli hücre yapılarının ve gen bölgelerinin tespit edilmesi Doku işlevini bozan gen bölgelerinin ekspresyon düzeylerini kontrol altına alacak tedavilerin geliştirilmesi Dokunun yalnızca işlev bozukluğuna sebep olan bölgelerine (hücre türlerine) yönelik tedavilerin geliştirilmesi
10
Problemin Tanımı Amaçlar ve hedefler
Tek hücre RNA-dizilemesi ile yeni hücre tiplerinin ve/veya kanser alt türlerinin belirlenmesi için mevcut yöntemler içerisinden en iyi sonucu veren istatistiksel yöntemin belirlenmesi ve elde edilen tek hücre RNA-dizileme verilerine uygulanması Kesikli veri yapısına uygun yeni istatistiksel yöntemlerin geliştirilerek tek hücre RNA dizileme verilerinin analizi için uygulanması
11
Materyal & Metot Literatür taraması
Treutlein ve ark. (2014) Doku hücre tiplerinin belirlenmesi Akciğer epitel dokusu 198 tek hücre Hiyerarşik kümeleme Zeisel ve ark. (2015) Beyin korteks ve hipokampüs dokusu ~ tek hücre 47 farklı hücre tipi (sinir hücreleri, bağışıklık sistemi hücreleri, oligodendrositler vb.)
12
Materyal & Metot Literatür taraması
Patel ve ark (2014) Kanser alt türlerinin belirlenmesi Gliyobalstom dokusu 430 tek hücre Hiyerarşik kümeleme ve Temel Bileşenler Analizi Macosko ve ark. (2015) Hücre tiplerinin belirlenmesi Retina dokusu (Fareler) 44,408 tek hücre Drop-Seq teknolojisi
13
Materyal & Metot Drop-Seq
14
Materyal & Metot Drop-Seq
15
Materyal & Metot Drop-Seq
16
Materyal & Metot Kümeleme algoritmaları
Hiyerarşik kümeleme k-ortalama kümelemesi Model tabanlı kümeleme Poisson ve Negatif Binom dağılımları gibi kesikli dağılımlara dayalı kümeleme algoritmaları
17
Materyal & Metot Kümeleme algoritmaları
Çalışmanın temel kısıtlaması: Mevcut algoritmaların bazılarında on binlerce tek hücrenin ve gen bölgesinin aynı anda kümeleme analizinde kullanılması mümkün değildir. 50bin tek hücre ve 20bin gen bölgesi için: Hücrelerin kümelenmesinde -> 50bin x 50bin boyutlu bir uzaklık matrisi (RAM kapasitesi??) Genlerin kümelenmesinde -> 20bin x 20bin boyutlu bir uzaklık matrisi. (64 GB RAM ile mümkün)
18
Genel değerlendirme Tek hücre çalışmaları yardımı ile;
Karmaşık dokuların yapısı çözülerek dokuya özgü tedaviler geliştirilmektedir. Hastalık tanısı tek hücre düzeyinde konulabilir. Looking for a needle in a haystack!! Yapısı bozulan ve kansere sebep olan ilk hücrelerin tespiti ile kanserin çok erken dönem tanısı konabilir. Deneysel kısıtlamaların giderilebilmesi sayesinde son zamanlarda popüler araştırma alanları arasına girmiştir. Çalışmada kullanılan teknolojik altyapı Türkiye’de kurulabilir (TUBİTAK Projesi)
19
Proje ekibi Assoc. Prof. Dr. Christopher Woelk
S3RI: Statistical Sciences Research Institute Biyoistatistik Deney düzenleri Klinik çalışmalar
20
Kaynaklar
21
Kaynaklar
22
Kaynaklar
Benzer bir sunumlar
© 2024 SlidePlayer.biz.tr Inc.
All rights reserved.