Biyoistatistiğe Giriş İstatistik ve Biyoistatistiğe Giriş
Kaynak Kitaplar (Merkez Kütüphanede Okumak Üzere Ayrılmış) 1. WA 900 D184 1991 Daniel, Wayne W. Biostatistics: A Foundation for Analysis in the Health Sciences 2. WA 950 D272 2004 Dawson, Beth Trapp, Robert G. Basic & Clinical Biostatistics Lange Medical Books/ McGrow-Hill NewYork 2004 3. QT 260 A456 2000 Alpar R. Spor bilimlerinde uygulamalı istatistik Nobel yayın , Ankara, 2000. 4. WA 950 A733 2002 Armitage, P. Statistical Methods in Medical Research Blackwell Science Oxford 2002 5. WA 950 G545 2002 Glantz, Stanton A. Primer of Biostatistics McGrow-Hill NewYork 2002
Dersin amacı: Bazı faktörler ve hastalıklar arasındaki ilişkiyi açığa çıkarmak Hastalığın etiyolojisini açıklamak(hastalıklara neden olan faktörler) Hastalık oluş sayısını tahmin etmek Sağlık literatürünü okumak, anlamak ve yorumlayabilmek
Makale hakkında fikir sahibi olunabilmesi ve değerlendirme yapılabilmesi için yeterli biyoistatistik bilgisine ihtiyaç vardır. Sağlık araştırmalarının çoğunda planlama, yürütme ve yorumlamada istatistiksel yöntemler kullanılmaktadır.
Planlama Kaç kişi/birey tedaviye alınmalıdır? Hastalar tedavilere nasıl dağıtılmalıdır? Bağımlı değişkeni etkileyebilecek diğer değişkenler nelerdir?
Yürütme Çalışma hangi şartlar altında yürütülmelidir? Eşleştirme gerekli midir? Körleme (tek körleme,çift körleme) gerekli midir? Kontrol grubuna gerek var mıdır? Plasebo etkisi dikkate alınmalı mıdır? Hangi deneysel tasarım yöntemi daha uygundur?
Yorumlama Örnek 1: Trombolizm tanısı konulmuş kadın hastaların kan grupları dağılımı Kan Grubu Sayı % A 32 58.2 AB 4 7.3 B 8 14.5 O 11 20.0 Toplam 55 100.0 Sağlıklı kadınların kan grupları dağılımı Kan Grubu Sayı % A 75 51.7 AB 8 5.5 B 19 13.1 O 43 29.7 Toplam 145 100.0
İstatistik Herhangi bir konu hakkında Bilgi toplamak, Toplanan bilgileri düzenlemek, Çözümlemek ve Yorumlamak için gerekli yöntemler topluluğudur.
Biyoloji, tıp ve diğer sağlık bilimle-rinde; Biyoistatistik Biyoloji, tıp ve diğer sağlık bilimle-rinde; Araştırma düzeninin oluşturulması, Verilerin elde edilmesi ve Değerlendirilmesi ile uğraşan bilim dalıdır.
İstatistik olarak iki ana gruba ayrılır. Tanımlayıcı İstatistik (Descriptive Statistics) Çıkarımsal İstatistik (Inferential Statistics) olarak iki ana gruba ayrılır.
Tanımlayıcı İstatistik Verilerin özetlenmesi, Sınıflandırılması, Tablo ve grafiklerle sunulmasını içerir.
Tanımlar Veri (Data) : İncelenen konuya açıklık getirmek amacıyla toplanan bilgiler, belgeler, ölçümler, ... vb. Denek : Bireysel veri kaynağı (Subject) Değişken: Deneklerin herhangi bir özelliğine (Variable) ilişkin verilere değişken denir. Örneğin, boy uzunluğu, yaş, öğrenim düzeyi, cinsiyet vb.
Kitle : Araştırma kapsamına giren, aynı denir. (Population) özellikleri taşıyan deneklerin tümüne denir. Örneklem: Bir kitleden, kitleyi temsil edecek (Sample) biçimde seçilen alt gruba denir. Parametre: Kitlenin özelliklerini tanımlamak için (Parameter) kullanılan ölçülere denir. İstatistik : Örneklemin özelliklerini tanımlamak (Statistics) için kullanılan ölçülere denir.
Veri Türleri Niceliksel (Quantitative) Niteliksel (Qualitative) Nicelik belirten (ölçü-lerek yada sayılarak elde edilen) verilerdir. Örneğin, yaş, ağırlık, boy gibi. Bireylerin sahip olduğu belli özelliklerin sınıflara ayrılarak belirtildiği verilerdir. Örneğin, cinsiyet, medeni durum, başarılı-başarısız gibi.
Niteliksel Veri Türleri Sıralanabilir (Ordered) Sınıflanabilir (Nominal) Nitelik verilerde belli bir sıralama yoksa bu tür verilere sınıflanabilir nitelik veriler denir. Örneğin cinsiyet, medeni durum gibi. Nitelik verilerde belli bir sıralama söz konusu ise (kötü-orta-iyi-mükemmel gibi) bu tür verilere sıralanabilir nitelik veriler denir. ??? İki Sınıflı Çok Sınıflı
Discrete numeric variable Niceliksel Veri Türleri Kesikli Sayısal Discrete numeric variable Sürekli Sayısal Continuous numeric variable Ölçümle belirtilirler ve bir aralıktaki bütün değerleri alırlar. Örnek: Boy uzunluğu, yaş, günlük kalsiyum tüketim miktarı (mg) gibi. Belirli bir aralıktaki tam sayıları alan veri türüdür. Örnek: Sınıftaki öğrenci sayısı, Aralık Ölçekli Interval Scale Oran Ölçekli Ratio Scale
Çıkarımsal İstatistik Örneklemden elde edilen bulgular yardımıyla; Kitle hakkında kestirimde bulunma, Hipotezleri test etme, Karara varma, işlemlerini içerir.
Çıkarımsal İstatististik İçin Tanımlar Örneklem : Bir kitleden, kitleyi temsil edecek (Sample) biçimde seçilen alt gruba denir. Örnek : Örnekleme seçilmiş denek (Sample) Örnekleme :Kitleden örnek seçmek amacıyla (Sampling) geliştirilen çeşitli yöntemler vardır. Uygun yöntemlerle kitleden örneklem seçme işlemine “örnekleme” denir.
Çıkarımsal İstatististik İçin Tanımlar Doğruluk : Ölçülen ya da hesaplanan değerin (Accuracy) kendi gerçek değerine olan yakınlığı Kesinlik : Aynı özelliğin bir çok kez ölçümü (Precision) sonucunda elde edilen değerlerinin birbirine yakınlığı
Tanımlayıcı İstatistikler Yer Gösteren Ölçüler Yaygınlık Ölçüleri Merkezi Eğilim Ölçüleri Konum Ölçüleri
Yer Gösteren Ölçüler Bir dağılımı tanımlayabilmek için çeşitli yer gösteren ölçüler vardır. Bu ölçüler merkez ölçüleri ya da ortalama ölçüleri olabileceği gibi, dağılımdaki herhangi bir noktayı da gösteren ölçüler olabilir.
Merkezi Eğilim (Ortalama) Ölçüleri Aritmetik Ortalama Ortanca Tepe Değeri Oran Geometrik Ortalama Harmonik Ortalama Konum Ölçüleri Yüzdelikler Çeyrekler
Buna göre yaş ortalaması Aritmetik Ortalama Aritmetik ortalama, veri setindeki tüm değerlerin toplanması ve bu toplamın veri sayısına bölünmesiyle elde edilir. Örnek 2: 9 kişinin yaşları 12, 13, 11, 12, 14, 29, 12, 13, 11 olsun. Buna göre yaş ortalaması 12 13 11 14 + 29 = 9 = 14,11 yıl
Aritmetik ortalama dağılımdaki tüm değerleri dikkate alır Aritmetik ortalama dağılımdaki tüm değerleri dikkate alır. Ancak dağılımdaki aşırı değerlerden etkilenir. Bu dağılımda 29 yaş aşırı bir değerdir ve ortalamayı etkiler ve aritmetik ortalamanın yüksek çıkmasına neden olur.
9 kişinin yaşları küçükten büyüğe doğru sıralandığında Ortanca Bir veri grubu küçükten büyüğe sıralandığında, terim sayısı tek ise ortadaki sayı, çift ise ortadaki iki sayının toplamının yarısıdır. Örnek 3: 9 kişinin yaşları küçükten büyüğe doğru sıralandığında 11, 11, 12, 12, 12 , 13, 13, 14, 29 Gözlem sayısı tektir. Ortanca =(9+1)/2=5. değer
Denek sayısı çift olduğunda Denek sayısı 10 ve yaşlar aşağıdaki gibi olsaydı 12, 13, 11, 12, 14, 29, 12, 13, 15 11 Yaşlar sıraya dizildiğinde 11 11 12 12 12 13 13 14 15 29 Denek sayısı çift olduğundan Ortanca (n/2)=5. ve (n+2)/2=6. değerlerin 12 13 + ortalamasıdır. Ortanca = = 12,5 2
Ortanca, dağılımın orta noktası hakkında bilgi verir Ortanca, dağılımın orta noktası hakkında bilgi verir. ve aşırı değerlerden etkilenmez. Bu nedenle dağılımda aşırı gözlemlerin bulunduğu durumlarda, ortalama ölçüsü olarak ortancanın kullanılması daha doğrudur.
Buna göre en çok tekrarlanan 12 olduğu için tepe değeri 12’dir. Tepe değeri dağılımda en fazla tekrarlanan değerdir. Örnek 4: 9 kişinin yaşları 12, 13, 11, 12, 14, 29, 12, 13, 11 olsun. Buna göre en çok tekrarlanan 12 olduğu için tepe değeri 12’dir.
Her gözlemin tekrar sayısı aynı ise o veri setinde tepe değeri yoktur. En yüksek sayıya sahip tek bir değerin olduğu dağılımlara tek tepeli dağılım, en yüksek sayıya sahip iki değerin olduğu dağılımlara iki tepeli dağılım denir. Bu durum ikiden fazla değerde ortaya çıkarsa çok tepeli dağılım adını alır. Tepe değeri, aritmetik ortama ve ortancaya göre daha az kullanılan bir ortalama ölçüsüdür.
Nitelik veriler çoğunlukla yüzde (oran) ile özetlenirler. Nitelik veriler; aritmetik ortalama, ortanca, tepe değeri gibi ortalama ölçüleri ile özetlenmez. Nitelik veriler çoğunlukla yüzde (oran) ile özetlenirler.
Örnek 5: Cinsiyet Sayı Erkek 50 Kız 70 Toplam 120 41,67 58,33 100 Beslenme ve Diyetetik Dönem IV Öğrencilerinin Cinsiyet Dağılımı Cinsiyet Sayı Erkek 50 Kız 70 Toplam 120 Yüzde (Oran) 41,67 58,33 100 Oran farklı bir ortalama ölçüsü olarak algılansa da bir aritmetik ortalamadır.
A Okulunda Öğrencilerin Ağırlıklarının Dağılımı Zayıf Normal Hafif Şişman Şişman Toplam Erkek Sayı 80 225 147 53 505 % 15,8 44,6 29,1 10,5 100,0 Kız Sayı 45 190 52 28 315 % 14,3 60,3 16,5 8,9 100,0
Konum Ölçüleri Çeyrekler Dağılımı 4 eşit parçaya bölen değerlerdir. Bunlar, 2. Çeyrek (Ç2) 3. Çeyrek (Ç3) 1. Çeyrek (Ç1) Değerlerin %25’i Ç1’e eşit ya da ondan küçüktür. Değerlerin %50’si Ç2’ye eşit ya da ondan küçüktür. Bu değer aynı zamanda ortancadır. Değerlerin %75’i Ç3’e eşit ya da ondan küçüktür.
Örnek 6: 15 kişinin yaşları aşağıdaki gibidir. 6 2 3 5 5 7 10 9 7 3 5 8 7 5 5 Yüzdelikleri bulurken dağılımdaki değerler küçükten büyüğe sıraya dizilir. 2 3 3 5 5 5 5 5 6 7 7 7 8 9 10 Çeyrek (25. Yüzdelik)=0,25x15=3,75. gözlemin değeridir. 1.Çeyrek 3. İle 4. arasında 4.’ değere daha yakındır. Bu durumda Ç1=3.Değer + (4.Değer – 3.Değer)0.75 3. Çeyrek (75. Yüzdelik)=0,75x15=11,25. Gözlemin değeridir. 3. Çeyrek 11. Ve 12. Değerler arasındadır. Örneğimizde 11. ve 12. değer aynı olduğundan Ç3=7
Yüzdelikler Yüzdelikler sıraya dizilmiş verilerde yığılımlı sıklıkları gösterirler. Örneğin verilerin ilk %30’u 30. Yüzdeliğe (Y30) eşit ya da ondan küçüktür.
Örnek 7: 24 bebeğe ait doğum ağırlıkları aşağıdaki gibidir 1 2850 7 Gözlem Ağırlık 1 2850 7 3150 13 3250 19 3700 2 2900 8 3200 14 3400 20 3800 3 2930 9 15 3450 21 3900 4 2980 10 16 3500 22 4100 5 3000 11 17 23 4400 6 3100 12 18 3600 24 4500
24 bebeğin doğum ağırlığına ilişkin 30 24 bebeğin doğum ağırlığına ilişkin 30. Yüzdelik(Y30) bulunmak istenirse, Sıraya dizilmiş bebek ağırlığı değerlerinde 24 x 0.30 = 7.2 olduğundan Y30, 7. ve 8. değerler arasındadır. 7. gözlem=3150gr 8. gözlem=3200gr 50x0.20=10gr Y30 = 3150+10=3160gr
24 bebeğin doğum ağırlığına ilişkin 60 24 bebeğin doğum ağırlığına ilişkin 60. Yüzdelik(Y60) bulunmak istenirse, Sıraya dizilmiş bebek ağırlığı değerlerinde 24 x 0.60 = 14.4 olduğundan Y60, 14. ve 15. değerler arasındadır. 14. gözlem=3400gr 15. gözlem=3450gr 50x0.40=20gr Y60 = 3400+20=3420gr
Kaynak: Kronik Hastalığın Önlenmesi ve Sağlığın Geliştirilmesi İçin Ulusal Merkez ile birlikte Sağlık İstatistikleri İçin Ulusal Merkez tarafından geliştirilmiştir. Yayınlanma: 30 Mayıs 2010 (ABD)
Yaygınlık Ölçüleri Bir dağılımdaki değerlerin, birbirlerine ya da kendi ortalamalarına göre farklılıklarını gösterir. Bu farklılıkların derecesi dağılımın yaygınlığı kavramını oluşturur. İki dağılım aynı ortalama, ortanca ya da tepe değerine sahipken yaygınlıkları farklı olabilir.
Dağılım I, dağılım II’ye göre daha yaygındır. 6 1 15 2 3 7 5 9 Dağılım I’deki değerlerin aritmetik ortalamaya olan uzaklığı dağılım II’ye göre daha fazladır. Dağılım I, dağılım II’ye göre daha yaygındır.
Dağılımların yaygınlığı hakkında bilgi veren ve en çok kullanılan ölçüler ; Dağılım (Değişim) Aralığı Standart Sapma Varyans Çeyreklikler Arası Genişlik Çeyrek Sapma Değişim Katsayısı
Dağılım Aralığı Dağılım aralığı en basit yaygınlık ölçüsüdür Dağılım Aralığı Dağılım aralığı en basit yaygınlık ölçüsüdür. Dağılımdaki en büyük değerden en küçük değerin çıkartılması ile bulunur. R ile gösterilir R= En Büyük Değer-En Küçük Değer
Dağılım aralığı dağılımdaki diğer değerlerden oldukça farklı değerler alan aşırı değer(ler)den etkilenir. Dağılımda yalnızca 2 gözleme ilişkin değer dikkate alındığı için kaba bir yaygınlık ölçüsüdür. Gözlemlerin çoğunun en büyük yada en küçük değere yakın olduğu durumlarda da gerçek değişkenlik hakkında bilgi vermez.
Standart Sapma Bir dağılımın yaygınlığını gösteren en önemli yaygınlık ölçülerinden biridir. Dağılımdaki tüm değerlerin aritmetik ortalamaya olan uzaklıklarının ortalamasıdır. Dağılımın yaygınlığı arttıkça standart sapma büyür. Dağılımdaki değerler aynı ise yaygınlık yoktur ve standart sapma sıfırdır.
Standart Sapma Standart sapma hesaplanırken dağılımdaki tüm değerler dikkate alınır. Standart sapma, aritmetik ortalama kullanıldığında bir yaygınlık ölçüsü olarak kullanılır. Çarpık dağılımlarda kullanılması önerilmez!
N : Kitledeki n : Örneklemdeki denek sayısını göstermek üzere Standart Sapma N : Kitledeki n : Örneklemdeki denek sayısını göstermek üzere Örneklem S. Sapması Kitle S. Sapması
Örnek Dağılım I için Standart Sapma Eşitliğine göre standart sapma hesaplanması 6 -5 25 1 6 15 9 81 6 2 -4 16 122
Örnek Dağılım II için Standart Sapma Eşitliğine göre standart sapma hesaplanması 3 -3 9 1 1 7 6 5 -1 1 6 9 3 9 20
Varyans Standart sapmanın karesine varyans denir (s2). Varyansın birimi karesel olduğu için yaygınlık ölçüsü olarak veriyi tanımlamakta pek kullanılmaz.
Çeyreklikler Arası Genişlik Dağılımdaki verilerin ortadaki 0.50 ‘sinin yer aldığı aralığı belirlemek için kullanılır. ÇAG = Ç3 – Ç1 Örnek 6’da Ç1=4,5 ve Ç3=7 bulunmuştu. ÇAG = 7 – 4,5 = 2,5 Değerlerin yarısı 2,5 birimlik bir aralık içindedir.
Çeyreklikler arası genişlik aşırı uç değerlerden etkilenmez. Çünkü çeyreklikler arası genişlik dağılımdaki değerlerin merkezdeki %50’si ile ilgilenir. Özellikle uçtaki değerlerden çok ortadaki değerlerle ilgilenildiği durumlarda kullanılır. Eğer incelenen dağılım simetrikse 25. ve 75. Yüzdelikler ortancadan eşit uzaklıktadır.
Çeyrek Sapma Bu değer çeyrekliklerle ortanca arasındaki uzaklığın ortalama bir ölçüsüdür. Çeyrek sapma, ortalama ölçüsü olarak ortancanın kullanıldığı durumlarda kullanılan yaygınlık ölçülerinden biridir. Özellikle aşırı değerlerin, dağılımın sadece bir tarafında olduğu durumlarda kullanılması gerekir.
Örnek 8: Örnek 6’da Ç1=4,5 ve Ç3=7 bulunmuştu. Bu değer, Ç1 ve Ç3’ün ortanca dan ortalama olarak 1,25 birim farklı olduğunu gösterir.
Değişim Katsayısı Standart sapma, bir dağılımın yaygınlığını gösteren ölçülerden birisidir. Aritmetik ortalama büyüdükçe standart sapmanın büyüme eğilimi vardır. Standart sapmanın büyüklüğüne bakarak bir dağılımın yaygınlığı konusunda yargıya varmak her zaman doğru değildir. İki ya da daha fazla dağılımın yaygınlığını karşılaştırmak istediğimizde standart sapmayı doğrudan kullanamayız.
Dağılımın yaygın olup olmadığına karar verebilmek için değişim katsayısını hesaplamalıyız. Değişim katsayısı dağılımdaki değerlerin ortalamaya göre yüzde kaçlık bir değişim gösterdiğini belirtir.
dağılım II’deki değerler %33,3’lük bir değişim göstermektedir. DK’nın sıfıra yaklaşması dağılımın yaygınlığının azaldığını gösterirken, DK’nın %25’in üzerinde olması incelenen dağılımın oldukça yaygın olduğunu gösterir. Dağılım I Dağılım II Dağılım I’deki değerler ortalamaya göre %82,3’lük bir değişim gösterirken, dağılım II’deki değerler %33,3’lük bir değişim göstermektedir.
Örnek 9: 10 bireyin boy ölçüleri cm. ve m. cinsinden aşağıda verilmiştir: 160 1.60 180 1.80 165 1.65 174 1.74 190 1.90 182 1.82 155 1.55 171 1.71 170.2 1.702 11.23 0.1123 6.6 Standart sapmalar farklı olmasına rağmen değişim katsayıları aynıdır. SS DK