BİYOİSTATİSTİK KONUM VE YAYGINLIK ÖLÇÜLERİ: MERKEZ ÖLÇÜLER & ÇEYREK VE YÜZDELİKLER Prof.Dr.İ.Safa GÜRCAN
DAĞILIMI TANIMLAYICI ÖLÇÜLER 2- YAYGINLIK ÖLÇÜLERİ a)Standart Sapma b) Standart Hata c) Varyasyon katsayısı d)Varyans 1- YER GÖSTEREN ÖLÇÜLER Merkezi Ölçüler: Ortalamalar Çeyrek ve Yüzdelikler
ORTALAMALAR Dağılımın orta noktasını gösteren ve incelenen bireylerin değerlerinin tek değerle temsil edilmesini sağlayan ölçüler ORTALAMA Tepe Değeri Ortanca (Medyan) Aritmetik Ortalama
SINIFLANDIRILMIŞ VERİLERDE ARİTMETİK ORTALAMANIN HESAPLANMASI UYGULAMA SINIFLANDIRILMIŞ VERİLERDE ARİTMETİK ORTALAMANIN HESAPLANMASI Yaş (Yıl) fi 15-19 50 20-24 75 25-29 100 30-34 150 35-39 90 40-44 70 45-49 45 A.O: Aritmetik ortalama bi: Çalışma birimi, frekansı en yüksek olan sınıfın karşısına 0 yazılır. A: Çalışma biriminde sıfıra karşılık gelen sınıfın, sınıf değeridir. C: Sınıf Aralığı n: Denek Sayısı
SINIFLANDIRILMIŞ VERİLERDE ARİTMETİK ORTALAMANIN HESAPLANMASI UYGULAMA SINIFLANDIRILMIŞ VERİLERDE ARİTMETİK ORTALAMANIN HESAPLANMASI Yaş (Yıl) fi bi fibi 15-19 50 -3 -150 20-24 75 -2 25-29 100 -1 -100 30-34 150 35-39 90 1 40-44 70 2 140 45-49 45 3 135 A.O: Aritmetik ortalama bi: Çalışma birimi, frekansı en yüksek olan sınıfın karşısına 0 yazılır. A: Çalışma biriminde sıfıra karşılık gelen sınıfın, sınıf değeridir. C: Sınıf Aralığı n: Denek Sayısı
ORTANCA Dağılımın orta noktasındaki değerdir. Dağılımdaki « aşırı » değerlerden etkilenmez. Sınıflanmamış Değerlerde: Denek Sayısı Tek (n+1)/2 ‘nci değer Denek Sayısı Çift n/2’ nci değer ile (n+2)/2’ nci değerin ortalaması
SINIFLANDIRILMIŞ VERİLERDE ORTANCA’NIN HESAPLANMASI UYGULAMA SINIFLANDIRILMIŞ VERİLERDE ORTANCA’NIN HESAPLANMASI Yaş (Yıl) f 15-19 50 20-24 75 25-29 100 30-34 150 35-39 90 40-44 70 45-49 45 L: Ortancanın içinde bulunduğu sınıfın ara değeridir. Yf: Ortancanın içinde bulunduğu sınıfın bir üstündeki sınıfın yığılımlı frekansı f: Ortancanın içinde bulunduğu sınıfın frekansı C: Sınıf Aralığı n: Denek Sayısı
İzlenecek Adımlar: Yaş (Yıl) f Yf 15-19 50 20-24 75 125 25-29 100 225 30-34 150 375 35-39 90 465 40-44 70 535 45-49 45 580 Toplam Yığılımlı Frekans Tablosu hazırla Ortancanın bulunduğu sınıfı belirleyip SAD’ i bul (L) Ortancanın içinde bulunduğu sınıfın bir üstündeki yığılımlı frekansı bul (Yf) Ortancanın içinde bulunduğu sınıfın frekansını bul (f) Sınıf Aralığını bul (C) Değerleri Formüle Yerleştir n/2: 290 Yf: 225 F: 150 C: 5 L: 29,5 Ortanca Değer: 31,67
Sınıflanmış Verilerde Tepe Değeri Sınıflanmış Verilerde tepe değeri en fazla frekansa sahip olan sınıfın sınıf değeridir.
Çeyrek Ve Yüzdelikler Ortalamalar Dağılımın orta noktasını gösterir Çeyrek ve Yüzdelikler Dağılımın herhangi bir noktasını gösterir Dağılımı parçaya bölen bir merkezi eğilim ölçüsüdür. Ör. Birinci Çeyrek %25. değer Üçüncü Çeyrek %75. değer
Sınıflanmış Verilerde Çeyrek ve Yüzdeliklerin Hesaplanması UYGULAMA Sınıflanmış Verilerde Çeyrek ve Yüzdeliklerin Hesaplanması «Den az»; sayı ve yüzdeleri herhangi bir SAD’ nden daha az alan kaç denek olduğunu ve bunların toplam denek sayısının yüzde kaçın olduğunu gösterir. Deneklerin %35 ‘ i hangi değerden daha az değer almıştır? X1: Verilen Yüzde X2: «Den az» yüzde kolonunda X1 ‘ in düştüğü aralığın üzerindeki değer X3: «Den az» yüzde kolonunda X1’ in düştüğü aralığın altındaki değer X: Hesaplanacak Değer X2SAD: X2’nin sınıf ara değeri X3SAD: X3’ ün sınıf ara değeri
Deneklerin %35 ‘ i hangi değerden daha az değer almıştır? Sınıflar ve frekanslar yazılır Sınıf Ara Değerleri (SAD) bulunur «Den az» kolonu geliştirilir. Her SAD’nden az değer alan kaç denek olduğu sayı olarak, sonra da yüzde olarak yazılır. Sınıf Ara Değeri 14,5 19,5 24,5 29,5 34,5 39,5 44,5 …den az Sayı Yüzde 50 8,62 125 21,55 225 38,79 375 64,66 465 80,17 535 92,24 Yaş f 15-19 50 20-24 75 25-29 100 30-34 150 35-39 90 40-44 70 45-49 45 Toplam 580 X1:35 X2SAD: 24,5 X2: 21,55 X3SAD: 29,5 X3: 38,79 X = 28,40
Yaygınlık Ölçüleri Bir dağılımdaki değerlerin ortalamaya olan uzaklıkları farklılıklar gösterir. Bu farklılıkların derecesi dağılımın yaygınlığı kavramını oluşturur. İki dağılım aynı ortalama, ortanca ya da tepe değerine sahipken yaygınlıkları farklı olabilir.
Dağılım I dağılım II’ye göre daha yaygındır. 6 1 15 2 3 7 5 9 Dağılım I’deki değerlerin aritmetik ortalamaya olan uzaklığı dağılım II’ye göre daha fazladır. Dağılım I dağılım II’ye göre daha yaygındır.
Dağılımların yaygınlığı hakkında bilgi veren ve en çok kullanılan ölçüler * Dağılım Aralığı * Standart Sapma * Varyans * Değişim Katsayısı
Dağılım Aralığı Dağılım aralığı en basit yaygınlık ölçüsüdür Dağılım Aralığı Dağılım aralığı en basit yaygınlık ölçüsüdür. Dağılımdaki en büyük değerden en küçük değerin çıkartılması ile bulunur. R ile gösterilir R= En Büyük Değer-En Küçük Değer
Dağılım aralığı dağılımdaki diğer değerlerden oldukça farklı değerler alan aşırı değer(ler)den etkilenir. Dağılımda yalnızca 2 gözleme ilişkin değer dikkate alındığı için kaba bir yaygınlık ölçüsüdür. Gözlemlerin çoğunun en büyük yada en küçük değere yakın olduğu durumlarda da gerçek değişkenlik hakkında bilgi vermez.
Standart Sapma Bir dağılımın yaygınlığını gösteren en önemli yaygınlık ölçülerinden biridir. Dağılımdaki tüm değerlerin aritmetik ortalamaya olan uzaklıklarının ortalamasıdır.
Standart sapma büyüdükçe dağılımın yaygınlığı artar Standart sapma büyüdükçe dağılımın yaygınlığı artar. Dağılımdaki değerler aynı ise yaygınlık yoktur ve standart sapma sıfırdır. Standart sapma hesaplanırken dağılımdaki tüm değerler dikkate alınır. Standart sapmanın, ortalama ölçüsü olarak aritmetik ortalama kullanıldığında bir yaygınlık ölçüsü olarak kullanılması önerilmektedir. Çarpık dağılımlarda kullanılması önerilmez.
Standart sapma s ile gösterilir Standart sapma s ile gösterilir. Sınıflandırılmış ve sınıflandırılmamış verilerde farklı formüllerle hesaplanır. Sınıflandırılmamış verilerde standart sapma Örnek:Yukarıda ortalama, ortanca ve tepe değerleri aynı olan dağılımların standart sapmasını hesaplayalım.
Dağılım I için Standart Sapma Bu dağılımdaki değerler aritmetik ortalama etrafında ortalama ±4,94 birimlik değişkenliğe sahiptir.
Dağılım II için Standart Sapma Bu dağılımdaki değerler aritmetik ortalama etrafında ortalama ± 2 birimlik değişkenliğe sahiptir. Buna göre ikinci dağılımın yaygınlığı birinciye göre oldukça düşüktür.
Varyans Standart sapmanın karesine varyans denir (s2) Varyans Standart sapmanın karesine varyans denir (s2). Varyansın birimi karesel olduğu için yaygınlık ölçüsü olarak veriyi tanımlamakta pek kullanılmaz.
Standart Sapma ve Varyans
Değişim Katsayısı (DK) Standart sapma bir dağılımın yaygınlığını gösteren ölçülerden birisidir. Ancak standart sapmanın büyüklüğüne bakarak bir dağılımın yaygınlığı konusunda yargıya varmak güçtür. İki ya da daha fazla dağılımın yaygınlığını karşılaştırmak istediğimizde standart sapmayı doğrudan kullanamayız.
Değişim Katsayısı
Dağılımın yaygın olup olmadığına karar verebilmek için değişim katsayısını hesaplamalıyız. Değişim katsayısı dağılımdaki değerlerin ortalamaya göre yüzde kaçlık bir değişim gösterdiğini belirtir.
dağılım II’deki değerler %33,3’lük bir değişim göstermektedir. DK’nın sıfıra yaklaşması dağılımın yaygınlığının azaldığını gösterirken DK’nın %25’in üzerinde olması incelenen dağılımın oldukça yaygın olduğunu gösterir. Dağılım I Dağılım II Dağılım I’deki değerler ortalamaya göre %82,3’lük bir değişim gösterirken, dağılım II’deki değerler %33,3’lük bir değişim göstermektedir.
Çarpıklık (Skewness) Normal dağılımda Çarpıklık katsayısı 0’dır. Uygulamalarda ± 1 oldukça, ± 2 kabul edilebilir değerdir.
Basıklık (Kurtosis) Normal dağılımda Çarpıklık katsayısı 0’dır. Uygulamalarda ± 1 oldukça, ± 2 kabul edilebilir değerdir. Pozitif yüksek değer dikliği, negatif düşük değer basıklığı gösterir.