Sıklık Tablolarından Elde Edilen Tanımlayıcı İstatistikler Sıklık Tabloları ve Sıklık Tablolarından Elde Edilen Tanımlayıcı İstatistikler
Sıklık Tablosu Veri dizisinde yer alan değerlerin tekrarlama sayılarını içeren tabloya sıklık tablosu denir. Yaş Mutlak Sıklık Göreli Sıklık(%) 16 8 17 14 28 18 6 12 19 20 40 2 4 Toplam 50 100 Sıklık Tabloları tek değişken için marjinal tablo olarak adlandırılır.
Neden Sınıflandırma? Sayısal verilerde merkezi eğilim, konum ölçüleri ve yaygınlık ölçüleri, incelenen verinin özelliklerine göre veri dizisini özetlemekte yetersiz kalabilir.
Neden Sınıflandırma? Beden kitle indeksi, şişmanlığın bir ölçüsü olarak kullanılır, çeşitli hastalıklar için de risk faktörüdür. Şişmanlık göreceli bir kavram olduğundan aritmetik ortalama ve standart sapma, beden kitle indeksi verisinin dağılma özelliklerini göstermez. Dağılma özelliklerini görebilmek için verilerin sınıflandırılması ve sıklık tablolarının elde edilmesi gerekir.
Neden Sınıflandırma? düşük kilolu normal kilolu hafif şişman Beden Kitle İndeksi Durum <18.5 kg/ düşük kilolu 18.5-24.9 kg/ m2 normal kilolu 25-29.9 kg/ m2 hafif şişman 30-34.9 kg/ m2 1. derecede şişman 35-39.9 kg/ m2 2. derecede şişman 40 kg/ m2 + 3. derecede şişman Dünya Sağlık Örgütü
Trombolizm tanısı konulmuş kadın hastaların kan grupları dağılımı Verilerin Sınıflandırılması Nitel verilerde sınıflama için bir yöntem ya da kural yoktur. Araştırıcı, kendi hipotezlerine göre verileri sınıflayabilir. Trombolizm tanısı konulmuş kadın hastaların kan grupları dağılımı Kan Grubu Sayı % A 32 58.2 AB 4 7.3 B 8 14.5 O 11 20.0 Toplam 55 100.0
Sayısal verilerde sınıflandırma Verilerin Sınıflandırılması Sayısal verilerde sınıflandırma Tanımlar Değişim Aralığı: En büyük değer – En küçük değer (R) Sınıf Sayısı: Veri dizisinde oluşturulacak sınıf sayısı (k) Sınıf: Bir alt ve üst sınır ile belirlenmiş veri grubu Sınıf Aralığı: Ardışık iki sınıfın alt ya da üst sınırları arasındaki fark (c) Sınıf Sınırları: Bir sınıfta yer alabilecek en küçük ve en büyük değerleri gösterir. A.S. (Alt Sınır) ve Ü.S. (Üst Sınır) Sınıf Değeri: Bir sınıfın alt ve üst sınırlarının ortalamasıdır. (s) Sınıf Sıklığı: Sınıftaki değer sayısını gösterir. (f) Sınıf Göreli Sıklığı(%): Sınıfın sıklığının toplam değer sayısı (n) içindeki payını gösterir. (%f)
Verilerin Sınıflandırılması Sınıflandırmada Aşamalar 1. Verileri küçükten büyüğe sıralama 2. Sınıf sayısı ya da sınıf aralığı belirleme 3. A.S. ve Ü.S. ların belirlenerek sınıfların oluşturulması 4. Sınıf mutlak sıklıklarının belirlenmesi 5. Göreli sınıf sıklıklarının hesaplanması
Verilerin Sınıflandırılması Sıklık tablosu oluştururken dikkat edilmesi gereken iki kural, Her bir sınıf aynı genişlikte olmalıdır. (bazı özel durumlar dışında) Veri setindeki değerler sadece bir sınıfa ait olmalıdır.
50 Yetişkinin Beden Kitle İndeksi Değerleri Örnek 1: 50 Yetişkinin Beden Kitle İndeksi Değerleri
Verilerin Sınıflandırılması 1. Sınıf sayısı belirleme Daha önceki bilgilerimize göre BKI için 6 sınıf ilk bakışta uygun görülmektedir. 2. A.S. Ve Ü.S. ların belirlenmesi R = 41.43-12.78 = 28.65 4.78 (Sınıf aralığı) c = 28.65 / 6 = 4.775 İlk sınıfın alt sınırı En Küçük değer (12.78) dir. Sonraki sınıfın alt sınırı 12.78 + 4.78 = 17.56
Sınıfların Belirlenmesi 50 Yetişkine İlişkin Beden Kitle İndeksi Dağılımı Sınıf A.S. Ü.S. 1 12.78 17.55 2 17.56 22.33 3 22.34 27.11 4 27.12 31.89 5 31.90 36.67 6 36.68 41.45
Sınıfların Mutlak Sıklıklarını Bulma A.S. Ü.S. 1 12.78 17.56 2 17.55 3 4 5 6 22.33 22.34 27.11 27.12 31.89 31.90 36.67 36.68 41.45
Sınıfların Mutlak Sıklıklarını Bulma
Sınıfların Mutlak Sıklıklarını Bulma A.S. Ü.S. 1 12.78 17.56 2 17.55 3 4 5 6 22.33 22.34 27.11 27.12 31.89 31.90 36.67 36.68 41.45 11
Sınıfların Mutlak Sıklıklarını Bulma
Sınıfların Mutlak Sıklıklarını Bulma A.S. Ü.S. 1 12.78 17.56 2 17.55 3 4 5 6 22.33 22.34 27.11 27.12 31.89 31.90 36.67 36.68 41.45 11 12
Sınıfların Mutlak Sıklıklarını Bulma
Sınıfların Mutlak Sıklıklarını Bulma A.S. Ü.S. 1 12.78 17.56 2 17.55 3 4 5 6 22.33 22.34 27.11 27.12 31.89 31.90 36.67 36.68 41.45 11 12 12
Sınıfların Mutlak Sıklıklarını Bulma
Sınıfların Mutlak Sıklıklarını Bulma A.S. Ü.S. 1 12.78 17.56 2 17.55 3 4 5 6 22.33 22.34 27.11 27.12 31.89 31.90 36.67 36.68 41.45 11 12 12 4
Sınıfların Mutlak Sıklıklarını Bulma
Sınıfların Mutlak Sıklıklarını Bulma A.S. Ü.S. 1 12.78 17.56 2 17.55 3 4 5 6 22.33 22.34 27.11 27.12 31.89 31.90 36.67 36.68 41.45 11 12 12 4 6
Sınıfların Mutlak Sıklıklarını Bulma 50 Yetişkinin Beden Kitle İndeksi Değerleri
Sınıfların Mutlak Sıklıklarını Bulma A.S. Ü.S. 1 12.78 17.56 2 17.55 3 4 5 6 22.33 22.34 27.11 27.12 31.89 31.90 36.67 36.68 41.45 11 12 12 4 6 5
Sınıfların Mutlak Sıklıklarını Bulma A.S. Ü.S. 1 12.78 17.56 2 17.55 3 4 5 6 22.33 22.34 27.11 27.12 31.89 31.90 36.67 36.68 41.45 f 11 12 %f 22 24 24 8 12 10
Sınıf Değeri Bulma Sınıf A.S. Ü.S. 1 12.78 17.56 2 17.55 3 4 5 6 22.33 Sınıf A.S. Ü.S. 1 12.78 17.56 2 17.55 3 4 5 6 22.33 22.34 27.11 27.12 31.89 31.90 36.67 36.68 41.45 f 11 12 %f S 22 15.165 24 19.945 24 24.725 8 29.505 34.285 12 39.065 10
Aritmetik Ortalamanın Hesaplanması Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama Aritmetik Ortalamanın Hesaplanması
Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama 15.165 19.945 24.725 29.505 34.285 39.065 Sınıf A.S. Ü.S. 1 12.78 17.56 2 17.55 3 4 5 6 22.33 22.34 27.11 27.12 31.89 31.90 36.67 36.68 41.45 f 11 12 %f 22 24 8 10 s f s 166,815 239,340 296,700 118,020 205,710 195,325 1221,91
Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama Sınıflandırılmamış veriden hesaplanan a. ortalama = 24,893
Standart Sapmanın Hesaplanması Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama Standart Sapmanın Hesaplanması
Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama A.S. Ü.S. f s %f f s s2 f s2 1 12.78 17.55 11 22 15.165 166,815 229,97 2529,67 2 17.56 22.33 12 24 19.945 239,340 4773,60 7335,84 3482,16 7052,76 7630,35 397,80 611,32 870,54 1175,46 1526,07 32804,68 3 22.34 27.11 12 24 24.725 296,700 4 27.12 31.89 4 8 29.505 118,020 5 31.90 36.67 6 12 34.285 205,710 6 36.68 41.45 5 10 39.065 195,325 1221,91
Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama Standart Sapmanın Hesaplanması Sınıflandırılmamış veriden hesaplanan s.sapma= 7,61
Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama Tepe Değerinin Hesaplanması Sınıflandırılmış verilerde tepe değeri, en fazla frekansa sahip olan sınıfın sınıf değeridir. (tek tepeli dağılım) Bir dağılımda veriler iki sınıfta yoğunlaşıyorsa bu dağılama ise iki tepeli dağılım denir. İkiden fazla sınıfta yoğunlaşıyor ise çok tepeli dağılım denir. Beden kitle indeksi örneğinde veriler iki sınıfta yoğunlaşmaktadır.( 2. ve 3. sınıf) Dolayısıyla tepe değeri iki sınıfın sınıf değeridir. (19.945 ve 27.725)
Yapay Sınıf Değerleri İle Aritmetik Ortalamanın Hesaplanması Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama Yapay Sınıf Değerleri İle Aritmetik Ortalamanın Hesaplanması Bu yöntemde sınıflara hesaplama kolaylığı sağlayacak biçimde yapay sınıf değerleri atanır. Yapay sınıf değerleri atanırken hesaplama kolaylığı sağlanabilmesi için sınıf sıklığı en büyük olan sınıfın yapay sınıf değeri sıfır alınır. Yapay sınıf kolonu sıklık tablolarında b ile gösterilir. Sıfırdan üste doğru bir azaltılarak alta doğru bir artırılarak b sütunu oluşturulur.
Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama A.S. Ü.S. 1 12.78 17.56 2 17.55 3 4 5 6 22.33 22.34 27.11 27.12 31.89 31.90 36.67 36.68 41.45 11 12 15.165 19.945 24.725 29.505 34.285 39.065 S b -2 -1 A 1 2 3
Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama A: b sütununda 0(sıfır) konulan sınıfın karşısındaki sınıf değeri
Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama A.S. Ü.S. 1 12.78 17.56 2 17.55 3 4 5 6 22.33 22.34 27.11 27.12 31.89 31.90 36.67 36.68 41.45 11 12 15.165 19.945 24.725 29.505 34.285 39.065 S -2 -1 b f b -22 -12 4 12 15 -3
Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama
Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama Standart Sapmanın Hesaplanması
Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama Standart Sapmanın Hesaplanması f Sınıf A.S. Ü.S. 1 12.78 17.56 2 17.55 3 4 5 6 22.33 22.34 27.11 27.12 31.89 31.90 36.67 36.68 41.45 11 12 -2 -1 b -22 -12 15 f b -3 9 b2 f b2 44 12 4 24 45 129
Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama Standart Sapmanın Hesaplanması
Sınıf Ara Değeri Bulma SAD Sınıf ara değeri, o sınıfın üst sınırı ile bir alttaki (sonraki) sınıfın alt sınırının ortalamasıdır. 1 2 3 4 5 6 Sınıf A.S. Ü.S. 12.78 17.56 17.55 22.33 22.34 27.11 27.12 31.89 31.90 36.67 36.68 41.45 f 11 12 %f 22 24 8 10 15.165 19.945 24.725 29.505 34.285 39.065 S SAD 17,555 22,335 27,115 31,895 36,675
Den Daha Az Sıklıkları Bulma 1 2 3 4 5 6 Sınıf A.S. Ü.S. 12.78 17.56 17.55 22.33 22.34 27.11 27.12 31.89 31.90 36.67 36.68 41.45 f 11 12 %f 22 24 8 15.165 19.945 24.725 29.505 34.285 39.065 S SAD 17,555 22,335 27,115 31,895 36,675 DDAS 11 23 35 39 45
Den Daha Az Göreli Sıklıkları Bulma 1 2 3 4 5 6 Sınıf A.S. Ü.S. 17.55 22.33 22.34 27.11 27.12 31.89 31.90 36.67 36.68 41.45 f 11 12 %f 22 24 8 10 15.165 19.945 24.725 29.505 34.285 39.065 S SAD 17,555 22,335 27,115 31,895 36,675 DDAS 23 35 39 45 12.78 17.56 DDAGS(%) 22 46 70 78 90
Sınıflandırılmış Verilerde Yüzdeliklerin hesaplanması P : Belirlenen yığılımlı yüzde n : Toplam gözlem sayısı L: Belirlenen yığılımlı yüzdenin içinde bulunduğu aralıktan öncekinin sınıf ara değeri y : Belirlenen yığılımlı yüzdenin içinde bulunduğu aralıktan önceki sınıfın “den daha az” değeri f: Belirlenen yığılımlı yüzdenin içinde bulunduğu sınıfın sıklığı c : Sınıf Aralığı
Sınıflandırılmış Verilerde Yüzdeliklerin hesaplanması Sınıflandırılmış Verilerde %25(Birinci Çeyreklik) Hesaplanması P = 0.25 n = 50 c = 4,78 1 2 3 4 5 6 Sınıf A.S. Ü.S. 12.78 17.56 17.55 22.33 22.34 27.11 27.12 31.89 31.90 36.67 36.68 41.45 f 11 12 SAD 17,555 22,335 27,115 31,895 36,675 DDAS 11 23 35 39 45 DDAGS(%) L f 22 46 y P 70 78 90
Sınıflandırılmış Verilerde Yüzdeliklerin hesaplanması Sınıflandırılmış Verilerde %25(Birinci Çeyreklik) Hesaplanması Sınıflandırılmamış veriden hesaplanan %25 = 20.145
Sınıflandırılmış Verilerde Yüzdeliklerin hesaplanması Sınıflandırılmış Verilerde Ortancanın Hesaplanması P = 0.5 n = 50 c = 4,78 1 2 3 4 5 6 Sınıf A.S. Ü.S. 12.78 17.56 17.55 22.33 22.34 27.11 27.12 31.89 31.90 36.67 36.68 41.45 f 11 12 SAD 17,555 22,335 27,115 31,895 36,675 DDAS 11 23 35 39 45 DDAGS(%) L 22 f 46 70 y P 78 90
Sınıflandırılmış Verilerde Yüzdeliklerin hesaplanması Sınıflandırılmış Verilerde Ortancanın Hesaplanması Sınıflandırılmamış veriden hesaplanan ortanca = 22.86