Sıklık Tabloları ve Sıklık Tablolarından Elde Edilen Tanımlayıcı İstatistikler
Sıklık Tablosu Veri dizisinde yer alan değerlerin tekrarlama sayılarını içeren tabloya sıklık tablosu denir. Sıklık Tabloları tek değişken için marjinal tablo olarak adlandırılır. YaşMutlak Sıklık Göreli Sıklık(%)
Neden Sınıflandırma? Sayısal verilerde merkezi eğilim, konum ölçüleri ve yaygınlık ölçüleri, incelenen verinin özelliklerine göre veri dizisini özetlemekte yetersiz kalabilir.
Neden Sınıflandırma? Beden kitle indeksi, şişmanlığın bir ölçüsü olarak kullanılır, çeşitli hastalıklar için de risk faktörüdür. Şişmanlık göreceli bir kavram olduğundan aritmetik ortalama ve standart sapma, beden kitle indeksi verisinin dağılma özelliklerini göstermez. Dağılma özelliklerini görebilmek için verilerin sınıflandırılması ve sıklık tablolarının elde edilmesi gerekir.
<18.5 kg/ kg/ m2m kg/m2m kg/ m2m kg/ m2m2 40 kg/m2m2 + Beden Kitle İndeksiDurum düşük kilolu normal kilolu hafif şişman 1. derecede şişman 2. derecede şişman 3. derecede şişman Neden Sınıflandırma? Dünya Sağlık Örgütü
Verilerin Sınıflandırılması Nitel verilerde sınıflama için bir yöntem ya da kural yoktur. Araştırıcı, kendi hipotezlerine göre verileri sınıflayabilir. Trombolizm tanısı konulmuş kadın hastaların kan grupları dağılımı Kan GrubuSayı% A AB47.3 B814.5 O Toplam
Sayısal verilerde sınıflandırma Tanımlar Sınıf Sayısı: Veri dizisinde oluşturulacak sınıf sayısı (k) Değişim Aralığı: En büyük değer – En küçük değer (R) Sınıf: Bir alt ve üst sınır ile belirlenmiş veri grubu Sınıf Aralığı: Ardışık iki sınıfın alt ya da üst sınırları arasındaki fark (c) Sınıf Sınırları: Bir sınıfta yer alabilecek en küçük ve en büyük değerleri gösterir. A.S. (Alt Sınır) ve Ü.S. (Üst Sınır) Sınıf Değeri: Bir sınıfın alt ve üst sınırlarının ortalamasıdır. (s) Sınıf Sıklığı: Sınıftaki değer sayısını gösterir. (f) Sınıf Göreli Sıklığı(%): Sınıfın sıklığının toplam değer sayısı (n) içindeki payını gösterir. (%f) Verilerin Sınıflandırılması
Sınıflandırmada Aşamalar 2. Sınıf sayısı ya da sınıf aralığı belirleme 3. A.S. ve Ü.S. ların belirlenerek sınıfların oluşturulması 4. Sınıf mutlak sıklıklarının belirlenmesi 5. Göreli sınıf sıklıklarının hesaplanması Verilerin Sınıflandırılması 1. Verileri küçükten büyüğe sıralama
Sıklık tablosu oluştururken dikkat edilmesi gereken iki kural, 1.Her bir sınıf aynı genişlikte olmalıdır. (bazı özel durumlar dışında) 2.Veri setindeki değerler sadece bir sınıfa ait olmalıdır. Verilerin Sınıflandırılması
Örnek 1: 50 Yetişkinin Beden Kitle İndeksi Değerleri
Verilerin Sınıflandırılması 1. Sınıf sayısı belirleme Daha önceki bilgilerimize göre BKI için 6 sınıf ilk bakışta uygun görülmektedir. R = = c = / 6 = (Sınıf aralığı) 2. A.S. Ve Ü.S. ların belirlenmesi İlk sınıfın alt sınırı En Küçük değer (12.78) dir. Sonraki sınıfın alt sınırı = 17.56
Sınıf A.S. Ü.S Sınıfların Belirlenmesi 50 Yetişkine İlişkin Beden Kitle İndeksi Dağılımı
Sınıf A.S. Ü.S f f Sınıfların Mutlak Sıklıklarını Bulma
Sınıf A.S. Ü.S f f 11 Sınıfların Mutlak Sıklıklarını Bulma
Sınıf A.S. Ü.S f f Sınıfların Mutlak Sıklıklarını Bulma
Sınıf A.S. Ü.S f f Sınıfların Mutlak Sıklıklarını Bulma
Sınıf A.S. Ü.S f f Sınıfların Mutlak Sıklıklarını Bulma
Sınıf A.S. Ü.S f f Sınıfların Mutlak Sıklıklarını Bulma
50 Yetişkinin Beden Kitle İndeksi Değerleri Sınıfların Mutlak Sıklıklarını Bulma
Sınıf A.S. Ü.S f f Sınıfların Mutlak Sıklıklarını Bulma
Sınıf A.S. Ü.S f f %f Sınıfların Mutlak Sıklıklarını Bulma
SınıfA.S. Ü.S f %f Sınıf Değeri Bulma S
Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama Aritmetik Ortalamanın Hesaplanması
Sınıf A.S. Ü.S f f %f s s 166, ,815 f s f s 239, , , , , , , , , , ,91 Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama
Sınıflandırılmamış veriden hesaplanan a. ortalama = 24,893
Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama Standart Sapmanın Hesaplanması
Sınıf A.S. Ü.S f f %f s s 166,815 f s 239, , , , , ,91 Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama 2529,67 f s 2 229,97 s2s2 s2s2 4773, , , , ,35 397,80 611,32 870, , , ,68
Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama Standart Sapmanın Hesaplanması Sınıflandırılmamış veriden hesaplanan s.sapma= 7,61
Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama Tepe Değerinin Hesaplanması Sınıflandırılmış verilerde tepe değeri, en fazla frekansa sahip olan sınıfın sınıf değeridir. (tek tepeli dağılım) Bir dağılımda veriler iki sınıfta yoğunlaşıyorsa bu dağılama ise iki tepeli dağılım denir. İkiden fazla sınıfta yoğunlaşıyor ise çok tepeli dağılım denir. Beden kitle indeksi örneğinde veriler iki sınıfta yoğunlaşmaktadır.( 2. ve 3. sınıf) Dolayısıyla tepe değeri iki sınıfın sınıf değeridir. ( ve )
Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama Bu yöntemde sınıflara hesaplama kolaylığı sağlayacak biçimde yapay sınıf değerleri atanır. Yapay sınıf değerleri atanırken hesaplama kolaylığı sağlanabilmesi için sınıf sıklığı en büyük olan sınıfın yapay sınıf değeri sıfır alınır. Yapay sınıf kolonu sıklık tablolarında b ile gösterilir. Sıfırdan üste doğru bir azaltılarak alta doğru bir artırılarak b sütunu oluşturulur. Yapay Sınıf Değerleri İle Aritmetik Ortalamanın Hesaplanması
Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama f f Sınıf A.S. Ü.S S S b b A
Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama A: b sütununda 0(sıfır) konulan sınıfın karşısındaki sınıf değeri
Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama f f Sınıf A.S. Ü.S S S b b f b -3
Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama
Standart Sapmanın Hesaplanması
Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama Standart Sapmanın Hesaplanması f f Sınıf A.S. Ü.S b b f b b2b2 b2b f b 2
Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama Standart Sapmanın Hesaplanması