Sıklık Tabloları ve Tek Değişkenli Grafikler
Sıklık Tabloları Veri dizisinde yer alan değerlerin tekrarlama sayılarını içeren tabloya sıklık tablosu denir. Tek değişken için çizilen sıklık tablolarına marjinal tablo denir. Sayısal verilerde yer gösteren ölçüler ve konum ölçüleri bazı durumlarda veri dizisini özetlemekte yetersiz kalabilir. Bu nedenle tablo ve grafiklerden yararlanılır. Yorumlarken yüzde üzerinden yorum yapılır.
Sıklık Tabloları Grafikler bu tablolara göre oluşturulurlar. Dağılım özelliklerini görebilmek için verilerin sınıflandırılması ve sıklık tablolarının elde edilmesinden yararlanılabilir. Niteliksel değişkenler için sıklık tablosu oluşturulurken çeteleme yapılır. Kan Grubu Sayı Yüzde A 26 52 B 14 28 AB 3 6 O 7 Toplam 50 100
Sıklık Tabloları Niceliksel değişkenler için sıklık tablosu oluşturulurken genellikle birleştirme yapılır. Sayısal değişkenlerde sınıflama yapılırken belli bir kural yoksa (BKI gibi) sınıf aralıkları eşittir. Yaş Sayı Yüzde 0-4 36 18 5-9 24 12 10-14 42 21 15-19 80 40 20-24 9 Toplam 200 100
Sınıflama Sayısal verileri kategorik hale getirmek için yapılır. Araştırıcı sayısal verileri amacına göre belirlediği sayıda sınıfa ayırabilir. Sınıflama yapılırken dikkat edilmesi gereken nokta, Her gözlem bir sınıfta yer almalıdır. Sınıf aralıkları bir birini içermemelidir.
Sınıflama Dağılım Aralığı: En büyük değer – En küçük değer (R) Sınıf Sayısı: Veri dizisinde oluşturulacak sınıf sayısı (k) Sınıf: Bir alt ve üst sınır ile belirlenmiş veri grubu Sınıf Aralığı: Ardışık iki sınıfın alt ya da üst sınırları arasındaki fark (c) Sınıf Sınırları: Bir sınıfta yer alabilecek en küçük ve en büyük değerleri gösterir. A.S. (Alt Sınır) ve Ü.S. (Üst Sınır) Sınıf Değeri: Bir sınıfın alt ve üst sınırlarının ortalamasıdır. (s) Sınıf Sıklığı: Sınıftaki değer sayısını gösterir. (f) Sınıf Göreli Sıklığı(%): Sınıfın sıklığının toplam değer sayısı (n) içindeki payını gösterir. (%f)
Sınıflama Aşamaları Uygun sınıf sayısı belirlenir ve dağılım aralığı hesaplanır. Alt ve üst sınırlar belirlenerek sınıflar oluşturulur. Her bir sınıfın eleman sayısı (mutlak sıklıklar) hesaplanır. Göreli sıklıklar hesaplanır.
Örnek: Sınıf sayısı ve dağılım aralığının hesaplanması Aşağıda 100 kişinin boy uzunluğu verilmiştir. 162 167 170 171 173 174 175 176 178 181 164 168 177 165 179 182 169 172 166 184 185 180 186 Sınıf sayısı ve dağılım aralığının hesaplanması
Alt ve üst sınırların oluşturulması Sınıf sayısı 5 olsun (Araştırıcı belirliyor) Alt ve üst sınırların oluşturulması Gözlem değerleri tam sayı olduğundan sınıf aralığı 5 olarak alınır. Alt Sınır Üst Sınır 162 166.9 167 171.9 172 176.9 177 181.9 182 186.9
Sınıfın eleman sayılarının hesaplanması 162 167 170 171 173 174 175 176 178 181 164 168 177 165 179 182 169 172 166 184 185 180 186 Sınıfın eleman sayılarının hesaplanması Alt Sınır Üst Sınır Mutlak Sıklık 162 166.9 7 167 171.9 27 172 176.9 38 177 181.9 21 182 186.9
Alt Sınır Üst Sınır Mutlak Sıklık Göreli Sıklık % Sınıf Değeri 162 166.9 7 (162+166.9)/2=164.45 167 171.9 27 169.45 172 176.9 38 174.45 177 181.9 21 179.45 182 186.9 184.45 Sınıflandırılmış tablodan ortalama, standart sapma, ortanca, tepe değeri gibi istatistikler hesaplanabilir. Sınıflandırılmış tablolarda hesaplama yapılırken o sınıftaki tüm gözlem değeri sınıf değerini alıyormuş gibi hesaplama yapılır.
Aritmetik ortalama (Ham veriden elde edilen 173.91) A.S. Ü.S. Sıklık (f) Sınıf Değeri (s) f * s 162 166.9 7 164.45 1151.15 167 171.9 27 169.45 4575.15 172 176.9 38 174.45 6629.1 177 181.9 21 179.45 3768.45 182 186.9 184.45 1291.15 Aritmetik ortalama (Ham veriden elde edilen 173.91)
Tablolar Tabloların amacı Elde edilen bulguların yazı metnine başvurmadan, açık kolay anlaşılır bir şekilde okuyucuya sunulmasını sağlamaktır. Bir tablodaki bulguların sunuluş biçimi; Yapılacak analizin amacına, kullanılacak istatistiksel yönteme, araştırıcının okuyucuya göstermek istediği veya okuyucunun dikkatini çekmek istediği konulara göre değişiklik gösterir.
Doğum ağırlığı Sayı (Frekans) Göreli Frekans (%) <2500 gr 14 23.33 Tablo 1. 60 bebeğin doğum ağırlıklarına göre dağılımı Doğum ağırlığı Sayı (Frekans) Göreli Frekans (%) <2500 gr 14 23.33 2500 gr 46 76.67 Toplam 60 100.00 Tablo 2. Yaş Gruplarına Göre Beden Kitle İndeksi Yaş Ortalama Std. Sapma En Küçük Değer En Büyük Değer n 19-24 23.06 2.86 18.37 27.61 15 25-34 24.39 6.40 14.34 35.43 35-44 29.50 8.54 17.89 43.84 14 45-54 25.73 7.97 12.89 40.97 13
Grafikler Grafikler, tablo olarak özetlenen bilgilerin şekillerle ifade edilerek açık, kolay ve anlaşılabilir bir biçimde sunulmasını sağlar. Bir Grafikte İlgilenilen olayı tanımlayacak bir başlık olmalıdır. Grafikte yatay eksen (x ekseni) ve dikey eksen (y eksen) tanımlanmalıdır.
* Daire Dilimleri Grafiği * Ortalama - Standart Sapma Grafiği Grafikler Niteliksel Veri * Çubuk Grafik * Daire Dilimleri Grafiği Niceliksel Veri * Histogram * Çizgi grafiği * Ortalama - Standart Sapma Grafiği * Kutu - Çizgi Grafiği * Dal ve Yaprak Grafiği Grafikler oluşturulurken veri türüne (sayısal – kategorik) ve değişken sayısına göre (tek değişkenli – çok değişkenli) uygun grafik seçilmelidir.
Çubuk (Sütun) Grafiği Yatay eksen sınıfları, dikey eksen sayı (sıklık) yada yüzdeleri belirtir. Çubuklar arasında boşluk vardır ve çubukların genişliği birbirine eşittir.
Daire Dilimleri Grafiği Kan Grubu Sayı Yüzde Açı A 26 52 187.2 B 14 28 100.8 AB 3 6 21.6 O 7 50.4 Toplam 50 100 360 Her bir kategoriye ait açı hesaplanarak çizilir. Her bir daire dilimi yüzde veya açı ile ifade edilir.
Histogram Sürekli sayısal veriler için kullanılır. Çubuk grafiğine benzer ancak histogramda çubuk grafikten farklı olarak çubuklar bir birine bitişik olarak çizilir. Verinin yapısı hakkında bilgi verir. Yatay eksende sınıf değerleri bulunur. Dikey eksende ise sayı yada yüzde bulunur. Bu grafiğin şeklini değiştirmez.
Histogram Simetrik yapı
Çizgi Grafiği İlgilenilen özelliğin zaman içerisindeki değişimini göstermek için kullanılır. Bu grafikte ilgilenilen zaman noktasındaki sıklıkların çizgi ile birleştirilmesi yardımıyla elde edilir.
Ortalama - Standart Sapma Grafiği Ort + Std Sapma 1 Standart sapma Aritmetik Ortalama 1 Standart sapma Ort - Std Sapma Tek tepeli simetrik verilerde kullanılır.
Kutu Çizgi Grafiği Genellikle çarpık dağılımlarda kullanılır. Aşırı yada aykırı olmayan en büyük değer 3. Çeyrek Ortanca ÇAG 1. Çeyrek Aşırı yada aykırı olmayan en küçük değer Genellikle çarpık dağılımlarda kullanılır.
Karşılaştırma Ortalama standart sapma grafiği tek tepeli simetrik dağılımlarda kullanılır. Kutu-çizgi grafiği çarpık dağılımlarda kullanılabilir. Ortalama standart sapma grafiği aşırı değerlerden etkilenirken kutu çizgi grafiği aşırı değerlerden etkilenmez ve aşırı değerleri gösterir. Kutu çizgi grafiği verinin yapısı hakkında bilgi verir; ortalama standart sapma verinin yapısı hakkında bilgi vermez.
Sağa çarpık dağılım Tepe değeri < Ortanca < Ortalama
Sola Çarpık Dağılım Tepe değeri > Ortanca > Ortalama
İki Tepeli Dağılım
İki Tepeli Dağılım
Dal-Yaprak Grafiği Dal Yaprak 4 0 1 3 5 2 4 4 5 6 6 1 2 2 5 6 7 8 9 7 1 1 2 3 3 4 4 4 4 4 5 8 1 3 4 5 6 6 7 8 9 0 1 4 6 7 9 Dal Yaprak 4 0 1 3 5 2 4 4 5 6 6 1 2 2 5 6 7 8 9 7 1 1 2 3 3 4 4 4 4 4 5 8 1 3 4 5 6 6 7 8 9 0 1 4 6 7 9 Aynı anda hem verileri hem de dağılımın yapısını gösterir. Verileri gösterdiği için bu grafik üzerinden ortalama, ortanca, tepe değeri gibi istatistikler hesaplanabilir.