Sıklık Dağılımları Yrd. Doç. Dr. Emine Cabı
Sıklık Dağılımları (Frequency Distributions) Sıklık dağılımı niçin gerekir? Sıklık dağılımı verilerin bir özeti ve tablosudur Elimizde bulunan verilerin hangi aralıkta olduğunu gösterir Hangi aralıklarda sıklıkların ne kadar olduğu hakkında bize bilgi verir
Sıklık Dağılımının Hazırlanması Sıklık Dağılımları Nitel değişkenlerin verilerinde Nicel değişkenlerin verilerinde Kesikli verilerde Sürekli verilerde
Nicel Sürekli Verilerde Sıklık Çizelgeleri Öncelikle sınıflandırma için bazı tanımlar verilecektir. Bu tanımlar aşağıda verilen problemde gösterilecektir. «Hazine müsteşarlığında çalışan sigara bırakmaya karar verip bir klinikten yardım alan kişilerin bazı bilgileri kaydedilmiştir. Bunlardan biri de bu kişilerin yaşlarıdır. Yaşlar nicel sürekli değişkendir. Diğer sayfada yaşlar ile ilgili rakamlar verilmiştir.»
Yaş ile ilgili veriler 30 34 30 36 34 33 35 34 30 22 32 30 29 26 19 30 40 28 37 32 29 28 31 35 24 34 32 34 36 29 20 28 40 24 29 25 29 26 40 36 25 33 22 27 34 33 35 28 25 37
Dağılım için özel tanımlar Dağılım Sınırları: Bir veri topluluğunda (dağılımda) yer alan en küçük ve en büyük değerlerdir. (Problemimizde 19 – 40) Dağılım Genişliği: Bir veri topluluğunda yer alan en küçük ve en büyük değerler arasındaki farktır. (Problemde 40-19=21) Sınıf: Eşit ya da birbirine yakın değerli verilerin oluşturduğu gruptur. Bu gruplar birbirinden ayrık kümeler oluşturur.
Sınıf Sayısı: Problemde k=1+3,3 log50=6,6 Eşit ya da birbirine yakın değerli verilerin oluşturduğu ayrık kümelerin sayısıdır. Sınıf sayısı “k” ile gösterilir. Bu sayının 7 ile 20 arasında olması tercih edilir. Dağılımdaki veri sayısı çok olduğunda, sınıf sayısı aşağıda verilen Sturges’in formülü kullanılarak bulunabilir: k=1+3,3 logn Problemde k=1+3,3 log50=6,6 Burada n, eldeki veri kümesindeki gözlem sayısını gösterir. k en yakın tam sayı olarak alınır. Problemde k=7 alınabilir. Eğer en büyük gözlen değeri dışarıda kalır ise sınıf sayısı 1 artırılabilir yani 8 olarak alınabilir.
SPSS Kullanılarak Yapılmış Sınıflama Sınıf Sıklık Göreli sıklık Birikimli Göreli Sıklık (Frequency) (Percent) (Cumulative Percent) 19-21 2 4,0 4,0 22-24 4 8,0 12,0 25-27 6 12,0 24,0 28-30 14 28,0 52,0 31-33 7 14,0 66,0 34-36 12 24,0 90,0 37-39 2 4,0 94,0 40-42 3 6,0 100,0 Toplam 50 100,0
Alt Sınır: Bir sınıfta yer alan en küçük değerdir. Problemde birinci sınıfın alt sınırı 19 olarak alınabilir. Üst Sınır: Bir sınıfta yer alan en büyük değerdir. Problemde birinci sınıfın üst sınırı sınıf aralığından sonra verilecektir. Sınıf Aralığı: Ard arda gelen iki sınıfın alt sınırları ve üst sınırları aralarındaki fark olup, w ya da c ile gösterilir. Sınıf aralıkları eşit ya da farklı olabilir, eşit olduğunda aşağıda verildiği biçimde elde edilir: w=c=(en büyük değer-en küçük değer)/k Problemde; c= (40-19)/7=3 w veya c hesaplama sonucunda bulunan sayı veya daha büyük bir sayı olarak alınır (Aralık katsayısını hesaplama kolaylığı nedeniyle bulunulan değere en yakın tek sayı alınabilir). Bu durumda birinci sınıfın üst sınırı birinci tür sınıflamaya göre 21 olacaktır.
Sınıf Değeri: Bir sınıfın alt ve üst sınırlarının ortalamasıdır ve si ile gösterilir. Problemde birinci sınıf için s1=(19+21)/2=20 olur Sıklık: Bir sınıfta yer alan gözlem sayısıdır ve fi ile gösterilir. Her bir sınıfa düşen sıklıkların toplamı, toplam gözlem sayısına eşittir. Problemde birinci tür sınıflamaya göre birinci sınıfın sıklığı 19 ve 21 dahil bu araya giren gözlem değerlerinin sayısıdır. Burada 2 olacaktır. Burada fi; i. sınıfın sıklığıdır.
Göreli Sıklık: Her bir sınıfa düşen gözlem sayısının toplam gözlem sayısına oranıdır. i. sınıfın göreli sıklığı (pi) yandaki eşitlik ile verilmiştir: Sınıf göreli sıklıkların toplamı 1’e eşittir Problemde birinci sınıfın göreli sıklığı p1=2/50=0,04 olur (Göreli sıklık, puanın toplam içindeki oranıdır ve araştırmacının daha kolay, daha fazla yorum yapmasını sağlar). Birikimli Sıklık: Sınıf sıklıklarının üst üste eklenmesi ile bulunan sıklıklardır. Göreli Birikimli Sıklık: Göreli birikimli sıklıklar, sınıf birikimli sıklıklarının toplam denek sayısına bölünmesiyle elde edilir.
SPSS Kullanılarak Yapılmış Sınıflama Sınıf Sıklık Göreli sıklık Birikimli Göreli Sıklık (Frequency) (Percent) (Cumulative Percent) 19-21 2 4,0 4,0 22-24 4 8,0 12,0 25-27 6 12,0 24,0 28-30 14 28,0 52,0 31-33 7 14,0 66,0 34-36 12 24,0 90,0 37-39 2 4,0 94,0 40-42 3 6,0 100,0 Total 50 100,0
Kesikli Nicel Veriler için Sınıflandırma Kardeş sayısı Sıklıklar 44 1 24 2 38 3 26 4 30 5 22 6 10 7 Toplam 200 Örnek: Başkent Üniversitesi öğrencileri ile yapılan bir araştırmada bireylere çeşitli sorular sorulmuştur. n=200 olarak alınmıştır. “kaç kardeşiniz var?” sorusuna verilen cevapların dağılımı tabloda verilmiştir.
Göreli Sıklıklar Göreli Sıklıklar Kardeş Sayısı Sıklıklar % 44 22 1 24 44 22 1 24 12 2 18 09 3 16 08 4 20 10 5 11 6 26 13 7 30 15 Toplam 200 100
Nitel Verilerde Sıklık Çizelgeleri Nitel veriler sınıflanabilir ve sıralanabilir veriler olarak iki özellik gösteriyordu.
Sınıflanabilir nitel veriler için örnek: Kırsal ve kentsel alanda yaşayan 0-5 yaş arasında çocuğu olan kadınların bebek beslenmesi ile ilgili davranışlarını belirlemek için yapılan araştırmada anketin yerleşim yeri, eğitim, meslek, doğumda yardım eden kişiler ile ilgili sorular sınıflanabilir özelliktedir. Bu değişkenlerden doğumun nerede gerçekleştirildiğine ve yerleşim yerine ilişkin değişkenler için sıklık dağılımını oluşturalım. Doğumunuz nerede gerçekleşti? Sınıflar Sıklıklar Göreli Sıklık Hastane 39 78,0 Sağlik ocağı 3 6,0 Ev 7 14,0 Diğer 1 2,0 Toplam 50 100,0
Sıralanabilir nitel veriler için örnek Bir iş yerinde yapılan memnuniyet derecesi ile ilgili araştırmada n=200 olarak alınmıştır. “Bu araştırmada iş yeri koşullarının yeterliliği konusunda sizin düşüncenizi aşağıdaki cümlelerden hangisi daha iyi açıklıyor” sorusuna yönelik cevapların sınıflaması: Sınıflar Sıklık Göreli Sıklık % Çok yeterli 40 20 Yeterli 95 47,5 Az yeterli 60 30 Yetersiz 5 2,5 Toplam 200 100
Grafikler Sayısal verileri görsel bir şekilde anlatır. Frekans dağılımlarını göstermek için genellikle; sürekli veriler için histogram veya frekans poligonu süreksiz veriler için bar grafik kullanılır. Bunun için yatay (x) ve dikey (y) olmak üzere ki eksenli bir düzlem kullanılır. Genellikle X ekseninde puanlar, Y ekseninde ise frekanslar kullanılır.
Nicel Değişkenlerde Grafikler Histogram grafikleri Poligon grafikleri Dağılış eğrileri
Histogramlar Histogramda sınıf değerleri yatay eksende yer alır. Sıklıklar düşey eksende bulunur. Dikdörtgenlerin yüksekliği o sınıfın sıklığıdır. Dikdörtgenler birbirleri ile yapışıktır.
Histogram ve poligon için bir örnek Sıralanmış veriler: 12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58 58-12=45 45/5=9 As Üs Si fi 10 – 19 15 3 20 – 29 25 6 30 – 39 35 5 40 – 49 45 4 50 – 59 55 2 Bir fazlası alınabilir
Ayrık dikdörtgenler ve çubuk grafikleri Nitel Değişkenlerde Grafikler Pay grafikleri Ayrık dikdörtgenler ve çubuk grafikleri Pareto grafikleri
Pay, Ayrık Dikdörtgenler ve Çubuk Grafikleri Bu grafikler genellikle nitel verilerde kullanılır. Grafiklerde yatay eksen sınıfları, düşey eksen sıklıkları ya da göreli sıklıkları gösterir.
Ayrık Dikdörtgenler
Pareto Grafikleri
Örnek Zaman Serisi Grafiği Yıl Enflasyon oranı 1985 3.56 1986 1.86 1987 3.65 1988 4.14 1989 4.82 1990 5.40 1991 4.21 1992 3.01 1993 2.99 1994 2.56 1995 2.83 1996 2.95 1997 2.29 1998 1.56 1999 2.21 2000 3.36 2001 2.85 2002 1.58