Sunum yükleniyor. Lütfen bekleyiniz

Sunum yükleniyor. Lütfen bekleyiniz

Tanımlayıcı İstatistikler

Benzer bir sunumlar


... konulu sunumlar: "Tanımlayıcı İstatistikler"— Sunum transkripti:

1 Tanımlayıcı İstatistikler

2 Tanımlayıcı İstatistikler
Yer Gösteren Ölçüler Yaygınlık Ölçüleri Merkezi Eğilim Ölçüleri Konum Ölçüleri

3 Yer Gösteren Ölçüler Bir dağılımı tanımlayabilmek için çeşitli yer gösteren ölçüler vardır. Bu ölçüler merkez ölçüleri ya da ortalama ölçüleri olabileceği gibi, dağılımdaki herhangi bir noktayı da gösteren ölçüler olabilir.

4 Merkezi Eğilim (Ortalama) Ölçüleri
Aritmetik Ortalama Ortanca Oran Tepe Değeri Konum Ölçüleri Yüzdelikler Çeyrekler

5 Buna göre yaş ortalaması
Aritmetik Ortalama Aritmetik ortalama, veri setindeki tüm değerlerin toplanması ve bu toplamın veri sayısına bölünmesiyle elde edilir. Örnek 2: 9 kişinin yaşları 12, 13, 11, 12, 14, 29, 12, 13, 11 olsun. Buna göre yaş ortalaması

6 Aritmetik ortalama dağılımdaki tüm değerleri dikkate alır
Aritmetik ortalama dağılımdaki tüm değerleri dikkate alır. Ancak dağılımdaki aşırı değerlerden etkilenir. Bu dağılımda 29 yaş aşırı bir değerdir ve ortalamayı etkiler ve aritmetik ortalamanın yüksek çıkmasına neden olur.

7 9 kişinin yaşları küçükten büyüğe doğru sıralandığında
Ortanca Bir veri grubu küçükten büyüğe sıralandığında, terim sayısı tek ise ortadaki sayı, çift ise ortadaki iki sayının toplamının yarısıdır. Örnek 3: 9 kişinin yaşları küçükten büyüğe doğru sıralandığında 11, 11, 12, 12, 12 , 13, 13, 14, 29 Gözlem sayısı tektir. Ortanca =(9+1)/2=5. değer

8 Denek sayısı çift olduğunda
Denek sayısı 10 ve yaşlar aşağıdaki gibi olsaydı 12, 13, 11, 12, 14, 29, 12, 13, 15 11 Yaşlar sıraya dizildiğinde 11 11 12 12 12 13 13 14 15 29 Denek sayısı çift olduğundan Ortanca (n/2)=5. ve (n+2)/2=6. değerlerin 12 13 + ortalamasıdır. Ortanca = = 12.5 2

9 Ortanca, dağılımın orta noktası hakkında bilgi verir
Ortanca, dağılımın orta noktası hakkında bilgi verir. ve aşırı değerlerden etkilenmez. Bu nedenle dağılımda aşırı gözlemlerin bulunduğu durumlarda, ortalama ölçüsü olarak ortancanın kullanılması daha doğrudur.

10 Buna göre en çok tekrarlanan 12 olduğu için tepe değeri 12’dir.
Tepe değeri dağılımda en fazla tekrarlanan değerdir. Örnek 4: 9 kişinin yaşları 12, 13, 11, 12, 14, 29, 12, 13, 11 olsun. Buna göre en çok tekrarlanan 12 olduğu için tepe değeri 12’dir.

11 Her gözlemin tekrar sayısı aynı ise o veri setinde tepe değeri yoktur.
En yüksek sayıya sahip tek bir değerin olduğu dağılımlara tek tepeli dağılım, en yüksek sayıya sahip iki değerin olduğu dağılımlara iki tepeli dağılım denir. Bu durum ikiden fazla değerde ortaya çıkarsa çok tepeli dağılım adını alır. Tepe değeri, aritmetik ortama ve ortancaya göre daha az kullanılan bir ortalama ölçüsüdür.

12 Nitelik veriler çoğunlukla yüzde (oran) ile özetlenirler.
Nitelik veriler; aritmetik ortalama, ortanca, tepe değeri gibi ortalama ölçüleri ile özetlenmez. Nitelik veriler çoğunlukla yüzde (oran) ile özetlenirler.

13 Örnek 5: Cinsiyet Sayı Erkek 50 Kız 70 Toplam 120 41.67 58.33 100
Eczacılık fakültesi birinci sınıf öğrencilerinin cinsiyet dağılımı Cinsiyet Sayı Erkek 50 Kız 70 Toplam 120 Yüzde (Oran) 41.67 58.33 100 Oran farklı bir ortalama ölçüsü olarak algılansa da bir aritmetik ortalamadır.

14 A Okulunda Öğrencilerin Ağırlıklarının Dağılımı
Zayıf Normal Hafif Şişman Şişman Toplam Erkek Sayı 80 225 147 53 505 % 15.8 44.6 29.1 10.5 100.0 Kız Sayı 45 190 52 28 315 % 14.3 60.3 16.5 8.9 100.0

15 Konum Ölçüleri Çeyrekler
Dağılımı 4 eşit parçaya bölen değerlerdir. Bunlar, 2. Çeyrek (Ç2) 3. Çeyrek (Ç3) 1. Çeyrek (Ç1) Değerlerin %25’i Ç1’e eşit ya da ondan küçüktür. Değerlerin %50’si Ç2’ye eşit ya da ondan küçüktür. Bu değer aynı zamanda ortancadır. Değerlerin %75’i Ç3’e eşit ya da ondan küçüktür.

16 Örnek 6: 15 kişinin yaşları aşağıdaki gibidir.
Yüzdelikleri bulurken dağılımdaki değerler küçükten büyüğe sıraya dizilir. Çeyrek (25. Yüzdelik)=0.25x15=3.75. gözlemin değeridir. 1.Çeyrek 3. İle 4. arasında 4.’ değere daha yakındır. Bu durumda Ç1=3.Değer + (4.Değer – 3.Değer)0.75 3. Çeyrek (75. Yüzdelik)=0.75x15= Gözlemin değeridir. 3. Çeyrek 11. Ve 12. Değerler arasındadır. Örneğimizde 11. ve 12. değer aynı olduğundan Ç3=7

17 Yüzdelikler Yüzdelikler sıraya dizilmiş verilerde yığılımlı sıklıkları gösterirler. Örneğin verilerin ilk %30’u 30. Yüzdeliğe (Y30) eşit ya da ondan küçüktür.

18 Örnek 7: 24 adet tablete ilişkin ağırlıklar (mg) aşağıdaki gibidir 1
2850 7 3150 13 3250 19 3700 2 2900 8 3200 14 3400 20 3800 3 2930 9 15 3450 21 3900 4 2980 10 16 3500 22 4100 5 3000 11 17 23 4400 6 3100 12 18 3600 24 4500

19 24 tablet ağırlığına ilişkin 30. Yüzdelik (Y30) bulunmak istenirse,
Sıraya dizilmiş tablet ağırlığı değerlerinde 24 x 0.30 = 7.2 olduğundan Y30, 7. ve 8. değerler arasındadır. 7. gözlem=3150mg gözlem=3200mg 50x0.20=10mg Y30 = =3160mg

20 24 tablet ağırlığına ilişkin 60. Yüzdelik(Y60) bulunmak istenirse,
Sıraya dizilmiş tablet ağırlığı değerlerinde 24 x 0.60 = 14.4 olduğundan Y60, 14. ve 15. değerler arasındadır. 14. gözlem=3400mg gözlem=3450mg 50x0.40=20mg Y60 = =3420mg

21 Yaygınlık Ölçüleri Bir dağılımdaki değerlerin, birbirlerine ya da kendi ortalamalarına göre farklılıklarını gösterir. Bu farklılıkların derecesi dağılımın yaygınlığı kavramını oluşturur. İki dağılım aynı ortalama, ortanca ya da tepe değerine sahipken yaygınlıkları farklı olabilir.

22 Dağılım I, dağılım II’ye göre daha yaygındır.
6 1 15 2 3 7 5 9 Dağılım I’deki değerlerin aritmetik ortalamaya olan uzaklığı dağılım II’ye göre daha fazladır. Dağılım I, dağılım II’ye göre daha yaygındır.

23 Dağılımların yaygınlığı hakkında bilgi veren ve en çok kullanılan ölçüler ;
Dağılım (Değişim) Aralığı Standart Sapma Varyans Çeyreklikler Arası Genişlik Çeyrek Sapma Değişim Katsayısı

24 Dağılım Aralığı Dağılım aralığı en basit yaygınlık ölçüsüdür
Dağılım Aralığı Dağılım aralığı en basit yaygınlık ölçüsüdür. Dağılımdaki en büyük değerden en küçük değerin çıkartılması ile bulunur. R ile gösterilir R= En Büyük Değer-En Küçük Değer

25 Dağılım aralığı dağılımdaki diğer değerlerden oldukça farklı değerler alan aşırı değer(ler)den etkilenir. Dağılımda yalnızca 2 gözleme ilişkin değer dikkate alındığı için kaba bir yaygınlık ölçüsüdür. Gözlemlerin çoğunun en büyük yada en küçük değere yakın olduğu durumlarda da gerçek değişkenlik hakkında bilgi vermez.

26 Standart Sapma Bir dağılımın yaygınlığını gösteren en önemli yaygınlık ölçülerinden biridir. Dağılımdaki tüm değerlerin aritmetik ortalamaya olan uzaklıklarının ortalamasıdır. Dağılımın yaygınlığı arttıkça standart sapma büyür. Dağılımdaki değerler aynı ise yaygınlık yoktur ve standart sapma sıfırdır.

27 Standart Sapma Standart sapma hesaplanırken dağılımdaki tüm değerler dikkate alınır. Standart sapma, aritmetik ortalama kullanıldığında bir yaygınlık ölçüsü olarak kullanılır. Çarpık dağılımlarda kullanılması önerilmez!

28 N : Kitledeki n : Örneklemdeki denek sayısını göstermek üzere
Standart Sapma N : Kitledeki n : Örneklemdeki denek sayısını göstermek üzere Örneklem S. Sapması Kitle S. Sapması

29 Örnek Dağılım I için Standart Sapma
Eşitliğine göre standart sapma hesaplanması 6 -5 25 1 6 15 9 81 6 2 -4 16 122

30 Örnek Dağılım II için Standart Sapma
Eşitliğine göre standart sapma hesaplanması 3 -3 9 1 1 7 6 5 -1 1 6 9 3 9 20

31 Varyans Standart sapmanın karesine varyans denir (s2). Varyansın birimi karesel olduğu için yaygınlık ölçüsü olarak veriyi tanımlamakta pek kullanılmaz.

32 Çeyreklikler Arası Genişlik
Dağılımdaki verilerin ortadaki 0.50 ‘sinin yer aldığı aralığı belirlemek için kullanılır. ÇAG = Ç3 – Ç1 Örnek 6’da Ç1=4.5 ve Ç3=7 bulunmuştu. ÇAG = 7 – 4.5 = 2.5 Değerlerin yarısı 2.5 birimlik bir aralık içindedir.

33 Çeyreklikler arası genişlik aşırı uç değerlerden etkilenmez.
Çünkü çeyreklikler arası genişlik dağılımdaki değerlerin merkezdeki %50’si ile ilgilenir. Özellikle uçtaki değerlerden çok ortadaki değerlerle ilgilenildiği durumlarda kullanılır. Eğer incelenen dağılım simetrikse 25. ve 75. Yüzdelikler ortancadan eşit uzaklıktadır.

34 Çeyrek Sapma Bu değer çeyrekliklerle ortanca arasındaki uzaklığın ortalama bir ölçüsüdür. Çeyrek sapma, ortalama ölçüsü olarak ortancanın kullanıldığı durumlarda kullanılan yaygınlık ölçülerinden biridir. Özellikle aşırı değerlerin, dağılımın sadece bir tarafında olduğu durumlarda kullanılması gerekir.

35 Örnek 8: Örnek 6’da Ç1=4.5 ve Ç3=7 bulunmuştu.
Bu değer, Ç1 ve Ç3’ün ortanca dan ortalama olarak 1.25 birim farklı olduğunu gösterir.

36 Değişim Katsayısı Standart sapma, bir dağılımın yaygınlığını gösteren ölçülerden birisidir. Aritmetik ortalama büyüdükçe standart sapmanın büyüme eğilimi vardır. Standart sapmanın büyüklüğüne bakarak bir dağılımın yaygınlığı konusunda yargıya varmak her zaman doğru değildir. İki ya da daha fazla dağılımın yaygınlığını karşılaştırmak istediğimizde standart sapmayı doğrudan kullanamayız.

37 Dağılımın yaygın olup olmadığına karar verebilmek için değişim katsayısı hesaplanır
Değişim katsayısı dağılımdaki değerlerin ortalamaya göre yüzde kaçlık bir değişim gösterdiğini belirtir.

38 dağılım II’deki değerler %33.3’lük bir değişim göstermektedir.
DK’nın sıfıra yaklaşması dağılımın yaygınlığının azaldığını gösterirken, DK’nın %25’in üzerinde olması incelenen dağılımın oldukça yaygın olduğunu gösterir. Dağılım I Dağılım II Dağılım I’deki değerler ortalamaya göre %82.3’lük bir değişim gösterirken, dağılım II’deki değerler %33.3’lük bir değişim göstermektedir.

39 Örnek 9: 10 bireyin boy ölçüleri cm. ve m. cinsinden aşağıda verilmiştir: 160 1.60 180 1.80 165 1.65 174 1.74 190 1.90 182 1.82 155 1.55 171 1.71 170.2 1.702 11.23 0.1123 6.6 Standart sapmalar farklı olmasına rağmen değişim katsayıları aynıdır. SS DK

40 Verilerin Sınıflandırılması,
Sıklık tabloları ve Sıklık tablolarından elde edilen tanımlayıcı istatistikler

41 Neden Sınıflandırma? Sayısal verilerde merkezi eğilim, konum ölçüleri ve yaygınlık ölçüleri, incelenen verinin özelliklerine göre veri dizisini özetlemekte kimi zaman yetersiz kalabilir.

42 Neden Sınıflandırma? Örneğin, sadece beden kitle indeksinin aritmetik ortalama ve standart sapmasını belirtmek, beden kitle indeksi verisinin dağılma özelliklerini göstermez. Dağılma özelliklerini görebilmek için verilerin sınıflandırılması ve sıklık tablolarının elde edilmesi gerekir.

43 Neden Sınıflandırma?

44 Öğrencilerin şişmanlık durumuna ilişkin sıklık tablosu:
Göreli Sıklık(%) Zayıf 15 21.4 Normal 36 51.4 Kilolu 14 20.0 Obez 5 7.2 Toplam 70 100

45 Neden Sınıflandırma?

46 Sıklık Tablosu Veri dizisinde yer alan değerlerin tekrarlama sayılarını içeren tabloya sıklık tablosu (frekans tablosu) denir. Yaş Sıklık Göreli Sıklık(%) 16 8 17 14 28 18 6 12 19 20 40 2 4 Toplam 50 100 Sıklık Tabloları tek değişken için marjinal tablo olarak adlandırılır.

47 Trombolizm tanısı konulmuş kadın hastaların kan grupları dağılımı
Verilerin Sınıflandırılması Nitel verilerde sınıflama için bir yöntem ya da kural yoktur. Araştırıcı, kendi hipotezlerine göre verileri sınıflayabilir. Trombolizm tanısı konulmuş kadın hastaların kan grupları dağılımı Kan Grubu Sayı % A 32 58.2 AB 4 7.3 B 8 14.5 O 11 20.0 Toplam 55 100.0

48 Sayısal verilerde sınıflandırma
Sayısal verilerde ise sınıflama için dikkat edilmesi gereken çeşitli kurallar bulunur.

49 Verilerin Sınıflandırılması
Sıklık tablosu oluştururken dikkat edilmesi gereken iki kural, Her bir sınıf aynı genişlikte olmalıdır. (bazı özel durumlar dışında) Veri setindeki değerler sadece bir sınıfa ait olmalıdır.

50 Sayısal verilerde sınıflandırma
Verilerin Sınıflandırılması Sayısal verilerde sınıflandırma Tanımlar Değişim Aralığı: En büyük değer – En küçük değer (R) Sınıf Sayısı: Veri dizisinde oluşturulacak sınıf sayısı (k) Sınıf: Bir alt ve üst sınır ile belirlenmiş veri grubu Sınıf Aralığı: Ardışık iki sınıfın alt ya da üst sınırları arasındaki fark (c) Sınıf Sınırları: Bir sınıfta yer alabilecek en küçük ve en büyük değerleri gösterir. A.S. (Alt Sınır) ve Ü.S. (Üst Sınır) Sınıf Değeri: Bir sınıfın alt ve üst sınırlarının ortalamasıdır. (s) Sınıf Sıklığı: Sınıftaki değer sayısını gösterir. (f) Sınıf Göreli Sıklığı(%): Sınıfın sıklığının toplam değer sayısı (n) içindeki payını gösterir. (%f)

51 Verilerin Sınıflandırılması
Sınıflandırmada Aşamalar 1. Verileri küçükten büyüğe sıralama 2. Sınıf sayısı ya da sınıf aralığı belirleme 3. A.S. ve Ü.S. ların belirlenerek sınıfların oluşturulması 4. Sınıf mutlak sıklıklarının belirlenmesi 5. Göreli sınıf sıklıklarının hesaplanması

52 Sıra Ağ. Sıra Ağ. Sıra Ağ. Sıra Ağ. Sıra Ağ.
Örnek: 50 tablete ilişkin tablet sertliğine (Kp) aşağıdaki gibidir: Sıra Ağ. Sıra Ağ. Sıra Ağ. Sıra Ağ. Sıra Ağ.

53 Verilerin Sınıflandırılması
Tablet sertliğini 6 sınıfta sınıflandıralım: 1. A.S. Ve Ü.S. ların belirlenmesi R = = 28.65 c = / 6 = 4.775 4.78 (Sınıf aralığı) İlk sınıfın alt sınırı En Küçük değer (12.78) dir. Sonraki sınıfın alt sınırı = 17.56

54 Sınıfların Belirlenmesi
50 tablete ilişkin tablet sertliği dağılımı için sınıflar: Sınıf A.S. Ü.S. 1 12.78 17.56 2 17.55 3 4 5 6 22.33 22.34 27.11 27.12 31.89 31.90 36.67 36.68 41.45

55 Sınıfların Mutlak Sıklıklarını (frekans) Bulma
A.S. Ü.S. 1 12.78 17.56 2 17.55 3 4 5 6 22.33 22.34 27.11 27.12 31.89 31.90 36.67 36.68 41.45 f 11 12

56 Sınıfların Göreli Sıklıklarını Bulma
A.S. Ü.S. 1 12.78 17.56 2 17.55 3 4 5 6 22.33 22.34 27.11 27.12 31.89 31.90 36.67 36.68 41.45 f 11 12 %f 22 24 24 8 12 10

57 Sınıf Değeri Bulma Sınıf A.S. Ü.S. 1 12.78 17.56 2 17.55 3 4 5 6 22.33
22.34 27.11 27.12 31.89 31.90 36.67 36.68 41.45 f 11 12 %f S 22 15.165 24 19.945 24 24.725 8 29.505 34.285 12 39.065 10

58 Aritmetik Ortalamanın Hesaplanması
Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama Aritmetik Ortalamanın Hesaplanması

59 Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama
15.165 19.945 24.725 29.505 34.285 39.065 Sınıf A.S. Ü.S. 1 12.78 17.56 2 17.55 3 4 5 6 22.33 22.34 27.11 27.12 31.89 31.90 36.67 36.68 41.45 f 11 12 %f 22 24 8 10 s f ×s

60 Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama
Sınıflandırılmamış veriden hesaplanan a. ortalama =

61 Standart Sapmanın Hesaplanması
Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama Standart Sapmanın Hesaplanması

62 Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama
A.S. Ü.S. f s %f f×s s2 f ×s2 1 12.78 17.55 11 22 15.165 229.97 2 17.56 22.33 12 24 19.945 397.80 611.32 870.54 3 22.34 27.11 12 24 24.725 4 27.12 31.89 4 8 29.505 5 31.90 36.67 6 12 34.285 6 36.68 41.45 5 10 39.065

63 Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama
Standart Sapmanın Hesaplanması Sınıflandırılmamış veriden hesaplanan s.sapma= 7.61

64 Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama
Tepe Değerinin Hesaplanması Sınıflandırılmış verilerde tepe değeri, en fazla frekansa sahip olan sınıfın sınıf değeridir. (tek tepeli dağılım) Bir dağılımda veriler iki sınıfta yoğunlaşıyorsa bu dağılama ise iki tepeli dağılım denir. İkiden fazla sınıfta yoğunlaşıyor ise çok tepeli dağılım denir. Tablet sertliği örneğinde veriler iki sınıfta yoğunlaşmaktadır. ( 2. ve 3. sınıf) Dolayısıyla tepe değeri iki sınıfın sınıf değeridir. ( ve )

65 Sınıf Ara Değeri Bulma Sınıf ara değeri, o sınıfın üst sınırı ile bir alttaki (sonraki) sınıfın alt sınırının ortalamasıdır. 1 2 3 4 5 6 Sınıf A.S. Ü.S. 12.78 17.56 17.55 22.33 22.34 27.11 27.12 31.89 31.90 36.67 36.68 41.45 f 11 12 %f 22 24 8 10 15.165 19.945 24.725 29.505 34.285 39.065 S SAD 17.555 22.335 27.115 31.895 36.675

66 Den Daha Az Sıklıkları Bulma
1 2 3 4 5 6 Sınıf A.S. Ü.S. 12.78 17.56 17.55 22.33 22.34 27.11 27.12 31.89 31.90 36.67 36.68 41.45 f 11 12 %f 22 24 8 15.165 19.945 24.725 29.505 34.285 39.065 S SAD 17.555 22.335 27.115 31.895 36.675 DDAS 11 23 35 39 45

67 Den Daha Az Göreli Sıklıkları Bulma
1 2 3 4 5 6 Sınıf A.S. Ü.S. 17.55 22.33 22.34 27.11 27.12 31.89 31.90 36.67 36.68 41.45 f 11 12 %f 22 24 8 10 15.165 19.945 24.725 29.505 34.285 39.065 S SAD 17.555 22.335 27.115 31.895 36.675 DDAS 23 35 39 45 12.78 17.56 DDAGS(%) 22 46 70 78 90

68 Sınıflandırılmış Verilerde Yüzdeliklerin hesaplanması
1 2 3 4 5 6 Sınıf A.S. Ü.S. 17.55 22.33 22.34 27.11 27.12 31.89 31.90 36.67 36.68 41.45 f 11 12 %f 22 24 8 10 15.165 19.945 24.725 29.505 34.285 39.065 S SAD 17.555 22.335 27.115 31.895 36.675 DDAS 23 35 39 45 12.78 17.56 DDAGS (%) 22 46 70 78 90

69 Sınıflandırılmış Verilerde %25(Birinci Çeyreklik) Hesaplanması
Sınıflandırılmış Verilerde Yüzdeliklerin hesaplanması Sınıflandırılmış Verilerde %25(Birinci Çeyreklik) Hesaplanması Sınıflandırılmış veriden hesaplanan %25 = 18.15 Sınıflandırılmamış veriden hesaplanan %25 =

70 Sınıflandırılmış Verilerde %50 (Ortanca) Hesaplanması
Sınıflandırılmış Verilerde Yüzdeliklerin hesaplanması Sınıflandırılmış Verilerde %50 (Ortanca) Hesaplanması Sınıflandırılmamış veriden hesaplanan %50 = 23.13 Sınıflandırılmamış veriden hesaplanan %50 = 22.86


"Tanımlayıcı İstatistikler" indir ppt

Benzer bir sunumlar


Google Reklamları