Sunum yükleniyor. Lütfen bekleyiniz

Sunum yükleniyor. Lütfen bekleyiniz

Tanımlayıcı İstatistikler. Yer Gösteren Ölçüler Yaygınlık Ölçüleri Merkezi Eğilim Ölçüleri Konum Ölçüleri.

Benzer bir sunumlar


... konulu sunumlar: "Tanımlayıcı İstatistikler. Yer Gösteren Ölçüler Yaygınlık Ölçüleri Merkezi Eğilim Ölçüleri Konum Ölçüleri."— Sunum transkripti:

1 Tanımlayıcı İstatistikler

2 Yer Gösteren Ölçüler Yaygınlık Ölçüleri Merkezi Eğilim Ölçüleri Konum Ölçüleri

3 Yer Gösteren Ölçüler  Bir dağılımı tanımlayabilmek için çeşitli yer gösteren ölçüler vardır.  Bu ölçüler merkez ölçüleri ya da ortalama ölçüleri olabileceği gibi, dağılımdaki herhangi bir noktayı da gösteren ölçüler olabilir.

4 Merkezi Eğilim (Ortalama) Ölçüleri Aritmetik Ortalama Ortanca Tepe Değeri Tepe Değeri Oran Konum Ölçüleri Çeyrekler Yüzdelikler

5 9 kişinin yaşları 12, 13, 11, 12, 14, 29, 12, 13, 11 olsun. Buna göre yaş ortalaması 9 kişinin yaşları 12, 13, 11, 12, 14, 29, 12, 13, 11 olsun. Buna göre yaş ortalaması Örnek 2: Aritmetik Ortalama  Aritmetik ortalama, veri setindeki tüm değerlerin toplanması ve bu toplamın veri sayısına bölünmesiyle elde edilir.

6  Aritmetik ortalama dağılımdaki tüm değerleri dikkate alır. Ancak dağılımdaki aşırı değerlerden etkilenir. Bu dağılımda 29 yaş aşırı bir değerdir ve ortalamayı etkiler ve aritmetik ortalamanın yüksek çıkmasına neden olur.

7 Örnek 3: 9 kişinin yaşları küçükten büyüğe doğru sıralandığında 11,11,12,12,11,11,12,12,1212, 13, 13,13,14,14,2929 Gözlem sayısı tektir. Ortanca =(9+1)/2=5. değer Ortanca Bir veri grubu küçükten büyüğe sıralandığında, terim sayısı tek ise ortadaki sayı, çift ise ortadaki iki sayının toplamının yarısıdır.

8 Denek sayısı 10 ve yaşlar aşağıdaki gibi olsaydı 12, 13, 11, 12, 14, 29, 12, 13, Yaşlar sıraya dizildiğinde Denek sayısı çift olduğundan (n/2)=5. ve(n+2)/2=6.değerlerin ortalamasıdır. Ortanca Ortanca = = 12.5 Denek sayısı çift olduğunda

9 Bu nedenle dağılımda aşırı gözlemlerin bulunduğu durumlarda, ortalama ölçüsü olarak ortancanın kullanılması daha doğrudur. Ortanca, dağılımın orta noktası hakkında bilgi verir. ve aşırı değerlerden etkilenmez.

10 Tepe Değeri Tepe değeri dağılımda en fazla tekrarlanan değerdir. Örnek 4: 9 kişinin yaşları 12, 13, 11, 12, 14, 29, 12, 13, 11 olsun. Buna göre en çok tekrarlanan 12 olduğu için tepe değeri 12’dir.

11 Her gözlemin tekrar sayısı aynı ise o veri setinde tepe değeri yoktur. En yüksek sayıya sahip tek bir değerin olduğu dağılımlara tek tepeli dağılım, en yüksek sayıya sahip iki değerin olduğu dağılımlara iki tepeli dağılım denir. Bu durum ikiden fazla değerde ortaya çıkarsa çok tepeli dağılım adını alır. Tepe değeri, aritmetik ortama ve ortancaya göre daha az kullanılan bir ortalama ölçüsüdür.

12 Nitelik veriler; aritmetik ortalama, ortanca, tepe değeri gibi ortalama ölçüleri ile özetlenmez. Nitelik veriler çoğunlukla yüzde (oran) ile özetlenirler. Oran

13 Eczacılık fakültesi birinci sınıf öğrencilerinin cinsiyet dağılımı CinsiyetSayı Erkek50 Kız70 Toplam120 Yüzde (Oran) Oran farklı bir ortalama ölçüsü olarak algılansa da bir aritmetik ortalamadır. Örnek 5:

14 A Okulunda Öğrencilerin Ağırlıklarının Dağılımı Zayıf Normal Hafif Şişman Şişman Toplam Kız Sayı Erkek Sayı % %

15 Konum Ölçüleri Çeyrekler Dağılımı 4 eşit parçaya bölen değerlerdir. Bunlar, Değerlerin %25’i Ç1’e eşit ya da ondan küçüktür. Değerlerin %50’si Ç2’ye eşit ya da ondan küçüktür. Bu değer aynı zamanda ortancadır. Değerlerin %75’i Ç3’e eşit ya da ondan küçüktür. 1. Çeyrek (Ç1) 2. Çeyrek (Ç 2 ) 3. Çeyrek (Ç 3 )

16 Örnek 6: 15 kişinin yaşları aşağıdaki gibidir Yüzdelikleri bulurken dağılımdaki değerler küçükten büyüğe sıraya dizilir Çeyrek (25. Yüzdelik)=0.25x15=3.75. gözlemin değeridir. 1.Çeyrek 3. İle 4. arasında 4.’ değere daha yakındır. Bu durumda Ç1=3.Değer + (4.Değer – 3.Değer) Çeyrek 11. Ve 12. Değerler arasındadır. Örneğimizde 11. ve 12. değer aynı olduğundan Ç3=7 3. Çeyrek (75. Yüzdelik)=0.75x15= Gözlemin değeridir.

17 Yüzdelikler Yüzdelikler sıraya dizilmiş verilerde yığılımlı sıklıkları gösterirler. Örneğin verilerin ilk %30’u 30. Yüzdeliğe (Y30) eşit ya da ondan küçüktür.

18 24 adet tablete ilişkin ağırlıklar (mg) aşağıdaki gibidir TabletAğırlıkTabletAğırlıkTabletAğırlıkTabletAğırlık Örnek 7:

19 24 tablet ağırlığına ilişkin 30. Yüzdelik (Y30) bulunmak istenirse, 24 x 0.30 = 7.2 olduğundan Y30, 7. ve 8. değerler arasındadır. Y30 = =3160mg Sıraya dizilmiş tablet ağırlığı değerlerinde 7. gözlem=3150mg 8. gözlem=3200mg 50x0.20=10mg

20 24 tablet ağırlığına ilişkin 60. Yüzdelik(Y60) bulunmak istenirse, 24 x 0.60 = 14.4 olduğundan Y60, 14. ve 15. değerler arasındadır. Y60 = =3420mg Sıraya dizilmiş tablet ağırlığı değerlerinde 14. gözlem=3400mg 15. gözlem=3450mg 50x0.40=20mg

21  Bu farklılıkların derecesi dağılımın yaygınlığı kavramını oluşturur. İki dağılım aynı ortalama, ortanca ya da tepe değerine sahipken yaygınlıkları farklı olabilir. Yaygınlık Ölçüleri  Bir dağılımdaki değerlerin, birbirlerine ya da kendi ortalamalarına göre farklılıklarını gösterir.

22 Dağılım IDağılım II Dağılım I’deki değerlerin aritmetik ortalamaya olan uzaklığı dağılım II’ye göre daha fazladır. Dağılım I, dağılım II’ye göre daha yaygındır.

23  Çeyrek Sapma Dağılımların yaygınlığı hakkında bilgi veren ve en çok kullanılan ölçüler ;  Dağılım (Değişim) Aralığı  Standart Sapma  Varyans  Çeyreklikler Arası Genişlik  Değişim Katsayısı

24 Dağılım Aralığı Dağılım aralığı en basit yaygınlık ölçüsüdür. Dağılımdaki en büyük değerden en küçük değerin çıkartılması ile bulunur. R ile gösterilir R= En Büyük Değer-En Küçük Değer

25  Gözlemlerin çoğunun en büyük yada en küçük değere yakın olduğu durumlarda da gerçek değişkenlik hakkında bilgi vermez.  Dağılım aralığı dağılımdaki diğer değerlerden oldukça farklı değerler alan aşırı değer(ler)den etkilenir.  Dağılımda yalnızca 2 gözleme ilişkin değer dikkate alındığı için kaba bir yaygınlık ölçüsüdür.

26  Dağılımdaki tüm değerlerin aritmetik ortalamaya olan uzaklıklarının ortalamasıdır. Standart Sapma  Bir dağılımın yaygınlığını gösteren en önemli yaygınlık ölçülerinden biridir.  Dağılımın yaygınlığı arttıkça standart sapma büyür.  Dağılımdaki değerler aynı ise yaygınlık yoktur ve standart sapma sıfırdır.

27  Çarpık dağılımlarda kullanılması önerilmez!  Standart sapma hesaplanırken dağılımdaki tüm değerler dikkate alınır.  Standart sapma, aritmetik ortalama kullanıldığında bir yaygınlık ölçüsü olarak kullanılır. Standart Sapma

28 N : Kitledeki n : Örneklemdeki denek sayısını göstermek üzere N : Kitledeki n : Örneklemdeki denek sayısını göstermek üzere Kitle S. Sapması Kitle S. Sapması Örneklem S. Sapması Örneklem S. Sapması

29 Örnek Dağılım I için Standart Sapma Eşitliğine göre standart sapma hesaplanması

30 Örnek Dağılım II için Standart Sapma Eşitliğine göre standart sapma hesaplanması

31 Standart sapmanın karesine varyans denir (s 2 ). Varyansın birimi karesel olduğu için yaygınlık ölçüsü olarak veriyi tanımlamakta pek kullanılmaz. Varyans

32 Dağılımdaki verilerin ortadaki 0.50 ‘sinin yer aldığı aralığı belirlemek için kullanılır. Çeyreklikler Arası Genişlik ÇAG= Ç3 – Ç1 Örnek 6’da Ç1=4.5 ve Ç3=7 bulunmuştu. ÇAG= 7 – 4.5 = 2.5 Değerlerin yarısı 2.5 birimlik bir aralık içindedir.

33  Eğer incelenen dağılım simetrikse 25. ve 75. Yüzdelikler ortancadan eşit uzaklıktadır.  Çeyreklikler arası genişlik aşırı uç değerlerden etkilenmez.  Çünkü çeyreklikler arası genişlik dağılımdaki değerlerin merkezdeki %50’si ile ilgilenir.  Özellikle uçtaki değerlerden çok ortadaki değerlerle ilgilenildiği durumlarda kullanılır.

34 Çeyrek Sapma  Bu değer çeyrekliklerle ortanca arasındaki uzaklığın ortalama bir ölçüsüdür.  Çeyrek sapma, ortalama ölçüsü olarak ortancanın kullanıldığı durumlarda kullanılan yaygınlık kullanıldığı durumlarda kullanılan yaygınlık ölçülerinden biridir. ölçülerinden biridir.  Özellikle aşırı değerlerin, dağılımın sadece bir tarafında olduğu durumlarda kullanılması gerekir.

35 Örnek 8: Örnek 6’da Ç1=4.5 ve Ç3=7 bulunmuştu. Bu değer, Ç1 ve Ç3’ün ortanca dan ortalama olarak 1.25 birim farklı olduğunu gösterir.

36 İki ya da daha fazla dağılımın yaygınlığını karşılaştırmak istediğimizde standart sapmayı doğrudan kullanamayız. Değişim Katsayısı  Standart sapma, bir dağılımın yaygınlığını gösteren ölçülerden birisidir.  Aritmetik ortalama büyüdükçe standart sapmanın büyüme eğilimi vardır.  Standart sapmanın büyüklüğüne bakarak bir dağılımın yaygınlığı konusunda yargıya varmak her zaman doğru değildir.

37 Değişim katsayısı dağılımdaki değerlerin ortalamaya göre yüzde kaçlık bir değişim gösterdiğini belirtir. Dağılımın yaygın olup olmadığına karar verebilmek için değişim katsayısı hesaplanır

38 DK’nın sıfıra yaklaşması dağılımın yaygınlığının azaldığını gösterirken, DK’nın %25’in üzerinde olması incelenen dağılımın oldukça yaygın olduğunu gösterir. Dağılım IDağılım II Dağılım I’deki değerler ortalamaya göre %82.3’lük bir değişim gösterirken, dağılım II’deki değerler %33.3’lük bir değişim göstermektedir.

39 Örnek 9: 10 bireyin boy ölçüleri cm. ve m. cinsinden aşağıda verilmiştir: SS DK Standart sapmalar farklı olmasına rağmen değişim katsayıları aynıdır.

40 Verilerin Sınıflandırılması, Sıklık tabloları ve Sıklık tablolarından elde edilen tanımlayıcı istatistikler

41 Neden Sınıflandırma? Sayısal verilerde merkezi eğilim, konum ölçüleri ve yaygınlık ölçüleri, incelenen verinin özelliklerine göre veri dizisini özetlemekte kimi zaman yetersiz kalabilir.

42 Neden Sınıflandırma?  Örneğin, sadece beden kitle indeksinin aritmetik ortalama ve standart sapmasını belirtmek, beden kitle indeksi verisinin dağılma özelliklerini göstermez.  Dağılma özelliklerini görebilmek için verilerin sınıflandırılması ve sıklık tablolarının elde edilmesi gerekir.

43 Neden Sınıflandırma?

44 Öğrencilerin şişmanlık durumuna ilişkin sıklık tablosu: Şişmanlık durumuSıklıkGöreli Sıklık(%) Zayıf Normal Kilolu Obez57.2 Toplam70100

45 Neden Sınıflandırma?

46 Sıklık Tablosu Veri dizisinde yer alan değerlerin tekrarlama sayılarını içeren tabloya sıklık tablosu (frekans tablosu) denir. Sıklık Tabloları tek değişken için marjinal tablo olarak adlandırılır. YaşSıklıkGöreli Sıklık(%) Toplam50100

47 Verilerin Sınıflandırılması  Nitel verilerde sınıflama için bir yöntem ya da kural yoktur.  Araştırıcı, kendi hipotezlerine göre verileri sınıflayabilir. Trombolizm tanısı konulmuş kadın hastaların kan grupları dağılımı Kan GrubuSayı% A AB47.3 B814.5 O Toplam

48 Sayısal verilerde sınıflandırma  Sayısal verilerde ise sınıflama için dikkat edilmesi gereken çeşitli kurallar bulunur.

49 Sıklık tablosu oluştururken dikkat edilmesi gereken iki kural, 1.Her bir sınıf aynı genişlikte olmalıdır. (bazı özel durumlar dışında) 2.Veri setindeki değerler sadece bir sınıfa ait olmalıdır. Verilerin Sınıflandırılması

50 Sayısal verilerde sınıflandırma Tanımlar Sınıf Sayısı: Veri dizisinde oluşturulacak sınıf sayısı (k) Değişim Aralığı: En büyük değer – En küçük değer (R) Sınıf: Bir alt ve üst sınır ile belirlenmiş veri grubu Sınıf Aralığı: Ardışık iki sınıfın alt ya da üst sınırları arasındaki fark (c) Sınıf Sınırları: Bir sınıfta yer alabilecek en küçük ve en büyük değerleri gösterir. A.S. (Alt Sınır) ve Ü.S. (Üst Sınır) Sınıf Değeri: Bir sınıfın alt ve üst sınırlarının ortalamasıdır. (s) Sınıf Sıklığı: Sınıftaki değer sayısını gösterir. (f) Sınıf Göreli Sıklığı(%): Sınıfın sıklığının toplam değer sayısı (n) içindeki payını gösterir. (%f) Verilerin Sınıflandırılması

51 Sınıflandırmada Aşamalar 2. Sınıf sayısı ya da sınıf aralığı belirleme 3. A.S. ve Ü.S. ların belirlenerek sınıfların oluşturulması 4. Sınıf mutlak sıklıklarının belirlenmesi 5. Göreli sınıf sıklıklarının hesaplanması Verilerin Sınıflandırılması 1. Verileri küçükten büyüğe sıralama

52 Örnek: 50 tablete ilişkin tablet sertliğine (Kp) aşağıdaki gibidir: SıraAğ.Sıra Ağ. Sıra Ağ. Sıra Ağ. Sıra Ağ

53 Verilerin Sınıflandırılması Tablet sertliğini 6 sınıfta sınıflandıralım: R = = c = / 6 = (Sınıf aralığı) 1. A.S. Ve Ü.S. ların belirlenmesi İlk sınıfın alt sınırı En Küçük değer (12.78) dir. Sonraki sınıfın alt sınırı = 17.56

54 Sınıf A.S. Ü.S Sınıfların Belirlenmesi 50 tablete ilişkin tablet sertliği dağılımı için sınıflar:

55 Sınıfların Mutlak Sıklıklarını (frekans) Bulma Sınıf A.S. Ü.S f f

56 Sınıf A.S. Ü.S f f %f Sınıfların Göreli Sıklıklarını Bulma

57 SınıfA.S. Ü.S f %f Sınıf Değeri Bulma S

58 Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama Aritmetik Ortalamanın Hesaplanması

59 Sınıf A.S. Ü.S f f %f s s f ×s Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama

60 Sınıflandırılmamış veriden hesaplanan a. ortalama =

61 Standart Sapmanın Hesaplanması Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama

62 Sınıf A.S. Ü.S f f %f s s f×s Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama f ×s s2s

63 Standart Sapmanın Hesaplanması Sınıflandırılmamış veriden hesaplanan s.sapma= 7.61 Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama

64 Tepe Değerinin Hesaplanması  Sınıflandırılmış verilerde tepe değeri, en fazla frekansa sahip olan sınıfın sınıf değeridir. (tek tepeli dağılım)  Bir dağılımda veriler iki sınıfta yoğunlaşıyorsa bu dağılama ise iki tepeli dağılım denir. İkiden fazla sınıfta yoğunlaşıyor ise çok tepeli dağılım denir.  Tablet sertliği örneğinde veriler iki sınıfta yoğunlaşmaktadır. ( 2. ve 3. sınıf) Dolayısıyla tepe değeri iki sınıfın sınıf değeridir. ( ve ) Sınıflandırılmış Verilerde Tanımlayıcı Ölçüleri Hesaplama

65 Sınıf A.S. Ü.S f f %f S S Sınıf Ara Değeri Bulma SAD Sınıf ara değeri, o sınıfın üst sınırı ile bir alttaki (sonraki) sınıfın alt sınırının ortalamasıdır.

66 Sınıf A.S. Ü.S f f %f S S SAD DDASDDAS Den Daha Az Sıklıkları Bulma

67 Sınıf A.S. Ü.S f f %f S S SAD DDASDDAS Den Daha Az Göreli Sıklıkları Bulma DDAGS (%)

68 Sınıflandırılmış Verilerde Yüzdeliklerin hesaplanması DDAGS (%) DDAGS (%)

69 Sınıflandırılmış Verilerde Yüzdeliklerin hesaplanması Sınıflandırılmış Verilerde %25(Birinci Çeyreklik) Hesaplanması Sınıflandırılmamış veriden hesaplanan %25 = Sınıflandırılmış veriden hesaplanan %25 = 18.15

70 Sınıflandırılmış Verilerde Yüzdeliklerin hesaplanması Sınıflandırılmış Verilerde %50 (Ortanca) Hesaplanması Sınıflandırılmamış veriden hesaplanan %50 = Sınıflandırılmamış veriden hesaplanan %50 = 23.13


"Tanımlayıcı İstatistikler. Yer Gösteren Ölçüler Yaygınlık Ölçüleri Merkezi Eğilim Ölçüleri Konum Ölçüleri." indir ppt

Benzer bir sunumlar


Google Reklamları