Sunum yükleniyor. Lütfen bekleyiniz

Sunum yükleniyor. Lütfen bekleyiniz

Tanımlayıcı İstatistikler

Benzer bir sunumlar


... konulu sunumlar: "Tanımlayıcı İstatistikler"— Sunum transkripti:

1 Tanımlayıcı İstatistikler

2 Tanımlayıcı İstatistikler
Yer gösteren ölçüler Merkezi eğilim ölçüleri Konum ölçüleri Yaygınlık ölçüleri Bir dağılımı tanımlayabilmek için çeşitli ölçüler vardır. Bu ölçüler yer gösteren ölçüler ve yaygınlık ölçüleridir.

3 Merkezi eğilim ölçüleri
Yer gösteren ölçüler Konum ölçüleri Çeyreklik Yüzdelik Merkezi eğilim ölçüleri (Ortalama ölçüleri) Aritmetik ortalama Ortanca Tepe Değeri Oran Geometrik ortalama Harmonik ortalama

4 Yer Gösteren Ölçüler Merkezi eğilim ölçüleri ve konum ölçüleri olmak üzere ikiye ayrılır. Merkezi eğilim ölçüleri bir verinin merkezi diğer bir ifade ile hangi nokta etrafında dağıldığı hakkında bilgi verir. Konum ölçüleri ise bir verideki herhangi bir değerin verinin neresinde yer aldığı hakkında bilgi verir.

5 Aritmetik Ortalama Veri setindeki tüm değerlerin toplanması ve bu toplamın veri sayısına bölünmesiyle elde edilir. Örnek: 7 kişinin yaşları 6, 8, 7, 8, 5, 9, 27 olsun. Buna göre yaş ortalaması:

6 Aritmetik Ortalama Aritmetik ortalama veri setindeki tüm değerleri dikkate alır. Bu nedenle çok büyük yada çok küçük değerlerden etkilenir. Bu dağılımda 27 yaş aşırı bir değerdir ve aritmetik ortalamanın yüksek çıkmasına neden olur. Tek tepeli, simetrik verilerde kullanılması uygundur.

7 Ortanca Verileri küçükten büyüğe doğru sıraladıktan sonra tam ortadaki değerdir. Ortanca dağılımın orta noktası hakkında bilgi verir. Aşırı değerlerden etkilenmez sadece veri setinin ortasındaki değeri göz önüne alır. Dağılımda aşırı değerlerin bulunduğu durumlarda veya dağılım simetrik olmadığı durumlarda ortalama ölçüsü olarak ortancanın kullanılması daha doğrudur.

8 Ortanca Örnek: 7 kişinin yaşları 6, 8, 7, 8, 5, 9, 27 olsun. Buna göre yaş ortancası: 5 – 6 – 7 – 8 – 8 – 9 – 27 Ortancadan küçük veri sayısı büyük veri sayısına eşit

9 Ortanca Örnek: (Veri sayısı çift olsun) 8 kişinin yaşları 6, 8, 7, 8, 5, 9, 15, 27 olsun. Buna göre yaş ortancası: 5 – 6 – 7 – 8 – 8 – 9 – 15 – 27 !!! Bu değer veride yok !!!

10 Tepe Değeri Tepe değeri bir dağılımda en fazla tekrar eden değerdir.
Örnek: 7 kişinin yaşları 6, 8, 7, 8, 5, 9, 27 olsun. Buna göre tepe değer: En fazla (iki defa) tekrar eden 8’dir.

11 Tepe Değeri Her gözlemin tekrar sayısı aynı ise o veri setinde tepe değeri yoktur. En fazla tekrara sahip tek bir değerin olduğu dağılımlara tek tepeli dağılım, en fazla tekrara sahip iki değerin olduğu dağılımlara iki tepeli dağılım denir. Bu durum ikiden fazla değerde ortaya çıkarsa çok tepeli dağılım adını alır. Tepe değeri, aritmetik ortama ve ortancaya göre daha az kullanılan bir ortalama ölçüsüdür.

12 Oran Aritmetik ortalama, ortanca ve tepe değeri sayısal veriler için kullanılan ortalama ölçüleridir. Bu ölçüler yardımıyla kategorik veriler özetlenemez. Kategorik (niteliksel) verileri özetlemek için oran kullanılır. Kategorik verileri karşılaştırmak için de orandan yararlanılır.

13 Oran Örnek: Bir sınıftaki öğrencilerin cinsiyet dağılımı Sayı Yüzde
Kız 45 56.25 Erkek 35 43.75 Toplam 80 100

14 Çeyreklikler Çeyreklikler 1. Çeyreklik 2. Çeyreklik 3. Çeyreklik
Dağılımı 4 eşit parçaya böler Çeyreklikler 1. Çeyreklik Değerlerin %25’i Ç1’e eşit ya da ondan küçüktür. 2. Çeyreklik (Ortanca) Değerlerin %50’si Ç2’ye eşit ya da ondan küçüktür. 3. Çeyreklik Değerlerin %75’i Ç3’e eşit ya da ondan küçüktür.

15 Çeyreklikler Örnek: 8 kişinin yaşları 6, 8, 7, 8, 5, 9, 12, 27 olsun.
Buna göre yaş ortancası yani dağılımın 2. Çeyreği: Çeyreği: 3. Çeyreği: Ç2=(𝑛+1)×0.50 nci değer, Yani: Ç2=9×0.50=4.5 nci değerdir Ç1=(𝑛+1)×0.25 nci değer, Yani: Ç1=9×0.25=2.25 nci değerdir Ç3=(𝑛+1)×0.75 nci değer, Yani: Ç3=9×0.75=6.75 nci değerdir

16 Çeyreklikler Örnek: Yaşlar sıralandığında
5, 6, 7, 8, 8, 9, 12, 27 olur. Ç3=9×0.75=6.75 Ç1=9×0.25=2.25 nci değer, Yani: 11.25 nci değer, Yani 6.25 Ç2=9×0.50=4.5 nci değer, Yani: 8

17 Yüzdelikler Dağılımı 100 eşit parçaya böler.
25. yüzdelik Ç1’e, 50. yüzdelik Ç2’ye (Ortanca) ve 75. yüzdelik Ç3’e eşittir. Yığılımlı sıklığı gösterir. Örneğin verileri küçükten büyüğe doğru sıraladıktan sonra ilk %10’u 10. yüzdeliğe eşit yada ondan küçüktür. 𝑌10=(𝑛+1)×0.10 𝑌20=(𝑛+1)×0.20 𝑌80=(𝑛+1)×0.80

18 Çeyreklikler Örnek: Yaşlar sıralandığında 20. yüzdelik
5, 6, 7, 8, 8, 9, 12, 27 olur. 𝑌20=9×0.20 = 1.8 nci değer, Yani 5.8

19 Çeyrekler arası genişlik
Yaygınlık Ölçüleri Yaygınlık ölçüleri Dağılım aralığı Standart Sapma Varyans Çeyrekler arası genişlik Çeyrek sapma Değişim Katsayısı Bir dağılımdaki verilerin, merkezine yada birbirine göre ne kadarlık bir değişim gösterdiğini belirtir.

20 Her iki dağılımında ortalama, ortanca ve tepe değeri aynıdır.
Örnek: Her iki dağılımında ortalama, ortanca ve tepe değeri aynıdır. Ancak dağılım 1’deki değerlerin aritmetik ortalamaya olan uzaklığı dağılım 2’ye göre daha fazladır. Dağılım 1, dağılım 2’ye göre daha yaygındır. Dağılım 1 7 2 16 3 Dağılım 2 4 8 6 10

21 Dağılım Aralığı Dağılım aralığı en basit yaygınlık ölçüsüdür.
En büyük değerin en küçük değerden çıkarılması ile bulunur. Sadece en uçtaki iki değerle ilgilenir, diğer değerleri dikkate almaz. Bu nedenle aşırı değerlerden etkilenir. Yalnızca 2 gözleme ilişkin değer dikkate alındığı için kaba bir yaygınlık ölçüsüdür.

22 Dağılım Aralığı Gözlemlerin çoğunun en büyük yada en küçük değere yakın olduğu durumlarda gerçek değişkenlik hakkında bilgi vermez. Biraz önceki örnek için, 1. dağılım 2. dağılıma göre daha yaygındır

23 Standart Sapma Bir dağılımın yaygınlığını gösteren en önemli yaygınlık ölçülerinden biridir. Verideki tüm değerlerin aritmetik ortalamaya olan uzaklıklarının ortalama bir göstergesidir. Standart sapma hesaplanırken verideki tüm değerler dikkate alınır.

24 Standart Sapma Dağılımın yaygınlığı arttıkça standart sapma büyür.
Dağılımdaki değerler aynı ise yaygınlık yoktur ve standart sapma sıfırdır. Standart sapma, tek tepeli ve simetrik dağılımlarda kullanılan bir yaygınlık ölçüsüdür. Veriyi özetlerken ortalama ölçüsü olarak aritmetik ortalama kullanıldığında kullanılır. Çarpık dağılımlarda kullanılması önerilmez.

25 Örnek: Dağılım 1 𝑥 𝑖 ( 𝑥 𝑖 − 𝑥 ) ( 𝑥 𝑖 − 𝑥 ) 2 7 2 -5 25 16 9 81 3 -4
2 -5 25 16 9 81 3 -4 122 Dağılım 2 𝑥 𝑖 ( 𝑥 𝑖 − 𝑥 ) ( 𝑥 𝑖 − 𝑥 ) 2 4 -3 9 8 1 7 6 -1 10 3 20

26 Varyans Aritmetik ortalamaya olan uzaklıkların karesinin ortalamasına varyans denir. Standart sapmanın karesine eşittir. Varyansın birimi karesel olduğu için yaygınlık ölçüsü olarak veriyi tanımlamada kullanılmaz.

27 Örnek: Dağılım 1 𝑥 𝑖 ( 𝑥 𝑖 − 𝑥 ) ( 𝑥 𝑖 − 𝑥 ) 2 7 2 -5 25 16 9 81 3 -4
2 -5 25 16 9 81 3 -4 122 Dağılım 2 𝑥 𝑖 ( 𝑥 𝑖 − 𝑥 ) ( 𝑥 𝑖 − 𝑥 ) 2 4 -3 9 8 1 7 6 -1 10 3 20

28 Çeyrekler Arası Genişlik
Eğer verinin yapısı çarpıksa ve ortalama ölçüsü olarak ortanca kullanılıyorsa yaygınlık ölçüsü olarak çeyrekler arası genişlik kullanılır. Üçüncü çeyreklikten birinci çeyrekliğin çıkarılması ile bulunur. Dağılımdaki verilerin ortadaki 0.50’ sinin yer aldığı aralığı belirlemek için kullanılır.

29 Çeyrekler Arası Genişlik
Özellikle uçtaki değerlerden çok ortadaki değerlerle ilgilenildiği durumlarda kullanılır. Çeyreklikler arası genişlik aşırı uç değerlerden etkilenmez. Çünkü çeyreklikler arası genişlik dağılımdaki değerlerin merkezdeki %50’si ile ilgilenir. Eğer incelenen dağılım simetrikse 25. ve 75. yüzdelikler ortancadan eşit uzaklıktadır.

30 Çeyrek Sapma Bu değer çeyrekliklerle ortanca arasındaki uzaklığın ortalama bir ölçüsüdür. Çeyrek sapma, ortalama ölçüsü olarak ortancanın kullanıldığı durumlarda kullanılan yaygınlık ölçülerinden biridir. Özellikle aşırı değerlerin, dağılımın sadece bir tarafında olduğu durumlarda kullanılması gerekir.

31 Değişim Katsayısı Standart sapma, bir dağılımın yaygınlığını gösteren ölçülerden birisidir ve aritmetik ortalama büyüdükçe standart sapmanın büyüme eğilimi vardır. Ancak sadece standart sapmaya bakarak bir dağılımın yaygınlığı konusunda karar vermek her zaman doğru olmayacaktır.

32 Değişim Katsayısı İki ya da daha fazla dağılımın yaygınlığını karşılaştırmak istediğimizde standart sapmayı doğrudan kullanamayız. Değişim katsayısı dağılımdaki değerlerin ortalamaya göre yüzde kaçlık bir değişim gösterdiğini belirtir. Değişim katsayısı yüzde cinsinden ifade edilir ve 0 ile 100 arasında değişir. Değişim Katsayısının sıfıra yaklaşması dağılımın yaygınlığının azaldığını gösterirken, DK’nın %25’in üzerinde olması incelenen dağılımın oldukça yaygın olduğunu gösterir.

33 Örnek: Dağılım 1’deki değerler ortalamaya göre %70,6’lık bir değişim gösterirken, dağılım 2’deki değerler %28,57’lik bir değişim göstermektedir. Dağılım 1 Dağılım 2 𝐷𝐾= 4,94 7 𝑥100=70.57 𝐷𝐾= 2 7 𝑥100=28.57

34 Örnek: Her iki dağılımın standart sapması farklı iken değişim katsayıları aynıdır. Boy Uzunlukları (cm) Boy Uzunlukları (m) 160 1.60 180 1.80 165 1.65 174 1.74 190 1.90 182 1.82 155 1.55 Ortalama 171,38 1,7138 SS 12,07 0,1207 𝐷𝐾= 12,07 171,38 𝑥100=0,07 𝐷𝐾= 0,1207 1,7138 𝑥100=0,07


"Tanımlayıcı İstatistikler" indir ppt

Benzer bir sunumlar


Google Reklamları