OLASILIK ve İSTATİSTİK BÖLÜM 3 MERKEZİ EĞİLİM ve DAĞILMA ÖLÇÜLERİ Yrd. Doç. Dr. Fatih TOSUNOĞLU
3-Merkezi eğilim ve dağılma ölçüleri Araştırma sonuçlarının açıklanmasında frekans tablosu ve poligonu istenilen bilgiyi her zaman sağlamayabilir. Verilerin merkezileştiği noktanın değeri nedir? Dağılımın değişkenlik durumu ne ölçüdedir? soruların cevaplanabilmesi için dağılımı karakterize eden bazı değerlerin hesaplanması gerekir. Bu amaçla veri grubuna ilişkin yer ve dağılma ölçülerinden yararlanılır.
3-Merkezi eğilim ve dağılma ölçüleri Eğer elimizde mevcutları aynı ve aynı sınava girmiş 2 sınıfa ait not değerleri var ise, bu verileri bir bölünme şeklinde grafik üzerinde gösterdiğimiz zaman birinin diğerinin sağında yer aldığını görebiliriz. B sınıfının A’dan ne kadar daha iyi olduğunu yani A’ya göre nerede bulunduğunu ifade edebilmek için, örneğin her iki sınıfın aritmetik ortalamalarını hesaplayarak bir kıyaslama yapabiliriz. Bir seriyi tek rakamla ifade ve temsil edebilmek amacıyla geliştirilmiş olan merkezi eğilim ölçüleri ANALİTİK OLANLAR ve OLMAYANLAR olarak iki genel gruba ayrılarak incelenebilirler. Analitik olanlar serideki tüm değerleri dikkate alırlar.
3-Merkezi eğilim ve dağılma ölçüleri Merkezi Eğilim Ölçüleri Analitik Analitik Olmayan Aritmetik Ortalama Medyan (Ortanca) Ağırlıklı (Tartılı) Ortalama Mod (Tepe Değeri) Geometrik Ortalama Harmonik Ortalama
3-Merkezi eğilim ve dağılma ölçüleri A- Aritmetik Ortalama Dağılımın yerinin belirlenmesinde kullanılır. Tek başına ortalama teriminden aritmetik ortalama anlaşılır. Basit aritmetik ortalama herhangi bir konu ile ilgili gözlemlerin toplamının toplam gözlem sayısına bölümü ile bulunur. X1, X2, X3,......, Xn gözlenen örnek değerlerini göstermek üzere aritmetik ortalama:
3-Merkezi eğilim ve dağılma ölçüleri A- Aritmetik Ortalama Aritmetik ortalamanın iki önemli özelliği vardır: Verilerin, aritmetik ortalamadan sapmalarının toplamı sıfıra eşittir. 2. Verilerin, aritmetik ortalamadan sapmalarının kareleri toplamı minimumdur. Herhangi bir değeri a ile gösterirsek ifade aşağıdaki gibi yazılabilir.
3-Merkezi eğilim ve dağılma ölçüleri B- Ağırlıklı Ortalama Bazı durumlarda verilerin aritmetik ortalaması sonuç hakkında pek fazla açıklayıcı bilgi taşımaz. Örneğin farklı krediye sahip dersler almış olan bir öğrencinin başarı ortalaması hesaplanırken aritmetik ortalama ile anlamsız sonuçlar bulunur. Böylesi durumlarda verilerin gözlenen frekansları ile çarpılıp toplanması ve elde edilen değerin toplam frekansa bölünmesi ile bulunan değer kullanılır. Bu işleme ağırlıklı ortalama denir. Xi gözlenen i. veri, Wi i. verinin gözlenen ağırlığı (frekansı) olmak üzere ağırlıklı ortalama:
3-Merkezi eğilim ve dağılma ölçüleri Örnek 1: Bir öğrencinin almış olduğu derslere ilişkin krediler ve notlar aşağıda verilmiştir. Öğrencinin başarı notunu; a) Aritmetik ortalama yöntemiyle hesaplayınız. b) Ağırlıklı ortalama yöntemiyle hesaplayınız. c) Hangi yöntemin sonucu kullanılmalıdır? Neden?
3-Merkezi eğilim ve dağılma ölçüleri Çözüm :
3-Merkezi eğilim ve dağılma ölçüleri C- Geometrik Ortalama Özellikle eşit zaman aralığı ile değişen oranların ortalamasının hesaplanmasında (örneğin, nüfus artışı, faiz gibi olaylarda ortalama artış hızını hesaplayabilmek için) geometrik ortalama kullanılır. Geometrik ortalama: Örnek 2: Akaryakıt fiyatlarında ardışık 3 yıldaki fiyat artışı %15, %20 ve %24 olarak gerçekleşmiştir. Ortalama artış oranını hesaplayınız. Çözüm:
3-Merkezi eğilim ve dağılma ölçüleri D- Harmonik Ortalama Verilerin terslerinin ortalamasının tersi harmonik ortalamayı verir. Oran şeklinde türetilmiş verilerde, oran elde edilirken, d/t, eğer pay (d) sabit payda (t) değişken ise oranların ortalaması harmonik ortalama ile hesaplanır. Bunun tersi durumda ise aritmetik ortalama kullanılır. Örneğin, hız=yol/zaman veya fiyat=para/mal şeklinde ifade edilen olaylarda; zamanın değişken gidilen yolun sabit, alınan mal miktarının değişken paranın sabit olması halinde harmonik ortalama kullanılır.
3-Merkezi eğilim ve dağılma ölçüleri Örnek 3: Bir sürücü 200 km’lik yolu 2 saatte gitmiş ve 4 saatte dönmüştür. Bu yolculukta sürücünün ortalama hızını hesaplayınız. Çözüm 3: Hız=yol/zaman Gidiş hızı=200/2=100km/s Dönüş hızı=200/4=50km/s Üç ortalama arasında: ilişkisi vardır. Bütün değerlerin aynı olması halinde ilişki eşitlik halinde gerçekleşir.
3-Merkezi eğilim ve dağılma ölçüleri Analitik Olmayan A-Medyan (Ortanca) Verilerin küçükten büyüğe veya büyükten küçüğe sıralanması halinde ortaya düşen değer (veri sayısı tek ise) veya ortaya düşen iki değer çiftinin ortalaması (veri sayısı çift ise) medyan olarak adlandırılır. n veri sayısını göstermek üzere; Gruplandırılmış verilerde (frekans tablosunda) medyan hesabı: L: Medyan sınıfının alt sınırı N: Toplam gözlem sayısı c: Sınıf aralığı (genişliği) Fmed: Medyan sınıfının frekansı Fb: Medyan sınıfından önceki sınıfların frekans toplamı
3-Merkezi eğilim ve dağılma ölçüleri Medyanın Avantajları Hesaplanması kolaydır Uç değerlerden çok az etkilenir Medyanın dezAvantajları Analitik özelliğe sahip değildir, Standart sapması ortalamanın standart sapmasından büyüktür Büyük veri setlerinden bilgisayar kullanmadan hesaplanması zordur.
3-Merkezi eğilim ve dağılma ölçüleri B-Mod (Tepe Değeri) Verilerin içinde en çok tekrarlanan (frekansı en büyük olan) değer mod olarak adlandırılır. Gruplandırılmış verilerde (frekans tablosunda) mod hesabı aşağıdaki formül yardımıyla yapılmaktadır. L: Mod sınıfının alt sınırı d1: Mod sınıfı frekansı ile bir önceki sınıf frekansı arasındaki fark d2: Mod sınıfı frekansı ile bir sonraki sınıfın frekansı arasındaki fark c: Sınıf aralığı (genişliği) Frekansı en yüksek olduğu sınıf mod sınıfı olarak adlandırılır. Mod değerinin anlamlı olabilmesi için gözlem sayısının çok fazla olması gerekir. Bazen veri gurubunun birden fazla modu olabilir. Bu durum, ilgili anakütlenin birkaç alt gruptan meydan geldiğini gösterir. mod veri grubundaki uç değerlerden etkilenmez.
3-Merkezi eğilim ve dağılma ölçüleri Örnek 4: Aşağıdaki verilerin modunu ve medyanını belirleyiniz. 120 100 130 100 160 130 86 100 94 90 Çözüm 3: Verileri küçükten büyüğe sıralayalım.
3-Merkezi eğilim ve dağılma ölçüleri Örnek 5: Aşağıdaki veri serisinde Medyan ve Modu belirleyiniz 7 9 8 6 5 6 7 8 5 6 6 10 4 13 4 12
3-Merkezi eğilim ve dağılma ölçüleri Örnek 6: Aşağıdaki sınıflandırılmış verilerde Medyan ve Modu hesaplayınız? Sınıf Sınıf Limitleri Sınıf Sınırları Sınıf Değeri Frekans Eklenik Frekans 1 2-4 1.5-4.5 3 8 2 5-7 4.5-7.5 6 18 26 8-10 7.5-10.5 9 12 38 4 11-13 10.5-13.5 40
3-Merkezi eğilim ve dağılma ölçüleri Örnek 7: Aşağıdaki tabloda bir yöredeki 108 ailenin aylık gelirlerine göre bölünmesi yer almaktadır? Medyan geliri hesaplayınız. Gelir (10 milyon tl) Frekans 20-60’dan az 17 60-100’den az 28 100-140’den az 26 140-180’den az 18 180-220’den az 7 220-260’den az 10 260-300’den az 2
3-Merkezi eğilim ve dağılma ölçüleri Dağılım (dağılma) ölçüleri Yer (merkezi eğilim) ölçüleri tek başına dağılımı karakterize etmez. Verilerin yer ölçülerinden uzaklık durumlarını, yani değişkenliklerini belirtmek için diğer bazı ölçülerin kullanılması gerekir. Verilerin değişkenlik durumunu ve dağılım şeklini belirlemek için kullanılan ölçülere dağılım ölçüleri denir. İki veri grubu ortalamasının eşit olması dağılımlarının aynı olmasını gerektirmez. Dağılım şeklinin ve değişkenliğinin karşılaştırılması dağılım ölçüleri ile belirlenir. Dağılım (Değişim) Ölçüleri Değişim Genişliği Varyans Standart Sapma Varyasyon Katsayısı
3-Merkezi eğilim ve dağılma ölçüleri A-Değişim Genişliği Değişkenliğin en basit ölçüsüdür. B-Varyans Verilerin ortalamasından sapmalarının büyüklüğü dağılımın değişkenliğini gösteren iyi bir ölçüdür. Yaygın olarak kullanılan bu değişkenlik ölçüsü varyanstır.
3-Merkezi eğilim ve dağılma ölçüleri Varyansın büyüklüğü veri grubundaki değişkenliğin fazlalığını ve veri grubunun dağılımının yayvanlığını gösterir. Varyans, değişim genişliğinden daha hassas bir ölçüdür. Öte yandan, varyansın birimi olmadığından bazı durumlarda verilerin elde edildiği birime sahip bir ölçü kullanılması daha uygun olmaktadır. Böyle bir ölçü varyansın karekökü olan standart sapmadır.
3-Merkezi eğilim ve dağılma ölçüleri C-Standart Sapma Dağılım ölçüsünü fiziksel anlamı olan bir büyüklük şeklinde ifade etmek için varyansın karekökü alınır ve buna standart sapma denir. Örnek standart sapmasının ve varyansının paydasında bulunan n-1 ifadesi serbestlik derecesi olarak adlandırılır.
3-Merkezi eğilim ve dağılma ölçüleri D-Varyasyon Katsayısı Verilerin değişkenliğini kendi ortalamalarına oranla ifade etmek için kullanılan bir ölçüdür. Değişim Katsayısı olarak da adlandırılır. Ortalamaları birbirinden farklı olan anakütlelerin değişkenliklerinin karşılaştırılmasında değişim katsayısı ölçüsü kullanılmalıdır. Değişim katsayısının büyüklüğü arttıkça istenilen değerden uzaklaşıldığı söylenebilir
3-Merkezi eğilim ve dağılma ölçüleri Örnek 6: Bir üretim hattından kg olarak alınan ağırlık ölçümleri 35 40 45 30 40 50 35 38 42 44 olarak belirlendiğine göre verilerin değişim genişliğini, varyansını, standart sapmasını ve değişim katsayısını hesaplayınız.
3-Merkezi eğilim ve dağılma ölçüleri Çözüm 6:
3-Merkezi eğilim ve dağılma ölçüleri Örnek 7: Üniversite bahçesindeki 200 çam ağacının yıllık büyüme boyları (cm) aşağıdaki tabloda özetlenmiştir. Verilerin, mod, medyan, ortalama, varyans, standart sapma, varyasyon katsayısı ve verilerinin çarpıklığını belirleyiniz? Sınıf Değeri 10 15 20 25 30 35 Frekans 40 50 80 6 4
3-Merkezi eğilim ve dağılma ölçüleri Çarpıklık ve Basıklık Ölçüleri A-Çarpıklık (Skewness) Normal dağılımda simetrikliğin bozulma derecesi çarpıklık olarak ifade edilir. Dağılım sağa doğru uzun kuyruklu ise sağa çarpık, sola doğru uzun kuyruklu ise sola çarpık olarak adlandırılır. Çarpıklık katsayısı : Hesap sonunda bulunan katsayıya göre dağılımın yorumu aşağıdaki gibi yapılır:
3-Merkezi eğilim ve dağılma ölçüleri B-Basıklık (Kurtosis) Normal dağılım eğrisinin sivrilik ya da basıklık derecesi Hesap sonunda bulunan katsayıya göre dağılımın yorumu aşağıdaki gibi yapılır:
3-Merkezi eğilim ve dağılma ölçüleri Örnek: İnşaat Müh. Bölümü Olasılık ve İstatistik Dersini alan öğrencilerinin kiloları aşağıdaki gibidir? Ortalama, medyan, mod, standart sapma, varyans, carpıklık? 65 82 54 45 59 56 90 77 75 62 60 70 68 76 50 83 61 78 80 85 97
3-Matlab Uygulamaları
3-Matlab Uygulamaları
3-Matlab Uygulamaları
3-Matlab Uygulamaları
3-Matlab Uygulamaları ÇARPIKLIK Yazım Biçimi Açıklama carp=skewness(A) A dizi vektörü veya matris olarak tanımlanan sayıların çarpıklık değerini verir A=[1 5 6 8 10 11 12 14 15 7]; carp=skewness(A);
3-Merkezi Eğilim ve Dağılma Ölçüleri Kaynaklar 1- İstatistik ve Olasılık Ders Notları-Prof. Dr. İrfan KAYMAZ 2-İstatistiğe Giriş- Prof. Dr. Necati YILDIZ 3- İstatistik Analiz Metotları- Prof. Dr. Bilge ALOBA KÖKSAL 4- Mühendisler için İstatistik- Prof. Dr. Mehmetçik BAYAZIT