MERKEZİ DAĞILIM ÖLÇÜTLERİ Birimlerin hangi değer etrafında toplandığını gösteren eğilim ölçütleri (ortalamalar) çoğu zaman yeterli bilgiyi sağlayamamaktadır. Örneğin A ve B hisse senetleri fiyatlarına ilişkin günlük ortalama değerlerinin eşit olduğunu varsayalım. Bu durumda A ve B hisse senetleri için ortalama değerlerin kıyaslanması anlamlı olmamaktadır. Buna karşın hisse senedi fiyatları için ortalamalar aynı olsa da ortalama civarındaki dağılımları farklılaşacaktır. Hisse senedi fiyatı bakımından ortalama civarındaki dağılımı daha homojen (türdeş) olan zaman içerisinde daha istikrarlı bir seyir izlemektedir. Daha istikrarlı olan hisse senedi için risk azaldığından bu hisse senedinin tercih edilmesi uygun olacaktır. Bir başka örnekte döviz kurları için verilebilir. Şöyle ki enflasyon hedeflemesi rejimi uygulayan Merkez Bankaları için döviz kurları serbest piyasada belirlenmektedir. Merkez Bankaları döviz kurunun değerine değil ancak kurlardaki volatiliteye (oynaklığa) bağlı olarak piyasaya müdahalede bulunmaktadır. Volatilite ise kurların dağılımlarındaki genel gidişatın izlenmesi ile ölçülmektedir. Volatilitenin sayısal olarak ifadesi ise merkezi dağılım ölçütleri ile mümkün olmaktadır. Uygulamada en çok kullanılan merkezi dağlım ölçütleri varyans ve standart sapma ile değişim katsayısıdır.
1. VARYANS VE STANDART SAPMA A 1. VARYANS VE STANDART SAPMA A. Bireysel Veriler İçin Bireysel veriler ile aritmetik ortalama arasındaki farklar daima sıfırdır. Bu nedenle verilerin ortalamadan farklarına dayalı bir dağılım ölçütü hesaplanamaz. Varyans, veriler ile ortalama arasındaki fark karelerin ortalaması olarak tanımlanabilir. Bireysel veriler için ana kitle varyansının hesaplama formülü aşağıdaki gibidir.
Karesel bir ifadenin ortalaması daima sıfırdan büyük olacaktır Karesel bir ifadenin ortalaması daima sıfırdan büyük olacaktır. O halde varyans için tanım aralığı 0 ile +∞ olmaktadır. Yorumu ise şu şekilde yapılabilir; Varyans değeri sıfıra yaklaştıkça dağılımın homojenliği artacaktır. Diğer bir ifadeyle sıfırdan uzaklaştıkça dağılımındaki homojenlik azalacak dolayısıyla heterojenlik artacaktır. Varyansın birimi X’in ölçü biriminin karesidir. Bu nedenle uygulamada varyans yerine onun pozitif karekökü olan standart sapma kullanılır. Böylece X’in ölçü birimi ile ifade edilen bir dağılım ölçütüne geçilmiş olmaktadır.
Ana kitleden seçilen rastgele bir örnekten bulunan örnek varyansı için hesaplama formülü aşağıdaki gibidir. Bu formülden de görüldüğü gibi ortalamadan farkların karesi “n” yerine “n-1” terimine bölünmektedir. n yerine (n-1) alınmasının nedeni iyi bir tahminin özelliklerinden birisi olan sapmasızlık kriterinin sağlanmasıdır.
Soru: A hisse senedi fiyatı için 1 haftalık gözlem değerleri aşağıdaki gibi tespit edilmiştir. Örnek varyansını ve standart sapmayı hesaplayınız.
İki Sınıflı Değişkenler İçin Varyans İki sınıflı değişken ana kitledeki birimlerin kusurlu-kusursuz, başarılı-başarısız, ekonomik kriz var ya da yok gibi herhangi bir özellik bakımından ikiye ayrılması şeklinde tanımlanır. Bu durumlarda ilgili değişken sadece 0 ve 1 değerlerini alır. Örneğin başarılı ise 1 değilse 0 gibi. Bu değişkenler için ortalama 0 ile 1 arasında değer alan bir orandır. Hangi niteliğe 1 denmişse bulunan ortalama o nitelik için oran olacaktır. Başarılı ise 1 değilse sıfır örneğinde bulunan ortalama başarı oranıdır. Ana kitle için varyans aşağıdaki gibi de yazılabilir:
İki terimli değişkenler sadece 0 ve 1 değerlerini aldığından eşitliği yazılabilir. O halde iki terimli değişken için ortalama eşitliği ile bulunur. Bu bilgi kullanıldığında iki sınıflı değişken için varyans aşağıdaki eşitlik yardımıyla hesaplanabilir: İki terimli değişken için ortalama yerine ile gösterilse, varyans aşağıdaki eşitlik ile hesaplanabilir:
Soru: 100 öğrencinin girmiş olduğu bir sınavda 75 öğrencinin başarılı olduğu belirlenmiştir. Başarılı öğrenci oranı için varyansı hesaplayınız. C. Frekans Dağılımı İçin Varyans Frekans dağılımında ana kitle için varyans aşağıdaki eşitlik ile hesaplanır.
Soru: 22 kişinin katıldığı bir sınavda notlara ilişkin dağılım aşağıdaki gibi tespit edilmiştir. Varyans ve standart sapmayı hesaplayınız
2. DEĞİŞİM KATSAYISI Dağılım ölçütü olarak standart sapmanın birimi X’in birimidir. Buna karşın iki ya da daha fazla ana kitle herhangi bir değişkenin dağılımları bakımından karşılaştırıldığında, ilgili değişkenin ölçme birimleri farklı olabilir. Örneğin Türkiye ile ABD’ni gelir dağılımları bakımından karşılaştırdığımızda, şayet gelirin birimi Türkiye için TL, ABD için US dolar ise, standart sapmanın kullanılması uygun olmayacaktır. Gerekli dönüşüm yapılıp Türkiye için gelir US dolar cinsinden ifade edilse dahi gelirlere ilişkin ortalama değerler farklı ise yine standart sapmanın kullanılması uygun olmaz. Bu nedenle değişkenin ölçü biriminden bağımsız ve ortalamaları dikkate alan oransal bir dağılım ölçütüne ihtiyaç vardır. Bu ölçüt değişim katsayısıdır. Değişim katsayısı standart sapmanın aritmetik ortalamaya oranı ile bulunan ve dolayısıyla birimden bağımsız olan bir ölçüttür.
DK değişim katsayısını göstermek üzere bu katsayı aşağıdaki gibi hesaplanır: DK katsayısının yorumu standart sapmanın yorumu gibidir. DK değeri sıfıra yaklaştıkça dağılımın homojenliği artar ve terside doğrudur. Soru: A ve B bölgelerinde gelir için frekans dağılımı aşağıdaki gibi belirlenmiştir. Hangi bölgede gelir dağılımı eşitsizliği daha fazladır? Uygun bir istatistikî ölçüt ile gösteriniz
Gerek A-Bölgesi gerekse de B-Bölgesi için gelir TL olarak aynı birimle ölçülmüştür. Buna karşın iki bölge için aritmetik ortalamalara bakılmalıdır. Şayet ortalama gelir her iki bölgede de aynı ise dağılım ölçütü olarak standart sapma kullanılabilir. Buna karşın ortalamalar farklı ise değişim katsayısı kullanılmalıdır.
olduğundan dağılım ölçütü olarak değişim katsayısı kullanılmalıdır olduğundan dağılım ölçütü olarak değişim katsayısı kullanılmalıdır. Değişim katsayısını hesaplamak için standart sapmalar bulunmalıdır
3. ÇARPIKLIK VE BASIKLIK ÖLÇÜTLERİ olduğundan A-Bölgesinde gelir dağılımı farklılaşmaması B-Bölgesine göre daha azdır. Diğer bir ifadeyle B-Bölgesinde gelir dağılımı farklılaşması daha fazladır. 3. ÇARPIKLIK VE BASIKLIK ÖLÇÜTLERİ MERKEZİ EĞİLİM ÖLÇÜTLERİNE GÖRE ÇARPIKLIK Herhangi bir değişkenin ortalamalara göre simetrik olup olmadığı çarpıklık katsayısı ile hesaplanmaktadır. Asimetrik durum ise sola ya da sağa çarpık şeklinde iki farklı durumundan biri olarak karşımıza çıkmaktadır. Merkezi eğilim ölçütlerinden aritmetik ortalama, ortanca ve mod birbirine eşitse dağılımın simetrik olduğu kararına varılır. Buna karşın Mod<Ortanca<Ortalama durumunda dağılım sağa çarpık iken Ortalama<Ortanca<Mod durumunda dağılım sola çarpık olmaktadır.
Çarpıklığın ölçümünü ilk kez öneren Karl Pearson (1895) olmuştur Çarpıklığın ölçümünü ilk kez öneren Karl Pearson (1895) olmuştur. Karl Pearson’ın çarpıklık katsayısı ortalama ve mod arasındaki farkın standart sapmaya oranlanması ile elde edilir.
Uygulamada ana kitle mod değerinin örnekten tahmin edilmesinde yaşanan sorun nedeniyle mod yerine ortancanın kullanılması üzerine geliştirilen ve örnekten tahmini daha güvenilir olan çarpıklık ölçüsü eşitliğinden hareketle aşağıdaki gibi geliştirilmiştir (Stuart ve Ord, 1994) Uygulamada birçok istatistikçi tarafından kullanılan bu katsayı Pearson çarpıklık katsayısı olarak adlandırılmakta ve genellikle 3 çarpanı ihmal edilerek aşağıdaki formül ile hesaplanmaktadır
Bu istatistik -1 ile +1 arasında değişen değerler almaktadır Bu istatistik -1 ile +1 arasında değişen değerler almaktadır. Hesaplanan çarpıklık katsayısının -1 değerine yaklaşması sola çarpıklığın arttığını +1 yaklaşması ise sağa çarpıklığın arttığını göstermektedir. Bu değer sıfıra yaklaştıkça çarpıklık azalmakta ve simetrik bir dağılıma yaklaşım söz konusu olmaktadır. Çarpıklık katsayısının mutlak değer olarak 0,2 ve üzerinde olması çarpıklığın büyük olduğuna işaret etmektedir (Hildebrand, 1986). Soru: N=1200 birimlik bir yığından seçilen n=9 birimlik örnekte X değişkenin almış olduğu değerler sırasıyla 2, 3, 5, 5, 7, 9, 12, 14, 15 olarak belirlenmiştir. Pearson Çarpıklık Katsayısını hesaplayınız.
Sağa çarpık bir dağılım söz konusudur Sağa çarpık bir dağılım söz konusudur. Pearson çarpıklık katsayısı 0,20 den biraz büyüktür. Bu durum çarpıklık yapısının çok fazla olmadığına işaret etmektedir.
Çarpıklık katsayısı , basıklık katsayısı olmak üzere hesaplama B. MOMENTLERE GÖRE ÇARPIKLIK VE BASIKLIK Pearson çarpıklık katsayısı hesaplaması oldukça kolay olmakla birlikte uygulamada yaygın olarak kullanılmamaktadır. Ayrıca bu ölçüt dağılımın çarpıklığı hakkında bilgi vermekle birlikte dağılımın basıklığı konusunda bilgi içermemektedir. Bu nedenlerle uygulamada çarpıklık için ortalamaya göre 3. moment, basıklık için ise ortalamaya göre 4. momentten hareketle hesaplanan çarpıklık ve basıklık katsayıları kullanılmaktadır. Çarpıklık katsayısı , basıklık katsayısı olmak üzere hesaplama formülleri aşağıdaki gibidir.
Bu değerlerin bireysel veriler ve frekans dağılımları için hesaplama formülleri aşağıdaki tabloda verilmiştir.
Bu katsayıların yorumları ise aşağıdaki gibidir;
Soru: N=1200 birimlik bir yığından seçilen n=9 birimlik örnekte X değişkenin almış olduğu değerler sırasıyla 2, 3, 5, 5, 7, 9, 12, 14, 15 olarak belirlenmiştir. Momentlere göre çarpıklık ve basıklık katsayılarını hesaplayınız ve yorumlayınız
Soru: 22 kişinin katıldığı bir sınavda notlara ilişkin dağılım aşağıdaki gibi tespit edilmiştir. Momentlere göre çarpıklık ve basıklık katsayılarını hesaplayarak notlara ilişkin dağılımın çarpıklığı ve basıklığı hakkında bilgi veriniz.
Deneysel (Ampirik) Kural Bireysel veriler incelendiğinde verilerin çoğunun ortalama civarında kümelendiği görülür. Sağa çarpık bir dağılımda verilerin çoğunluğu ortalamadan daha küçük değerler alacak ve kümelenme ortalamanın solunda oluşacaktır. Sola çarpık dağılımda ise verilerin çoğu ortalamadan daha büyük değerler alacak ve kümelenme ortalamanın sağında oluşacaktır. Simetrik bir dağılımda ise veriler ortalamanın sağında ve solunda eşit sayıda dağılacak ve dağılım çan-eğrisi şeklinde gözlenecektir. Çan eğrisi şeklinde simetrik bir dağılım söz konusu olduğunda aşağıdaki kurallar yaklaşık olarak geçerli olacaktır. Verilerin yaklaşık %68’i ortalamadan ±1 standart sapma uzaklığı içerisinde yer alır. Diğer bir ifadeyle µ±σ aralığı birimlerin yaklaşık %68’ni içerir. Verilerin yaklaşık %95’i ortalamadan ±2 standart sapma uzaklığı içerisinde yer alır. Diğer bir ifadeyle µ±2σ aralığı birimlerin yaklaşık %95’ini içerir. Verilerin yaklaşık %99,7’i ortalamadan ±3 standart sapma uzaklığı içerisinde yer alır. Diğer bir ifadeyle µ±3σ aralığı birimlerin yaklaşık %97,7’sini içerir.
Chebyshev Kuralı Bu kural dağılımın şekline bağlı olmaksızın ortalamadan k standart sapmalık uzaklık içerisinde yer alan verilerin yüzdesini bulmamıza yardımcı olur. Bu kural aşağıdaki gibi ifade edilir; Bu eşitlikte k sayısının 1’den daha büyük olması gerekmektedir. Örneğin k=2 alındığında; olmaktadır. Diğer bir ifadeyle dağılımın herhangi bir şekli için yani dağılıma bağlı olmaksızın verilerin yaklaşık %75’i ortalamadan standart sapma uzaklığı içerisinde yer alır. Diğer bir ifadeyle aralığı birimlerin yaklaşık %75’ini içerir. Chebyshev kuralında k=3 alındığında ise verilerin yaklaşık %88,9’u ortalamadan standart sapma uzaklığı içerisinde yer almaktadır. Diğer bir ifadeyle aralığı birimlerin yaklaşık %88,9’unui içermektedir.