Tanımlayıcı İstatistikler

Slides:



Advertisements
Benzer bir sunumlar
EĞİTİMDE ÖLÇME & DEĞERLENDİRME -12-
Advertisements

GİRİŞ BÖLÜM:1-2 VERİ ANALİZİ YL.
Yrd. Doç. Dr. Mustafa Akkol
DOĞAL SAYILAR.
T.C. İNÖNÜ ÜNİVERSİTESİ Arapgir Meslek YÜKSEKOKULU
Farklı örnek büyüklükleri ( n ) ve farklı populasyonlar için ’nın örnekleme dağılışı.
Atlayarak Sayalım Birer sayalım
Nicel / Nitel Verilerde Konum ve Değişim Ölçüleri
Diferansiyel Denklemler
ÖRNEKLEME DAĞILIŞLARI VE TAHMİNLEYİCİLERİN ÖZELLİKLERİ
İSTATİSTİK VE OLASILIK I
Tanımlayıcı İstatistikler
Nicel / Nitel Verilerde Konum ve Değişim Ölçüleri
Tanımlayıcı İstatistikler
KIR ÇİÇEKLERİM’ E RakamlarImIz Akhisar Koleji 1/A.
Hafta 03: Verinin Numerik Analizi (Yrd.Doç.Dr. Levent AKSOY)
HİSTOGRAM OLUŞTURMA VE YORUMLAMA
CAN Özel Güvenlik Eğt. Hizmetleri canozelguvenlik.com.tr.
1/20 PROBLEMLER A B C D Bir fabrikada kadın ve çocuk toplam 122 işçi çalışmaktadır. Bu fabrikada kadın işçilerin sayısı, çocuk işçilerin sayısının 4 katından.
HAZIRLAYAN:SAVAŞ TURAN AKKOYUNLU İLKÖĞRETİM OKULU 2/D SINIFI
1/25 Dört İşlem Problemleri A B C D Sınıfımızda toplam 49 öğrenci okuyor. Erkek öğrencilerin sayısı, kız öğrencilerin sayısından 3 kişi azdır.
ÖLÇME VE DEĞERLENDİRME DERSİ
TÜRKİYE KAMU HASTANELERİ KURUMU
İmalat Yöntemleri Teyfik Demir
MATRİSLER ve DETERMİNANTLAR
Merkezi Eğilim (Yığılma) Ölçüleri
İstatistikte Bazı Temel Kavramlar
PÇAĞEXER / SAYILAR Ali İhsan TARI İnş. Yük. Müh. F5 tuşu slaytları çalıştırmaktadır.
Değişkenlik Ölçüleri.
EĞİTİMDE ÖLÇME VE DEĞERLENDİRME
4 X x X X X
Yard. Doç. Dr. Mustafa Akkol
VERİLERİN DERLENMESİ VE SUNUMU
SÜREKLİ ŞANS DEĞİŞKENLERİNİN OLASILIK YOĞUNLUK FONKSİYONLARI
BİYOİSTATİSTİK KONUM VE YAYGINLIK ÖLÇÜLERİ: MERKEZ ÖLÇÜLER & ÇEYREK VE YÜZDELİKLER Prof.Dr.İ.Safa GÜRCAN.
ANA BABA TUTUMU ENVANTERİ
Test : 2 Konu: Çarpanlar ve Katlar
Merkezi Eğilim (Yer) Ölçüleri
VERİ İŞLEME VERİ İŞLEME-4.
EĞİTİMDE ÖLÇME VE DEĞERLENDİRME
DEĞİŞKENLİK ÖLÇÜLERİ.
Tuğçe ÖZTOP İlköğretim Matematik Öğretmenliği 2. sınıf
PÇAĞEXER / SAYILAR Ali İhsan TARI İnş. Yük. Müh. F5 tuşu slaytları çalıştırmaktadır.
Diferansiyel Denklemler
DEĞİŞKENLİK ÖLÇÜLERİ.
Betimleyici İstatistik – I
Merkezi Eğilim (Yer) Ölçüleri
21 - ÖLÇME SONUÇLARI ÜZERİNE İSTATİSTİKSEL İŞLEMLER
DEĞİŞKENLİK ÖLÇÜLERİ.
Asimetri ve Basıklık Ölçüleri
Asimetri ve Basıklık Ölçüleri
Tanımlayıcı İstatistikler
Asimetri ve Basıklık Ölçüleri
Bölüm 03 Sayısal Tanımlama Teknikleri
Merkezi Eğilim (Yığılma) Ölçüleri
SU KALİTESİ VERİLERİNİN İSTATİSTİKSEL YÖNTEMLERLE DEĞERLENDİRİLMESİ
Analitik olmayan ortalamalar Bu gruptaki ortalamalar serinin bütün değerlerini dikkate almayıp, sadece belli birkaç değerini, özellikle ortadaki değerleri.
Konum ve Dağılım Ölçüleri BBY252 Araştırma Yöntemleri Güleda Doğan.
ÖLÇME VE DEĞERLENDİRME DERSİ
Tanımlayıcı İstatistikler
TEMEL BETİMLEYİCİ İSTATİSTİKLER
Ölçme Sonuçları Üzerinde İstatistiksel İşlemler
VERİLERİN DERLENMESİ VE SUNUMU
DEĞİŞİM ÖLÇÜLERİ.
DEĞİŞKENLİK ÖLÇÜLERİ.
DEĞİŞKENLİK ÖLÇÜLERİ.
Sapma (Dağılma) ölçüleri
ÖLÇME-DEĞERLENDİRME 8. SINIF
ÖLÇME SONUÇLARI ÜZERİNE İSTATİSTİKSEL İŞLEMLER
Sunum transkripti:

Tanımlayıcı İstatistikler Bölüm 3 Tanımlayıcı İstatistikler

Tanımlayıcı İstatistikler Bir veri setini tanımak veya birden fazla veri setini karşılaştırmak için kullanılan ve ayrıca örnek verilerinden hareket ile frekans dağılışlarını sayısal olarak özetleyen değerlere tanımlayıcı istatistikler denir. Analizlerde kullanılan veri tiplerine (basit, gruplanmış, sınıflanmış) göre hesaplamalarda kullanılacak formüller değişmektedir.

Tanımlayıcı İstatistikler Yer Ölçüleri 1)Aritmetik ort. 2)Geometrik ort. 3)Harmonik ort. 4)Mod 5)Medyan 6)Kartiller Değişkenlik Ölçüleri Range (Değişim Aralığı) 2) Ort. Mutlak sapma 3) Varyans 4) Standart Sapma 5) Değişkenlik(Varyasyon) Katsayısı Çarpıklık Ölçüleri 1)Pearson Asimetri Ölçüsü 2)Bowley Asimetri Ölçüsü Basıklık Ölçüleri

Yer Ölçüleri Yer ölçüsünü belirlemek amacıyla veri analizini yapacak kişi, öncelikle veri seti için hangi ölçüyü kullanması gerektiğine karar vermelidir.

Tanım Merkezi Eğilim Ölçüsü Veri setinin orta noktası veya merkezinin değeridir.

1) Aritmetik Ortalama Üzerinde inceleme yapılan veri setindeki elemanların toplanıp incelenen eleman sayısına bölünmesiyle elde edilen yer ölçüsüne aritmetik ortalama denir. Örnek: Sınav notlarının ortalaması, Yaz aylarında m2’ye düşen ortalama yağış miktarı

Örnek Ortalaması ve Anakütle Ortalaması x  x x = n  x µ = N , x-bar şeklinde telaffuz edilir ve örneklemin ortalamasıdır. x x = n  x µ, “mü” şeklinde telaffuz edilir ve anakütle ortalamasıdır N µ =  x

Bir Denge Noktası Olarak Ortalama 1, 14, 19, 31, 50 sayılarının ortalaması =23 tür. Şekil sayıları bir çizgi üzerinde yerleştirilmiş eşit küçük ağırlıklar şeklinde gösterir.1,14,19,31,50 Aritmetik ortalama denge noktasıdır. 1 14 19 31 50

Basit Veriler için Aritmetik Ortalama Örneği Örnek: İzmir ilinde ilköğretim ikinci sınıfta okuyan öğrenciler üzerinde yapılan bir araştırmada rasgele 8 öğrenci seçilmiş ve ailenizde kaç çocuk vardır sorusuna aşağıdaki gibi cevap vermişlerdir. Ailelerin çocuk sayılarının ortalamasını hesaplayınız. 1,3,2,1,4,5,6,2 n = 8 i = 1,2,…,8

Gruplanmış Veriler İçin Aritmetik Ortalama f : frekans k: grup sayısı i = 1,2,3,……….,k

Örnek: Bir otomobil bayisinde 80 gün boyunca yapılan inceleme sonucunda satılan arabaların adetlerine göre dağılımı yandaki tabloda verilmiştir. Buna göre bir gün içinde satılan ortalama araba sayısını hesaplayınız. Araba(xi) GÜN(fi) xi.fi 5 1 12 2 35 70 3 14 42 4 8 32 6 30 ∑fi=80

Sınıflanmış Veriler İçin Aritmetik Ortalama f : frekans k : sınıf sayısı i = 1,2,3,……….,k m : sınıf orta noktası Sınıflanmış verilerde her bir sınıf içindeki değerlerin neler olduğu bilinmediğinden dolayı ve yalnızca her bir sınıfın frekans değerleri bilindiğinden dolayı sınıfı temsil etmek üzere sınıf orta noktaları hesaplamada kullanılır. Kullanılan formül gruplanmış veriler için kullanılan formüle benzerdir.

Örnek: Bir sınıftaki öğrencilerin boyları hakkında bir araştırma yapılmaktadır. Bu amaçla 50 öğrencinin boyları ölçülerek kaydedilmiştir.Öğrencilerin boylarının aritmetik ortalamasını hesaplayınız.

Ağırlıklı Ortalama

2) Geometrik Ortalama Bir veri setinde bulunan n adet elemanın çarpımının n nci dereceden kökünün alınmasıyla elde edilen yer ölçüsüdür. Geometrik ortalamanın formülüne bakıldığında hesaplama zorluğu olduğundan dolayı logaritma ifadesi kullanılır. Genellikle basit veriler için kullanışlı olup negatif sayılar için kullanışlı değildir.

Geometrik Ortalama’nın Kullanım Alanları Ortalama oranları, Değişim Oranları, Logaritmik dağılış gösteren veri setleri, için kullanışlıdır. Örnek: fiyat indeksleri, faiz formülleri.

Örnek: Abac şirketinin yıldan-yıla olan fuel deki tüketim harcamalarının değişimi yüzde -5, 10, 20, 40, ve 60. büyüme faktörlerinin geometrik ortalamasını kullanarak harcamalardaki ortalama yıllık yüzde değişim belirlenir. Büyüme faktörleri için yüzde değişim dönüştürme ile elde edilenler; 0.95 1.10 1.20 1.40 1.60

G = anti log 0,27045 = 100,08971 ≈ 1,229

3) Harmonik Ortalama Bir veri setinde bulunan n adet elemanın çarpma işlemine göre terslerinin ortalamasının tersinin alınmasıyla elde edilen yer ölçüsüdür. Genellikle basit veriler için kullanışlıdır.

Harmonik Ortalama’nın Kullanım Alanları Zaman verileri için kullanışlıdır. Örnek: Zaman birimi başına hız, para birimi başına satın alınan birim sayısı. Belirli koşullar ve fiyat tipleri için zaman verilerinin ortalamalarının hesaplanmasında kullanılan bir yer ölçüsüdür. Zamana bağlı hız, fiyat verimlilik gibi oransal olarak ifade edilebilen verilerin ortalamasın alınmasında da kullanılabilir. NOT: ARİTMETİK ORT. > GEOMETRİK ORT. > HARMONİK ORT.

Örnek: Bir tekstil fabrikasında çalışan dört kişinin bir pantolonu ütüleme süreleri aşağıda verilmiştir. Buna göre bu fabrikada bir pantolon ortalama kaç dakikada ütülenir? İşçi 1: 10 dk. İşçi 2: 6 dk. İşçi 3: 4 dk. İşçi 4 : 5 dk.

4) Mod Bir veri setinde en çok gözlenen ( en çok tekrar eden ) değere veya frekansı en fazla olan şans değişkeni değerine mod adı verilir. Veri setinin modu olmayacağı gibi birden fazla da modu olabilir. Mod genellikle kesikli şans değişkenleri için oluşturulan gruplanmış verilerde aritmetik ortalama yerine kullanılabilir.

Mod Mod, büyük veri setlerinde verinin daha çok nerede toplandığını bulmak için kullanılır. Örneğin erkek kıyafetleri satan bir perakendeci, potansiyel müşterilerini belirlemek için gömlek kol uzunluğu ve gömlek yaka ölçüsüyle ilgilenebilir. Nicel veri seti çok büyük olmadığı zaman mod anlamlı olmayabilir. Sınıflandırılmış veriler için kullanılabilecek tek merkezi eğilim ölçüsüdür.

Örnekler Modu 1,10 1 den fazla moda sahip , 27 ve 55 Modu yok 1) 5,40 1,10 0,42 0,73 0,48 1,10 2) 27 27 27 55 55 55 88 88 99 3) 1 2 3 6 7 8 9 10

Gruplanmış Veriler İçin Mod Basit verilerde bulunduğu gibi hesaplanır. Örnek: Bir otomobil bayisinde 80 gün boyunca yapılan inceleme sonucunda satılan arabaların adetlerine göre dağılımı yandaki tabloda verilmiştir. Buna göre araba satışları için mod değeri nedir? Araba(xi) GÜN(fi) 5 1 12 2 35 3 14 4 8 6 En yüksek frekansa sahip olan gözlem değeri 2 olduğundan dolayı araba satışları için mod değeri 2’dir.

Sınıflanmış Veriler İçin Mod Sınıflanmış verilerde mod değeri hesaplanırken ilk olarak mod sınıfı belirlenir. Mod sınıfı frekansı en yüksek olan sınıftır. Mod sınıfı belirlendikten sonra bu sınıf içerisinde yer alan modun tam değeri sınıf frekansı ve kendine komşu olan sınıf frekansları dikkate alınarak hesaplanır.

= Mod Sınıfı Frekansı – Kendinden Bir Sonraki Sınıf Frekansı = Mod Sınıfı Aralığının Alt Sınırı = Mod Sınıfı Frekansı - Kendinden Bir Önceki Sınıf Frekansı = Mod Sınıfı Frekansı – Kendinden Bir Sonraki Sınıf Frekansı i = Mod Sınıfının Sınıf Aralığı

Örnek: Bir sınıftaki öğrencilerin boyları hakkında bir araştırma yapılmaktadır. Bu amaçla 50 öğrencinin boyları ölçülerek kaydedilmiştir.Öğrencilerin boylarının mod değerini hesaplayınız. Mod sınıfı

Frekansı en yüksek olan sınıf mod sınıfı olarak belirlenir Frekansı en yüksek olan sınıf mod sınıfı olarak belirlenir. Mod sınıfı belirlendikten sonra formülde ilgili değerler yerine koyularak mod değeri hesaplanır.

5) Medyan Bir veri setini büyükten küçüğe veya küçükten büyüğe sıraladığımızda tam orta noktadan veri setini iki eşit parçaya ayıran değere medyan adı verilir. Veri setinde aşırı uçlu elemanlar olduğunda aritmetik ortalamaya göre daha güvenilirdir. Medyan, veri setindeki tüm elemanlardan etkilenmez.

Basit Veriler İçin Medyan Veri Setinin Hacmi Tek Sayı İse; nci gözlem değeri medyandır. Veri Setinin Hacmi Çift Sayı İse; ve nci gözlem değerinin aritmetik ortalaması medyandır.

Medyan bu iki noktanın arasına düşmektedir 5.40 1.10 0.42 0.73 0.48 1.10 0.42 0.48 0.73 1.10 1.10 5.40 0.73 + 1.10 2 Medyan bu iki noktanın arasına düşmektedir MEDYAN 0.915 5.40 1.10 0.42 0.73 0.48 1.10 0.66 0.42 0.48 0.66 0.73 1.10 1.10 5.40 Tam ortadaki değer medyandır. MEDYAN 0.73

Gruplanmış Veriler İçin Medyan Gruplanmış verilerde medyan değeri hesaplanırken veri setinin tam orta noktasının hangi gruba ait olduğunu belirlemek için birikimli frekans sütunu oluşturulur. Sıra numarası belirlendikten sonra o sıra numarasına ait grup medyan değeri olarak ifade edilir.

Birikimli Frekans ( ∑f ) Örnek: Bir un fabrikasının satış mağazasında bir gün içinde satılan un paketlerinin gramajlarına göre satış adetleri aşağıda verilmiştir. Buna göre veri seti için medyan değerini hesaplayınız. Kg Satış adedi Birikimli Frekans ( ∑f ) 1 5 2 12 17 3 35 52 4 14 66 8 74 6 80 n/2 ve (n/2)+1 nci gözlem değerlerine karşılık gelen değerler (40 ve 41 nci sıra ) 3 olduğundan dolayı medyan değeri 3’tür.

Birikimli Frekans ( ∑f ) Frekans dağılımı aşağıdaki gibi olsaydı (n+1)/2 nci elemana (45 nci elemana) karşılık gelen değer 4 olacağından dolayı veri setinin medyanı 4 olarak hesaplanacaktır. Kg Satış adedi Birikimli Frekans ( ∑f ) 1 5 2 12 17 3 22 39 4 32 71 14 85 6 89

Sınıflanmış Veriler İçin Medyan Sınıflanmış verilerde medyan değeri hesaplanırken ilk olarak medyan sınıfı belirlenir. Medyan sınıfı birikimli frekanslar dikkate alındığında toplam frekansın yarısını içinde bulunduran sınıftır. Medyan sınıfı belirlendikten sonra medyan sınıfından bir önceki sınıfın birikimli frekansı ve medyan sınıfı frekansı dikkate alınarak hesaplanır.

fmed : Medyan sınıfının frekansı Lmed : Medyan sınıfının alt sınırı fl : Medyan sınıfından bir önceki sınıfın birikimli frekansı fmed : Medyan sınıfının frekansı i: Sınıf Aralığı

Örnek: Bir sınıftaki öğrencilerin boyları hakkında bir araştırma yapılmaktadır. Bu amaçla 50 öğrencinin boyları ölçülerek kaydedilmiştir.Öğrencilerin boylarının mod değerini hesaplayınız. Medyan sınıfı

Toplam 50 adet gözlem olduğundan dolayı, birikimli frekans sütununda 50/2 =25 nci gözlemin bulunduğu sınıf medyan sınıfı olarak belirlenir.

Veriler mod etrafında simetrik oldukları zaman, mod, medyan ve artimetik ortalama birbirlerine eşit olur. Eğer örneklem aynı anakütleden çekilmişse, aritmetik ortalama diğer ölçülere göre daha güvenilirdir

6) Kartiller Bir veri setini büyükten küçüğe veya küçükten büyüğe sıraladığımızda dört eşit parçaya ayıran üç değere kartiller adı verilir. İlk % 25’lik kısmı içinde bulunduran 1. Kartil (Q1), % 50’lik kısmı içinde bulunduran 2. Kartil (Q2), % 75’lik kısmı içinde bulunduran 3. Kartil (Q2), olarak adlandırılır. %50’lik kısmı içinde bulunduran 2. Kartil (Q2) aynı zamanda veri setinin medyanıdır. %25 %25 %25 %25 Q1 Q2 Q3

Basit Veriler İçin Kartiller 1.Kartil Q1 nci gözlem değeri, 3.Kartil Q3 nci gözlem değeri,

Örnek: İstatistik I dersini alan 10 öğrencinin vize notları aşağıdaki gibi sıralanmıştır. Buna göre vize notları için Q1 ve Q3 değerlerini hesaplayınız. 30,42,56,61,68,79,82,88,90,98 (n+1)/4 ‘ncü verinin sıra numarası (10+1)/4 = 2,75’dir. Q1= 42 + 0,75 .(56 - 42) = 52,5 , 3(n+1)/4 ‘ncü verinin sıra numarası 3(10+1)/4 = 8,25’dir. Q3= 88 + 0,25.(90 - 88) = 88,5 ‘dir.

Veri seti aşağıdaki gibi verilseydi, 30,42,56,61,68,79,82,88,90 (n+1)/4 ‘ncü verinin sıra numarası (9+1)/4 = 2,5’dir. Q1= 42 + 0, 5 .(56 - 42) = 49 , 3(n+1)/4 ‘ncü verinin sıra numarası 3(9+1)/4 = 7,5’dir. Q3= 82 + 0, 5.(88 - 82) = 85 , olarak hesaplanacaktı.

Gruplanmış Veriler İçin Kartiller Gruplanmış verilerde kartiller hesaplanırken veri setinin ilk çeyrek ve son çeyrek kısmını tam olarak ifade etmek amacıyla birikimli frekans sütünü oluşturulur. Gruplanmış verilerde örnek hacminin tek veya çift olduğuna bakılmaksızın n/4 ncü eleman 1.Kartil (Q1), 3n/4 ncü eleman ise 3.Kartil (Q3), olarak ifade edilir.

Birikimli Frekans ( ∑f ) Örnek: Bir un fabrikasının satış mağazasında bir gün içinde satılan un paketlerinin gramajlarına göre göre satış adetleri aşağıda verilmiştir. Buna göre veri seti için Q1 ve Q3 nedir? Kg Satış adedi Birikimli Frekans ( ∑f ) 1 5 2 12 17 3 35 52 4 14 66 8 74 6 80 n/4 ncü ( 20 nci ) sıra numarasına karşılık gelen gözlem 3 olduğundan; 1.kartil 3, 3n/4 ncü ( 60 ncı ) sıra numarasına karşılık gelen gözlem 4 olduğundan; 3.kartil 4’tür.

Sınıflanmış Veriler İçin Kartiller Sınıflanmış verilerde kartiller hesaplanırken ilk olarak birikimli frekans sütunu oluşturularak kartil sınıfları belirlenir. Kartil sınıfları belirlenirken gruplanmış verilerde olduğu gibi n/4 ve (3n)/4 ncü sıralardaki elemanların hangi sınıflara ait iseler o sınıflar kartil sınıfları olur. Kartil sınıfları belirlendikten sonra bu sınıflardan bir önceki sınıfın birikimli frekansı ve mevcut sınıf frekansı dikkate alınarak kartil değerleri hesaplanır.

1. Kartil 2. Kartil 3. Kartil

Örnek: Bir sınıftaki öğrencilerin boyları hakkında bir araştırma yapılmaktadır. Bu amaçla 50 öğrencinin boyları ölçülerek kaydedilmiştir.Öğrencilerin boylarının birinci ve üçüncü kartillerini hesaplayınız. Q1 sınıfı Q3 sınıfı

Yayılma (Değişkenlik) Ölçüleri Bir veri setini tanımak yada iki farklı veri setini birbirinden ayırt etmek için her zaman yalnızca yer ölçüleri yeterli olmayabilir. Dağılımları birbirinden ayırt etmede kullanılan ve genellikle aritmetik ortalama etrafındaki değişimi dikkate alarak hesaplanan istatistiklere yayılma (değişkenlik) ölçüleri adı verilir.

Aşağıdaki iki grafik n = 1500 hacimli iki farklı örnek doğrultusunda oluşturulan histogramlardır. Her iki örnek ortalaması yaklaşık olarak 100 olduğuna göre iki örneğin aynı anakütleden alındığı söylenebilir mi?

Dağılımları birbirinden ayırt etmede kullanılan yayılım ölçüleri aritmetik ortalama etrafındaki değişimleri dikkate alan tanımlayıcı istatistiklerdir. Bir veri setinde aritmetik ortalamalardan her bir gözlemin farkı alınıp bu değerlerin tümü toplandığında sonucun 0 olduğu görülür.

Örnek: 4,8,9,13,16 şeklinde verilen bir basit veri için; Bu örnekten görüleceği üzere gözlemlerin aritmetik ortalamadan uzaklığı alıp toplandığında 0 elde edildiğinden dolayı bu problem mutlak değer kullanarak veya karesel uzaklık alınarak ortadan kaldırılır.

7) Range (Değişim Aralığı) Veri setindeki yayılımı ifade etmede kullanılan en basit ölçü, değişim aralığıdır. Genel olarak az sayıda veri için kullanılır. En büyük gözlem değeri ile en küçük gözlem değeri arasındaki fark değişim aralığını verir. Range, veri setindeki tek bir gözlemin aşırı derecede küçük veya büyük olmasından etkilendiği için bir başka ifadeyle örnekte yer alan sadece iki veri kullanılarak hesaplanmasından dolayı tüm veri setinin değişkenliğini açıklamak için yetersiz kalmaktadır. 56

Değişim Aralığı 57

Kartiller Arası Fark Diğer değişkenlik 1. ve 3. kartiller arasındaki farka dikkat çeker. Çeyrek aralık olarak adlandırılan bu fark, Q3-Q1, veri setinin yarısını içeren genişliği verir. 58

8) Ortalama Mutlak Sapma(OMS) Veri setindeki her bir gözlem değerinin mutlak değerce aritmetik ortalamadan farklarının toplamının, örnek hacmine bölünmesiyle elde edilir. Gözlem değerlerinin aritmetik ortalamadan faklarının toplamı 0 olacağından bu problemi ortadan kaldırmak için mutlak değer ifadesi kullanılır. Basit veriler için: Gruplanmış veriler için: Sınıflanmış veriler için :

Örnek: İstatistik I dersini alan 10 öğrencinin vize notları aşağıdaki gibi sıralanmıştır. Buna göre vize notları için ortalama mutlak sapma değerini hesaplayınız. 30,41,53,61,68,79,82,88,90,98

Sınıflanmış Veriler İçin Ortalama Mutlak Sapma Örneği

Yayılma Ölçülerinin Gerekliliği

9) Varyans Ortalama mutlak sapmada kullanılan mutlak değerli ifadeler ile işlem yapmanın zor hatta bazı durumlarda imkansız olması sebebiyle yeni değişkenlik ölçüsüne ihtiyaç bulunmaktadır. Mutlak değer ifadesindeki zorluk aritmetik ortalamadan farkların karelerinin alınmasıyla ortadan kalkmaktadır. Veri setindeki her bir gözlem değerinin aritmetik ortalamadan farklarının karelerinin toplamının örnek hacminin bir eksiğine bölünmesinden elde edilen yayılım ölçüsüne örnek varyansı adı verilir.

m : Anakütle Ortalaması N : Anakütle Hacmi Basit veriler İçin: Anakütle Varyansı: m : Anakütle Ortalaması N : Anakütle Hacmi Örnek Varyansı : Gruplanmış veriler için: Sınıflanmış veriler için :

ifadesi istatistikte bir çok formülde kullanılır ve kareler toplamı olarak adlandırılır. Matematiksel olarak hesaplama kolaylığı sağlaması açısından formüllerde kareler toplamının açılımı olan aşağıdaki eşitlik kullanılabilir.

Basit Veriler İçin: Gruplanmış Veriler İçin: Sınıflanmış Veriler İçin :

Örnek: Bir un fabrikasının satış mağazasında bir gün içinde satılan un paketlerinin gramajlarına göre göre satış adetleri aşağıda verilmiştir. Buna göre veri seti için varyans değerlerini hesaplayınız. Kg Satış adedi xi.fi x2i.fi 1 5 2 12 24 48 3 35 105 315 4 14 56 224 8 40 200 6 36 216 toplam 80 266 1008

Sınıflanmış Veriler İçin Ortalama Varyans Örneği 68

10) Standart Sapma Varyans hesaplanırken kullanılan verilerin kareleri alındığında mevcut ölçü biriminin de karesi alınmış olur. Örnek: kg2, cm2 gibi. Bu nitelendirme veriler açısından bir anlam taşımayacağından varyans yerine ortalama etrafındaki değişimin bir ölçüsü olarak onun pozitif karekökü olan standart sapma kullanılır.

Populasyon Standart Sapması: Basit Veriler İçin: Populasyon Standart Sapması: : Populasyon Standart Sapması N : Populasyon Hacmi Örnek Standart Sapması : Gruplanmış Veriler İçin: Sınıflanmış Veriler İçin :

Örnek: İstatistik I dersini alan 10 öğrencinin vize notları aşağıdaki gibi sıralanmıştır. Buna göre vize notları için varyans ve standart sapmayı hesaplayınız. 30,41,53,61,68,79,82,88,90,98 → İstatistik I vizesinden alınan notların ortalama etrafında yaklaşık olarak 22 puan değiştiği görülmektedir.

Aynı soru kareler ortalamasının açılımı kullanılarak çözüldüğünde aynı sonuçları verecektir. 30,41,53,61,68,79,82,88,90,98

CHEBYSHEV TEOREMİ K=2 ve K=3 için; Herhangi bir veri setinde, verilerin ortalamadan K standart sapma uzakta bulunma oranı 1-1/K2 dır. Burada K, birden büyük pozitif sayıdır. K=2 ve K=3 için; Verilerin en az 3/4’ ü (%75) ortalamanın 2 standart sapma uzağında bulunur. Verilerin en az 8/9’ u (%89) ortalamanın 3 standart sapma uzağında bulunur.

Örnek: X değişkeni bir sınıftaki İstatistik I dersinin başarı notlarını göstermek üzere; örnek ortalamasının 60, varyansının 100 olduğu bilindiğine göre, verilerin ¾ ‘ü hagi aralıkta değişir?

Standart Sapmanın Yorumlanması

Ampirik Kural 77

Ampirik Kural 78

Ampirik Kural 79

2 ondalık basamağa yuvarlanır. 11) z Skoru Verilen bir gözlem değerinin ortalamanın kaç standart sapma uzağında olduğunu ölçer. Örneklem Anakütle x - µ z =  z = x - x s 2 ondalık basamağa yuvarlanır.

z- skorunun Yorumlanması Bir veri ortalamadan küçük olursa z-skoru değeri negatif olur. Olağan Veriler : z skoru –2 ve 2 s.s arasında Olağandışı Veriler: z skoru < -2 veya z skoru > 2 s.s

82

Örnek: 200 çelik işçisinin yıllık gelirleri incelenmiş ve ortalaması = 24.000$ ve standart sapması s= 2.000$ olarak bulunmuştur. Yıllık geliri 22.000$ olan Joe Smith’in z-skoru kaçtır? 18.000$ 22.000$ Joe Smith’in geliri 24.000$ 30.000$ 83

84

12) Değişkenlik(Varyasyon) Katsayısı İki veya daha fazla populasyon üzerinde aynı şans değişkenleri için yapılan araştırmalarda değişkenliklerin karşılaştırılması için kullanılan bir ölçüdür. Standart sapmayı ortalamanın bir yüzdesi olarak ifade eden ve iki veya daha fazla populasyondaki varyasyonu (değişkenliği) karşılaştırmada kullanılan ölçüye varyasyon(değişkenlik) katsayısı denir. Örnek: İstanbul’da ve Ankara’da yaşayan ailelerin aylık gelirlerinin değişkenliklerinin karşılaştırılması Varyasyon Katsayısı:

Örnek: A,B ve C hisse senetlerinin kapanış fiyatlarına ilişkin yapılan bir araştırmada, hisse senetlerinin kapanış fiyatlarının ortalamaları ve standart sapmaları hesaplanmış ve aşağıdaki tabloda verilmiştir. Buna göre hisse senetlerini kapanış fiyatlarının değişkenlikleri açısından karşılaştırınız ve hangi hisse senedinin fiyatındaki değişkenlik daha fazladır ifade ediniz. s A 8 2 B 5 1 C 15 3 Üç hisse senedinin kapanış fiyatlarının değişkenlikleri karşılaştırıldığında en büyük standart sapma değeri C hisse senedinde olmasına rağmen en büyük varyasyon katsayısına sahip olduğundan en fazla değişkenliğin A hisse senedinde olduğu görülür.

Simetrik Veriler Tanımlamalar Eğer veri simetrik ise verinin histogramının sağ tarafı ve sol tarafı eşit büyüklüktedir Çarpık Veriler Eğer veri çarpık ise (simetrik değilse), verinin histogramın bir kısmı diğer kısmından büyüktür veya küçüktür.

Çarpıklık

Çarpıklık (Asimetri) Ölçüleri Anakütleleri birbirinden ayırmak için her zaman yalnızca yer ve yayılım ölçüleri yeterli olmayabilir. Aşağıda iki farklı anakütleden alınmış örnekler için oluşturulan histogramlar verilmiştir.

BOWLEY ÇARPIKLIK ÖLÇÜSÜ 13) Asimetri Ölçüleri PEARSON ÇARPIKLIK ÖLÇÜSÜ SkP < 0 →Negatif çarpık(Sola) SkP > 0 → Pozitif Çarpık(Sağa) SkP = 0 ise dağılış simetrik veya BOWLEY ÇARPIKLIK ÖLÇÜSÜ Skb < 0 → Negatif çarpık(Sola) Skb > 0 → Pozitif Çarpık(Sağa) Skb = 0 ise dağılış simetrik

Sağa Çarpık , Pozitif Asimetri Sağa Çarpık , Pozitif Asimetri Örnek: Aşağıdaki tabloda 30 günlük süre içinde bir restoranın kullandığı et miktarının dağılımından elde edilen bazı tanımlayıcı istatistikler verilmiştir. Buna göre pearson ve bowley asimetri ölçülerini hesaplayıp yorumlayınız. Aritmetik Ort. Mod Medyan Q1 Q3 s2 46,6 45,4 46,2 41,5 51,9 54,46 Sağa Çarpık , Pozitif Asimetri Sağa Çarpık, Pozitif Asimetri Sağa Çarpık , Pozitif Asimetri 91

Simetrik Dağılım A.O = Med = Mod Sağa çarpık dağılım Sola çarpık dağılım A.O < Med < Mod İki modlu simetrik dağılım Modu olmayan dağılım Tekdüzen dağılım

14) Sapan Gözlemler Sapan gözlem, diğer bütün gözlemlerden uzakta bulunan gözlemdir. Sapan gözlem ortalama üzerinde önemli bir etkiye sahip olabilir. Sapan gözlem standart sapma üzerinde önemli bir etkiye sahip olabilir. Sapan gözlem, dağılımın gerçek histogramının ölçeği üzerinde önemli bir etkiye sahip olabilir.

15) 5 Sayı Özeti 5 sayı özeti, bir veri setinde minimum değer, 1.Kartil, 2.Kartil(medyan), 3.Kartil’i ve maksimum değeri içerir. Kutu grafiği(veya kutu ve bıyık grafiği) bir veri seti için, sınırları maksimum ve minimum değer olmak üzere, içinde 1.Kartil, 2.Kartil(medyan) ve 3.Kartil’i bulunduran kutu şeklindeki grafiktir.

Kutu Grafiği

Kutu grafiği hazırlama Q1:Kutunun sol kenarı Q3:Kutunu sağ kenarı Q2:Kutunun ortasındaki çizgi Sapan hariç min.: Sol bıyık Sapan hariç max.: Sağ bıyık Sapan değer kontrolu Q1 – 1.5(Q3 – Q1) Q3 + 1.5(Q3 – Q1) bu değerleri aşan veriler * ile gösterilir.

Örnek: Yazlık ürünler satan bir mağazada haftalık satılan t-shirt sayıları yandaki tabloda verilmiştir. Verilen tablodan beş sayı özetini bulunuz ve kutu grafiğini çiziniz. 27 22 20 17 18 21 29 32 30 19 28 25 31 23 24 44  

Çözüm: Öncelikle veriler yandaki gibi sıralanırsa; Q1=(31+1)/4=8.sıraya karşılık gelen veri olur. Q1=18 Q3=3(31+1)/4=24. sıraya karşılık gelen veri olur. Q3=28 Minimum değer=17, Maksimum değer=44 ve Medyan(Q2)=22 olur. Sapan değerleri kontrol etmek için; Q1-1,5(Q3-Q1)=18-1,5(28-18)=3 Q3+1,5(Q3-Q1)=28+1,5(28-18)=43 bulunur. Bu durumda elimizdeki 44 değeri sapan değerdir ve * ile gösterilir.. 17 20 25 21 27 18 28 22 29 30 31 19 23 32 24 44

45 44 sapan değer * 40 35 30 25 Medyan(Q2)=22 20

Kutu Grafiği Figure 2-16

Kutu Grafiği Figure 2-17

16) Basıklık Ölçüsü Aşağıdaki A ve B dağılımlarının ortalamaları, değişkenlik ölçülerinin aynı olmasından dolayı ve hatta ikisinin de simetrik olmalarından dolayı bu iki dağılışı ayırt etmek için Basıklık Ölçüsü kullanılır.

4 > 3 ise Seri Sivri Ya da Yüksek Herhangi bir olasılık fonksiyonunun şekli ile ilgili parametrelerden bir tanesi de basıklık ölçüsüdür. Basıklık Ölçüsü ortalamaya göre dördüncü momentten gidilerek hesaplanır ve 4 olarak gösterilir. Basit Seri İçin 4 = 3 ise Seri Normal 4 < 3 ise Seri Basık 4 > 3 ise Seri Sivri Ya da Yüksek