Sunum yükleniyor. Lütfen bekleyiniz

Sunum yükleniyor. Lütfen bekleyiniz

Bölüm 03 Sayısal Tanımlama Teknikleri

Benzer bir sunumlar


... konulu sunumlar: "Bölüm 03 Sayısal Tanımlama Teknikleri"— Sunum transkripti:

1 Bölüm 03 Sayısal Tanımlama Teknikleri
Dr. Halil İbrahim CEBECİ İstatistik Ders Notları

2 Sayısal Tanımlama Teknikleri
Merkezi Eğilim Ölçütleri Ortalama, Medyan, Mod Değişkenlik Ölçütleri Dağılım Aralığı, Standart Sapma, Varyans, Değişkenlik Katsayısı Göreceli Durum Ölçütleri Yüzdelik, Çeyreklik Doğrusal İlişki Ölçütleri Kovaryans, Korelasyon, En Küçük Kareler Doğrusu İstatistik Ders Notları – Bölüm 03

3 Merkezi Eğilim Ölçütleri
Aritmetik Ortalama Basit şekli ile bütün gözlem değerlerinin toplam gözlem adedine bölünmesi ile hesaplanır. Aykırı değerlerden fazlasıyla etkilenen bir ölçüttür. Örn. Bir milyoner mahalleye taşındığı zaman, ortalama hane halkı alım gücü birden yükselir. 𝐴𝑛𝑎 𝐾ü𝑡𝑙𝑒 𝑂𝑟𝑡𝑎𝑙𝑎𝑚𝑎𝑠𝚤: Ö𝑟𝑛𝑒𝑘𝑙𝑒𝑚 𝑂𝑟𝑡𝑎𝑙𝑎𝑚𝑎𝑠𝚤: İstatistik Ders Notları – Bölüm 03

4 Aritmetik Ortalama = 89+77+90+…+80 20 =74,65
Örn3.1 – Bir sınıftaki öğrencilerin ağırlıkları aşağıda verilmiştir. Aritmetik ortalamayı hesaplayınız. Eğer 140 kg ağırlığında yeni bir öğrenci sınıfa kayıt yaptırırsa, yeni ortalama ne olur. Yeni sonucun geçerliliğini tartışınız. 89 77 90 101 66 76 59 64 75 88 65 72 70 68 82 80 = … =74,65 = …+80+𝟏𝟒𝟎 𝟐𝟏 =𝟕𝟕,𝟕𝟕 İstatistik Ders Notları – Bölüm 03

5 Merkezi Eğilim Ölçütleri
Medyan Önceden sıralanmış veri seti içerisindeki tam orta değerdir. Eğer gözlem sayısı çift ise ortada bulunan iki değerin ortalaması medyan olarak kabul edilir. İstatistik Ders Notları – Bölüm 03

6 Merkezi Eğilim Ölçütleri
Örn3.2 - Örn3.1 deki değerler için medyanı bulunuz. 𝑀𝑒𝑑𝑦𝑎𝑛 20 = =73,5 59 64 65 66 68 70 72 75 76 77 80 82 88 89 90 101 140 𝑀𝑒𝑑𝑦𝑎𝑛 21 =75 İstatistik Ders Notları – Bölüm 03

7 Merkezi Eğilim Ölçütleri
Mod En yüksek frekansa sahip olan gözlem değeridir. Merkezi eğilim ölçütü olarak kullanılmasında bazı sıkıntılar olabilir. Eğer örnek sayısı çok az ise uygun sonuç üretmeyebilir. Bazı durumlarda tek değildir. İstatistik Ders Notları – Bölüm 03

8 Mod Örn3.3 – Örn3.1 deki değerleri dikkate alarak mod değerini hesaplayınız. Mode=66 89 77 90 101 66 76 59 64 75 88 65 72 70 68 82 80 İstatistik Ders Notları – Bölüm 03

9 Geometrik Ortalama Bir veri setindeki aykırı değerlerin etkisini minimize edebilmek için geometrik ortalama kullanılır. 𝐺= 𝑛 𝑖=1 𝑛 𝑥 𝑖 Örn3.4 – Bir sınav için final sonuçları aşağıda verilmiştir. Geometrik ve Aritmetik ortalamayı hesaplayınız. 45 37 40 30 35 50 95 𝜇= =47,13 𝐺= 8 45∗37∗40∗30∗35∗45∗50∗95 =44,34 İstatistik Ders Notları – Bölüm 03

10 Değişkenlik Ölçütleri
Merkezi eğilim ölçüleri dağılım hakkında bilgi vermez. Bir veri setinin ortalamasının ne olduğu kadar, verilerin bu ortalama etrafında nasıl değişkenlik gösterdiğinin de bilinmesi önemlidir. Yandaki örnekten de anlaşılacağı üzere, mavi ve kırmızı sınıfların bir dersten aldığı ortalamalar aynı olmakla beraber, farkı değişkenlikleri oldukları görsel olarak söylenebilir. İstatistik Ders Notları – Bölüm 03

11 Değişkenlik Ölçütleri
Dağılım Aralığı: Dağılım aralığı en basit değişkenlik ölçütüdür. 𝐷𝑎ğ𝚤𝑙𝚤𝑚 𝐴𝑟𝑎𝑙𝚤ğ𝚤=𝐸𝑛 𝐵ü𝑦ü𝑘 𝐷𝑒ğ𝑒𝑟−𝐸𝑛 𝐾üçü𝑘 𝐷𝑒ğ𝑒𝑟 Avantaj : Basitlik Dezavantaj : Basitlik Set 1 : 4, 4, 4, 4, 4, 50 𝐷𝑎ğ𝚤𝑙𝚤𝑚 𝐴𝑟𝑎𝑙𝚤ğ𝚤=50−4=46 Set 2 : 4, 8, 15, 24, 39, 50 İstatistik Ders Notları – Bölüm 03

12 Değişkenlik Ölçütleri
Varyans: Bir veri setindeki her bir değerin ortalamadan uzaklıklarının karelerinin, ortalaması şeklinde hesaplanır. Varyans beklenen değer ile (Bütçe) gözlenen değer (Harcama) arasındaki farktır. Yapılması gereken ile yapılan arasındaki farktır. 𝐴𝑛𝑎 𝐾ü𝑡𝑙𝑒 𝑉𝑎𝑟𝑦𝑎𝑛𝑠𝚤: Ö𝑟𝑛𝑒𝑘𝑙𝑒𝑚 𝑉𝑎𝑟𝑦𝑎𝑛𝑠𝚤: İstatistik Ders Notları – Bölüm 03

13 Varyans Örn3.5 – 6 mezun tarafından ortalama yapılan iş başvurusu sayısı aşağıda verilmiştir. Varyansı hesaplayınız. 17 15 23 7 9 13 = =14 = (17−14) 2 + (15−14) 2 +…+ (13−14) 2 6−1 = =33.2 İstatistik Ders Notları – Bölüm 03

14 Değişkenlik Ölçütleri
Standart Sapma: Ortalama veya beklene değerden ne ölçüde sapma olduğunu gösterir. Düşük standart sapma değerleri verilerin ortalamaya daha yakın seyrettiğini gösterir. Yüksek değerlerde ise veriler o kadar ortalamadan uzaklaşır. 𝐴𝑛𝑎 𝐾ü𝑡𝑙𝑒 𝑆𝑡𝑎𝑛𝑑𝑎𝑟𝑡 𝑆𝑎𝑝𝑚𝑎𝑠𝚤 𝜎= 𝜎 2 Ö𝑟𝑛𝑒𝑘𝑙𝑒𝑚 𝑆𝑡𝑎𝑛𝑑𝑎𝑟𝑡 𝑆𝑎𝑝𝑚𝑎𝑠𝚤 𝑠= 𝑠 2 İstatistik Ders Notları – Bölüm 03

15 Standard Deviation Örn3.6 – Örn3.5 daki değerler için standart sapma hesaplayınız. 17 15 23 7 9 13 =33.2 𝑠= 𝑠 2 = =5.8 İstatistik Ders Notları – Bölüm 03

16 Standart Sapma Nasıl Yorumlanır?
Eğer histogram çan eğrisi şeklinde ise Bütün gözlemlerin yaklaşık %68 si tek standart sapmalık aralıktadır. Bütün gözlemlerin yaklaşık %95 i iki standart sapmalık aralıktadır. Bütün gözlemlerin yaklaşık %99,7 si ise üç standart sapmalık aralıktadır. İstatistik Ders Notları – Bölüm 03

17 Chebysheff’s Teoremi 1− 1 𝑘 2 𝑓𝑜𝑟 𝑘>1
Chebysheff’s Teoremi, yardımıyla her türlü şekle sahip dağılımlar (sadece çan eğrisi değil) için standart sapma yorumlamaları için kullanılır. Gözlem değerleri ortalamadan 𝑘 standart sapma kadar dağılıyorsa, o aralıkta beklenen örneklem yüzdesi aşağıdaki formülle hesaplanır. 1− 1 𝑘 2 𝑓𝑜𝑟 𝑘>1 İstatistik Ders Notları – Bölüm 03

18 Chebysheff’s Teoremi Örn3.7 – Bir öğretim üyesi vermiş olduğu dersin final sınavı notları ortalamasının 72 ve standart sapmasının 6 olduğunu açıklamıştır. Öğretim üyesi not dağılımı hakkında bilgi sahibi değilse, aşağıdaki değer aralıkları ile ilgili yorumda bulununuz. 66 ila 78? 60 ila 84? 54 ila 90? C3.7a (66, 78) = (72 - 6, ) olduğundan tek standart sapmalık (k=1) bir dağılım olduğunu öngörebiliriz − =0 Yani notların % 0’ı bu aralık arasına düşer. İstatistik Ders Notları – Bölüm 03

19 Chebysheff’s Teoremi C3.7b
(60, 84) = ( , ) olduğundan çift standart sapmalık (k=2) bir dağılım olduğunu öngörebiliriz 1− = 3 4 Yani notların % 75 i 60 ila 84 arasındadır. C3.7c (54, 90) = ( , ) olduğundan üç standart sapmalık (k=3) bir dağılım olduğunu öngörebiliriz 1− = 8 9 Yani notların % 89 u 654 ila 90 arasındadır. İstatistik Ders Notları – Bölüm 03

20 Chebysheff’s Teoremi Örn3.8 – Örn3.8 deki verilerin dağılımının çan eğrisi şeklinde olduğu biliniyorsa bu durumda aynı sorulara cevap veriniz. 66 ila 78? Yaklaşık notların % 68’i 66 ile 78 arasındadır. 60 and 84? Yaklaşık notların % 95’i 60 ile 84 arasındadır. 54 and 90? Yaklaşık notların % 99,7 ’si 54 ile 90 arasındadır. İstatistik Ders Notları – Bölüm 03

21 Göreceli Durum Ölçütleri
Yüzdelik (Persentil): Yüzdelik; bir değişkenin gözlem değerleri arasındaki belirli yüzdelik dilimi belirleyen değerdir. 𝑄 1 =İ𝑙𝑘 𝑣𝑒𝑦𝑎 𝑎𝑙𝑡 ç𝑒𝑦𝑟𝑒𝑘𝑙𝑖𝑘(%25 𝑦ü𝑧𝑑𝑒𝑙𝑖ğ𝑖) 𝑄 2 =İ𝑘𝑖𝑛𝑐𝑖 ç𝑒𝑦𝑟𝑒𝑘𝑙𝑖𝑘 𝑀𝑒𝑑𝑦𝑎𝑛 ((%50 𝑦ü𝑧𝑑𝑒𝑙𝑖ğ𝑖) 𝑄 3 =Üçü𝑛𝑐ü 𝑣𝑒𝑦𝑎 ü𝑠𝑡 ç𝑒𝑦𝑟𝑒𝑘𝑙𝑖𝑘((%75 𝑦ü𝑧𝑑𝑒𝑙𝑖ğ𝑖) 𝐵𝑖𝑟 𝑦ü𝑧𝑑𝑒𝑙𝑖𝑘 𝑑𝑒ğ𝑒𝑟𝑖𝑛 𝑘𝑜𝑛𝑢𝑚𝑢= 𝐿 𝑝 =(𝑛+1) 𝑃 100 İstatistik Ders Notları – Bölüm 03

22 Göreceli Durum Ölçütleri
Örn3.9 – Bir grup çalışanın ağırlık değerleri aşağıda verilmiştir: 173 165 171 175 188 183 177 160 151 169 162 179 145 168 158 186 182 154 180 164 166 157 %25 lik dilime karşılık gelen değeri ( 𝑄 1 ) bulunuz %50 lik dilime karşılık gelen değeri ( 𝑄 2 ) bulunuz. %75 lik dilime karşılık gelen değeri ( 𝑄 3 ) bulunuz. İstatistik Ders Notları – Bölüm 03

23 Göreceli Durum Ölçütleri
Sıra Ağırlık 1 145 14 171 2 151 15 3 154 16 173 4 157 17 175 5 158 18 6 160 19 177 7 162 20 179 8 21 180 9 164 22 182 10 165 23 183 11 166 24 186 12 168 25 188 13 169 C3.9a 𝐿 𝑝 = 𝑛+1 𝑃 100 = =6.5 𝑄 1 = =161 C3.9b 𝑄 2 =𝑀𝑒𝑑𝑖𝑎𝑛=169 C3.9c 𝐿 𝑝 = 𝑛+1 𝑃 100 = =19.5 𝑄 3 = =178 İstatistik Ders Notları – Bölüm 03

24 Kutu Grafiği Sayılabilir değerler için bir grafik gösterim tekniğidir. Bir kutu grafiği olası uç değerleri, ortalamayı ve dağılımını birlikte sunabilir. 5 farklı değer grafik Üzerinde sunulur. En Küçük Değer(𝑆) Alt Çeyreklik ( 𝑄 1 ) Medyan( 𝑄 1 ) Üst Çeyreklik ( 𝑄 1 ) En Büyük Sayı (𝐿) İstatistik Ders Notları – Bölüm 03

25 Kutu Grafiği Çeyreklikler arası uzaklık:
Alt ve üste çeyreklikler arasındaki uzaklığı belirtir. Ç𝑒𝑦𝑟𝑒𝑘𝑙𝑖𝑘𝑙𝑒𝑟 𝑎𝑟𝑎𝑠𝚤 𝑢𝑧𝑎𝑘𝑙𝚤𝑘=𝐼𝑄𝑅= 𝑄 3 − 𝑄 1 Çubuklar (Whiskers): Soldan sağa doğru uzayan doğrusal çizgi. Sola doğru 𝑄 1 −1,5∗𝐼𝑄𝑅 kadar uzar. Veri setindeki en küçük değerden daha sola gidemez. Sağa doğru 𝑄 2 +1,5∗𝐼𝑄𝑅 kadar uzar. Veri setindeki en büyük değerden daha sağa gidemez. İstatistik Ders Notları – Bölüm 03

26 Kutu Grafiği Örn3.10 –Örn3.10 daki verileri kullanarak bir kutu grafiği çiziniz. Çeyrekler arası uzaklığı ve aykırı değerleri belirtiniz. A3.11 – Öncelikle beş farklı tanımlayıcı istatistik değerleri hesaplayalım. Daha sonra bu değerleri grafik üzerine yerleştirelim. Descriptive Statistics Numerical Value S 145 𝑄 1 161 𝑄 2 169 𝑄 3 178 L 188 𝐼𝑄𝑅 17 𝐼𝑄𝑅∗1.5 135.5 and 203,5 * There is no outlier İstatistik Ders Notları – Bölüm 03

27 Kutu Grafiği Wendy’s firmasının servis süresi en kısa ve en az değişkenlik gösterendir. Hardee’s en yüksek değişkenlik değerine ulaşır. Jack-in-the-Box en uzun servis süresine sahiptir. İstatistik Ders Notları – Bölüm 03

28 Doğrusal İlişki Ölçütleri
Kovaryans: İki değişkenin birlikte ne kadar değiştiğini gösteren ölçüttür. 𝐴𝑛𝑎 𝐾ü𝑡𝑙𝑒 𝐾𝑜𝑣𝑎𝑟𝑦𝑎𝑛𝑠𝚤= Ö𝑟𝑛𝑒𝑘𝑙𝑒𝑚 𝐾𝑜𝑣𝑎𝑟𝑦𝑎𝑛𝑠𝚤= İstatistik Ders Notları – Bölüm 03

29 Doğrusal İlişki Ölçütleri
Korelasyon Katsayısı: Kovaryans değerinin 0 ila ∓1 arasında ölçeklendirilmiş halidir. +1 ve -1 değerlerine yaklaşıldıkça ilişkinin derecesi yükselir. 𝜌= 𝜎 𝑥𝑦 𝜎 𝑥 𝜎 𝑦 𝐴𝑛𝑎 𝐾ü𝑡𝑙𝑒 𝐾𝑜𝑟𝑒𝑙𝑎𝑠𝑦𝑜𝑛 𝐾𝑎𝑡𝑠𝑎𝑦𝚤𝑠𝚤= 𝑟= 𝑆 𝑥𝑦 𝑆 𝑥 𝑆 𝑦 Ö𝑟𝑛𝑒𝑘𝑙𝑒𝑚 𝐾𝑜𝑟𝑒𝑙𝑎𝑠𝑦𝑜𝑛 𝐾𝑎𝑡𝑠𝑎𝑦𝚤𝑠𝚤= İstatistik Ders Notları – Bölüm 03

30 Doğrusal İlişki Ölçütleri
Örn3.11 – Aşağıdaki verileri dikkate alarak iki değişkenin birlikte nasıl değiştiğini, kovaryans ve korelasyon katsayılarını hesaplayarak yorumlayınız. Eğitim Alınan Yıl (𝑥) Aylık Gelir (𝑦) 11 25 12 33 22 15 41 8 18 10 28 32 24 17 53 26 İstatistik Ders Notları – Bölüm 03

31 Doğrusal İlişki Ölçütleri
(𝑥) (𝑦) (𝒙− 𝒙 ) (𝒙− 𝒙 ) 𝟐 (𝒚− 𝒚 ) (𝒚− 𝒚 ) 𝟐 (𝒙− 𝒙 ) (𝒚− 𝒚 ) 11 25 - 0.8 0.64 -5,2 27.04 4.16 12 33 0.2 0.04 2,8 7.84 0.56 22 -0.8 -8,2 67.24 6.56 15 41 3.2 10.24 10,8 116.64 34.56 8 18 -3.8 14.44 -12,2 148.84 46.36 10 28 -1.8 3.24 -2,2 4.84 3.96 32 1,8 -1.44 24 -6,2 38.44 -1.24 17 53 5.2 22,8 519.84 118.56 26 -4,2 17.64 3.36 𝒙 =11.8 𝒚 =30.2 Σ=57.6 Σ=951.8 Σ=215.4 İstatistik Ders Notları – Bölüm 03

32 Doğrusal İlişki Ölçütleri
= =2.53 = =10.28 = =23.93 𝑟= 𝑠 𝑥𝑦 𝑠 𝑥 𝑠 𝑦 = ∗10.28 =0.92 İstatistik Ders Notları – Bölüm 03

33 Doğrusal İlişki Ölçütleri
En Küçük Kareler Yöntemi: Gözlem değerleri arasına, bu değerler ile arasında oluşabilecek uzaklıkları minimum yapacak şekilde yerleştirilecek bir doğrunun denkleminin belirlenmesidir. 𝑦 = 𝑏 0 + 𝑏 1 𝑥 𝑏 0 = 𝑦 − 𝑏 1 𝑥 İstatistik Ders Notları – Bölüm 03

34 Doğrusal İlişki Ölçütleri
Örn3.12 – Örn 3.11 deki değerler için en küçük kareler (regresyon) doğrusu denklemini belirleyiniz. 𝑏 0 =30.2−3.74∗11.8=−13.93 = =3.74 𝑦 =− 𝑥 İstatistik Ders Notları – Bölüm 03

35 Çalışma Soruları S3.1 – Aşağıdaki ver seti düşünüldüğünde ortalama
medyan the mod değerlerini hesaplayınız. 37 32 30 28 35 29 İstatistik Ders Notları – Bölüm 03

36 Çalışma Soruları S3.2 - Aşağıdaki ver seti düşünüldüğünde Ortalama
Dağılım Aralığı Varyans Standart Sapma değerlerini hesaplayınız. 17 25 18 14 28 21 İstatistik Ders Notları – Bölüm 03

37 Çalışma Soruları S3.3 – Aşağıdaki verileri dikkate alarak,
Kutu grafiğini hazırlayınız. Çeyreklikler arası uzaklıkları belirleyerek, aykırı değer olup olmadığını sorgulayınız. 208 160 175 334 228 211 179 354 265 215 191 239 298 226 220 260 173 163 165 252 422 284 232 225 348 290 180 300 200 245 204 256 281 230 275 158 224 315 217 İstatistik Ders Notları – Bölüm 03

38 Çalışma Soruları S3.4 – Aşağıdaki verileri dikkate alarak,
Kovaryansı hesaplayınız. Korelasyon katsayısını hesaplayınız. En küçük kareler doğrusu denklemini belirleyiniz. Reklam Sayısı (𝑥) Müşteri Sayısı (𝑦) 5 528 12 876 8 653 6 571 4 556 15 1058 10 963 7 719 İstatistik Ders Notları – Bölüm 03


"Bölüm 03 Sayısal Tanımlama Teknikleri" indir ppt

Benzer bir sunumlar


Google Reklamları