Hafta 03: Verinin Numerik Analizi (Yrd.Doç.Dr. Levent AKSOY) İstatistik eİKT-203 Hafta 03: Verinin Numerik Analizi (Yrd.Doç.Dr. Levent AKSOY)
Konular Verinin görsel özetlenmesi ve histogram. Ortalama, standart sapma ve diğer tanımlayıcı istatistikler. Kombinasyon, Permutasyon ve Olasılık. Olasılık kuramı. Kesikli rassal değişkenler. Sürekli rassal değişkenler. Normal dağılım. Örneklem dağılımı eİKT 203 – İstatistik Hafta: 03 – Verinin Numerik Analizi
Veriyi Tanımlama Verinin iki temel özelliği dikkatimizi çeker: Merkezi Eğilim ve Yayıklık Merkezi Eğilim Ölçüleri: Mod Medyan Aritmetik Ortalama Geometrik Ortalama Yayıklık Ölçüleri: Aralık Dördebölenler Aralığı Ortalama Mutlak Sapma Varyans / Standart Sapma eİKT 203 – İstatistik Hafta: 03 – Verinin Numerik Analizi
Veriyi Tanımlama Ortalama Medyan Mod Aritmetik Ortalama Merkezi Eğilim Ortalama Medyan Mod Aritmetik Ortalama Sıralı değerlerin ortası En sık gözlenen değer (varsa) eİKT 203 – İstatistik Hafta: 03 – Verinin Numerik Analizi
Mod En çok tekrarlayan değere mod denir. Uç değerlerden çok etkilenmez. Hiç mod olmayabileceği gibi birden çok mod da olabilir. 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 1 2 3 4 5 6 Mod yok Mod = 9 eİKT 203 – İstatistik Hafta: 03 – Verinin Numerik Analizi
Medyan En ortadaki gözlemdir. Gözlemlerin %50si solunda %50si sağındadır. Uç değerlerden çok etkilenmez. 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 Medyan = 3 Medyan = 3 eİKT 203 – İstatistik Hafta: 03 – Verinin Numerik Analizi
Medyan Medyan en ortadaki gözlemdir. Eğer gözlem sayısı tek ise medyan sıradadır (en ortadaki gözlemdir). Eğer gözlem sayısı çift ise medyan ve sıradaki gözlemlerin (en ortadaki iki gözlemin) toplamının yarısıdır. eİKT 203 – İstatistik Hafta: 03 – Verinin Numerik Analizi
Aritmetik Ortalama Aritmetik ortalama en çok kullanılan merkezi eğilim ölçüsüdür. Tüm gözlemlerin değerlerinin toplanıp gözlem sayısına bölünmesiyle bulunur. 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 Ortalama = 3 Ortalama = 4 eİKT 203 – İstatistik Hafta: 03 – Verinin Numerik Analizi
Ortalama Daha formal gösterimiyle ortalama: eİKT 203 – İstatistik Hafta: 03 – Verinin Numerik Analizi
Geometrik Ortalama Gözlemlerin değerlerinin mertebelerinin birbirlerinden çok farklı olması durumunda ortalama en büyük değerden çok etkilenir. Bu durumda geometrik ortalama kullanılabilir. Örneğin gözlemlerimiz {15, 250, 4000} olsun. Aritmetik ortalama en büyük değerden çok etkilenir. Geometrik ortalama gözlem değerlerinin birbirleriyle çarpılıp gözlem sayısı kökünün alınmasıyla bulunur. eİKT 203 – İstatistik Hafta: 03 – Verinin Numerik Analizi
Geometrik Ortalama Formal gösterimiyle ortalama: Her iki tarafın da logaritmasını alırsak. eİKT 203 – İstatistik Hafta: 03 – Verinin Numerik Analizi
Merkezi aynı, yayıklık farklı Yayıklık Ölçütleri Gözlemlerin ne kadar yayıldığını ölçen yöntemler. Aralık Dördebölenler Aralığı Ortalama Mutlak Sapma Varyans / Standart Sapma Merkezi aynı, yayıklık farklı eİKT 203 – İstatistik Hafta: 03 – Verinin Numerik Analizi
Aralık Aralık = Xmaks – Xmin En basit yayıklık ölçütüdür. En büyük gözlem ile en küçük arasındaki farka eşittir. Aralık = Xmaks – Xmin Örnek: 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Aralık = 14 - 1 = 13 eİKT 203 – İstatistik Hafta: 03 – Verinin Numerik Analizi
Aralık Verinin nasıl dağıldığına bakmaz Uç değerlerden doğrudan etkilenir 7 8 9 10 11 12 7 8 9 10 11 12 Aralık = 12 - 7 = 5 Aralık = 12 - 7 = 5 1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,5 Aralık = 5 - 1 = 4 1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,120 Aralık = 120 - 1 = 119 eİKT 203 – İstatistik Hafta: 03 – Verinin Numerik Analizi
Dördebölenler Dördebölenler veriyi her bölümünde eşit sayıda gözlem olacak şekilde ayıran değerlerdir. Gözlemlerin %25’i Birinci Dördebölen’den (Q1) küçük, %75’i büyüktür. Q2 medyan ile aynıdır (%50’si küçük, %50’si büyüktür). Gözlemlerin sadece %25’i üçüncü dördebölenden büyüktür. 25% 25% 25% 25% Q1 Q2 Q3 eİKT 203 – İstatistik Hafta: 03 – Verinin Numerik Analizi
Dördebölen Hesaplaması Sıralı verinden aşağıdaki sırada olan veriler dördebölenlerin değerleridir. Birinci Dördebölenin Yeri: Q1 = 0.25(n+1) İkinci Dördebölenin Yeri: Q2 = 0.50(n+1) (medyan) Üçüncü Dördebölenin Yeri: Q3 = 0.75(n+1) n gözlem sayısı eİKT 203 – İstatistik Hafta: 03 – Verinin Numerik Analizi
Dördebölen Hesaplaması Birinci Dördebölen n=9 iken (n+1)/4’üncü veri = (9+1)/4 = 10 / 4 = 2,5. veri birinci dördebölendir. Tam sayı olmadığı için 2. ve 3.’nün ortalaması alınır. Q1 = 12,5 Sıralı Veri: 11 12 13 16 16 17 18 21 22 eİKT 203 – İstatistik Hafta: 03 – Verinin Numerik Analizi
Dördebölenler Aralığı Ortadaki %50 veriyi içeren aralıktır. Üçüncü ile birinci dördebölen arasındaki farktır. Dördebölenler Aralığı = Q3 - Q1 eİKT 203 – İstatistik Hafta: 03 – Verinin Numerik Analizi
Ortalama Mutlak Sapma Bir verinin ortalamasından sapmasının ortalama değerini verir. eİKT 203 – İstatistik Hafta: 03 – Verinin Numerik Analizi
Geometrik Ortalama Varyans sapmaların karelerinin yaklaşık ortalamasıdır. eİKT 203 – İstatistik Hafta: 03 – Verinin Numerik Analizi
Geometrik Ortalama Standart Sapma varyansın kare köküdür. eİKT 203 – İstatistik Hafta: 03 – Verinin Numerik Analizi