Ölçmeyle İlgili Temel İstatistikler
Bir eğitimci olarak niçin belli düzeyde istatistik bilmeliyiz? Günlük hayatta çevremizde olup bitenleri izleyebilmek, anlayabilmek ve yorumlayabilmek için Borsa düşünce dolara ne oluyor? Seçimleri kim kazanacak? Şampiyon kim olacak? Sınıftaki en başarılı öğrenci kim? Sınavda ilk yüzde elliye kimler giriyor? Elde ettiğimiz verilerle ilişkiler kurar, sonuçlar çıkarmaya çalışırız! 05.04.2017 05.04.2017 2 2
İstatistik Nedir? İstatistik, belli amaçlar için veri toplama, toplanan verileri düzenleme, çözümlemenin yanı sıra yorumlama teknik ve yöntemleri olarak tanımlanabilir. Nitel ve nicel değerlerle ilgilenir. Nicel verilerin ve bilgilerin düzenlenmesi, özetlenmesi ve açıklanması betimsel (descriptive) istatistiğin uğraştığı alandır. Nitel verilerin yorumlanması ve betimsel istatistik sonuçları kullanılarak bir olay veya olgu hakkında varsayımda bulunmak, genellemeler yapmak sonuç çıkarıcı (inferential) istatistiktir. 05.04.2017 05.04.2017 3 3
Bir çalışma sonunda toplanan veriler ham verilerdir. Verileri anlamlı hâle getirmek için toplanan veriler; Sözel ifadelerle açıklanır. Tablolar oluşturularak sunulur. Grafiklerle ifade edilir. Veriler üzerinde bazı istatistiksel hesaplamalar yapılır. Bu sayılan yöntemlerden birkaçı birden kullanılır. Yukarıda sayılan yöntemlerden hangisinin kullanılacağı; ne tür ölçek kullanıldığına ve ne tür veri elde edildiğine bağlıdır. 05.04.2017 05.04.2017 4 4
Evren-Genel Uzay Araştırmanın yapıldığı, verilerin toplanıldığı, gözlemlerin yapıldığı alandaki tüm nesneler veya bireyler evreni oluşturur. Örneklem Evrenin içinden ayrıntılı olarak üzerinde çalışmak amacıyla seçilen bir grup nesne veya birey, çalışmanın örneklemini oluşturur. Örneklem evrenin bütün özelliklerini yansıtmalıdır. Örneklem seçimi çeşitli tekniklerle yapılır. Bütün bu teknikler araştırmanın türüne ve amacına bağlıdır. Ölçmede kesinlik Kullanılan ölçeklerin hassasiyetine bağlı olarak yapılan ölçümlerin kesinlik dereceleri de değişmektedir. 05.04.2017 05.04.2017 5 5
Verilerin Özetlenmesi ve Grafikle Gösterilmesi Frekans Dağılımları Basit Frekans Dağılımı Gruplandırılmış Frekans Dağılımı Verilerin Grafikle Gösterilmesi Bar Grafik Histogram Frekans Poligonu Çizgi Grafiği Pasta ya da Daire Grafiği 05.04.2017 05.04.2017 6 6
Frekans Dağılımları Gözlem ya da kayıt yoluyla elde edilen ve işlenmemiş, anlamlı hale getirilmemiş sayılar yığını “ham veri” olarak kabul edilir. Ham verilerin düzenlenmesinde, özetlenmesinde, anlamlı ve anlaşılır hale getirilmesinde en sık kullanılan yöntemlerden biri, bu verilerin frekans dağılımlarının verilmesidir. Frekans dağılımlarının verilmesi ile karışık halde bulunan puanlamalar derlenir, puanlar yüksekten düşüğe ya da tersi biçimde sıralanabilir ve puanlar hakkında yorumlar yapılabilir. 05.04.2017 05.04.2017 7 7
Frekans Dağılımları Ham Puanlar Sıralanmış Puanlar 05.04.2017 8 8
Basit Frekans Dağılımı Basit frekans dağılımı, her puan değerinin kaç sefer tekrarlandığını gösterir. Frekans “f” harfi ile gösterilir. Frekans tablosu hazırlanırken; tüm puanlar gösterilir. İstenirse öğrencilerin almadıkları diğer puanlar da verilebilir. Toplamalı frekans, frekans değerlerinin ard arda toplanması ile elde edilir. 05.04.2017 05.04.2017 9 9
05.04.2017 05.04.2017 10 10
Gruplandırılmış Frekans Dağılımı Gruplandırılmış frekans dağılımında, belirli puan kategorilerinin oluşturulması için puanlar arasındaki ranjlar ya da aralıklar dikkate alınır. Burada grup ya da kategorilerin aralığını gösteren “aralık katsayısı”nın bulunması önemlidir. 05.04.2017 05.04.2017 11 11
Gruplandırılmış Frekans Dağılımı Gruplandırılmış frekans dağılımını belirlemede “aralık katsayısı”nı bulmak için en yüksek ve en düşük puanlar arasındaki fark (RANJ) belirlenir. Bu değer tahmini grup sayısına bölünür. Grup ya da kategori sayısı 5, 8, 10, 12 ya da 15 olarak alınabilir. Az sayıda kategori oluşturma veri kaybına, çok sayıda kategori oluşturma ise işlemlerin güçleşmesine yol açabilir. 05.04.2017 12 12
05.04.2017 05.04.2017 13 13
05.04.2017 05.04.2017 14 14
05.04.2017 05.04.2017 15 15
Temel Kavramlar 05.04.2017 05.04.2017 16 16
Temel Kavramlar 05.04.2017 05.04.2017 17 17
Bar Grafik İstatistiksel verileri açıklamak için en çok kullanılan grafik türüdür. Bar diyagram, birbirini izleyen barların bir serisini gösterir. Barlar küçükten büyüğe ya da tersi biçimde sıralanır. 05.04.2017 18 18
Histogram Histogram bar grafiğe benzer. Ancak, bar grafik kategorik ya da kesikli grup aralıklarıyla çizildiği halde, histogram sürekli grup aralıklarıyla çizilir. Histogramda dikey eksen her zaman sıfır değeriyle başlarken, yatay eksen sıfır ya da büyük bir değerden başlayabilir. 05.04.2017 19 19
Frekans Poligonu Puan aralıkları ve orta noktalar Histogramda verilen puan aralıklarının orta noktalarının birleştirilmesiyle oluşur. Puan aralıkları ve orta noktalar 05.04.2017 20 20
Çizgi Grafiği Frekans poligonunun iki ucu yatay eksene değmediği zaman çizgi grafiği oluşur. Çizgi grafiği sürekli verilere uygulanabilir. Puanlar ya da puan aralıkları yatay eksende, bunlara ait frekanslar dikey eksende yer alır. 05.04.2017 22 22
Pasta ya da Daire Grafiği Özellikle değişkenlerin yüzdelik değerlerini göstermede sıklıkla kullanılan bir grafik türüdür. 05.04.2017 23 23
Merkezi Eğilim (Yığılma) Ölçüleri Aritmetik Ortalama Mod (Tepe Değer) Medyan (Ortanca) 05.04.2017 24 24
Aritmetik Ortalama Puan toplamlarının veri sayısına bölümüdür. Örnek: 95,88,73,67,59,46,35,26,23 Ortalama: 56.88 05.04.2017 25
Mod (Tepe Değer) Mod ya da tepe değer, bir puan dağılımında en çok tekrar eden, yani frekansı en fazla olan puan ya da ölçümdür. Örnek: 60,72,82,72,61,81,72 ise Mod=72’dir. Güvenirliğinin düşük olması nedeniyle nadiren kullanılır. Çünkü bazı durumlarda dağılımın çarpık olması nedeniyle birden fazla mod bulunabilir. 05.04.2017 30 30
05.04.2017 05.04.2017 31 31
Tepe Değer (Mod) ile ilgili bazı önemli noktalar 1) Bir puan dağılımında puanların frekansı aynı ise dağılımın modu hesaplanamaz (mod yoktur). Örneğin; 1,1,1,5,5,5,7,7,7 puan dağılımının modu yoktur. 2) Bir dizi puan dağılımında ardı ardına gelen iki puanın frekansı birbirine eşitse bu durumda mod frekansı eşit olan puanların ortalamasıdır. Örneğin; 2,2,3,3,3,5,5,5,9,9 puan dağılımında 3 ve 5 puanlarının frekansları birbirine eşittir. Bu durumda mod (3+5)/2=4 olarak bulunur. Dizinin modu 4’tür. 3) Bir dizi puan dağılımında frekansı eşit fakat ardı ardına gelmeyen puanlar varsa, bu durumda dizinin iki modu olur. Örneğin; 2,3,3,3,4,5,6,6,6,7 puan dağılımının 3 ve 6 olmak üzere iki modu (bimodal) bulunmaktadır. 32 05.04.2017 32
Medyan (Ortanca) Büyüklük sırasına göre dizilmiş puanlar dizisinin tam ortasına düşen puandır. Örnek: 95,88,73,67,59,46,35,26,23 Medyan: 59 Puanların sayısı çift ise: ‘inci değerin ortalaması alınır Örnek: 95,88,73,67,59,46,35,26,23,12 Medyan: 52.5 05.04.2017 33
Medyan (Ortanca) Örnek: 4, 7, 8, 11, 12, 15, 19 ise Medyan=(n+1)/2=(7+1)/2=8/2=4. sıradaki 11’dir. Örnek: 3, 5, 7, 9 ise Medyan=n/2=4/2=2. sıradaki (5+7)/2=6’dır. 05.04.2017 34 34
Medyan (Ortanca) Medyan sıralamalı ölçeklerle elde edilen veriler için uygun bir merkezi eğilim ölçüsüdür. Medyanda ölçümlerin her birinin puan değerinden çok dağılım içindeki sırası önemlidir. 05.04.2017 35 35
05.04.2017 05.04.2017 39 39
05.04.2017 40
Dağılım (Değişim, Yayılma) Ölçüleri Yayılma Ölçüleri: Verilerin yığılma gösterdikleri noktadan ne kadar uzakta olduklarını, yani: merkeze yığılma ölçüsüne göre ne kadar dağıldıklarını belirler Ranj (dizi genişliği) Çeyrek Sapma Standart Sapma 05.04.2017 41
Puanların sıralanmış olması gerekmez Ranj (Dizi Genişliği) Bir veri grubunda en yüksek puan ile, en düşük puan arasındaki farktır. Puanların sıralanmış olması gerekmez Grubun homojen ya da heterojen bir dağılım gösterdiği hakkında bilgi verir. Örnek: 78,89,56,36,48,92,59,60 Ranj: 92-36=56 05.04.2017 42
Ranj (Dizi Genişliği) Örnek Birinci Dağılım: 59, 59, 59, 60, 61, 61, 61 ise Ranj=? 61-59=2 İkinci Dağılım: 30, 40, 50, 60, 70, 80, 90 ise Ranj=? 90-30=60 Bu iki dağılımda aritmetik ortalama ve medyanlar eşit olmasına karşın ranjları farklıdır. Dağılımın ranjı azaldıkça dağılımdaki puanlar birbirine yaklaşır ya da benzeşir, ranj arttıkça puanlar birbirinden uzaklaşır ya da puanlar arası fark artar. 05.04.2017 43
Çeyrek Sapma Çeyrek sapma, bir dağılımdaki üçüncü çeyrek (75.yüzdelik) ile birinci çeyrek (25.yüzdelik) arasındaki farkın yarısına eşittir. Aritmetik ortalama yerine medyanın kullanıldığı durumlarda kullanılması uygundur. 05.04.2017 44 44
25. yüzdelik için (Y25)= 20(25/100) = 5. puan (25) Aşağıda 20 öğrencinin İngilizce sınavından aldığı notlar küçükten büyüğe doğru sıralanarak verilmiştir. Çeyrek sapmayı hesaplayalım: 15,17,20,21,25,30,33,40,43,47,50,55,57,60,65,70,73,77,80,84 25. yüzdelik için (Y25)= 20(25/100) = 5. puan (25) 75. yüzdelik için (Y75)= 20(75/100) = 15. puan (65) Bu durumda çeyrek sapma (65-25)/2=20 olur. 05.04.2017 45 45
Baştan % 25. not 25 ve sondan % 75. not 65 olduğuna göre bu notların aritmetik ortalamadan ne kadar saptığını çeyrek sapma yaklaşık olarak vermektedir. 05.04.2017 46 46
Aralığın Gerçek Sınırı Örnek: Çeyrek Sapma Puan Aralığı f Toplamalı Frekans Aralığın Gerçek Sınırı 21,00-25,00 1 20,50-25,50 26,00-30,00 2 25,50-30,50 31,00-35,00 4 30,50-35,50 36,00-40,00 6 10 35,50-40,50 41,00-45,00 16 40,50-45,50 46,00-50,00 7 23 45,50-50,50 51,00-55,00 24 50,50-55,50 05.04.2017 47
05.04.2017 48 48
05.04.2017 49 49
Standart Sapma (SS) Örnek: 78,89,56,36,48,92,59,60 S=19.8 Bir veri grubunda verilerin aritmetik ortalamadan ne kadar uzaklaştığının ölçüsüdür. Puanların ortalamadan olan farklarının, kareleri toplamının ortalamasının (Varyans), kareköküne eşittir. Varyans standart sapmanın karesine eşittir. Örnek: 78,89,56,36,48,92,59,60 S=19.8 05.04.2017 50
Standart sapma Bir veri dizisinde standart sapmayı hesaplamak için önce aritmetik ortalama bulunur ve her veriyle aritmetik ortalamanın farkının karesi şeklinde hesaplanarak aşağıdaki formülle dizinin standart sapması hesaplanır. ÇEYREK SAPMA değişim hakkında kaba bir sonuç verir. SS verilerin oluşturduğu dizinin homojenliğiyle ilgili bilgi verir. 05.04.2017 51
Gruplandırılmış Frekans tablosuyla verilen dizinin standart sapması, aşağıdaki formül ile hesaplanır: 05.04.2017 52
Standart Sapmanın Özellikleri SS, bir veri grubunun ortalaması etrafındaki dağılımını belirlemek amacıyla kullanılır. Negatif değerler almaz. Veri grubundaki tüm değerler aynı ise SS sıfırdır. SS veri grubundaki uç değerlere karşı duyarlı olup tek bir uç değer dahi değerini artırabilir. Yani, dağılımı çarpık hale getirir. 05.04.2017 05.04.2017 55 55
Standart Sapma ve Aritmetik Ortalama Arasındaki İlişki Aritmetik ortalama ile standart sapmanın arası büyürse, Heterojen yapı oluşur ve grup başarısı düşer. Aritmetik ortalama ile standart sapmanın arası küçülürse, Homojen yapı oluşur ve grup başarısı artar. Bir puan dağılımında puanlar arası fark (ranj) büyüdükçe, Standart sapmada büyür. Bir testten elde edilen puanların standart sapması büyüdükçe, Testin güvenirliği artar. 05.04.2017 56
Standart Hata Standart sapmayla ilgili bir kavram da ortalamanın standart hatasıdır. Bir dağılımda standart hata, standart sapmanın örneklem sayısının kareköküne bölünmesiyle hesaplanır. 05.04.2017 57 57
Standart Puanlar Standart puan, gözlenen puanların ortalamadan farklarının standart sapmaya bölünmesiyle standart sapma birimi cinsinden elde edilen bir puandır. “Z” ve “T” puanları olmak üzere iki türlüdür. Aritmetik ortalaması 0,00 ve standart sapması 1,00 olan dağılıma birim normal dağılım ya da standart normal dağılım denir. Uygulanan bir testten elde edilen sonuçların standart normal dağılıma dönüştürülmesi ile elde edilen puanlara Z puanları adı verilir
5. test için Z puanı = +2 olarak bulunur. Z puanı, farklı test sonuçlarının karşılaştırılmasında ve matematiksel işlemlerde kolaylık sağlar. Farklı test sonuçlarının karşılaştırılmasına yönelik olarak aşağıdaki soruyu inceleyelim. Soru 2: Tabloya göre Ali hangi testte daha başarılıdır? Hangi iki testteki başarısı birbirine eşittir? 1. test için Z puanı = -1 2. test için Z puanı = 0 3. test için Z puanı = +1 4. test için Z puanı = +1 5. test için Z puanı = +2 olarak bulunur. Buna göre Ali, 5. testte daha başarılıdır ve 3. ve 4. testlerdeki başarıları birbirine eşittir
T puanı T puanı, aritmetik ortalaması 50 ve standart sapması 10 olan diğer bir standart dağılımdır.
Normal Dağılım Eğrisi (Simetrik Dağılım) Z T %34,13 %13,59 %2,14 +1 +2 %13,59 %2,14 +1 +2 +3 -3 -2 -1 Sx Z 50 60 70 80 20 30 40 T %68 %95 %99 Normal Dağılım Eğrisi (Simetrik Dağılım) 05.04.2017 61
Normal Dağılım Birçok değişkene ait ölçümlerin frekans dağılımı, çan eğrisi şeklinde simetrik bir frekans eğrisiyse bu eğri, normal dağılım eğrisi olarak adlandırılır. İstatistikte çok önemli bir yeri olan normal dağılım eğrisi aslında bir matematiksel eğridir. Eğrinin tepe noktası aritmetik ortalamaya karşılık gelir. Normal dağılımda standart sapma, eğrinin genişliğini belirler. Standart sapma büyüdükçe değişkenin alacağı en küçük değer ile en büyük değer arasındaki açıklık büyür. Ortalamanın üstünde ve altında eşit sayıda puan (%50’si) bulunmaktadır. Hiçbir puan dağılımı, normal dağılımı tam olarak karşılamaz. Bu nedenle, normal dağılım eğrisinin yüzdelik karşılıkları tahmini olarak belirtilir.
Soru: Aritmetik Ort:60, SS=8 olan bir testten 70 puan alan bir öğrencinin başarısı hakkında yorum yapılacak olursa; AO ve SS dikkate alınarak grubun genel dağılımının bulunması gerekir. -3S -2S -1S AO +1S +2S +3S 36 44 52 60 68 76 84 Öğrenci puanları 36 ile 84 arasında değiştiği söylenebilir 70 puan +2S puan diliminde yer alır.Yani öğrencinin sınıfın % 84’ünden daha fazla puan aldığı söylenebilir.
Hangi derste dağılım normaldir? KPSS Soru Örneği Aritmetik Ortalama Mod (Tepe Değer) Medyan (Ortanca) Standart Sapma Leyla’nın notu Türkçe 68 75 70 5 55 Matematik 65 60 10 Tarih 80 7 73 Fizik 4 72 Coğrafya 3 69 Hangi derste dağılım normaldir? Normal Dağılım: Aritmetik ortalama, mod ve medyanın eşit olduğu dağılımdır. 05.04.2017 64 64
Aritmetik Ortalama Mod Medyan Standart Sapma Leyla’nın notu Türkçe 68 75 70 5 55 Matematik 65 60 10 Tarih 80 7 73 Fizik 4 72 Coğrafya 3 69 Hangi derste grup homojendir ya da farklılaşma en düşük ya da öğrencilerin öğrenme düzeyi birbirine en yakındır? Hangi derste grup heterojendir ya da farklılaşma en yüksek ya da öğrencilerin öğrenme düzeyi birbirine en uzaktır? 05.04.2017 65
Grup olarak en başarılı ve en başarısız olunan ders hangisidir? Aritmetik Ortalama Mod Medyan Standart Sapma Leyla’nın notu Türkçe 68 75 70 5 55 Matematik 65 60 10 Tarih 80 7 73 Fizik 4 72 Coğrafya 3 69 Grup olarak en başarılı ve en başarısız olunan ders hangisidir? Ortalama öğrenme düzeyi ya da grup başarı düzeyi en yüksek ve en düşük olan ders hangisidir? Coğrafya (SS-min)ve Matematik(SS-max) dersi; Tarih (AO-max) ve Coğrafya (AO-min) 05.04.2017 66
+1 +2 +3 -3 -2 -1 Sx Türkçe Matematik Tarih Fizik Coğrafya Leyla’nın en başarılı ve en başarısız olduğu dersler hangisidir ? +1 +2 +3 -3 -2 -1 Sx Türkçe 53 55 58 63 68 73 78 83 Matematik 40 50 60 70 80 90 100 Tarih 67 87 94 Fizik 57 61 65 69 72 77 Coğrafya 51 54 66 67
1.Matematik, 2.Türkçe, 3.Sosyal Bilgiler, 4.Fen-Teknoloji. KPSS Soru Örneği Ders Ham Puan SS Z-Puanı T-Puanı Türkçe 90 75 13 (90-75)/13= +1,15 50+(10.1,15)= 61,5 Fen-Teknoloji 55 65 16 (55-65)/16= -0,63 50+(10.-0,63)= 43,7 Sosyal Bilgiler 45 40 12 (45-40)/12= +0,42 50+(10.0,42)= 54,2 Matematik 85 60 14 (85-60)/14= +1,79 50+(10.1,79)= 67,9 1.Matematik, 2.Türkçe, 3.Sosyal Bilgiler, 4.Fen-Teknoloji. 68
05.04.2017 69
Dağılımda Çarpıklık: Negatif Çarpık Dağılım Puanların çoğu dağılımın sağ tarafına yığılmıştır. Sola çarpık: Sınıf başarısı yüksek. Ortalama<Medyan<Mod. Sorular ve test kolaydır. 05.04.2017 70
Dağılımda Çarpıklık: Pozitif Çarpık Dağılım Puanların çoğu dağılımın sol tarafına yığılmıştır. Sağa çarpık: Sınıf başarısı düşük. Mod<Medyan<Ortalama. Sorular ve test zordur. 05.04.2017 71
Çarpıklık Katsayısı Çarpıklık katsayısının sıfırdan küçük olması çarpıklığın negatif (sola), sıfırdan büyük olması ise pozitif (sağa) olduğunu gösterir. Çarpıklık katsayısının sıfıra eşit olması, dağılımın simetrik olduğunu gösterir. 05.04.2017 73
Dağılımın Basıklığı
Korelâsyon Korelasyon, X ve Y gibi iki değişken arasında bir ilişki olup olmadığı eğer ilişkili ise bu ilişkinin derecesini belirlemeye yarayan istatistiksel bir tekniktir. Değişkenler arasındaki ilişkinin derecesini veren katsayıya ise korelasyon katsayısı denilmektedir. Korelasyon katsayısı “r” ile gösterilir ve +1 ile -1 arasında değerler alır
Pearson Momentler Çarpımı Korelasyon Katsayısı Bu korelasyon katsayısı, aralıklı ya da oranlı ölçek düzeyinde elde edilen veriler arasındaki ilişkilerin belirlenmesinde kullanılan bir tekniktir. Pearson korelasyon katsayısı “r” ile gösterilmektedir ve değeri -1 ile +1 arasında değişmektedir. Pearson momentler çarpımı korelâsyon katsayısı aşağıdaki formüller kullanılarak hesaplanabilir
Sperman Sıra Farkları Korelasyonu (Spearman Rho) Bu korelasyon katsayısı, sıralama ölçeğinde elde edilen veriler arasındaki ilişkilerin belirlenmesinde kullanılan bir tekniktir (Baykul, 2000). Sperman Rho, Pearson korelasyon katsayısı ile aynı şekilde yorumlanmaktadır. Bunun yanı sıra, değişkenlerden biri sıralama diğeri ise aralıklı ya da oranlı ölçek düzeyinde ise, bu korelasyon katsayısının kullanılabilmesi için, aralıklı ya da oranlı ölçek düzeyindeki değişkenin sıralama ölçeğine dönüştürülmesi gerekir.
5A sınıfındaki öğrencilerin 25 soruluk matematik testinden aldıkları puanlar gruplanarak aşağıdaki frekans grafiğinde gösterilmiştir. (KPSS-2007) 3. 5A sınıfının mevcudu kaçtır? A) 5 B) 7 C) 8 D) 20 E) 25 4. 5A sınıfının matematik testi puanlarının aritmetik ortalaması kaçtır? A) 5,7 B) 7,4 C) 14,5 D) 18,6 E) 20 5. 5A sınıfının matematik testi puanlarının tepe değeri (mod) kaçtır? A) 5 B) 7 C) 8 D) 18 E) 25
7. Mehmet Öğretmen, öğrencilerine uyguladığı bir test sonucunda elde ettiği puanlardan bazı istatistikleri hesaplamıştır. Daha sonra, öğrencilerden birinin puanını yanlış yazdığını fark etmiş ve gerekli düzeltmeyi yaparak istatistikleri tekrar hesaplamıştır. Buna göre, Mehmet Öğretmen’in düzeltmesi sonucunda aşağıdaki istatistiklerden hangisi kesin olarak değişmiştir? (KPSS-2008) A) Ortalama B) Ortanca C) Mod D) Ranj E) Yığmalı frekans