Sunum yükleniyor. Lütfen bekleyiniz

Sunum yükleniyor. Lütfen bekleyiniz

Ölçmeyle İlgili Temel İstatistikler

Benzer bir sunumlar


... konulu sunumlar: "Ölçmeyle İlgili Temel İstatistikler"— Sunum transkripti:

1 Ölçmeyle İlgili Temel İstatistikler

2 Bir eğitimci olarak niçin belli düzeyde istatistik bilmeliyiz?
Günlük hayatta çevremizde olup bitenleri izleyebilmek, anlayabilmek ve yorumlayabilmek için Borsa düşünce dolara ne oluyor? Seçimleri kim kazanacak? Şampiyon kim olacak? Sınıftaki en başarılı öğrenci kim? Sınavda ilk yüzde elliye kimler giriyor? Elde ettiğimiz verilerle ilişkiler kurar, sonuçlar çıkarmaya çalışırız! 2 2

3 İstatistik Nedir? İstatistik, belli amaçlar için veri toplama, toplanan verileri düzenleme, çözümlemenin yanı sıra yorumlama teknik ve yöntemleri olarak tanımlanabilir. Nitel ve nicel değerlerle ilgilenir. Nicel verilerin ve bilgilerin düzenlenmesi, özetlenmesi ve açıklanması betimsel (descriptive) istatistiğin uğraştığı alandır. Nitel verilerin yorumlanması ve betimsel istatistik sonuçları kullanılarak bir olay veya olgu hakkında varsayımda bulunmak, genellemeler yapmak sonuç çıkarıcı (inferential) istatistiktir. 3 3

4 Bir çalışma sonunda toplanan veriler ham verilerdir.
Verileri anlamlı hâle getirmek için toplanan veriler; Sözel ifadelerle açıklanır. Tablolar oluşturularak sunulur. Grafiklerle ifade edilir. Veriler üzerinde bazı istatistiksel hesaplamalar yapılır. Bu sayılan yöntemlerden birkaçı birden kullanılır. Yukarıda sayılan yöntemlerden hangisinin kullanılacağı; ne tür ölçek kullanıldığına ve ne tür veri elde edildiğine bağlıdır. 4 4

5 Evren-Genel Uzay Araştırmanın yapıldığı, verilerin toplanıldığı, gözlemlerin yapıldığı alandaki tüm nesneler veya bireyler evreni oluşturur. Örneklem Evrenin içinden ayrıntılı olarak üzerinde çalışmak amacıyla seçilen bir grup nesne veya birey, çalışmanın örneklemini oluşturur. Örneklem evrenin bütün özelliklerini yansıtmalıdır. Örneklem seçimi çeşitli tekniklerle yapılır. Bütün bu teknikler araştırmanın türüne ve amacına bağlıdır. Ölçmede kesinlik Kullanılan ölçeklerin hassasiyetine bağlı olarak yapılan ölçümlerin kesinlik dereceleri de değişmektedir. 5 5

6 Verilerin Özetlenmesi ve Grafikle Gösterilmesi
Frekans Dağılımları Basit Frekans Dağılımı Gruplandırılmış Frekans Dağılımı Verilerin Grafikle Gösterilmesi Bar Grafik Histogram Frekans Poligonu Çizgi Grafiği Pasta ya da Daire Grafiği 6 6

7 Frekans Dağılımları Gözlem ya da kayıt yoluyla elde edilen ve işlenmemiş, anlamlı hale getirilmemiş sayılar yığını “ham veri” olarak kabul edilir. Ham verilerin düzenlenmesinde, özetlenmesinde, anlamlı ve anlaşılır hale getirilmesinde en sık kullanılan yöntemlerden biri, bu verilerin frekans dağılımlarının verilmesidir. Frekans dağılımlarının verilmesi ile karışık halde bulunan puanlamalar derlenir, puanlar yüksekten düşüğe ya da tersi biçimde sıralanabilir ve puanlar hakkında yorumlar yapılabilir. 7 7

8 Frekans Dağılımları Ham Puanlar Sıralanmış Puanlar 05.04.2017
8 8

9 Basit Frekans Dağılımı
Basit frekans dağılımı, her puan değerinin kaç sefer tekrarlandığını gösterir. Frekans “f” harfi ile gösterilir. Frekans tablosu hazırlanırken; tüm puanlar gösterilir. İstenirse öğrencilerin almadıkları diğer puanlar da verilebilir. Toplamalı frekans, frekans değerlerinin ard arda toplanması ile elde edilir. 9 9

10 10 10

11 Gruplandırılmış Frekans Dağılımı
Gruplandırılmış frekans dağılımında, belirli puan kategorilerinin oluşturulması için puanlar arasındaki ranjlar ya da aralıklar dikkate alınır. Burada grup ya da kategorilerin aralığını gösteren “aralık katsayısı”nın bulunması önemlidir. 11 11

12 Gruplandırılmış Frekans Dağılımı
Gruplandırılmış frekans dağılımını belirlemede “aralık katsayısı”nı bulmak için en yüksek ve en düşük puanlar arasındaki fark (RANJ) belirlenir. Bu değer tahmini grup sayısına bölünür. Grup ya da kategori sayısı 5, 8, 10, 12 ya da 15 olarak alınabilir. Az sayıda kategori oluşturma veri kaybına, çok sayıda kategori oluşturma ise işlemlerin güçleşmesine yol açabilir. 12 12

13 13 13

14 14 14

15 15 15

16 Temel Kavramlar 16 16

17 Temel Kavramlar 17 17

18 Bar Grafik İstatistiksel verileri açıklamak için en çok kullanılan grafik türüdür. Bar diyagram, birbirini izleyen barların bir serisini gösterir. Barlar küçükten büyüğe ya da tersi biçimde sıralanır. 18 18

19 Histogram Histogram bar grafiğe benzer. Ancak, bar grafik kategorik ya da kesikli grup aralıklarıyla çizildiği halde, histogram sürekli grup aralıklarıyla çizilir. Histogramda dikey eksen her zaman sıfır değeriyle başlarken, yatay eksen sıfır ya da büyük bir değerden başlayabilir. 19 19

20 Frekans Poligonu Puan aralıkları ve orta noktalar
Histogramda verilen puan aralıklarının orta noktalarının birleştirilmesiyle oluşur. Puan aralıkları ve orta noktalar 20 20

21

22 Çizgi Grafiği Frekans poligonunun iki ucu yatay eksene değmediği zaman çizgi grafiği oluşur. Çizgi grafiği sürekli verilere uygulanabilir. Puanlar ya da puan aralıkları yatay eksende, bunlara ait frekanslar dikey eksende yer alır. 22 22

23 Pasta ya da Daire Grafiği
Özellikle değişkenlerin yüzdelik değerlerini göstermede sıklıkla kullanılan bir grafik türüdür. 23 23

24 Merkezi Eğilim (Yığılma) Ölçüleri
Aritmetik Ortalama Mod (Tepe Değer) Medyan (Ortanca) 24 24

25 Aritmetik Ortalama Puan toplamlarının veri sayısına bölümüdür.
Örnek: 95,88,73,67,59,46,35,26,23 Ortalama: 56.88 25

26

27

28

29

30 Mod (Tepe Değer) Mod ya da tepe değer, bir puan dağılımında en çok tekrar eden, yani frekansı en fazla olan puan ya da ölçümdür. Örnek: 60,72,82,72,61,81,72 ise Mod=72’dir. Güvenirliğinin düşük olması nedeniyle nadiren kullanılır. Çünkü bazı durumlarda dağılımın çarpık olması nedeniyle birden fazla mod bulunabilir. 30 30

31 31 31

32 Tepe Değer (Mod) ile ilgili bazı önemli noktalar
1) Bir puan dağılımında puanların frekansı aynı ise dağılımın modu hesaplanamaz (mod yoktur). Örneğin; 1,1,1,5,5,5,7,7,7 puan dağılımının modu yoktur. 2) Bir dizi puan dağılımında ardı ardına gelen iki puanın frekansı birbirine eşitse bu durumda mod frekansı eşit olan puanların ortalamasıdır. Örneğin; 2,2,3,3,3,5,5,5,9,9 puan dağılımında 3 ve 5 puanlarının frekansları birbirine eşittir. Bu durumda mod (3+5)/2=4 olarak bulunur. Dizinin modu 4’tür. 3) Bir dizi puan dağılımında frekansı eşit fakat ardı ardına gelmeyen puanlar varsa, bu durumda dizinin iki modu olur. Örneğin; 2,3,3,3,4,5,6,6,6,7 puan dağılımının 3 ve 6 olmak üzere iki modu (bimodal) bulunmaktadır. 32 32

33 Medyan (Ortanca) Büyüklük sırasına göre dizilmiş puanlar dizisinin tam ortasına düşen puandır. Örnek: 95,88,73,67,59,46,35,26,23 Medyan: 59 Puanların sayısı çift ise: ‘inci değerin ortalaması alınır Örnek: 95,88,73,67,59,46,35,26,23,12 Medyan: 52.5 33

34 Medyan (Ortanca) Örnek: 4, 7, 8, 11, 12, 15, 19 ise
Medyan=(n+1)/2=(7+1)/2=8/2=4. sıradaki 11’dir. Örnek: 3, 5, 7, 9 ise Medyan=n/2=4/2=2. sıradaki (5+7)/2=6’dır. 34 34

35 Medyan (Ortanca) Medyan sıralamalı ölçeklerle elde edilen veriler için uygun bir merkezi eğilim ölçüsüdür. Medyanda ölçümlerin her birinin puan değerinden çok dağılım içindeki sırası önemlidir. 35 35

36

37

38

39 39 39

40 40

41 Dağılım (Değişim, Yayılma) Ölçüleri
Yayılma Ölçüleri: Verilerin yığılma gösterdikleri noktadan ne kadar uzakta olduklarını, yani: merkeze yığılma ölçüsüne göre ne kadar dağıldıklarını belirler Ranj (dizi genişliği) Çeyrek Sapma Standart Sapma 41

42 Puanların sıralanmış olması gerekmez
Ranj (Dizi Genişliği) Bir veri grubunda en yüksek puan ile, en düşük puan arasındaki farktır. Puanların sıralanmış olması gerekmez Grubun homojen ya da heterojen bir dağılım gösterdiği hakkında bilgi verir. Örnek: 78,89,56,36,48,92,59,60 Ranj: 92-36=56 42

43 Ranj (Dizi Genişliği) Örnek
Birinci Dağılım: 59, 59, 59, 60, 61, 61, 61 ise Ranj=? 61-59=2 İkinci Dağılım: 30, 40, 50, 60, 70, 80, 90 ise Ranj=? 90-30=60 Bu iki dağılımda aritmetik ortalama ve medyanlar eşit olmasına karşın ranjları farklıdır. Dağılımın ranjı azaldıkça dağılımdaki puanlar birbirine yaklaşır ya da benzeşir, ranj arttıkça puanlar birbirinden uzaklaşır ya da puanlar arası fark artar. 43

44 Çeyrek Sapma Çeyrek sapma, bir dağılımdaki üçüncü çeyrek (75.yüzdelik) ile birinci çeyrek (25.yüzdelik) arasındaki farkın yarısına eşittir. Aritmetik ortalama yerine medyanın kullanıldığı durumlarda kullanılması uygundur. 44 44

45 25. yüzdelik için (Y25)= 20(25/100) = 5. puan (25)
Aşağıda 20 öğrencinin İngilizce sınavından aldığı notlar küçükten büyüğe doğru sıralanarak verilmiştir. Çeyrek sapmayı hesaplayalım: 15,17,20,21,25,30,33,40,43,47,50,55,57,60,65,70,73,77,80,84 25. yüzdelik için (Y25)= 20(25/100) = 5. puan (25) 75. yüzdelik için (Y75)= 20(75/100) = 15. puan (65) Bu durumda çeyrek sapma  (65-25)/2=20 olur. 45 45

46 Baştan % 25. not 25 ve sondan % 75. not 65 olduğuna göre bu notların aritmetik ortalamadan ne kadar saptığını çeyrek sapma yaklaşık olarak vermektedir. 46 46

47 Aralığın Gerçek Sınırı
Örnek: Çeyrek Sapma Puan Aralığı f Toplamalı Frekans Aralığın Gerçek Sınırı 21,00-25,00 1 20,50-25,50 26,00-30,00 2 25,50-30,50 31,00-35,00 4 30,50-35,50 36,00-40,00 6 10 35,50-40,50 41,00-45,00 16 40,50-45,50 46,00-50,00 7 23 45,50-50,50 51,00-55,00 24 50,50-55,50 47

48 48 48

49 49 49

50 Standart Sapma (SS) Örnek: 78,89,56,36,48,92,59,60 S=19.8
Bir veri grubunda verilerin aritmetik ortalamadan ne kadar uzaklaştığının ölçüsüdür. Puanların ortalamadan olan farklarının, kareleri toplamının ortalamasının (Varyans), kareköküne eşittir. Varyans standart sapmanın karesine eşittir. Örnek: 78,89,56,36,48,92,59,60 S=19.8 50

51 Standart sapma Bir veri dizisinde standart sapmayı hesaplamak için önce aritmetik ortalama bulunur ve her veriyle aritmetik ortalamanın farkının karesi şeklinde hesaplanarak aşağıdaki formülle dizinin standart sapması hesaplanır. ÇEYREK SAPMA değişim hakkında kaba bir sonuç verir. SS verilerin oluşturduğu dizinin homojenliğiyle ilgili bilgi verir. 51

52 Gruplandırılmış Frekans tablosuyla verilen dizinin standart sapması, aşağıdaki formül ile hesaplanır: 52

53

54

55 Standart Sapmanın Özellikleri
SS, bir veri grubunun ortalaması etrafındaki dağılımını belirlemek amacıyla kullanılır. Negatif değerler almaz. Veri grubundaki tüm değerler aynı ise SS sıfırdır. SS veri grubundaki uç değerlere karşı duyarlı olup tek bir uç değer dahi değerini artırabilir. Yani, dağılımı çarpık hale getirir. 55 55

56 Standart Sapma ve Aritmetik Ortalama Arasındaki İlişki
Aritmetik ortalama ile standart sapmanın arası büyürse, Heterojen yapı oluşur ve grup başarısı düşer. Aritmetik ortalama ile standart sapmanın arası küçülürse, Homojen yapı oluşur ve grup başarısı artar. Bir puan dağılımında puanlar arası fark (ranj) büyüdükçe, Standart sapmada büyür. Bir testten elde edilen puanların standart sapması büyüdükçe, Testin güvenirliği artar. 56

57 Standart Hata Standart sapmayla ilgili bir kavram da ortalamanın standart hatasıdır. Bir dağılımda standart hata, standart sapmanın örneklem sayısının kareköküne bölünmesiyle hesaplanır. 57 57

58 Standart Puanlar Standart puan, gözlenen puanların ortalamadan farklarının standart sapmaya bölünmesiyle standart sapma birimi cinsinden elde edilen bir puandır. “Z” ve “T” puanları olmak üzere iki türlüdür. Aritmetik ortalaması 0,00 ve standart sapması 1,00 olan dağılıma birim normal dağılım ya da standart normal dağılım denir. Uygulanan bir testten elde edilen sonuçların standart normal dağılıma dönüştürülmesi ile elde edilen puanlara Z puanları adı verilir

59 5. test için Z puanı = +2 olarak bulunur.
Z puanı, farklı test sonuçlarının karşılaştırılmasında ve matematiksel işlemlerde kolaylık sağlar. Farklı test sonuçlarının karşılaştırılmasına yönelik olarak aşağıdaki soruyu inceleyelim. Soru 2: Tabloya göre Ali hangi testte daha başarılıdır? Hangi iki testteki başarısı birbirine eşittir? 1. test için Z puanı = -1 2. test için Z puanı = 0 3. test için Z puanı = +1 4. test için Z puanı = +1 5. test için Z puanı = olarak bulunur. Buna göre Ali, 5. testte daha başarılıdır ve 3. ve 4. testlerdeki başarıları birbirine eşittir

60 T puanı T puanı, aritmetik ortalaması 50 ve standart sapması 10 olan diğer bir standart dağılımdır.

61 Normal Dağılım Eğrisi (Simetrik Dağılım) Z T %34,13 %13,59 %2,14 +1 +2
%13,59 %2,14 +1 +2 +3 -3 -2 -1 Sx Z 50 60 70 80 20 30 40 T %68 %95 %99 Normal Dağılım Eğrisi (Simetrik Dağılım) 61

62 Normal Dağılım Birçok değişkene ait ölçümlerin frekans dağılımı, çan eğrisi şeklinde simetrik bir frekans eğrisiyse bu eğri, normal dağılım eğrisi olarak adlandırılır. İstatistikte çok önemli bir yeri olan normal dağılım eğrisi aslında bir matematiksel eğridir. Eğrinin tepe noktası aritmetik ortalamaya karşılık gelir. Normal dağılımda standart sapma, eğrinin genişliğini belirler. Standart sapma büyüdükçe değişkenin alacağı en küçük değer ile en büyük değer arasındaki açıklık büyür. Ortalamanın üstünde ve altında eşit sayıda puan (%50’si) bulunmaktadır. Hiçbir puan dağılımı, normal dağılımı tam olarak karşılamaz. Bu nedenle, normal dağılım eğrisinin yüzdelik karşılıkları tahmini olarak belirtilir.

63 Soru: Aritmetik Ort:60, SS=8 olan bir testten 70 puan alan bir öğrencinin başarısı hakkında yorum yapılacak olursa; AO ve SS dikkate alınarak grubun genel dağılımının bulunması gerekir. -3S -2S -1S AO +1S +2S +3S Öğrenci puanları 36 ile 84 arasında değiştiği söylenebilir 70 puan +2S puan diliminde yer alır.Yani öğrencinin sınıfın % 84’ünden daha fazla puan aldığı söylenebilir.

64 Hangi derste dağılım normaldir?
KPSS Soru Örneği Aritmetik Ortalama Mod (Tepe Değer) Medyan (Ortanca) Standart Sapma Leyla’nın notu Türkçe 68 75 70 5 55 Matematik 65 60 10 Tarih 80 7 73 Fizik 4 72 Coğrafya 3 69 Hangi derste dağılım normaldir? Normal Dağılım: Aritmetik ortalama, mod ve medyanın eşit olduğu dağılımdır. 64 64

65 Aritmetik Ortalama Mod Medyan Standart Sapma Leyla’nın notu Türkçe 68 75 70 5 55 Matematik 65 60 10 Tarih 80 7 73 Fizik 4 72 Coğrafya 3 69 Hangi derste grup homojendir ya da farklılaşma en düşük ya da öğrencilerin öğrenme düzeyi birbirine en yakındır? Hangi derste grup heterojendir ya da farklılaşma en yüksek ya da öğrencilerin öğrenme düzeyi birbirine en uzaktır? 65

66 Grup olarak en başarılı ve en başarısız olunan ders hangisidir?
Aritmetik Ortalama Mod Medyan Standart Sapma Leyla’nın notu Türkçe 68 75 70 5 55 Matematik 65 60 10 Tarih 80 7 73 Fizik 4 72 Coğrafya 3 69 Grup olarak en başarılı ve en başarısız olunan ders hangisidir? Ortalama öğrenme düzeyi ya da grup başarı düzeyi en yüksek ve en düşük olan ders hangisidir? Coğrafya (SS-min)ve Matematik(SS-max) dersi; Tarih (AO-max) ve Coğrafya (AO-min) 66

67 +1 +2 +3 -3 -2 -1 Sx Türkçe Matematik Tarih Fizik Coğrafya
Leyla’nın en başarılı ve en başarısız olduğu dersler hangisidir ? +1 +2 +3 -3 -2 -1 Sx Türkçe 53 55 58 63 68 73 78 83 Matematik 40 50 60 70 80 90 100 Tarih 67 87 94 Fizik 57 61 65 69 72 77 Coğrafya 51 54 66 67

68 1.Matematik, 2.Türkçe, 3.Sosyal Bilgiler, 4.Fen-Teknoloji.
KPSS Soru Örneği Ders Ham Puan SS Z-Puanı T-Puanı Türkçe 90 75 13 (90-75)/13= +1,15 50+(10.1,15)= 61,5 Fen-Teknoloji 55 65 16 (55-65)/16= -0,63 50+(10.-0,63)= 43,7 Sosyal Bilgiler 45 40 12 (45-40)/12= +0,42 50+(10.0,42)= 54,2 Matematik 85 60 14 (85-60)/14= +1,79 50+(10.1,79)= 67,9 1.Matematik, 2.Türkçe, 3.Sosyal Bilgiler, 4.Fen-Teknoloji. 68

69 69

70 Dağılımda Çarpıklık: Negatif Çarpık Dağılım
Puanların çoğu dağılımın sağ tarafına yığılmıştır. Sola çarpık: Sınıf başarısı yüksek. Ortalama<Medyan<Mod. Sorular ve test kolaydır. 70

71 Dağılımda Çarpıklık: Pozitif Çarpık Dağılım
Puanların çoğu dağılımın sol tarafına yığılmıştır. Sağa çarpık: Sınıf başarısı düşük. Mod<Medyan<Ortalama. Sorular ve test zordur. 71

72

73 Çarpıklık Katsayısı Çarpıklık katsayısının sıfırdan küçük olması çarpıklığın negatif (sola), sıfırdan büyük olması ise pozitif (sağa) olduğunu gösterir. Çarpıklık katsayısının sıfıra eşit olması, dağılımın simetrik olduğunu gösterir. 73

74 Dağılımın Basıklığı

75 Korelâsyon Korelasyon, X ve Y gibi iki değişken arasında bir ilişki olup olmadığı eğer ilişkili ise bu ilişkinin derecesini belirlemeye yarayan istatistiksel bir tekniktir. Değişkenler arasındaki ilişkinin derecesini veren katsayıya ise korelasyon katsayısı denilmektedir. Korelasyon katsayısı “r” ile gösterilir ve +1 ile -1 arasında değerler alır

76 Pearson Momentler Çarpımı Korelasyon Katsayısı
Bu korelasyon katsayısı, aralıklı ya da oranlı ölçek düzeyinde elde edilen veriler arasındaki ilişkilerin belirlenmesinde kullanılan bir tekniktir. Pearson korelasyon katsayısı “r” ile gösterilmektedir ve değeri -1 ile +1 arasında değişmektedir. Pearson momentler çarpımı korelâsyon katsayısı aşağıdaki formüller kullanılarak hesaplanabilir

77 Sperman Sıra Farkları Korelasyonu (Spearman Rho)
Bu korelasyon katsayısı, sıralama ölçeğinde elde edilen veriler arasındaki ilişkilerin belirlenmesinde kullanılan bir tekniktir (Baykul, 2000). Sperman Rho, Pearson korelasyon katsayısı ile aynı şekilde yorumlanmaktadır. Bunun yanı sıra, değişkenlerden biri sıralama diğeri ise aralıklı ya da oranlı ölçek düzeyinde ise, bu korelasyon katsayısının kullanılabilmesi için, aralıklı ya da oranlı ölçek düzeyindeki değişkenin sıralama ölçeğine dönüştürülmesi gerekir.

78

79

80

81 5A sınıfındaki öğrencilerin 25 soruluk matematik testinden aldıkları puanlar gruplanarak aşağıdaki frekans grafiğinde gösterilmiştir. (KPSS-2007) 3. 5A sınıfının mevcudu kaçtır? A) B) C) D) E) 25 4. 5A sınıfının matematik testi puanlarının aritmetik ortalaması kaçtır? A) 5,7 B) 7,4 C) 14, D) 18, E) 20 5. 5A sınıfının matematik testi puanlarının tepe değeri (mod) kaçtır? A) B) C) D) E) 25

82

83 7. Mehmet Öğretmen, öğrencilerine uyguladığı bir test sonucunda elde ettiği puanlardan bazı istatistikleri hesaplamıştır. Daha sonra, öğrencilerden birinin puanını yanlış yazdığını fark etmiş ve gerekli düzeltmeyi yaparak istatistikleri tekrar hesaplamıştır. Buna göre, Mehmet Öğretmen’in düzeltmesi sonucunda aşağıdaki istatistiklerden hangisi kesin olarak değişmiştir? (KPSS-2008) A) Ortalama B) Ortanca C) Mod D) Ranj E) Yığmalı frekans

84


"Ölçmeyle İlgili Temel İstatistikler" indir ppt

Benzer bir sunumlar


Google Reklamları