KLASİK TEST KURAMI VE GÜVENİLİRLİK

Slides:



Advertisements
Benzer bir sunumlar
ÖLÇME ARACINDA BULUNMASI İSTENİLEN NİTELİKLER
Advertisements

ÖLÇME VE DEĞERLENDİRME DERSİ
Bu slayt ‘ten indirilmiştir.
EĞİTİMDE ÖLÇME VE DEĞERLENDİRME
İstatistik Tahmin ve Güven aralıkları
ANOVA.
DEĞERLENDİRMENİN İŞLEVLERİ
GÜVENİRLİK 1-Tarihsel gelişimi 2- Güvenirlik Tanımı
Geçerlik, Güvenirlik ve Kullanışlık
ÖLÇME ARACINDA BULUNMASI GEREKEN NİTELİKLER
Ölçme Araçlarının Nitelikleri
Ölçme Düzeyleri Ölçeklerin Kullanılması
GEÇERLİLİK ve GÜVENİLİRLİK
EĞİTİMDE ÖLÇME & DEĞERLENDİRME -5-
ÖLÇME ARACINDA BULUNMASI İSTENİLEN NİTELİKLER
EĞİTİMDE ÖLÇME & DEĞERLENDİRME -6-
Ölçme Araçlarında Bulunması Gereken Nitelikler
PSİKİYATRİDE ÖLÇEK KULLANIMI
EĞİTİMDE ÖLÇME VE DEĞERLENDİRME
TEST HAZIRLAMA SÜRECİ.
Temel İstatistik Terimler
ÖLÇME VE DEĞERLENDİRME DERSİ
Ölçme ve Değerlendirme
Madde Analizi Yrd. Doç. Dr. Cenk Akbıyık.
Bilimsel Araştırma Yöntemleri
ÖLÇME ARAÇLARININ NİTELİKLERİ
2 - ÖLÇME ARAÇLARININ TAŞIMASI GEREKEN NİTELİKLER
Tüketim Gelir
Meta Analizinde Son Gelişmeler
ÖLÇME: ARAÇ ve YÖNTEMLERİN
Madde (soru istatistikleri)
Ölçme AraçlarInda BulunmasI İstenen NİTELİKLER
IMGK 207-Bilimsel araştırma yöntemleri
Örneklem Dağılışları ve Standart Hata
HİPOTEZ TESTLERİNE GİRİŞ
Standart Puanlar Z puanı: T puanı: T=10*Z+50 = Bireyin puanı
Ölçeklerde Aranan Özellikler a) Geçerlik b) Güvenirlik c) Kullanışlılık Bu özelliklerden en önemlisi geçerlik, sonra güvenirlik, sonuncusu ise kullanışlılıktır.
Eğitimde ve Psikolojide ÖLÇME VE DEĞERLENDİRME
BİLİMSEL ARAŞTIRMA YÖNTEMLERİ ÜNİTE 6
ÖLÇME VE DEĞERLENDİRME DERSİ
TEST PLANI MADDE ANALİZİ.
ÖLÇME VE DEĞERLENDİRME DERSİ
ÖLÇME ve DEĞERLENDİRME
Ders 5: ÖLÇME VE DEĞERLENDİRME
Ölçme ve Değerlendirme
Çapraz Geçerlilik (Cross Validation) Nedir?*
Sınav Analizleri. Sınav Analizleri SINAV ANALİZLERİ 1- FREKANS 2- MADDE ANALİZLERİ FREKANS Dağılımdaki her puanın kaç kez tekrar etiğini gösteren sayı,
TEMEL BETİMLEYİCİ İSTATİSTİKLER
Ölçme Sonuçları Üzerinde İstatistiksel İşlemler
Şans Başarısı Çoktan seçmeli maddeler (iki ve daha çok seçenekli)
Eğitimde ve Psikolojide ÖLÇME VE DEĞERLENDİRME
BİLİMSEL ARAŞTIRMA YÖNTEMLERİ ÜNİTE 9
Temel İstatistik Terimler
MADDE TEPKİ KURAMI: İlk adımlar
PSİKOLOJİK TESTLER.
GÜVENİRLİK ve GEÇERLİK
KGO KR-20 ve KR-21 Korelasyon Hesaplamaları.
Eğitimde ve Psikolojide ÖLÇME VE DEĞERLENDİRME
DEĞERLENDİRMENİN İŞLEVLERİ
Yrd.doç.dr.h.denİz GÜlleroĞlu
ÖLÇMEDE HATA VE ÖLÇME ARACINDA BULUNMASI GEREKEN TEKNİK ÖZELLİKLER
Tipik Performans Testlerinde Güvenirlik
EĞİTİMDE ÖLÇME ve DEĞERLENDİRME
Psikolojik Testlerin Çeşitli Kriterlere Göre Sınıflandırılması
ÖLÇME ARACININ YAPISAL NİTELİKLERİ
Verilerin Toplanması I
EĞİTİMDE ÖLÇME VE DEĞERLENDİRME
Temel İstatistik Terimler
Eğitimde ve Psikolojide ÖLÇME VE DEĞERLENDİRME
Güvenirlik Yrd. Doç. Dr. Ömer Kutlu.
Sunum transkripti:

KLASİK TEST KURAMI VE GÜVENİLİRLİK Prof.Dr. Nükhet Demirtaşlı-OD5007

Prof.Dr. Nükhet Demirtaşlı-OD5007 Test kuramı; (a) Ölçmenin sorunlarını tanımlama (b) Bu sorunlarla baş etme veya bunları azaltmada yöntemler geliştirme. Prof.Dr. Nükhet Demirtaşlı-OD5007

Prof.Dr. Nükhet Demirtaşlı-OD5007 Eğitimde ve psikolojide ölçülen özelliklerin bazı sınırlılıkları; Evrensel olarak kabul edilmiş tanımları ve ölçme yaklaşımları yoktur, Bireylerarası ve bireyiçi farklılıklar gösterirler, 3. Belirli bir davranış örneklemine dayanırlar, 4. Çoğunlukla dolaylı olarak ölçülürler, 5. Daima bir miktar hata taşırlar. Prof.Dr. Nükhet Demirtaşlı-OD5007

Prof.Dr. Nükhet Demirtaşlı-OD5007 Ölçme ve Hata Hata; Ölçülen özelliğin gerçek değeri ile gözlenen değeri arasındaki fark. Gözlenen puan X=T+ E Hata puanı Gerçek Puan Prof.Dr. Nükhet Demirtaşlı-OD5007

Prof.Dr. Nükhet Demirtaşlı-OD5007 Hatanın ölçme sonuçlarına etkisi farklı biçimlerde olur: Ali, 15 maddelik bir testte, 12 maddenin doğru yanıtını biliyor, ancak dikkatsizlikle iki madde de yanlış seçeneği işaretliyor. Ali’nin gözlenen puanı, X = 12 - 2 = 10 olur. Prof.Dr. Nükhet Demirtaşlı-OD5007

Prof.Dr. Nükhet Demirtaşlı-OD5007 Aynı testte Ceren 9 maddenin doğru yanıtını biliyor, 3 maddeyi de tahmine giderek doğru yanıtlıyor. Ceren’in gözlenen puanı, X = 9 + 3 = 12 olur. Prof.Dr. Nükhet Demirtaşlı-OD5007

Prof.Dr. Nükhet Demirtaşlı-OD5007 Erhan ise, bu testte sadece 7 maddenin doğru yanıtını biliyor, 1 maddeyi dikkatli okumadığı için yanlış yanıtlıyor, 1 maddeyi de tahmine giderek doğru yanıtlıyor. Bu pozitif ve negatif yanıtlar birbirini götürüyor. Erhan’ın gözlenen puanı, X = 7 + 0 = 7 olur. Prof.Dr. Nükhet Demirtaşlı-OD5007

Prof.Dr. Nükhet Demirtaşlı-OD5007 Hata Kaynakları Ölçme Aracı: Ölçme aracının kapsamı, yönergelerin anlaşılırlığı, testin dizaynı ile ilgili etmenler. Ölçme Ortamı: Ölçme işinin yapıldığı ortam ve koşullardan kaynaklanan etmenler. Ölçülen Birey: Bireyden kaynaklanan fizyolojik ve psikolojik etmenler. Ölçme/Puanlama Yapan kişi/puanlama yöntemi: Puanlama yanlılıkları, test uygulama ve puanlama konusundaki maddi hatalar, yetersizlik, dikkatsizlik, yorgunluk vb. etmenler. Prof.Dr. Nükhet Demirtaşlı-OD5007

Prof.Dr. Nükhet Demirtaşlı-OD5007 Hata Türleri Sabit : Her ölçme sonucuna aynı miktarda karışan hata. Sistematik: Ölçülen bireye, ölçülen özelliğe ve ölçülen büyüklüğe göre değişir (Yanlılık). Seçkisiz (random/tesadüfi): Hata kaynağı tam olarak kestirilemeyen, ölçme sonuçlarını artıran veya azaltan yönde etkileyen hatalar. Prof.Dr. Nükhet Demirtaşlı-OD5007

Klasik Test Kuramının Varsayımları 1. X = T+ E var (X) = var (T) + var (E) X = gözlenen puan (seçkisiz değişken) T = gerçek puan E = hata puanı(seçkisiz/random) 2. e (X) = T Gözlenen puanın beklenen (expected) değeri, gerçek puana eşittir. Diğer bir ifadeyle, bir yanıtlayıcı evreninden elde edilen seçkisiz hataların beklenen ortalaması sıfırdır. Prof.Dr. Nükhet Demirtaşlı-OD5007

Prof.Dr. Nükhet Demirtaşlı-OD5007 3. r T E = 0 gerçek ve hata puanları arasındaki ilişki sıfırdır. 4. r E1 E2 = 0 Farklı iki testten/aynı testin iki ayrı uygulamasından elde edilen hata puanları arasındaki ilişki sıfırdır. rTxEx = 0 rTyEy = 0 ise, rTxEy = 0 Sonuç; Bir ölçmede bir bireyi etkileyen seçkisiz hatalar, aynı bireyi başka bir ölçmede etkileyen hatalardan bağımsızdır. Prof.Dr. Nükhet Demirtaşlı-OD5007

Ölçme Duyarlılığı/Doğruluğu Güvenilirlik Ölçme Duyarlılığı/Doğruluğu (Random hatalardan arınıklık) Eşdeğerlik Tutarlılık Kararlılık İç tutarlılık Prof.Dr. Nükhet Demirtaşlı-OD5007

Prof.Dr. Nükhet Demirtaşlı-OD5007 Güvenilirlik Güvenilirlik, Kuramsal; güvenilirlik İndeksi: gerçek ve gözlenen puanlar arasındaki ilişki. ρxx’ = Gerçek puan varyansı / Gözlenen puan varyansı arasındaki orana eşittir. Gerçek dünyada; güvenilirlik katsayısı: paralel testler/formlar arasındaki ilişki. Tutarlılık Kararlılık İç tutarlılık (Bileşik puanın güvenilirliği) Prof.Dr. Nükhet Demirtaşlı-OD5007

Prof.Dr. Nükhet Demirtaşlı-OD5007 Güvenilirlik Bireylerin tekrarlı ölçmelerden veya testin paralel formlarından aldıkları puanların tutarlılığını ifade eder. Gözlenen puanlardaki tutarsızlığın başlıca kaynağı, seçkisiz (random) hatalardır. Ölçme sonuçları, bu hatalardan arınık olduğu ölçüde tutarlıdır. Ölçmecilere düşen sorumluluk, hatanın testteki performansı ne ölçüde etkilediğini kestirmektir. Prof.Dr. Nükhet Demirtaşlı-OD5007

Güvenilirlik bilgisinin yorumu 1) ρxx; gözlenen puanlardaki varyansta gerçek puan varyansının oranı/katkısı Gözlenen puandaki varyansın % kaçı gerçek puan varyansından gelir? 2) (ρxx)²; Formların birindeki değişkenliğin (gözlenen puan) % kaçı diğer formdaki değişkenlikle tahmin edilir? 3) gözlenen ve gerçek puan arasındaki korelasyon Prof.Dr. Nükhet Demirtaşlı-OD5007

güvenilirlik bilgisinin yorumu ρxx=.81 gözlenen puanlardaki varyansın %81’i gerçek puan varyansından gelir. O zaman gerçek puan varyansı/st.sapması nedir? σ²T=.81σ²x ►sd=4 ise Doğrudan gözlenemeyen gerçek puan dağılımının standart sapması, σT= √(.81)(16) = 3.6 biçiminde tahmin edilebilir. Prof.Dr. Nükhet Demirtaşlı-OD5007

Güvenilirlik bilgisinin yorumu 2) (.81)², ya da ikinci testte gözlenen puanlardaki varyansın %65’i ilk testte gözlenen puanlardaki varyanstan tahmin edilebilir. Prof.Dr. Nükhet Demirtaşlı-OD5007

Güvenilirlik bilgisinin yorumu 3) Testi alan grup için, gözlenen ve gerçek puanlar arasındaki, √.81 veya .90’dır. Prof.Dr. Nükhet Demirtaşlı-OD5007

Güvenilirlik Kestirim Yöntemleri 1) Korelasyonel Yöntemler Eşdeğerlik; Paralel Testler Yöntemi: Eşdeğer formlar; aynı gerçek puanı veren formlar. hata kaynağı testin kapsamı. Tutarlılık ve kararlılık; Test-Tekrar Test Yöntemi: hata kaynağı, test uygulama koşulları, ölçülen bireylerden kaynaklanan faktörler. Prof.Dr. Nükhet Demirtaşlı-OD5007

Güvenilirlik Kestirim Yöntemleri İki Yarıya Bölme Yöntemi: Bileşik puanın güvenilirliği. Muhtemel alt testler arası korelasyon. Spearman - Brown düzeltme formülü. Hata kaynağı testin kapsamı (alt testler arasında yeterli paralellik olmaması) Prof.Dr. Nükhet Demirtaşlı-OD5007

Spearman - Brown düzeltme formülü r xx’ : iki yarı test arasındaki korelasyon/varolan testin güvenilirliği k : Test uzunluğu/madde sayısı rxx:tüm testin/uzatılmış testin güvenilirliği Prof.Dr. Nükhet Demirtaşlı-OD5007

Prof.Dr. Nükhet Demirtaşlı-OD5007 Cronbach Alfa: Madde varyans ve madde kovaryanslarına dayalı güvenilirlik hesaplama. Tek uygulama; Dereceli ve iki kategorili puanlanan maddeler için İç tutarlılık Güvenirlik kestiriminin alt sınırı: madde kapsamlarının tam paralel olmadığı durumda Prof.Dr. Nükhet Demirtaşlı-OD5007

Prof.Dr. Nükhet Demirtaşlı-OD5007 Cronbach Alfa Formülü K = Testin soru sayısı = Testin varyansı j maddesinin varyansı Prof.Dr. Nükhet Demirtaşlı-OD5007

Prof.Dr. Nükhet Demirtaşlı-OD5007 KR20-21 Formülleri Madde varyans ve kovaryansları, KR20 ve 21, 0-1 ile puanlanan maddelerde; test kapsamının homojenliği ve eşit madde güçlüğü Prof.Dr. Nükhet Demirtaşlı-OD5007

KR-21 güvenilirlik katsayısı   Prof.Dr. Nükhet Demirtaşlı-OD5007

Güvenilirlik Kestirim Yöntemleri 2) Puan cinsinden güvenirliğin kestirilmesi: Ölçmenin standart hatası (ÖSH). ÖSH= s√1- rxx S= 10 rxx = 0.75 ÖSH = ? Prof.Dr. Nükhet Demirtaşlı-OD5007

Prof.Dr. Nükhet Demirtaşlı-OD5007 Bu bireyin gerçek puan aralığını tahmin etmek için standart normal dağılım eğrisi kullanacak olursak Prof.Dr. Nükhet Demirtaşlı-OD5007

Test Geliştirme Süreci Testin kullanılma amacını belirleme. Test ile ölçülecek davranışları, kullanılma amacı doğrultusunda tanımlama. Testte kullanılacak madde (soru) sayısına ve türüne karar verme. 2. basamaktan belirlenen davranışları/kazanımları ölçecek sorular yazma. Hazırlanan soruları, soru yazım teknikleri, bilimsel doğruluk, dil ve anlatım ölçütleri bakımından gözden geçirerek düzeltme. Gözden geçirilmiş soruları düzenleyerek, uygulanabilir bir forma (test kitapçığı) getirerek çoğaltma. Gözden geçirilmiş soruları 1. basamakta saptanan kullanma amacı doğrultusunda, asıl yanıtlayıcı grubuna benzer bir yanıtlayıcı grubunda uygun test koşularında uygulayarak, deneme. Deneme grubundan alınan yanıtları bir yanıt anahtarına göre puanlayarak, soruları analize hazır hale getirme. Sorular üzerinde, soru (madde) analizi yaparak, her sorunun kalitesi hakkında objektif ölçüler (madde güçlük ve ayırıcılık indeksleri) hesaplama. Testin güvenirliğini hesaplama. Güvenirliliğin .90’ın altında çıktığı durumda, ayırıcılığı düşük, orta güçlükten çok fazla sapan maddeleri çıkararak güvenirliği tekrar hesaplama. Prof.Dr. Nükhet Demirtaşlı-OD5007

ÖLÇMELERİN GEÇERLİK VE GÜVENİRLİĞİ ETKİLEYEN ETMENLER Test kapsamı (madde/soru sayısı) Test yanıtlama süresi Testi alan grubun homojenliği Puanlama yanlılıkları Test uygulama koşulları Prof.Dr. Nükhet Demirtaşlı-OD5007

Klasik Test Kuramının Sınırlılıkları Test ve madde istatistikleri, grubun özelliklerine bağlıdır. Farklı gruplardan elde edilen sonuçları tek bir test için karşılaştırmak zordur. Hata kestirimi, grubun test puanları dağılımına dayalı olarak tek bir değer olarak (güvenilirlik katsayısı veya ölçmenin standart hatası)kestirilir. Test puanları, daha çok sıralama ölçeğinde tanımlanmıştır. 0 ile maksimum puan arasında değişir. Prof.Dr. Nükhet Demirtaşlı-OD5007