Ölçme ve Değerlendirme Yrd.Doç.Dr. Kerem KILIÇER
Güvenirlik Güvenirlik, bir ölçme aracıyla aynı koşullarda tekrarlanan ölçümlerde elde edilen değerlerin kararlılığının bir göstergesidir. Güvenirlik, ölçme aracının ölçme sonuçlarını hata karıştırmadan ölçme yapabilmesidir. Kısaca güvenirlik, ölçme aracının ölçülecek özelliği doğru ölçmesidir. Güvenilir bir ölçme aracı aynı özellikle ilgili olarak arka arkaya yapılan ölçümlerde yaklaşık olarak aynı sayısal sonucu verir.
Güvenirlik Güvenilir bir ölçme aracı aynı özellikle ilgili olarak arka arkaya yapılan ölçümlerde yaklaşık olarak aynı sayısal sonucu verir. Güvenirlik için ölçme aracı tesadüfi hatalardan arınık olması gerekmektedir. Güvenirlik katsayısı (rx) 0,00 ile 1,00 arasında değer alan bir korelasyon katsayısıdır. Güvenirlik katsayısı 1’e yaklaştıkça güvenirlik yüksek, 0’a yaklaştıkça güvenirlik düşük olarak değerlendirilir.
Geçerlik ve Güvenirlik Bir ölçme aracının güvenilir olması geçerli olduğu anlamına gelmeyebilir. Bir test geçerli olmasa da güvenilir olabilir. Güvenirlik geçerlik için gerekli fakat yeterli değildir. Bu nedenle geçerlik güvenirliği de kapsayan ölçme araçlarının önemli teknik özelliğidir.
Güvenirlik Güvenirlik bir korelasyon (iki değişken arasındaki ilişki yada bağıntı ölçüsü) katsayısı olduğu için elde edilen güvenirlik katsayısı iki uygulamadan benzer sonuçlar elde edildiğini ya da uygulamaların farklılaşmadığını gösterir. Korelasyon katsayısının 1 olması hatasız ölçüm yapıldığını gösterir. Hatasız ölçüm yapmak olanaksız olduğu için sosyal bilimlerde 0,60-0,65 değerin üzerindeki güvenirlik katsayıları güvenilir olarak değerlendirilmektedir.
Güvenirlik Türleri Eğitimde en fazla tercih edilen güvenirlik belirleme yöntemleri şunlardır; A- TEST TEKRAR TEST YÖNTEMİ B- EŞDEĞER (PARELEL) FORMLAR YÖNTEMİ C- TESTİ YARILAMA YÖNTEMİ D- KR-20 VE KR-21 YÖNTEMİ E- CRONBACH ALFA YÖNTEMİ D- PUANLAYICI GÜVENİRLİĞİ
Güvenirlik Türleri (Test Tekrar Test Yöntemi) Bir testin aynı gruba farklı zamanlarda iki kez uygulanması ve bu iki uygulama arasındaki ilişki (kararlılık/tutarlılık) düzeyinin belirlenmesidir. İki uygulama arasındaki süre ölçülen özelliğe bağlı olarak değişmektedir. Ancak süre ne çok kısa ne de çok uzun olmamalıdır. Süre çok kısa olursa cevaplayıcılar soruları hatırlayacağı için ölçüm sonuçları hatalı olur. Eğer süre çok uzun olursa cevaplayıcılarda meydana gelebilecek değişim güvenirliği olumsuz etkiler.
Güvenirlik Türleri (Test Tekrar Test Yöntemi) Örnek1: Bir öğretmen Fransızca kelime bilgisini yoklayan bir test hazırlamış bunu birkaç hafta arayla öğrencilere iki kez uygulamıştır. Bu iki uygulamadan elde edilen puanlar arasındaki korelasyon 0,80 olarak hesaplanmıştır. Örnek2: Bir öğretmen geliştirdiği “Ölçme Değerlendirme Dersine Tutum” ölçeğini bir ay arayla Eğitim Fakültesi Formasyon Eğitimi Spor Yönetimi bölümü öğrencilerine iki kez uygulamış ve iki uygulama arasında 0,95 olarak bulunmuştur.
Güvenirlik Türleri (Eşdeğer Formlar Yöntemi) Bir testin oluşturulan eşdeğer formuyla birlikte aynı gruba aynı veya farklı zamanlarda uygulanması ve bu iki uygulama arasındaki ilişki (eşdeğerlik) düzeyinin belirlenmesidir. Hazırlanacak iki form nicelik (soru sayısı), nitelik (kapsamı) ve istatistiki özellikleri (madde güçlük, ayırtedicilik, ortalama, standart sapma vb.) olarak aynı olması gerekmektedir. Kısaca hazırlanacak teste ait iki form “tek yumurta ikizleri” gibi birbirine tıpa tıp benzemelidir. En önemli avantajı aynı anda uygulanabilmesidir.
Güvenirlik Türleri (Paralel Formlar Yöntemi) Örnek: Bir öğretmen hazırladığı soru sayısı, niteliği ve ölçtüğü davranışlar bakımından aynı olan iki farklı Bilgisayar becerileri başarı testini final sınavı öncesi Mühendislik Fakültesi Bilgisayar Mühendisliği bölümü 1. sınıf öğrencilerine aynı anda uygulamış ve bu iki uygulama arasındaki korelasyon 0,73 olarak hesaplanmıştır.
Güvenirlik Türleri (Testi Yarılama Yöntemi) Bir testin iki eş değer parçaya bölünerek tek gruba uygulanması ve uygulama sonucunda bireylerin iki eşdeğer parçadan aldıkları puanlar arasındaki ilişki (iç tutarlılık) düzeyinin belirlenmesidir. En güçlü yanı tek bir öğrenci grubu ve tek bir form gerektirir. Ancak oluşturulan iki parçanın birbiriyle paralel ve eşdeğer olması gerekmektedir? En çok kullanılan iki yarıya bölme işlemi testteki tek sayılı soruların çift sayılı sorularla karşılaştırılmasıdır.
Güvenirlik Türleri (Testi Yarılama Yöntemi) Örnek: Bir öğretmen hazırlamış olduğu 100 soruluk Türkçe başarı testine ait tek rakamlı soruları bir grup, çift rakamlı soruları bir grup olarak almış ve öğrencilerin iki gruptan aldıkları toplam puanlar arasındaki korelasyonu hesaplayarak 0,75 bulmuştur. (Testin tamamı 0,86) NOT: Testi yarılama yöntemiyle elde edilen güvenirlik testin yarısına ait güvenirlik düzeyidir. Bu nedenle testin tamamının güvenirliği Spearman-Brown veya Rulon formülüyle belirlenir.
Güvenirlik Türleri (KR-20 ve KR-21Yöntemi) Maddelerinin tamamı aynı özelliği ölçen ve doğru-yanlış olarak sınıflandırılan bir testin tek bir uygulama sonucunda elde edilen iç tutarlık katsayısıdır. Kuder- Richardson yöntemi olarak da adlandırılır. Doğru cevaplara 1, yanlış ve boş cevaplara 0 puan verilerek işlem yapılır. Bu yöntem ölçme aracının iç tutarlılığı ile ilgili olduğu için bulunan katsayı iç tutarlık katsayısı olarak adlandırılır.
Güvenirlik Türleri (KR-20 ve KR-21Yöntemi) Eğer; Maddelerin puanları eşitse (Her soru 5 puan) Soruların güçlük düzeyleri farklı ise Düzeltme formülü kullanılmamışsa (Dört yanlış bir doğruyu götürmüyorsa) Maddelerin puanları farklı ise Soruların güçlük düzeyleri birbirine yakınsa (0,45-0,55) Düzeltme formülü kullanılmış ise (Dört yanlış bir doğruyu götürüyorsa) KR-20 KR-21
Güvenirlik Türleri (Cronbach Alfa Yöntemi) Bir testin bir kez uygulanması ve testte yer alan maddelerin birbirleriyle uyumuna bakılarak testin güvenirliğini kestirme yöntemidir. Cronbach alfa yöntemiyle bir ölçme aracında yer alan x tane maddenin homojen bir yapı oluşturup oluşturmadığı test edilir. KR-20 yönteminin daha genişletişmiş bir versiyonu olarak kabul edilmektedir.
Güvenirlik Türleri (Cronbach Alfa Yöntemi) Cronbach alfa yöntemiyle testteki matematiksel olarak tüm olası yarı formlarının korelasyonlarının ortalamasıdır. Cronbach alfa yöntemiyle ölçme aracı bir defa kullanıldığı ve analizlerde bu maddelerin birbirleriyle ilişkisi incelendiği için elde edilen değer iç tutarlılık katsayısı olarak kabul edilir. Özellikle eğitimde kullanılan tutum, kişilik veya davranış ölçeklerinde cronbach alfa (α) güvenirlik katsayısı hesaplanmaktadır.
Güvenirlik Türleri (Puanlayıcı Güvenirliği) Puanlayıcı güvenirliği, ölçmeyi yapan kışının veya araştırmacının güvenirlik düzeyinin belirlenmesidir. Puanlayıcı güvenirliği için farklı istatistiksel teknikler (korelasyon, kappa istatistiği vb.) kullanılabilir. Bunun için; puanlayıcı tekse, bir gruptan topladığı verileri bir süre sonra tekrar puanlar ve elde edilen değerler arasındaki ilişkiye bakar. birden fazla puanlayıcı varsa, bir gruptan toplanan veriler birbirinden bağımsız olarak farklı puanlayıcılar tarafından puanlanır. Puanlayıcılar arası korelasyon yüksek ise güvenirlik yüksek kabul edilir.
Güvenirliği Etkileyen Faktörler Testte yer alan soru sayısı Test uygulanan grubun özelliği Test türü Testin güçlük düzeyi Testi cevaplama süresi Testin uygulandığı ortam Testin anlaşılırlığı
Güvenirliği Artırmak için Yapılabilecekler Soru sayısını artırmak Soruları açık ve anlaşılır olarak hazırlamak Sınavları uygun ortamda yapmak Öğrencilere yeterli zaman vermek Soruları öğrencilerin seviyesine uygun hazırlamak Birçok puanlayıcıya puanlatmak Kopya çektirmemek Soruları orta güçlükte hazırlamak Objektif puanlanan ölçme araçlarını tercih etme
KPSS-2010
KPSS-2010
KPSS-2012
KPSS-2013
KPSS-2013
Kullanışlılık Kullanışlılık ölçme aracının geliştirilmesinin, çoğaltılmasının, uygulanmasının, cevaplanmasının ve puanlanmasının kolay ve ekonomik olmasıdır. Bir ölçme aracının kullanışlı olması için; Hazırlanmasının kolay olması, Ekonomik olması, Puanlamasının pratik olması, Uygulama süresinin kısa olması, Uygun bir yönergesinin olması, Ölçme işlemini yapan kişiden istenen becerinin az olması gerekmektedir.
KPSS-2012