Ölçme ve Değerlendirme Başarının kanıtı olarak neyi alacağınızı bile bilmiyorsanız, birisine “başarılıdır” damgasını vurmak oldukça şüpheli bir davranıştır... “ R. F. Mager Ölçme ve Değerlendirme 1 1
ÖLÇME VE DEĞERLENDİRME Eğitimci : Hamide KARAMAN Halk Eğitimi Merkezi 19 Mayıs/SAMSUN 2
Ders İçeriği Bu dersin amacı MTSK kurslarında vereceğimiz ölçme ve değerlendirme konularını kapsamaktadır. Bilindiği gibi ölçme ve değerlendirme bir bilim dalı olmakla beraber sadece MTSK için uyarlanmış bir dalı bulunmamaktadır. Derslerimizde eğitimde ölçme ve değerlendirme konularını işleyecek özelde ise bu bilimi MTSK için uyarlayacağız.
Ölçme değerlendirme konusunda kurs katılımcılarımızla birlikte; değerlendirmelerde bulunacak, “Direksiyon Eğitimi Değerlendirmelerinde” uygulayacağımız ya da uygulayabileceğimiz araçların geliştirilmesi, alternatif ölçme değerlendirme yöntemleri konularında söyleşiler yapacağız.
Temel Kavramlar Eğitim Ölçme Değerlendirme Hata Geçerlilik Güvenirlik Ölçme Süreci Değişken Ölçüt Ölçüm Ölçek Değerlendirme Hata Geçerlilik Güvenirlik 5
Temel Kavramlar Eğitim: Bireyin davranışında, kendi yaşantısı yoluyla ve kasıtlı olarak değişme meydana getirme sürecidir. Eğitim, insanlarda var olan bazı davranışları belli amaçlar doğrultusunda değiştiren ve yine bu amaçlar doğrultusunda bireylerin bazı yeni davranışlar kazanmalarını sağlayan bir sistemdir. 6
Temel Kavramlar Sistem: En az bir hedefi gerçekleştirmek üzere uygun ve değişik ögelerden oluşan dirik bir örüntüdür. ‘dirik’:”canlılığını sürdüren, sürekli kendisini yenileyen ve gelişen” anlamında, ‘örüntü’:”ögelerden oluşan ve aralarında ilişki olan bir bütün” anlamında kullanılmaktadır. 7
Değerlendirme (Kontrol) Sistem Şeması Süreç Girdi Çıktı Hedefler/ Amaçlar Tutarlı Tutarlı değil Değerlendirme (Kontrol) 8
Eğitim bir sistem midir? 9
Eğitim bir sistem midir? Evet eğitim bir sistemdir. Çünkü, 1. Gerçekleştirmek istediği hedefleri vardır: a) Uzak hedefler: b) Genel hedefler: c) Özel hedefler: 10
Eğitim Sisteminin Hedefleri a) Uzak hedefler: Devletin siyasi hedefleridir; çerçevesi anayasa ile belirlenmiştir. En genel hali “Çağdaş gelişmiş ülkeler seviyesine çıkarmak” 11
Eğitim Sisteminin Hedefleri b) Genel hedefler: Okulun hedefleridir; farklı okul türlerinin ortak hedefleri dışında kendilerine özgü hedefleri vardır. İlköğretim okulu, genel liseler, meslek liseleri, fakülte ve bölümleri gibi. 12
Eğitim Sisteminin Hedefleri c) Özel hedefler:Dersin hedefleridir; bir dersin kazanımlarını kapsar. Bir okuldan başarı ile mezun olunabilmesi, okulun bütün derslerinden başarılı olunmasını gerektirir. Dersten başarılı olunabilmesi için ise derste asgari düzeyde başarı sağlanması ile mümkündür. 13
Eğitim bir sistem midir? Evet eğitim bir sistemdir. Çünkü, 2. Bu hedefleri gerçekleştirebilmek için değişik ögelerden oluşmuştur: a) Girdi: b) Süreç: c) Çıktı: d) Kontrol: 14
Eğitim Sisteminin Ögeleri a) Girdi: Eğitim-öğretim için gerekli her şey eğitim sisteminin girdisini oluşturur. Örneğin, öğrenci, öğretmen, okul, kitap, defter, çalışanlar, yönetim, ders programları, yardımcı materyaller, sınıf, sıra, servis gibi her şey girdi olarak görülebilir. 15
Eğitim Sisteminin Ögeleri b) Süreç: Girdilerin hedefler doğrultusunda bir araya getirildiği; dersin hedeflerinin öğrenciye kazandırıldığı eğitim durumlarını kapsamaktadır. Süreç kısmı, dar anlamda, öğretmenin farklı öğretim yöntemlerini kullanarak ders işlediği bölümü oluşturur. Geniş anlamda ise, öğrencinin okula başladığı ve okuldan mezun olduğu süreyi içerir. 16
Eğitim Sisteminin Ögeleri c) Çıktı: Girdilerin işlemler bölümünden hedefler doğrultusunda biçimlendirilip oluşturulmasının sonunda ortaya çıkan ürünlerin tümüdür. Bir okulun mezun ettiği bireyler eğitim sisteminin çıktısını oluşturur. Çıktılar sistemin hedefleriyle nicelik ve nitelik açısından uyuşuyorsa sistem tam işliyor demektir. 17
Eğitim Sisteminin Ögeleri d) Kontrol: Mikro anlamda kontrol, eğitim sürecindeki sınavlar ile yapılmaktadır. Aynı zamanda diplomalı insanların çeşitli meslek gruplarına başvurduklarında yapılan sınavlar da kontrol olarak algılanabilir. Makro anlamda ise mezun bireylerin iş hayatında gösterdikleri başarı performansları ve piyasadaki albeni durumlarıdır. 18
Temel Kavramlar Ölçme: Bireylerin davranışlarını gözleyip gözlem sonuçlarını sayılarla ya da sembollerle ifade etmedir. Herhangi bir nesnenin ne kadar büyük, küçük veya çok olduğunu belirtme sorunudur. Ölçme, bilinmeyen bir değer veya bir ölçünün, bilinen bir değer veya bir ölçü ile mukayese edilmesidir. Başka bir deyişle herhangi bir nesneyi kanunla belirlenmiş bir birimle karşılaştırmaktır 19
Değerlendirme Değerlendirme: Ölçme sonuçlarını bir ölçütle karşılaştırıp, ölçülecek nitelik hakkında karar verme sürecidir. Öğretme ve öğrenmenin etkililiğini belirlemek amacı ile yapılan, eğitimle ilgili verilerin toplanmasını ve yorumlanmasını içeren çok adımlı, sistematik bir süreçtir. .
Temel Kavramlar Değerlendirmenin basamakları: I. Ölçme II.Ölçüt (Değerlendirmeye dayanak sağlayan ölçme sonuçları) III. Karar 21
Ölçme Varlıkların, olayların özellikleri GÖZLEM Sayı veya sembol ile ifade ediş. ÖLÇME Ölçme Süreci Ölçme : Herhangi bir niteliği gözlemlemek ve sonucunu sayılarla ya da başka sembollerle ifade etme işidir.
Örnekler: Okul bahçesinin sıcaklığı 29°C’dir. Ali’nin kütlesi 79 kg’dir. Park yerinde 25 araba var. Masanın boyu 185 cm’dir.
Ölçme işleminin yapılabilmesi için; 1. Ölçülecek özelliğin tanımlanması, 2. Ölçülecek özelliğe uygun sayı ve semboller kümesinin belirlenmesi, 3. Ölçülecek özelliğe hangi sayı ve sembollerin verileceğini gösteren kuralın belirlenmesi gerekir.
Örneğin; “Fizik dersinden sınav yapan bir öğretmen 2.soruya tam cevap veren öğrenciler 20 puan alacaktır.” diyerek, o soruya tam cevap veren öğrencilere kaç puan verileceğine dair bir ölçme kuralı belirlemiştir.
Ölçme sonuçları her zaman sayılarla ifade edilmez. Bazı ölçme sonuçları büyük–küçük, iyi–orta–kötü gibi sembollerle (sıfatlarla) de ifade edilebilir. Örneğin; “Serkan iyi bir sunu hazırladı” cümlesindeki “iyi”, bir ölçme sonucunu gösteren semboldür. Bu tür ölçme işlemleri sınıflama düzeyinde yapılan ölçme işlemlerine örnektir.
ÖLÇME ÇEŞİTLERİ 1- Fiziksel Ölçme: Belirli ve uygun ölçü birimine göre varlığın içinde ne miktarda olduğunun belirlenmesidir.Uzunluk,ağırlık ve hacim miktarlarının ölçülmesi gibi fiziki yapılan ölçmedir. 2- Eğitsel Ölçme: Eğitime tabi tutulan bireylerin davranışlarında oluşması gereken gelişmelerin ve değişikliklerin not sistemine göre ölçülmesidir. Bu ölçmede kullanılan amaçlar ve işlemler bakımından fiziksel ölçmeden farklıdır.
Ölçme, ölçülen özelliğe ve bu özelliğin gözlenme şekline bağlı olarak üçe ayrılır. ÖLÇME TÜRLERİ Doğrudan (Temel) Ölçme Dolaylı (Göstergeyle) Ölçme Türetilmiş
A) Doğrudan (Temel) Ölçme Ölçülecek özelliklerin, araya başka bir değişken girmeden doğrudan doğruya gözlenmesi sonucu yapılan ölçme türüne “doğrudan (temel) ölçme” denir. Doğrudan ölçmelerde ölçülecek özellikle, bu özelliği ölçmek için kullanılacak aracın özelliği aynıdır.
Örnekler: Sude’nin boyu 178 cm’dir. Kitaplıkta 15 tane fizik kitabı var. Ayşe tartılarak 48 kg olduğunu öğrendi. Sınıfta 20 öğrenci var. Bir bahçenin enini metre ile ölçmek, Öğrencileri boy sırasına dizmek,
Bir masanın boyunun cetvel ile ölçülmesi, Bir paketin kefeli terazi ile ölçülmesi, Bir sınıftaki öğrenci sayısının belirlenmesi Öğrencilerin boy uzunluklarının belirlenmesi Bir Öğrencinin sahip olduğu kitap sayısının belirlenmesi Ahmet’in kaç kardeşinin olduğunun belirlenmesi
B) Dolaylı (Göstergeyle) Ölçme Ölçmek istediğimiz değişkenlerin bazıları doğrudan gözlem yapılarak ölçülemez. Doğrudan gözlem yapılarak ölçülemeyen bir değişkenin, onunla ilgisi olduğu bilinen ya da sanılan başka bir değişken gözlenerek ölçülmesine “dolaylı (göstergeyle) ölçme” adı verilir.
Örneğin; Sıcaklığı doğrudan gözlemleyemeyiz. Civa ya da ispirtodaki genleşme veya yoğunlaşma ile sıcaklık artışı veya düşüşü arasında bir ilişki olduğu tespit edilmiştir. Bu nedenle sıcaklık onunla ilgisi olduğu düşünülen civa veya ispirtonun termometredeki yükselişi veya düşüşü gözlemlenerek ölçülür.
Eğitimde ölçülmek istenen özelliklerin çoğu dolaylı olarak ölçülebilen özelliklerdir. Eğitimde en çok ölçülmeye çalışılan başarı ve yetenek değişkenleri doğrudan doğruya gözlenemediği için testler aracılığıyla ölçülmeye çalışılır. Bireylerin testlerdeki maddelere verdiği yanıtlar onların yeteneği ve başarısının bir göstergesi olarak kabul edilir ve bu yanıtlar gözlenerek, bireylerin doğrudan doğruya gözlenemeyen başarı ve yetenek düzeyleri belirlenmeye çalışılır.
Örnek Bir öğrencinin bilgisinin sınav ile ölçülmesi Öğrencinin zekâ düzeyinin ölçülmesi Öğrencinin yeteneklerinin ve kişilik özelliklerinin ölçülmesi Bir dersten geçme notunun belirlenmesi Bir paketin yaylı terazi ile ölçülmesi Bir odanın sıcaklığının termometre ile ölçülmesi.
Antalya’nın hava sıcaklığı 35°C’dir. Ahmet zeka testinden 145 puan aldı. Ayşe matematik sınavından 80 puan aldı.
Eğitimde uygulanan sınavlar dolaylı ölçmeye örnektir.
C) Türetilmiş Ölçme İki veya daha fazla değişken arasında yapılan matematiksel bir işlem sonucu elde edilen ölçme türüne “türetilmiş ölçme” denir. Türetilmiş ölçmelerde, değişkenlerin hepsi ayrı ayrı ölçülür ve bu ölçme sonuçları arasında matematiksel bir işlem yapılır.
Örneğin; Bir otomobilin hızını bulmak için, önce otomobilin gitti uzunluğu, sonra bu yolu kaç saate gittiği belirlenerek; yol ve zaman arasında bölme işlemi yapılır. Burada iki ölçme sonucu arasında matematiksel işlem yapıldığı için türetilmiş ölçme söz konusudur. Hız=Yol/Zaman
Beden kitle indeksi: kilo/boy2 Yol=hız X zaman öğrencinin sınıf geçme notu= vize ortalamasının % 40’ıyla final puanının % 60’ının toplamı
Ölçme Türleri Özellikler ve Örnekler Doğrudan Ölçme Ölçülecek özelliklerin, araya başka bir değişken girmeden doğrudan doğruya gözlenmesi sonucu yapılan ölçme türüdür. Ölçülecek Özellikle bu özelliği ölçmek için kullanılan aracın özelliği aynıdır. Metre ile boy ölçmek Cetvel ile uzunluk ölçmek Dolaylı Ölçme Doğrudan gözlem yapılarak ölçülemeyen bir değişkenin, onunla ilgisi olduğu bilinen ya da sanılan başka bir değişken gözlenerek ölçülmesidir. Termometre ile sıcaklık ölçme Zeka puanını ölçme Öğrencilere uygulanan sınavlar Türetilmiş Ölçme İki veya daha fazla değişken arasında yapılan matematiksel bir işlem sonucu elde edilen ölçme türüne “türetilmiş ölçme” denir. Bir cimin yoğunluğunu belirleme Bir aracın hızını belirleme Aritmetik nufus yoğunluğunu belirleme
Ölçmede Sıfır Matematiksel olarak sıfır, boş kümenin eleman sayısını gösterir. Bu sıfır yokluğu gösterdiği için mutlak (doğal=gerçek sıfır) kavramı kullanılmaktadır. Uzunluk ve ağırlık gibi değişkenlerin ölçülmesinde kullanılan ölçme araçlarındaki sıfır mutlak (doğal=gerçek) sıfırı gösterir. Bir tahta parçasının uzunluğu, bir insanın ağırlığı doğrudan ölçülebilir. Bu tür ölçmelerde kullanılan ölçme aracında başlangıç noktası olarak alınan sıfır (0) mutlak yokluğu göstermektedir. 0 (sıfır)=YOK demek ise=Mutlak sıfırdır
Ölçmede Sıfır Bazı değişkenlerin mutlak sıfırı yoktur. Örneğin, hava sıcaklığının 0 °C olması yokluk anlamına gelmez. Burada yer alan sıfır bağıl (izafi, göreceli, yapay, itibari) sıfır olarak adlandırılır. Yine başarı, zekâ, yetenek gibi değişkenlerin ölçülmesinde de kullanılan ölçme araçlarındaki sıfır o özelliğin hiç olmadığı anlamına gelmez. Ölçme işlemlerinde sıfırın mutlak sıfır veya bağıl sıfır olma durumu ölçme sonuçları üzerinde yapılabilecek matematiksel işlemleri etkiler. 0 (sıfır)=VAR demek ise=Bağıl sıfırdır.
Ölçmede Birim Ölçme sonuçları tanımlanmış ve herkesçe kabul edilmiş bir birimle ifade edilir. Bu durum ölçme sonuçlarını yorumlamayı kolaylaştırır. Termometre birimleri, °C Cetvelin birimleri, m,cm, mm Saatin birimleri, saniye, dakika, saat, Kütle birimleri, gr, kg, ton
Ölçek ve Ölçek Türleri Ölçek: Belli birimlerle bölmelenmiş bir ölçme aracıdır. Ölçme sonuçlarının özelliklerine bakarak değişik ölçek türleri bulunmuştur. Bunlar:
Ölçek Türleri a) Sınıflama (Adlandırma) Ölçeği b) Sıralama Ölçekleri c) Eşit Aralıklı Ölçek d) Eşit Oranlı Ölçek
ÖLÇÜT ve TÜRLERİ Ölçüt= Bir yargıya varmak için kullanılan ilke ve kriterdir. Mutlak ölçüt ve Bağıl ölçüt şeklinde ayrılabilir.
a) Mutlak Ölçüt Ölçme yapılmadan önce herkes için eşit ve kesin olarak belirlenen ölçüte denir. 60 puan ve üzeri geçer. 100 metreyi 16 saniye altında koşanlar kazanır. Akdemik ortalaması 2,5 ve üzerinde olanlar formasyona başvurabilir.
b) Bağıl Ölçüt Ölçme yapıldıktan sonra ölçme sonuçlarından çıkarılan ölçüttür. Ortalamanın üstünde olanlar geçer, altında olanlar kalır. Formasyona akademik ortalaması en yüksek olan ilk 40 kişi girebilir. % 25’e girenlere indirim uygulanır.
Ölçme Araç ve Yöntemlerinde Bulunması Gereken Nitelikler Ölçme araçlarının nitelikleri ölçme hataları ile doğrudan ilgili olduğundan öncelikle hata ve hata türleri incelenmelidir. Okulda öğrenci başarılarının ölçülmesinde farklı ölçme araç ve yöntemleri belirli oranlarda kullanılmaktadır. Bu araçlarla yapılan ölçme uygulamalarında ne kadar dikkatli olunsa da, ölçme sonuçlarına bir miktar hata karışır.
Ölçmede Hata Hata: Ölçme sonuçlarına istenmeyen değişkenlerin karışmasıdır. Hataların bir kısmı kontrol dışında ölçme sonuçlarına karışabilir. Bu nedenle çok iyi sanılan ölçme araçlarıyla yapılan ölçmelerde bile bir miktar hata vardır.
Ölçme işlemine karışan hatalar üçe ayrılır HATA TÜRLERİ Sabit Hatalar Sistematik Hatalar Tesadüfi Hatalar
Sabit Hatalar Her ölçme birimi için miktarı değişiklik göstermeyen hatalara sabit hata denir. Hata miktarı ölçümden ölçüme değişmez. Hata miktarı her ölçme işleminde aynı orandadır. Daha çok ölçmenin güvenirliği (?) ile ilgilidir.
Örnek: Bir sınavda herkese 10 puan fazla verilmesi sabit hatadır. Ancak her öğrenciye aldığı puanın %10 kadar puan vermek sabit hata değildir.
. ÖRN: Bakkalın terazisinin her ölçtüğü ağırlığı 50 gram fazla göstermesi… * Öğretmenin okuduğu her yazılı kağıdına 10 puan fazla vermesi… * Bir termometrenin ölçtüğü her sıcaklığı 2 °C fazla göstermesi… * Bir metrenin ölçtüğü her uzunluğu 3 cm eksik ölçmesi.
Sistematik Hatalar Ölçülen nitelik veya özelliğin büyüklüğüne, ölçmeyi yapan kişinin kendi kusurlarına ve ölçme koşullarına bağlı olarak ortaya çıkan hatalara sistematik hatalar denir.
NOT: Eğitimde sistematik hatada öğretmenin Eğitimde bu hatalara “Yanlılık” denir. Hata miktarı ölçümden ölçüme belli oranda artar / azalır. Ölçülen büyüklüğe, ölçmeye ve ölçme koşullarına bağlı olarak miktarı değişen hatadır. Puanlamanın sübjektif olduğu hatalardır. Daha çok ölçmenin geçerliği ile ilgilidir. Sistematik hatalardan arındırılması geçerliği artırır. NOT: Eğitimde sistematik hatada öğretmenin YANLILIĞI ve TARAF TUTMASI söz konusudur.
Örnek: Yazısı güzel olana fazla puan verilmesi, Kızların fazla puan alması gibi. Öğrencilerin puanlarını yükseltmek için aldıkları puanların %10’u oranında ilave yapması.
Tesadüfi Hatalar Tesadüfen ortaya çıkan ve çoğu kez bilinmeyen nedenlere bağlı olan ve kaynakları da bilinmeyen hatalara tesadüfî hatalar denir. Hata miktarı kuralsız olarak artar ya da azalır. Hatanın kaynağı bilinmez. Ölçme sonuçlarına gelişi güzel karışan hatalardır. Daha çok ölçmenin güvenirliği ile ilgilidir.
Örnek: Dikkatsizce okunup puanlanan doğru okunduğu halde yanlış kayıt edilen notlar
ÖRNEKLER: Dikkatsizce puanlanan, okunan veya doğru okunduğu halde yanlış kaydedilen notlar . * Öğrencinin sınav günü hasta olması, sınav salonunun soğuk olması, şans başarısı, kopya çeken öğrencinin aldığı puan. * Terazinin bir ölçtüğü kütleyi 50 gram fazla gösterirken, bir başka kütleyi 120 gram eksik, bir diğerini 250 gram fazla göstermesi * Öğretmenin bir kağıda 5 puan fazla verirken, bir başka kağıda 10 puan fazla vermesi.
HATA KAYNAKLARI Bu hata kaynakları şunlardır: Ölçme işlemine karışan hatalar, ölçme sonuçlarının gerçek değerlerinin bulunmasına engel olurlar. Bu hata kaynakları şunlardır: 1 Ölçmeciden Kaynaklanan Hatalar 2 Ölçme Yöntem ve Aracından Kaynaklanan Hatalar 3 Ölçme İşleminin Yapıldığı Ortamdan Kaynaklanan Hatalar 4 Ölçme İşleminin Yapıldığı Gruptan Kaynaklanan Hatalar
1 Ölçmeciden Kaynaklanan Hatalar Ölçmeyi yapan kişinin ölçme yaparken öznel puan verme eğilimi, dikkatsizliği, yorgunluğu, eğitim durumu, yaşı vb. nedenlerden ölçme sonuçlarına hata karışmasına neden olabilir.
Aynı kağıtlar değişik puanlayıcılar tarafından puanlandırıldığında öğrencilerin alacağı puanlar farklı olabilecekken; aynı kişi tarafından farklı zamanlarda yapılan puanlamalarda da öğrencilerin alacağı puanlar farklı olabilir. Bu durumda puanların farklı olması, ölçme sonuçlarına ölçmeciden kaynaklanan hata karıştığını gösterir.
2 Ölçme Yöntem ve Aracından Kaynaklanan Hatalar Testler uygulanırken test yönergelerinin ve maddelerinin iyi ifade edilmemesi nedeniyle öğrencilerin soruları yanlış anlamaları Ölçme aracının iyi yapılandırılmamış olması, bozuk yada hatalı olması Ölçme aracının kapsamı iyi temsil etmemsi nedeni ile öğrencilerin bildikleri konulardan sorular sorulduğunda yüksek puan almaları, bilmedikleri konulardan sorular sorulduğunda düşük puan almaları ölçme sonuçlarına hata karışmasına neden olur. Ölçme için seçilen yöntemin yanlış tercih edilmesinden, örneğin yazılı sınav yerine sözlü sınav tercih edilmesi,
3 Ölçme İşleminin Yapıldığı Ortamdan Kaynaklanan Hatalar Test uygulanırken, testin uygulandığı ortamın sıcaklığı, ışığı, havalandırma durumu, gürültü düzeyi, sınav düzeninin kopya çekmeye uygun olup olmaması gibi faktörler ölçme sonuçlarına hata karışmasına neden olabilir.
4 Ölçme İşleminin Yapıldığı Gruptan Kaynaklanan Hatalar Ölçme işleminin yapıldığı gruptaki bireylerin, ölçme işlemi yapılırken içinde bulundukları stres, motivasyon, heyecan, korku, uykusuzluk, dikkat dağınıklığı gibi nedenlerle ya da ölçme işlemi yapılmadan önce geçirdikleri olumsuz yaşantılar nedeniyle (şok, tartışma vb) gerçek performanslarını ortaya koymamaları, ölçme sonuçlarına hata karışmasına neden olabilir.
Güvenirlik, Geçerlik ve Kullanışlık
Güvenirlik Tanımı Güvenirlik, aynı şeyin bağımsız ölçümleri arasındaki kararlılıktır; Ölçülmek istenen belli bir şeyin, sürekli olarak aynı sembolleri almasıdır; Aynı süreçlerin izlenmesi ve aynı ölçütlerin kullanılması ile aynı sonuçların alınmasıdır; Ölçmenin, tesadüfî yanılgılardan arınık olmasıdır.
Güvenirlik Hata ne kadar düşük olursa güvenirlik o kadar yüksek olur. Güvenirlik; duyarlılık, kararlılık, tutarlılık ve objektiflik kavramlarıyla doğrudan bağlantılıdır.
Kararlılık; bir testin birden çok uygulamasında benzer sonuçlar elde edilmesidir. Tutarlılık; bir testi oluşturan birimlerin birbirine benzemesi veya testin ilk uygulaması ve ikinci uygulamasının birbiriyle tutarlı olmasıdır. Duyarlılık; ölçme aracındaki birimlerin küçüklüğü ile ilgilidir. Bu durumda aracın duyarlılığı artar Objektiflik; ölçme işlemi kim tarafından yapılırsa yapılsın, puanlamada aynı sonuca ulaşılması
Ölçme Aracının Güvenirliğini Etkileyen Faktörler Test türü Testte yer alan soru sayısı Testin güçlük düzeyi Testi cevaplama süresi Testin puanlanması Testin uygulandığı grubun uygunluğu Test anlaşılırlığı Testin uygulandığı ortam
Güvenirliği Artırmanın Yolları Soru sayısını artırmak Soruların açık, anlaşılır ve cevaplanabilir olması Öğrencilerin güdülenmesi Sınav süresinin yeterli olması Testin orta güçlükte olması Testin objektif ve dikkatli puanlanması güvenirliği artırır Duyarlılığı yüksek ölçme aracının kullanılması Ölçme sonuçlarının hatasız kaydedilmesi Uygun bir test yönergesinin hazırlanması Testin uygulanacağı öğrenci sayısını artırmak
Ölçmecinin Güvenirliği Ölçme ve değerlendirme sürecinde, kullanılan ölçme aracının güvenilirlik düzeyinin yüksek olmasının yanında ölçmeyi yapan kişinin veya araştırmacının güvenilirlik düzeyi de oldukça önemlidir. Güvenilir ölçme yapan kişiler, olaylara “nesnel” veya “objektif” bakabilen kişilerdir.
Ölçmecinin ne kadar güvenilir olduğunu belirlemenin yöntemleri: Ölçmeyi yapan kişinin, bir gruptan topladığı verileri bir süre sonra tekrar puanlamasıdır. Farklı zamanlarda yapılan puanlamalarda elde edilen değerler birbiri ile tutarlıysa ölçmecinin güvenilir işlem yaptığı kabul edilir. 2. Bir gruptan toplanan veriler birbirinden bağımsız olan kişiler tarafından farklı ortamlarda puanlanır. Bu kişilerin uzmanlık alanlarının aynı olması gereklidir. Aksi takdirde puanlama güvenirliği oldukça düşük çıkar. İki veya daha çok uzmanın puanlama sonuçları birbiri ile tutarlı ise, ölçme işleminin güvenilirliğinin yüksek olduğu kabul edilir.
ÖLÇME ARACININ GEÇERLİĞİ Bir ölçme aracının, ölçülmek istenen özelliği başka özelliklerle karıştırmadan ölçebilme yeteneğine geçerlik denir. Başka bir tanıma göre ölçme aracının geçerliği, ölçülmek istenen nitelikleri ölçmeleri ve amaca uygun ölçme yapmalarıdır. Bir ölçme aracının amacı ne kadar gerçekleştirdiği ile ilgili bir derecedir. ÖRNEK : Uzunluk ölçmek için geliştirilmiş olan metre kişilerin boylarını ölçme amacına hizmet eder. Bu demektir ki bir ölçme aracı olan metre, uzunluk ölçmede geçerlidir fakat ağırlık ölçmede geçerli değildir.
Bir ölçme aracının “geçerliği var” veya “geçerliği yok” gibi ifadelerle tanımlanması doğru değildir. Geçerlik bir derece olduğundan, güvenirlikte olduğu gibi, “geçerliği yüksek” veya “geçerliği düşük” ifadelerinin kullanılması daha uygundur.
Bir aracın geçerli olması için, onun sadece ölçmek için düzenlendiği özelliği ölçmesi yani onu başka özelliklerle karıştırmadan ölçmesi de gerekir. Mesela; yazı güzelliği, ifade biçimi, sayfa düzeni, yanlılık vb. etkenlerin de ölçmeye karışmaması gerekir. Bu etkenlerin ölçmeye karışması geçerliği düşürür. ÖRNEK : Bir öğretmen yaptığı bir Biyoloji sınavında yüksek bir okuma yeteneği ve kelime bilgisi gerektirecek sorular sormuş ve puanlama yaparken de yazı güzelliği, sayfa düzeni vb. özelliklere de fazla puan vermiştir. Böyle bir test ölçmeyi amaçladığı özelliği başka özellikleri de karıştırarak ölçtüğü için geçerliliği düşüktür.
a) Uygunluk: Geçerli ölçme araçları iki temel özellik taşır. Bunlar: Uygunluk ve güvenirlik tir. a) Uygunluk: Bir ölçme aracının ölçülecek özelliği tam olarak ortaya çıkarabilme yeteneği olarak tanımlanmaktadır. Yani hangi özellik ölçülmek isteniyorsa, ölçme işleminde kullanılacak ölçme aracı bu özelliği ortaya çıkarıcı nitelikte olmalıdır. Ölçme araçlarının uygunluğu, istatistiksel analizlerle belirlenemez. Bir ölçme aracının uygunluk özelliğini taşımasında, hazırlayan kişilerin alan uzmanı olmasının büyük rolü vardır.
b) Güvenirlik Ölçme aracının farklı uygulamalarda tutarlı sonuçlar vermesidir. Bir ölçme aracının geçerli olabilmesi için mutlaka güvenilir olması gerekir. Yani güvenirlik, geçerlik için ön şartıdır. Güvenilirliği düşük olan ölçme araçlarının geçerliği de kesinlikle düşük olur. Fakat güvenilirliği yüksek olan her ölçme aracının geçerliğinin yüksek olmayacağı da bilinmelidir.
NOT: Bir başarı testinin niteliği; ölçülecek olanın ne olduğuna ve onun nasıl ölçüleceğinin açıkça belirlenmiş olmasına bağlıdır. Ne ölçülecek sorusunun cevabı testin uygunluk ve ilgililik özelliği ile ilgilidir. Nasıl ölçülecek sorusunun cevabı büyük ölçüde testin güvenirliği ile ilgilidir.
Geçerlik-Güvenirlik İlişkisi
Şekillerden çıkarılacak sonuçlar Güvenirliği düşük ölçme sonuçlarının geçerliği de düşüktür (A şekli). Güvenirliği yüksek ölçme sonuçlarının geçerliği yüksek olmayabilir (B şekli). Geçerliği yüksek ölçme araçlarının güvenirliği de yüksektir (C şekli).
Ölçme Aracının Geçerliğini Etkileyen Faktörler 1. Ölçme aracının güvenirliği üzerinde etkili olan özellikler geçerlik üzerinde de etkilidir. 2. Ölçme aracında yer alan soruların sayısının artırılması geçerliği yükseltir. 3. Testte yer alan soruların güçlük düzeyleri normal dağılım eğrisine benzemelidir. 4. Ölçme aracında yer alan maddelerin düzeyi, öğrencilerin seviyesine ne kadar uygun olursa geçerlik düzeyi de o ölçüde artar. 5. Testte yer alan soruların, çalışan ve çalışmayan öğrencileri ayırt edebilir olması, geçerliğin yükselmesini sağlayacaktır.
… Ölçme Aracının Geçerliğini Etkileyen Faktörler 6. Testi cevaplamak için verilen sürenin fazla veya az olmaması geçerliği yükseltir. 7. Testte yer alan maddelerin kolaydan zora, basitten karmaşığa doğru sıralanması geçerliği olumlu yönde etkiler. 8. Testin uygulaması sırasında kopya çekilmesi geçerliği düşürür. 9. Testin puanlanmasında hata yapılmaması geçerliğin yükselmesini sağlayacaktır. 10. Testte yer alan soruların doğru cevaplarının sistematik olarak sıralanmaması geçerliği yükseltir. 11. Ölçme aracında, dersin veya konunun her hedef davranış ile ilgili sorulara yer verilmesi geçerliği yükseltir.
Geçerlik ve Güvenirlik Arasındaki İlişki Bir ölçme işleminde güvenirlik “nasıl ölçülecek?”, geçerlik ise “ne ölçülecek?” sorusuna odaklanır. Yani ölçme aracının geçerliği, testte yer alan maddelerin neyi ölçtüğü ile ilgiliyken, güvenirliği bu testin nasıl uygulanacağı ile ilgilidir. 2. Ölçme aracının geçerlik düzeyi; bütün hatalardan (sabit, sistematik ve tesadüfî hatalar) olumsuz etkilenirken, güvenirlik düzeyi yalnızca tesadüfî hatalardan olumsuz etkilenir. 3. Güvenirlik düzeyi düşük olan ölçme araçlarının geçerliği de düşük olur. Yani güvenirlik, geçerlik için en önemli ön şarttır.
… Geçerlik ve Güvenirlik Arasındaki İlişki 4. Geçerliği yüksek olan bir testin güvenirliği de mutlaka yüksek olur. Çünkü geçerliğin yüksek olması için, ölçme sürecine hiçbir hata karışmamış olması gerekir. 5. Bir ölçme aracının güvenirlik düzeyi yüksek olsa bile geçerlik düzeyi düşük olabilir. 6. Geçerlik ve güvenirlik düzeyi düşük olan bir ölçme aracının geçerliğini yükseltilmek için öncelikle güvenirlik düzeyini yükseltmek gerekir. Çünkü bir ölçme aracının geçerlik düzeyi, ne kadar çaba gösterilirse gösterilsin, güvenirlik katsayısının karesinden (r2) daha fazla yükseltilemez.
ÖLÇME ARACININ KULLANILIŞLIĞI Kullanışlılık, bir ölçme aracında aranan üçüncü temel özelliktir. Kullanışlılık; bir ölçme aracının geliştirilmesinin, çoğaltılmasının, uygulanmasının, cevaplanmasının ve puanlanmasının kolay olmasıdır. Ayrıca bir testin maliyeti ne kadar düşük olursa, kullanışlılığı o ölçüde yüksek olur.
Ölçme aracının kullanışlılığı ile ilgili genel özellikler şunladır: Hazırlanması: Öğretmenin ölçme aracını hazırlarken zorlanmaması ve kısa sürede tamamlaması, Uygulanması: Öğretmenin ölçme aracını uygularken güçlük çekmemesi ve kısa sürede uygulaması, Cevaplanması: Öğrencilerin ölçme aracını cevaplarken zorluk çekmemeleri ve kısa sürede cevaplamaları,
Puanlanması: Öğretmenin ölçme aracını puanlarken zorlanmaması ve kısa sürede puanlaması, Maliyetin düşüklüğü: Ölçme aracını okula maddi yönden yük getirmemesidir.
ÖLÇMENİN STANDART HATASI Ölçme aracının hatalardan arınıklık derecesini gösteren güvenirlik katsayısı, ölçme işleminde yapılan hatanın miktarını belirtmez. Ölçmede yapılan hataların standart değerini hesaplamak için, güvenirliğe ve test puanlarının standart sapmasına dayalı olarak ölçmenin standart hatasının hesaplanması gerekir.
Değerlendirme Türleri 1) Öğrenci başarısının değerlendirilmesi, 2) Öğrenme eksikliklerinin değerlendirilmesi, 3) Eğitim programının değerlendirilmesi, 4) Hazır bulunuşluk düzeyinin değerlendirilmesi, 5) Rehberlik amacıyla yapılan değerlendirme, 6) Öğretmenin değerlendirilmesi. 93
Davranışların Gruplandırılması Eğitim ortamında öğrenciye kazandıırlması istenilen davranışlar üç alanda toplanır. Bunlar, A) Bilişsel Alan B) Duyuşsal Alan C) Psiko-motor Alan dır. Her alan içerisinde hedef ve davranışlar alt kategorilerde gösterilir. 94