ÖLÇME ARACININ YAPISAL NİTELİKLERİ Hazırlayan: Doç. Dr. Mustafa Akdağ
Yapısal Nitelikler Ölçme araçlarının nitelikleri değişik kaynaklarda farklı biçimlerde ele alınmasına rağmen, nitelikler başlıca üç başlık altında ele alınmaktadır. Geçerlilik, Güvenirlilik Kullanışlılık Yapısal Nitelikler
Geçerlilik Bir ölçme aracının her şeyden önce, ölçülecek özellik ya da özellikleri tam ve doğru olarak ölçmesi ve ölçülmesi söz konusu olmayan başka özelliklerle karıştırılmadan ölçülebilmesidir. İçerik ön plandadır. Geçerliliği kestirme, genellikle korelasyon tekniğine dayanır. “-1” ile “+1” arasında değerler alır. +1’e yaklaşması yükselmesi, +1’den uzaklaşması ise düşmesi anlamına gelir. Yapısal Nitelikler
Geçerlilik türleri 1) Kapsam geçerliliği: Bir ölçme aracının yoklanması gereken konu, ünite ya da tüm davranışları kapsayıp kapsamadığı ile ilgilidir. Bir testin hangi davranışları kapsayacağı; “belirtke tablosu” ile belirlenir. Bu tablo, davranışların konulara ne kadar ağırlıkta dağıldığını gösteren iki boyutlu bir çizelgedir. Yapısal Nitelikler
Geçerlilik türleri Kapsam geçerliliğini belirleme yolları: Uzman kanısı alma. Aynı kapsamı ölçen başka bir testle korelasyon. Yapısal Nitelikler
Geçerlilik türleri 2) Bir ölçüte dayalı Geçerlilik: İki türü vardır: Yordama Geçerliliği: Puanların ileri performanslara ilişkin tahminlerde dayanak olarak kullanıldığı durumlarda kullanılır. Yordayıcı puanlar, ölçüt puanlardan önce edilir. ÖSS korelasyon Akademik başarı (yordayıcı) (ölçüt) İşe giriş sınavı korelasyon İş yerindeki performans (yordayıcı) (ölçüt) Yapısal Nitelikler
Geçerlilik türleri Uygunluk (uyum) Geçerliliği: Ölçüt puanlar, yordayıcı puanlardan önce elde edilir. Deneme sınavı korelasyon ÖSS (ölçüt) (yordayıcı) Yapısal Nitelikler
Geçerlilik türleri 3) Yapı Geçerliliği: Bir testin yapı geçerliliği, testle ölçülmek istenen yapının ortaya konulması derecesidir. Bir ölçme aracının yapı geçerliliğine sahip olup olmadığının anlaşılması; maddelerin tamamıyla aynı yapıyı ölçmesine bağlıdır. Araca verilen cevapların birbirleriyle ilişkili olmasına bağlıdır. Faktör analizi ve hipotez testi yapı geçerliliğini sağlamada kullanılır Yapısal Nitelikler
Geçerlilik türleri 4) Görünüş geçerliği: Testin hangi davranışları ölçtüğünün görülmesi ile ilgilidir. Bu daha çok testlerin kapağında yazılır. Matematik testi, Tarih testi gibi. Testin içindeki sorular, kapağındaki başlık ile örtüşmesi gerekir. Yapısal Nitelikler
Geçerliliği Etkileyen Faktörler Güvenilirlik, geçerlik için bir önkoşuldur. Güvenilirlik düşükse geçerlilikte düşüktür.Güvenilirliğin sağlanmış olması; geçerliliğin de sağlandığı anlamına gelmez. Soru sayısının artması, Sabit ve sistematik hatalar geçerliliği düşürür Maddelerin, ölçmek istenen değişkeni ölçmesi geçerliliği arttırır. Soruların, bilenle bilmeyeni ayırt etmesi geçerliliği attırır. Sınavın uygulanma koşulları (gürültülü, karanlık, soğuk ya da sıcak, verilen süre, soruların önceden edinilmesi) geçerliliği düşürür. Yapısal Nitelikler
Güvenilirlik Ölçümlerin hatasızlık derecesi ya da gerçeği yansıtma derecesi olarak algılayabiliriz. 0 ile 1 arasında değerler alan bir korelasyon katsayısıdır Belli bir özellik, bir ölçme aracı ile değişik zamanlarda ölçüldüğü zaman aynı ya da hiç olmazsa yaklaşık olarak aynı ölçümleri vermelidir. Yani güvenilirlik, aracın ölçtüğü şeyi tutarlı bir biçimde ölçmesidir. Yapısal Nitelikler
Güvenilirliğin üç özelliği: Duyarlılık: Hatası az olan ölçmedir. Hata azaldıkça ölçme daha duyarlı (hassas) olur. Ör: 25 soruluk bir test; 10 soruluk bir testten daha duyarlı sonuçlar verir. Soru sayısı arttıkça duyarlık artar. Ör: Bir cetvelin en küçük birimi, cm. yerine mm. olursa; daha hassas bir ölçme yapılır. Duyarlık; birimlerin büyüklüğü ile ilgilidir. Birimleri küçük olan ölçme aracı, büyük olandan daha duyarlıdır. Yapısal Nitelikler
Güvenilirliğin üç özelliği: Tutarlılık: Aynı özelliğin farklı araçlarla ya da farklı kişiler tarafından ölçülmesi durumunda ölçme sonuçlarının benzer olmasına denir. Örnek: Bir masanın boyunun iki farklı metre ile ölçülmesi durumunda, iki ölçme sonucunun birbirine yakın olması, metrelerin birbirleriyle tutarlı ölçmeler yaptığını gösterir. Ayrıca, Madde puanlarının (cevapların), testin bütününden elde edilen puan ile korelasyonunun bir göstergesidir. Korelasyonun yüksek olması, maddelerin ölçülmek istenen özellik bakımından homojen (tutarlı) olduğunu gösterir. Düşük olması, maddelerin birbirleriyle ve bütünle tutarlı olmadığını, testin heterojen bir yapıda olduğunu gösterir Yapısal Nitelikler
Güvenilirliğin üç özelliği: Kararlılık: Bir nitelik aynı araçla birden fazla ölçüldüğünde, birbirinden farklı olmayan sonuçlar çıkarsa, ölçme aracı kararlıdır. Örnek:Bir metre ile bir masanın uzunluğunu birden çok ölçtüğümüzde ölçme sonuçlarının birbirine yakın çıkması metrenin kararlı ölçmeler yaptığını gösterir. Soru: Eğitim ve psikolojideki ölçmelerde hata kaynakları; fiziksel ölçmelerdekinden daha fazla olmaktadır neden? Yapısal Nitelikler
Güvenilirliği sağlama yöntemleri Test-tekrar test yöntemi: Test aynı gruba belirli bir aralıkla iki kez uygulanır. Birinci uygulama ile ikinci uygulama puanları arasındaki ilişki/korelasyon hesaplanır. Bu yöntemde iki uygulama arasındaki tutarlılığa bakılır. Güvenirlik için katsayının +1.00’a yaklaşması gerekir. Testin tekrarı için üç haftalık süre yeterlidir. Elde edilen katsayı; “kararlılık katsayısı” olarak da bilinir. Yapısal Nitelikler
Güvenilirliği sağlama yöntemleri Eşdeğer (Paralel) formlar yöntemi: Testin iki kez uygulanmasından kaynaklanan olumsuzlukları gidermek için eşdeğer formlar geliştirip uygulanır. Geliştirilen iki form aynı gruba aynı anda ya da kısa bir zaman aralığında uygulanır. İki testten elde edilen puanlar arasındaki korelasyon katsayısı hesaplanır. Elde edilen katsayı; “tutarlılık ve eşdeğerlik” olarak ifade edilir. Yapısal Nitelikler
Güvenilirliği sağlama yöntemleri Testi yarılama (eşdeğer yarılar) yöntemi: Testin iki yarısı arasındaki tutarlılık araştırılır. Tek numaralı sorular bir yarı, çift numaralı sorular bir yarı oluşturur. Elde edilen iki yarı; iki ayrı testmiş gibi kabul edilip aralarındaki korelasyon hesaplanır. Bu yöntem, testin bir kez uygulanmasına dayandığından kullanışlıdır. Yapısal Nitelikler
Güvenilirliği sağlama yöntemleri Kuder-Richardson yöntemi (KR-20, KR-21 formülleri: Her iki katsayı, testin iç tutarlılık katsayısıdır. Eşdeğer yarılar yönteminde testin iki yarısı arasındaki ilişki miktarı hesaplanırken, iç tutarlılık katsayılarında testin bütün sorularının birbirleri ile uyumu incelenir. Bu yöntemin kullanılması; testin homojen bir yapıya, yani aynı özelliği ölçüyor olması sayıltısına dayanır. Bu yöntem, cevapların “1” ve “0” olarak puanlanabildiği testlerde kullanılır. Yapısal Nitelikler
Güvenilirliği sağlama yöntemleri KR-20: Her bir maddenin güçlük indekslerinin belirlenebildiği durumlarda kullanılır. Güçlük indekslerinin hesaplanamadığı durumlarda KR-21 kullanılır. KR-21 formülü, madde güçlük indekslerinin eşit olduğu varsayımına dayalıdır. Eğer maddeler güçlük indeksleri bakımından birbirinden farklı, yani heterojen bir dağılım gösteriyorsa KR-21 ile hesaplanan katsayı, KR-20 ile hesaplanandan daha düşük çıkar. Yapısal Nitelikler
Güvenilirliği sağlama yöntemleri Cronbach Alpha (α) Katsayısı: Cevapların “1” ve “0” şeklinde puanlanamadığı araçlarda kullanılır. İç tutarlılık katsayısıdır. Duyuşsal özelliklerin ölçülmesinde kullanılır. Örneğin tutum ölçeklerinde doğru cevap yoktur ve cevaplar kategoriktir. Alpha değerinin +1.00’e yaklaşması testin kendi içinde tutarlılığının arttığını gösterir. Yapısal Nitelikler
Güvenilirliği sağlama yöntemleri Puanlayıcı güvenilirliği: Yazılı, sözlü sınav gibi puanlaması subjektif olan araçlarda kullanılır. Cevap kağıtları birden çok puanlayıcı tarafından puanlanarak, arasındaki korelasyon hesaplanır. Yapısal Nitelikler
Güvenilirlik sağlama yöntemleri ve anlamları Uygulama Sayısı Güvenirlik Test-tekrar test 2 Kararlılık Paralel (Eşdeğer) Formlar Tutarlılık Eşdeğer Yarılar 1 İç tutarlılık KR-20 ve KR-21 Cronbach Alpha Puanlayıcı Güvenirliği Yapısal Nitelikler
Güvenirliği Etkileyen Faktörler Testin uzunluğu: Soru sayısı arttıkça güvenirlik artar Ölçülen niteliğin genişliği (Ranj): Gruptaki değişiklik ne kadar fazla ise güvenirlik o kadar yüksek olur. Bu nedenle birkaç sınıfta uygulanan testin güvenirliği bir sınıfta uygulanan testin güvenirliğinden daha yüksektir Test uygulama şartları: Sınav süresi, öğrencileri güdülenme düzeyleri, dikkatsizlik, gürültü, ölçmeyi yapan kişinin sınav anındaki davranışları Ranj: Bir veri grubunda en yüksek puan ile en düşük puan arasındaki farktır. Yapısal Nitelikler
GÜVENİLİRLİĞİ ARTTIRMAK İÇİN; Bir testteki soru sayısını arttırmak, Açık anlaşılır ve kesin cevaplı sorular sormak, Öğrencilerin seviyelerine uygun sorular sormak. Sınav süresinin gereğinden kısa veya uzun olmamasına dikkat etmek. Öğrencilerin sınav öncesi motivasyonunu sağlamak. Ölçmenin hatalardan arındırılması. Puanlamanın objektifliği. Şans başarısının azaltılması Soru sayısı, süre, puanlamanın nasıl olacağı gibi özelliklerin yönerge ile belirtilmesi Yapısal Nitelikler
Güvenilirlik ve Geçerlilik arasındaki ilişki Bir test eğer geçerliyse zaten güvenilirdir Test istenen özelliği ölçüyorsa, hatalardan arınık ölçüyor demektir. Güvenilir bir test geçerli olmayabilir Güvenilirliği yüksek bir matematik testi, fen bilgisini ölçmek için geçerli değildir. Testin güvenilirliği, geçerliliğini sınırlar Güvenilirliği 0.90 olan bir test, 0.10 kadar tesadüfi hata barındırır. Bu hatadan dolayı geçerlilik sınırlı olur. Güvenilirlik ve Geçerlilik bir derecedir, varlık ya da yokluk durumu değildir Bir testin güvenilirliği ve geçerliliği yok/var yerine, düşüktür/yüksektir denir. Yapısal Nitelikler
Kullanışlılık Ekonomiklik Hazırlama süresi Uygulama süresi Hazırlayıcı ve uygulayıcının nitelikleri Cevaplayıcının nitelikleri Uygulama kolaylığı Puanlama kolaylığı Puanların yorumlama kolaylığı Yapısal Nitelikler