Ölçme ve Değerlendirme Tuncay hoca
Nesne özelliğiGözleSayı yada Sembolle ifadeÖLÇME Temel Kavramlar Ölçme: Herhangi bir niteliği gözlemek ve gözlem sonucunu sayılarla ifade etmektir. Nesne özelliğiGözleSayı yada Sembolle ifadeÖLÇME Değerlendirme:Ölçme Sonucunda elde ettiğimiz sonucu bir ölçüt ile karşılaştırarak bi karar yada yargıya varmadır. Ölçme Türleri: Doğrudan ve Dolaylı, türetilmiş Eğitimde ölçme konusu olan özelliklerin çok azı doğrudan gözlenebilir. Psiko-motor beceriler, yanlışsız ve güzel okuma, iyi konuşma becerisi gibi. Değerlendirme Türleri: Mutlak ve Bağıl Değerlendirme Ölçme ve Değerlendirme: Eğitimde hedeflere ne düzeyde ulaşıldığı, gerçekleşmeyen hedeflerin nedenlerini sorgulama, öğrenme sürecinin etkililiğini arttırma ve öğrenci gelişimi hakkında bilgi verir
Temel Kavramlar Türetilmiş Ölçme: Değişkenlerin ortak noktası, kendi başlarına bir tanımlarının olmaması ve başka değişkenler ve bu değişkenler arasındaki ilişkiyi yansıtan aritmetik işlemlerle tanımlanmış olmasıdır. Yoğunluk değişkeni, kütle/hacim olarak; hız değişkeni ise yol/zaman olarak; nüfus yoğunluğu ise, kişi sayısı/alan şeklinde iki değişken ve bu değişkenler arasındaki aritmetik işlemlerle tanımlanmıştır.
Birimli ölçme, ölçülecek büyüklüğün miktarının sayısal olarak gösterilmesi işlemidir. Eşitlik; kullanılan ölçme işlemindeki birimlerin birbirine eşit olmasını ifade eder. Genellik; birimlerin herkes tarafından aynı biçimde anlaşılmasını, kişiden kişiye, yerden yere değişmemesini ifade eder. Kullanışlılık; birimlerin, kullanılış amacına hizmet etmesi anlamına gelmektedir.
Temel Kavramlar Ölçüm: Ölçme İşlemi Sonucunda elde edilen sembol-sayıdır. Ölçme Kuralı: Ölçme işleminde ölçülen özelliğin ne kadarlık miktarına ne kadar puan verileceğidir. (bu soruya tam puan verenlerin 10 puan alması) Ölçmede Sıfır: Doğal ve tanımlanmış sıfır olarak belirlenir. Ölçmede Hata: Ölçülen nesnenin gerçek değeri ile gözlenen değeri arasındaki farktır. (Hata Türleri; Sabit, Sistematik ve Tesadüfi olarak değişir).
Hata Türleri Sabit Hata: Ölçümden Ölçüme değişmez, aynı oranda hata vardır ve testin geçerliliğini etkileyecektir. Sistematik Hata: Hata miktarı ölçümden ölçüme belli oranda artar yada azalır ve testin geçerliliğini etkileyecektir. Tesadüfi Hata: Hatanın kaynağı bilinmez yada hata miktarı kuralsız olarak artar-azalır ve ve testin güvenilirliliğini etkileyecektir. Ölçek: Cetvel, metre gibi ölçme araçları üzerinde yapılan bölmelendirme işlemlerinde kullanılır. Ayrıca; Sınıflama(), Sıralama, Eşit Aralıklı ve Oranlı ölçek olarak kullanılmaktadır.
ÖLÇEK ve ÖLÇEK TÜRLERİ Ölçmede gözlem sonuçlarının sayılarla ifade edilmesinde uyulan kısıtlamalardır. Nesnelere verilen sayıların anlamıdır.. Cetvel ve metre gibi araçlar üzerindeki bölümlemelerdir. Dört tür ölçek vardır: Sınıflandırma Ölçeği Sıralama Ölçeği Eşit Aralıklı Ölçek Oranlı Ölçek
ÖLÇEK TÜRLERİ-1 Sınıflandırma (Nominal, Adlandırma ) Ölçeği: Nesnelerin belli bir yönden benzeyip, benzemediklerine göre sınıflandırılmasıdır. Kadın-erkek; evli-dul-boşanmış kategorisi gibi. Gözlemin en basit biçimidir. Bu ölçekle nesnelere verilen sayıların sayısal anlamları yoktur, miktar belirmezler (plaka numaraları, il kodları gibi). Bu ölçekle yapılan iş, ölçmeden çok anlamlandırmadır. Bu ölçekle elde edilen sayılar üzerinde matematiksel işlem yapılmaz.
ÖLÇEK TÜRLERİ-2 Sınıflandırma ölçeğinin iki özelliği vardır: 1- Simetriklik: A=B ise, B=A dır. Ali ,Veli’nin kardeşi ise, Veli de Ali’nin kardeşidir. 2-Geçişlilik: Ali, Veli’nin kardeşi, Veli’de Ayşe’nin kardeşi ise, Ali, Ayşe’nin de kardeşidir. A=B ve B=C ise, A= C dir.
ÖLÇEK TÜRLERİ-3 2. Sıralama Ölçeği: Nesneleri belli bir özelliğine sahip oluş miktarı bakımından sıraya koymaktır. Öğrencileri boy sırasına göre sıralamak veya bir dersten alınan puanlara göre başarı sırasına koymak. Sıralamada başlangıç noktası ve sıralar sabit değildir. Gruba yeni üyelerin katılımıyla sıralama değişir. Eğitimde kullanılan bir ölçek türüdür. Bu ölçekle elde edilen sonuçlar üzerinde, ortanca (medyan) ve yüzdelik hesapları yapılabilir.
ÖLÇEK TÜRLERİ-4 Sıralama Ölçeğinin İki Özelliği Vardır: Geçişlilik Ali, Veliden daha boylu, Veli de Can’dan daha boylu ise, Ali Can’dan daha boyludur A>B ise B>C ise A>C dir. 2. Asimetriklik Ali Veliden boylu ise, Veli’de Ali’den boyludur denilemez. A>B ise B>A değildir.
ÖLÇEK TÜRLERİ-5 3. Eşit Aralıklı Ölçek: Ya iki noktası belirlenip bu iki nokta arası eşit aralıklara bölünerek ya da bir noktası belirlenip bu noktadan itibaren tanımlanmış bir birimle bölümlenerek geliştirilen ölçektir. Bu ölçekte, tanımlanmış, saymaca, keyfi bir sıfır noktası ve tanımlanmış, değişmez bir birim vardır. Termometre, Takvim ve standart puanlar. Eğitimde kullanılan bir ölçek türüdür. Bu ölçekle elde edilen sonuçlar üzerinde, ortanca (medyan) ve yüzdelik hesapları yapılabilir.
ÖLÇEK TÜRLERİ-6 Eşit Aralıklı Ölçekle elde edilen sonuçlar toplanıp, çıkarılabilir, ancak çarpma ve bölme (oran belirten) yapılamaz. Aritmetik ortalama, standart kayma ve korelasyon hesaplanabilir. 20 derece sıcaklık, 10 derece sıcaklığın iki katı değildir, 10 fazlasıdır denilebilir. 0-100 arası 100 eşit parçaya bölünerek ölçek elde edilir. Bu ölçekte sıfır, ölçülen özelliğin hiç olmadığı anlamına gelmez
ÖLÇEK TÜRLERİ-7 4. Oranlı Ölçek: Saymaca sıfırın yerine doğal/gerçek sıfırın konulmasıyla elde edilen ölçektir. Bu ölçekle elde edilen sonuçlar üzerinde, her türlü matematiksel işlem yapılabilir. Metre, Kilogram gibi. Saat?
ÖZELLİK ÖLÇEKLER Sınıflama Sıralama Aralık Oran Eşit Ölçme Birim Yok Var Sıfır Noktası Tanımlı Gerçek Dört İşlem +, - +, -, x, / Ölçme Duyarlılığı Düşük Yüksek
Değerlendirme Türleri Summative (Özetleyici) Değerlendirme Bu değerlendirmede geçti-kaldı, başarılı-başarısız kararları, eğitimde çok kullanılması, başarı ve erişi testlerinde kullanılması, ara-son sınavlarda kullanılmaktadır. Formative / Geliştirici (Biçimlendirici) Değerlendirme Bu değerlendirmede öğrenme eksiklikleri üzerinde durulur, ünite yada konu sonlarında izleme şeklinde kullanılır. Eğitim Programlarının Değerlendirilmesi Programın bütün halinde her bir öğesinin etkinliği değerlendirilir. Hazır Bulunuşluk Düzeyinin Değerlendirilmesi Ön koşul davranışlarının belirlenmesine dönüktür: Giriş Sınavları vb. Öğretmenin Değerlendirmesi Tüm değerlendirme tür ve ölçme işlemlerini yaparak öğretmenin öğretimi gerçekleştirmesidir
Ölçme değerlendirme amaçları Tanımaya Yönelik Değ: Bir davranışın önceden edinilip edinilmediğini yoklamak, öğretim sürecinin başında yada dersin giriş bölümünde yapılan değerlendirme, bir ders yada kursun ön koşulu niteliğindeki giriş davranışlarına sahip olma derecesidir. * ÖSS sınavı, ingilizce kur belirleme sınavı, seviye tespit, hazır bulunuşluk, yetenek testi, tanıma testi Formatif (Biçimlendirmeye yönelik) Değ: Bu değerlendirme yaklaşımında kullanılan testler formatif, izleme ve ünite testleri olarak 3’e ayrılır. Biçimlendirme ve yetiştirmeye yöneliktir. Öğretim süreci içerisinde öğrenme eksikliklerini belirlemek ve gidermek amacıyla kullanılır. Not verme amaçlı değildir. Değer biçmeye dönük (Summatif) Değ: Birkaç ünitede bir yada öğretim sonunda yapılan değerlendirmedir. Ders-kurs sonunda yapılan sınavlar, öğrenme düzeyi ve başarı düzeyini belirlemek, erişi testleri için kullanılır.
Ancak araştırmanın amacına göre bağımlı-bağımsız olarak ikiye ayrılır; Değişken Bir durumdan diğerine farklı değerler alabilen özelliktir. Nicel Değişken: Sayılarla ifade edilir Boy uzunluğu, Ağırlık düzeyi Nitel Değişken: Semboller ve sıfatlarla ifade edilen değişkenlerdir. Cinsiyet, Milliyet, Din Sürekli Değişken: İki değer arasında başka bir değer bulabilen değişkendir. Kilometre, metre, ağırlık, zeka v.b Süreksiz Değişken: İki değer arasında sınırlı sayıda değer alan değişkendir. Cinsiyet, okul türü v.b Ancak araştırmanın amacına göre bağımlı-bağımsız olarak ikiye ayrılır; Bağımlı Değişken: Bir başka değişkene bağlı olarak değişir. Kanserin Depresyon üzerindeki Etkisi Bağımsız Bağımlı Sigaranın kanser üzerindeki etkisi
Güvenilirlik Bir ölçme aracının tesadüfi hatalardan arınık olma derecesidir. Yani ölçme aracının hatalardan arınık, duyarlı, kararlı ve tutarlı olmasıdır. Bir ölçme aracının güvenilirliğini etkileyen hata kaynakları; *Ölçme aracından kaynaklanan hatalar: Ölçme aracının birden fazla davranışı karışık ölçmesi yada soruların anlaşılmaması *Ölçmeciden kaynaklanan hatalar: Motivasyon, yaş, taraflılık, bilgi düzeyi *Ortamdan kaynaklanan hatalar: Sınav yerinin ısı, ışık v.s. *Ölçülen kişiden kaynaklana Hatalar: Tutum, sorumluluk, yorgunluk v.s *Ölçme aracı çeşidinden kaynaklanan: Sözlü sınav yerine yazılı kullanma
Güvenilirliliği Etkileyen Faktörler Testin uzun olması Test sorularının ayırt edicilik gücü (0-1) Testin anlaşılır olması, güçlük düzeyi Sınavın yapıldığı ortam, Maddelerin homojenliği Zaman, Şans başarısı, Testin uygulama koşulları, Kopya çekme Öğrenci tutumları – Puanlamada nesnellik – Davranışları ölçülen grubun normal dağılım göstermesi ve heterojen olması güvenilirliliği yükseltir. Örnek: Test maddeleri ne kolay ne de zor olacak, bilenle bilmeyeni ayırt edecek, Bir ölçme aracının güvenilirliliğini belirlemede 1 Test tekrar yöntemi, 2 Paralel testler, 3 Testi yarılama yöntemi kullanılır. Ayrıca, KR-20, 21 ve Alpha güvenilirlik katsayılarından faydalanılır.
ÖLÇMEDE TUTARLILIK-1 Ölçmede tutarlılığı sağlamanın iki yolu: 1-Birbirini izleyen ölçmelerde, bireyin grup içindeki pozisyonundaki tutarlılık. Grup içinde sırasının değişmezliği. Bu yaklaşımda aynı nesnelerle ilgili iki ölçüm takımı arasındaki korelasyon hesaplanır ve bulunan katsayı, güvenirlik katsayısı olarak isimlendirilir. 2-Bireysel ölçümlerde görülen ölçme hatasının büyüklüğüyle ilgilidir. Bir nesne tekrar tekrar ölçülecek olursa ele edilen ölçümler birbirinden farklı olacak ve onlar belli bir dağılım gösterecektir. Ölçümlerdeki değişme, standart kayma olarak isimlendirilir ve bu ölçümdeki hata payını gösterir. Bu durumda ona ölçmenin standart hatası denir.
GÜVENİRLİK KATSAYISI-1 Gerçek ölçümlerin bilinmemesi, dolaylı yoldan güvenirlik katsayısı hesaplamayı gündeme getirmiştir. Güvenirlik katsayısı hesaplama yolları 1- Test Tekrar Yöntemi: Aynı test formunu, aralıklı olarak iki ayrı zamanda aynı gruba uygulanması ve iki uygulamadan elde edilen puanlar arasındaki korelasyonun bulunması. Bu test ile elde edilen katsayıya İstikrarlılık / Kararlılık / Tutarlılık katsayısı denir. Temel sorun, zamandır (2-8 hafta). Bu durum zor olmakla birlikte eşleştirilmiş grupla aşılabilir. Maddelere verilen cevapların tutarlılığının önemli olduğu durumlara uygundur. Başarının yordanması için kullanılacak testlerin güvenirlik katsayısını hesaplamada kullanılır (İlgi ölçeği gibi).
GÜVENİRLİK KATSAYISI-2 2- Paralel Testler Yöntemi: İki eşdeğer testin yada bir testin iki eşdeğer formunun aynı gruba aynı zamanda /belli zaman aralığı ile uygulanması ve iki eşdeğer testten elde edilen puanlar arasındaki korelasyonun bulunması. Bu test ile elde edilen katsayıya Eşdeğerlik katsayısı denir. Bu yöntemle elde edilen güvenirlik katsayısı genellikle düşüktür. Pearson Çarpım Momentler katsayısı olarak da bilinen bu yolla elde edilen katsayı, yarı testin katsayısı olup, Spearman-Brown formülü ile tam testin güvenirlik katsayısına dönüştürülür.
GÜVENİRLİK KATSAYISI-3 3- Testi Yarılama Yöntemi: Bir testin iki eşdeğer yarıya bölünmesi ve öğrencilerin bu iki eşdeğer yarıdan aldıkları puanlar arasındaki korelasyonun bulunması. Bu test ile elde edilen katsayıya İç Tutarlılık katsayısı denir. En çok kullanılan yöntemdir. Çünkü tek test, tek öğrenci grubu ve tek form vardır. Bu yöntemle elde edilen güvenirlik katsayısı da yarı testin katsayısı olup, Spearman-Brown formülü ile bütün testin güvenirlik katsayısına dönüştürülür. Temel sorun, testi eşdeğer iki yarıya bölmektir. Testteki tek ve çift nolu soruları ayrı ayrı puanlamak bir yol olabilir. Stanley formülü de bu amaçla kullanılır.
GÜVENİRLİK KATSAYISI-4 4- Kuder-Richardson 20-21 Formülü ile Hesaplama Yöntemi: Testteki her bir maddeye doğru cevap veren öğrenci yüzdesi hesaplanmışsa, bu yöntem kullanılabilir. Bu test ile elde edilen katsayıya İç Tutarlılık katsayısı denir. Bu yöntem; -Testteki her maddenin aynı değişkeni ölçtüğü sayıltısına dayanır (Homojen test) -Yalnızca doğru cevaplara puan verilmesi, yanlış /boş cevaplara puan verilmemesi durumunda kullanılır (KR-20) -Testteki her maddenin güçlük derecesi birbirinden önemli ölçüde farklı değilse, maddelerin güçlük dereceleri eşitse KR-21 kullanılır.
GÜVENİRLİK KATSAYISI-5 4- Kuder-Richardson 20-21 Formülü ile Hesaplama Yöntemi (devam) KR-20 ile hesaplanan güvenirlik katsayısı yüksek ise: a) Puanlar tesadüfi hatadan arınıktır, b) Ölçülen değişken tek boyutludur, c) Grup heterojendir (test grubu birbirinden iyi ayırmıştır), d) Test maddeleri homojendir, f) Testin yapı geçerliği yüksektir.
GÜVENİRLİK KATSAYISI-6 Alpha (α) güvenirlik katsayısı: Tek uygulama gerektiren güvenirlik bulma tekniğidir (KR-20’nin genişletilmiş şeklidir ve iç tutarlılıkla ilgilidir). Psikomotor becerileri ölçmek amacıyla geliştirilmiş testler ve tutum ölçeklerini puanlamada kullanılır. Güvenirlik katsayısı (– 1) ile (+1) arasında değişirse de, her zaman (0,00) ile (+1) arasında değişir. Rastgele hatalardan arındırıldığında bu katsayı üst sınıra (+1) yaklaşır. 0,90 olması istenir. Ancak eğitim ve psikolojide bu sınırda test geliştirmek imkansızdır.
TEST GÜVENİRLİĞİ-1 Güvenirliği Etkileyen Faktörler A- Testin Kendisiyle İlgili Faktörler 1-Testin uzunluğu: diğer etkenler kontrol edilmek şartıyla, soru sayısı artırılarak güvenirlik artırılabilir. 2-Test yönergesi ve testteki maddelerin ifadesi: testin aşında yönerge olmalı. Sorular açık-anlaşılır olmalı (Anlaşılmaz sorulara değişik zamanlarda değişik cevaplar verilir). 3- Test içeriğinin benzeşikliği: ölçülecek davranış veya konu bakımından homojen maddelerden oluşan test, heterojen bir testten daha güvenilirdir (100 maddelerin bir fizik testi, 100 maddelik bir fen bilgisi testinden daha güvenilirdir.
TEST GÜVENİRLİĞİ-2 Güvenirliği Etkileyen Faktörler A- Testin Kendisiyle İlgili Faktörler 3- Test içeriğinin benzeşikliği: Aşamalılık özelliği olan konuları ölçen test, homojen. Ayırt edici maddelerden oluşan bir test, heterojen. 4- Puanlamadaki nesnellik: Bir testin değişik kişilerce yada aynı kişi tarafından değişik zamanlardaki puanlanmasından elde edilen puanlar arasındaki tutarlılığa puanlama güvenirliği denir. Puanlama güvenirliği, puanlamanın nesnel olmasına ve puanlayıcının öznel kanısının puanlamaya etki etmesine bağlıdır. Objektif testler en yüksek puanlama güvenirliğine sahiptir.
TEST GÜVENİRLİĞİ-3 Güvenirliği Etkileyen Faktörler B- Uygulama Koşulları Ana Kural: uygulama koşullarının her öğrenci için aynı olmasıdır. Sınavdan önce kopya çekme önlemleri alınmalı Soruların basımı, çoğaltılması ve dağıtımı güvenli yapılmalı.
TEST GÜVENİRLİĞİ-4 Güvenirliği Etkileyen Faktörler C- Testi Alan ve Testin uygulandığı Grup ile İlgili Etkenler Öğrencinin ölçülen özelliği bakımından değişken olması. Eğitimde ölçülen özellik çoğu zaman kararlı değildir. Öğrencinin test puanının değişmesine neden olan bireysel etkenler: 1-Bireyin sürekli ve genel karakteristikleri: Hızlı okuyabilme, kendine güven/güvenmeme, heyecan. 2-Bireyin sürekli ve özel karakteristikleri: Öğrencinin testte yer alan metni daha önce okumuş olması.
TEST GÜVENİRLİĞİ-5 Güvenirliği Etkileyen Faktörler C- Testi Alan ve Testin uygulandığı Grup ile İlgili Etkenler 3-Bireyin geçici ve genel karakteristikleri: Sınav günü hasta, uykusuz, yorgun, sinirli olma, önceden alıştırma yapma, güdülenmiş olma, sınav yerindeki ışık, ısı, havalandırma durumu. 4-Bireyin geçici ve özel karakteristikleri: Doğru cevabı bilmeden işaretleme, güdülenme eksikliği
GEÇERLİK ile GÜVENİRLİK Sistemli, sabit, rastgele hatalar testin geçerliğini düşürür. Güvenirlik ise, sabit ve sistemli hatalardan etkilenemez, sadece rastgele hatalardan etkilenir. Çünkü, kararsızlık rastgele ve geçici hatalardan kaynaklanır. Bir testin geçerliği, onun güvenirliğini sınırlar. Bir testin geçerliği en çok √ güvenirlik olabilir
GÜVENİRLİK-1 Nasıl ölçülecek? Güvenilir bir ölçme aracı, aynı özellikle ilgili olarak arka arkaya yapılan ölçümlerde yaklaşık aynı sayısal sonucu verir. Güvenilir bir test, aynı gruba iki/üç kez uygulandığında, gruptaki her kişi bütün uygulamalarda yaklaşık olarak aynı puanı almalıdır. Güvenirlik, geçerliğin bir parçasıdır. Bir test, ölçmek istediği özelliği doğru olarak ölçmek için, söz konusu özelliği tutarlı olarak ölçmelidir. Kopya en çok güvenirliği etkiler.
GÜVENİRLİK-2 Pratikte bir nesne/özellik değişik zamanlarda ölçüldüğünde, ölçmelerin hepsinde aynı sonucu elde etmek hemen hemen imkansızdır. Çünkü çeşitli nedenlerden dolayı hatalardan arınık ölçme yapılamaz. Ölçme hatası: Elde edilen puan ile gerçek puan arasındaki fark. Gözlenen puan = gerçek puan + hata
GÜVENİRLİK-3 Hata kaynakları: -Ölçmeci -Araç -Yöntem -Ortam -Ölçülen özellik -Testin evreni örnekleme derecesi -Testi uygulama koşulları -Testi alan öğrencinin durumu (hastalık, güdü, yorgunluk vb.) sonucu bilmediği maddelerde tahmine gitmesi. Şans başarısı Kopya en çok güvenirliği etkiler.
GÜVENİRLİK-4 Hata Türleri: 1-Sabit Hata: Hata miktarının her bir ölçüm için değişmemesidir. Bu tür hata, standart kayma ve varyansı etkilemez. Ancak puanları olduğundan büyük /küçük gösterir. Örnek: Bir öğretmenin bütün öğrencilerin cevap kağıdına +10 puan vermesi. Kopya en çok güvenirliği etkiler.
GÜVENİRLİK-5 Hata Türleri: 2-Sistemli Hata: Bütün ölçümler için sabit olmayan hatadır. Örnek: Sadece kız öğrencilere +10 puan veren bir öğretmen sistemli hata yapmaktadır. Yazılı yoklamada yazısı güzel ve düzgün olan öğrenciye fazla puan verilmesi. Puanlama yanlılığı (Subjektiflik)
GÜVENİRLİK-6 Hata Türleri: 3-Rastgele-Tesadüfi Hata: Şans ile ortaya çıkan ve ne yönde etki ettiği bilinemeyen hatadır. Ölçme sonuçlarına gelişigüzel karışan hatadır. Örnek: Sınav günü öğrencinin hasta olması, sınav koşullarının elverişsizliği /bütün öğrenciler için eşit olmayışı, şans başarısı, öğretmenin yaptığı teknik hatalar.
ÖLÇMEDE TUTARLILIK-1 Ölçmede tutarlılığı sağlamanın iki yolu: 1-Birbirini izleyen ölçmelerde, bireyin grup içindeki pozisyonundaki tutarlılık. Grup içinde sırasının değişmezliği. Bu yaklaşımda aynı nesnelerle ilgili iki ölçüm takımı arasındaki korelasyon hesaplanır ve bulunan katsayı, güvenirlik katsayısı olarak isimlendirilir. 2-Bireysel ölçümlerde görülen ölçme hatasının büyüklüğüyle ilgilidir. Bir nesne tekrar tekrar ölçülecek olursa ele edilen ölçümler birbirinden farklı olacak ve onlar belli bir dağılım gösterecektir. Ölçümlerdeki değişme, standart kayma olarak isimlendirilir ve bu ölçümdeki hata payını gösterir. Bu durumda ona ölçmenin standart hatası denir.
GÜVENİRLİK KATSAYISI-1 Gerçek ölçümlerin bilinmemesi, dolaylı yoldan güvenirlik katsayısı hesaplamayı gündeme getirmiştir. Güvenirlik katsayısı hesaplama yolları 1- Test Tekrar Yöntemi: Aynı test formunu, aralıklı olarak iki ayrı zamanda aynı gruba uygulanması ve iki uygulamadan elde edilen puanlar arasındaki korelasyonun bulunması. Bu test ile elde edilen katsayıya İstikrarlılık / Kararlılık / Tutarlılık katsayısı denir. Temel sorun, zamandır (2-8 hafta). Bu durum zor olmakla birlikte eşleştirilmiş grupla aşılabilir. Maddelere verilen cevapların tutarlılığının önemli olduğu durumlara uygundur. Başarının yordanması için kullanılacak testlerin güvenirlik katsayısını hesaplamada kullanılır (İlgi ölçeği gibi).
GÜVENİRLİK KATSAYISI-2 2- Paralel Testler Yöntemi: İki eşdeğer testin yada bir testin iki eşdeğer formunun aynı gruba aynı zamanda /belli zaman aralığı ile uygulanması ve iki eşdeğer testten elde edilen puanlar arasındaki korelasyonun bulunması. Bu test ile elde edilen katsayıya Eşdeğerlik katsayısı denir. Bu yöntemle elde edilen güvenirlik katsayısı genellikle düşüktür. Pearson Çarpım Momentler katsayısı olarak da bilinen bu yolla elde edilen katsayı, yarı testin katsayısı olup, Spearman-Brown formülü ile tam testin güvenirlik katsayısına dönüştürülür.
GÜVENİRLİK KATSAYISI-3 3- Testi Yarılama Yöntemi: Bir testin iki eşdeğer yarıya bölünmesi ve öğrencilerin bu iki eşdeğer yarıdan aldıkları puanlar arasındaki korelasyonun bulunması. Bu test ile elde edilen katsayıya İç Tutarlılık katsayısı denir. En çok kullanılan yöntemdir. Çünkü tek test, tek öğrenci grubu ve tek form vardır. Bu yöntemle elde edilen güvenirlik katsayısı da yarı testin katsayısı olup, Spearman-Brown formülü ile bütün testin güvenirlik katsayısına dönüştürülür. Temel sorun, testi eşdeğer iki yarıya bölmektir. Testteki tek ve çift nolu soruları ayrı ayrı puanlamak bir yol olabilir. Stanley formülü de bu amaçla kullanılır.
GÜVENİRLİK KATSAYISI-4 4- Kuder-Richardson 20-21 Formülü ile Hesaplama Yöntemi: Testteki her bir maddeye doğru cevap veren öğrenci yüzdesi hesaplanmışsa, bu yöntem kullanılabilir. Bu test ile elde edilen katsayıya İç Tutarlılık katsayısı denir. Bu yöntem; -Testteki her maddenin aynı değişkeni ölçtüğü sayıltısına dayanır (Homojen test) -Yalnızca doğru cevaplara puan verilmesi, yanlış /boş cevaplara puan verilmemesi durumunda kullanılır (KR-20) -Testteki her maddenin güçlük derecesi birbirinden önemli ölçüde farklı değilse, maddelerin güçlük dereceleri eşitse KR-21 kullanılır.
GÜVENİRLİK KATSAYISI-5 4- Kuder-Richardson 20-21 Formülü ile Hesaplama Yöntemi (devam) KR-20 ile hesaplanan güvenirlik katsayısı yüksek ise: a) Puanlar tesadüfi hatadan arınıktır, b) Ölçülen değişken tek boyutludur, c) Grup heterojendir (test grubu birbirinden iyi ayırmıştır), d) Test maddeleri homojendir, f) Testin yapı geçerliği yüksektir.
GÜVENİRLİK KATSAYISI-6 Alpha (α) güvenirlik katsayısı: Tek uygulama gerektiren güvenirlik bulma tekniğidir (KR-20’nin genişletilmiş şeklidir ve iç tutarlılıkla ilgilidir). Psikomotor becerileri ölçmek amacıyla geliştirilmiş testler ve tutum ölçeklerini puanlamada kullanılır. Güvenirlik katsayısı (– 1) ile (+1) arasında değişirse de, her zaman (0,00) ile (+1) arasında değişir. Rastgele hatalardan arındırıldığında bu katsayı üst sınıra (+1) yaklaşır. 0,90 olması istenir. Ancak eğitim ve psikolojide bu sınırda test geliştirmek imkansızdır.
Testi yarılama yönteminde aşağıdaki formül kullanımı yaygındır
KR-20 / KR-21 & Cronbach Alfa Güv. Katsayısı KR20 & 21 testin iç tutarlılık katsayısıdır. Testin tüm soruları arasındaki uyumu incelenir. KR-20 testteki doğru cevaba 1, yanlış cevaba 0 verildiği durumlarda kullanılır. KR-21 testte madde analizi yapılmamışsa ve testteki maddelerin güçlük dereceleri önemli ölçüde birbirine yakınsa (homojen) kullanılır. * Ancak KR-20 ile yapılan ölçümler daha güvenilirdir. Cronbach Alfa: İç güv. katsayısıdır. Ancak 1-0 şeklinde puanlanmaz fakat tutuma yönelik ölçme araçları içindir.
Ölçme Standart Hata Ölçmede yapılan hataların standart değerini hesaplamak için, güvenirliğe ve test puanlarının standart sapmasına dayalı olarak ölçmenin standart hatasının hesaplanması gerekir Test puanlarına karışan hatanın yönü (negatif ya da pozitif) bilinmez. Bu nedenle bir bireyin testten aldığı gerçek puan bir aralık değeri olarak hesaplanır. Bu aralık değerinin hesaplanması için, ölçmenin standart hatası bireyin aldığı puana bir eklenip bir çıkarılır. Ancak bu işlemle de bireyin gerçek puanı % 68 olasılıkla belirlenen aralıkta olur. Normal olasılık dağılım eğrisine dayalı olarak bir standart hata ile yapılan kestirimlerin olasılıkları % 68, iki standart hata ile yapılan kestirimlerin olasılıkları % 95 ve üç standart hata ile yapılan kestirimlerin olasılıkları % 99 olur. Güvenilirliliğin yüksek, standart sapmanın düşük olması standart hatanın küçük olduğunu gösterir.
Testin Güvenilirlik Katsayısını İstenilen Düzeye Yükseltme Spearman-Brown formülü Örnek : Güvenirliği (0.60) olan bir testin güvenirliğini (0.90) çıkarmak için bu teste ne kadar soru eklenmelidir? Çözüm: = (1-egk)x ygk (1-ygk)xegk 6 (testin yeni soru sayısı başlangıçtakinin 6 katı olmalıdır.)
Geçerlilik Bir ölçme aracının geçerliği, o aracın kendi amacına (ölçmek istediği değişkeni ölçmesi) hizmet etmesi ile ilgilidir. Bu nedenle bir ölçme aracı amaçladığı işlevi yerine getirebildiği ölçüde geçerlidir. Bir ölçme aracının ölçmek istediği özelliği başka değişkenlere veya özelliklere karıştırmadan ölçmesine geçerlik denir. Güvenirliği artırmak için yapılacak her türlü çalışma geçerliği de artırır. Güvenirlik sınavda yapılan hatalarla ilgili iken geçerlik sınavın amacıyla ilgilidir. Geçerlik, ölçme sonucunda elde edilen puanların kullanılış amaçlarına göre kapsam, yordama, yapı, görünüş gibi çeşitli türlere ayrılmıştır. Güvenirlik katsayısı 0.00 ile +1.00 arasında değerler alırken geçerlik katsayısı ise – 1.00 ile +1.00 arasında değerler alır. Geçerlilik=güvenilirlilik karekökü
ÖSS (Yordayıcı) Akademik Başarı (Ölçüt) Kapsam Geçerliliği, ölçme aracının ölçülmek istenen konu, ünite yada davranışları kapsama derecesidir. Ölçüte Dayalı Yordama: Geleceğe yönelik tahmin amacı güden testin, bu tahminin düzeyde gerçekleştiğidir. ÖSS (Yordayıcı) Akademik Başarı (Ölçüt) Ölçüte Dayalı Uygunluk: yordamadan farkı ölçüt yordayıcıdan hemen önce elde edilmiştir Deneme Sınavı (Ölçüt) ÖSS (Yordayıcı) Yapı Geçerliği: ölçmeye dayanak olan kuramların geçerliği sorunudur. Örneğin bir iş yerinde iş doyumunu ölçmek isteriz. Buna yönelik iş doyumunu ölçen kuramlar oluştururuz. (“iş doyumlu insan üretken olur” “İş doyumlu insan daha uyumlu olur.”vb.) Bu kuramlar insanların iş doyumunu ifade edebiliyor mu? Bu sonuç bize yapı geçerliğini verir. Görünüş Geçerliği: Bazı hallerde bir testin görünüşte neyi ölçüyor olduğu önemli olur. Bir testin ya da bir maddenin ölçmek istediği değişkeni ölçebiliyor görünmesi, o testin ya da maddenin görünüş geçerliği olarak adlandırılır
Geçerliği Artırma Yolları Güvenirliği artırmak için yapılacak tüm çalışmalar geçerliği de artırır Her sorunun belirtke tablosuna dayalı olarak bir davranışı ölçmesi geçerliği artırır Sınavda; kopya çekme, ipuçlarından yaralanma, tahminle doğru yanıtlanama gibi geçerli olmayan davranışların ya da yolların kullanılması geçerliği düşürür Aynı soruların daha sonraki yıllarda tekrar tekrar sorulması, soruların öğrencilerin bildiği bir kaynaktan aynen alınıp kullanılması, sınavdan önce soruların verilmesi, kopya çekilmesi, sınav süresinin kısa oluşundan bazı soruların yanıtlanamaması, sınav süresinin gereğinden uzun olması durumunda kopya çekilmesine fırsat verilmesi gibi durumlarda geçerliği düşüren nedenler olarak sayılabilir. KULLANIŞLILIK Bir ölçme aracının ekonomik olması, uygulama süresinin kısalığı, ölçmeyi yapandan istenen becerinin az olması, hazırlanmasının ve uygulanmasının kolay olması, puanlanmasının pratik olması ve puanların yorumlanmasının kolay olması gibi etmenler kullanışlılık olarak ifade edilebilir. Bir ölçme aracının kullanışlı olması da aracın güvenirlik ve geçerliğini yükselten etmenlerden biridir.
Sınav Planı Hazırlama Test Amacının ve Kapsamının Belirlenmesi Ölçülecek Davranışların Belirlenmesi Belirtke Tablosu Hazırlama Soru sayısı belirleme Soru tipini belirleme Sınavın güçlük derecesini belirleme Sınav süresi belirleme Soruları yazma Puanlamanın nasıl olacağını belirleme Testleri Sınıflandırılması Öğretmen yapımı testler: standart testler objektiftir, ÖSS tarzı testler örnektir, geçerli ve güvenilirdir Hız ve güç testleri Objektif ve Subjektif testler Kağıt kalem testleri: Geçerlilik-güvenilirliği en düşük testlerdir (yazılıyoklama) Seçmeli Testler: Geçerlilik-güvenilirliği en yüksek testlerdir.
Öğrenci Özelliklerini Değerlendirmede: Psikometrik yaklaşım: Öğrencinin hangi özelliklere sahip olduğu ve sentez düzeyinde olan, sonu ağırlıklı objektif bir yaklaşımdır. İzlenimci yaklaşım: Öğrencinin hangi özelliklere sahip olduğunun iyi-kötü şeklinde betimlendiği, subjektif ve sadece sentez değerlendirme düzeyinde yarı-yapılandırılmış yaklaşımdır. Uzlaştırıcı: Klasik değerlendirmelere alternatif olarak üretilen, üst düzey zihinsel becerileri objektij olarak puanlayan portfolyo değerlendirmeyi baz alan en çağdaş yaklaşımdır.
Portfolyo (Bireysel Gelişim Dosyaları) İle Değerlendirme Portfolyo; öğrenciye ve başkalarına, öğrencinin bir ya da daha fazla alandaki başarılarını sunmak için, amaçlı olarak öğrenci çalışmalarının toplanmasıdır. Bu bağlamda, portfolyo öğrenci gelişimini takip edebilmek ve değerlendirmek için bireyin öğrenme sürecinin göstergesi olarak, öğrenci çalışma örneklerinin toplanması için kullanılır. Bireysel Gelişim Dosyaları (portfolyo); öğrencinin kendi çalışmalarının değerlendirilmesine katılmasını, her bir öğrencinin kendi ilerleyişini izlemesini ve bireysel olarak öğrencilerin performansının izlenmesini sağlar. Geleneksel testler öğrenciyi sınırlı bir açıdan ve belli bir zamanda değerlendirirken portfolyo, öğrencinin gerçekçi koşullar altında, öğrenmelerini bir süreç olarak değerlendirir. Portfolyo, öğrencilerimizin nasıl düşündüğünü, çalıştığını ve ne kadar öğrendiğini gösterebilmesi için ilk karalamalarından en son halini almış tüm çalışmaları kapsar. Veliler sene boyunca öğrencilerin dosyalarını inceleyebilirler.
Portfolyoların Genel Amaçları 1. Öğrencinin öğrenmelerini süreç içinde ve sağlıklı izlemek, 2. Öğrencide, öğrenme sorumluluğu alabilmeyi ve öz disiplini geliştirmek, 3. Değerlendirme becerisi kazandırmak, 4. Öğrenciyi gerçekçi koşullarda değerlendirmek, 5. Öğrencilerin yeteneklerini sergilemelerine ve ilgi alanlarını keşfetme ve çoğaltmak, 6. Öğrenme ve değerlendirmeyi birleştirmektir 7. Bir sınav kağıdındaki başarı yerine bir öğretim süreci içinde öğrenci gelişimini takip etmek, 8. Bir öğrenme süreci içinde öğrencinin, harcadığı zamanı, taslakları, eksikliklerini, düzeltmelerini, performansını ve çalışmalarını (yani tüm bir süreci) değerlendirmek, 9. Öğrencinin çalışmasının müsvedde, karalama, düzeltme gibi her aşamasının önemli ve birbiri ile ilişkili olduğunu fark etmelerini sağlamak, 10. Öğrencinin çalışmalarının en iyilerini seçip portfolyolarına koyarak, iftihar etmeleri ve çalışmaları için daha çok sorumluluk almalarını sağlamak, 11. Öğrencinin yaratıcılığını geliştirmek,
Puanlama Anahtarı (Rubric) Rubric, bir ölçme veya etkinliğin tamamının ya da bölümlerinin nasıl puanlanacağının ana hatlarıyla gösterilmesidir. Başka bir tanımıyla rubric; kabul edilebilir ya da edilemez performans sınırlarının öğretmen ve öğrenciler için açıkça belirtildiği kriter grubu ölçeğidir. Daha çok yazılı performansın ve portfolyonun puanlanılmasında kullanılır. Avantajları: Daha objektif ve tutarlı ölçmeye izin verir, Öğretmenler belirli zamanlarda kriterlerini açıklayabilirler, Öğrenci, çalışmasının nasıl değerlendirileceğini ve ne beklendiğini görür, Öğrenci kendi performansının değerlendirilmesinde kullanılacak kriterler hakkında bilgi sahibi olduğundan ilerlemesini sağlayabilir, Eğitimin etkisine ilişkin dönüt vermede yardımcı olur, Gelişmeyi ölçmek ve belgelendirmek için ölçütler sağlar, Öğrenme ve değerlendirme için ortak bir araçtır “Analitik” ve “Holistik” olmak üzere iki tür rubric bulunmaktadır. Analitik süreçle ilgilidir. Holistik ise süreçten çok sonuçla ilgilidir.
Rubric, farklı olarak her bir basamak için kriterlerin mükemmelden kötüye kadar derecelenmesi söz konusudur ve her derece için performans kriterlerinin ayrıntılı tanımlanması gerekir
Madde Analizi
Aritmetik ortalama ve Standart Sapma Hes. O maddeye doğru cevap verenlerin oranı il yanlış cevap verenlerin oranının çarpımıyla bulunur.
Madde Güçlük İndeksi ve Ayırt edicilik İndeksi Pj>0,50 Sorular kolay Pj=0,50 Sorular ideal Pj<0,50 Sorular zor yada Öğretim Yetersiz Değer testten direkt atılır 0 - 0,19 Zayıf .20 - .29 Geliştirilmeli .30 - .39 İyi .40 ve üzeri Mükemmel
Bağıl Değişkenlik Katsayısı (V): Hem aritmetik ortalamayı hem de standart sapmayı içeren ve daha çok bilgi, verici bir değişkenlik katsayısı bağıl değişkenlik katsayısıdır.
Kayışlılık (Çarpıklık) Çarpık dağılımlarda aritmetik ortalama, tepe değer (mod) ve ortanca (medyan) arasında çok çeşitli ilişkilerin gözlenmesinin nedeni, ortalamanın çok yüksek ya da çok düşük puanlardan etkilenerek bu puanlara doğru kaymasıdır. Bir tek modu bulunan düzgün bir dağılımda kayışlılığın yönü ve derecesi yaklaşık olarak;
Ortalama öğrenme düzeyi ve grup başarısı düzeyini gösteren Aritmetik ortalamadır. Aritmetik ort: eşitse Grup başarısı yada en başarılı grubu gösteren SS ‘dır. SS küçükse grup homojen, farklılaşma düşük ve öğrenme düzeyi birbirine yakındır.