EĞİTİMDE ÖLÇME VE DEĞERLENDİRMENİN ÖNEMİ
Ölçme, günlük yaşantımızda ve bilimsel çalışmalarda önemli bir yer tutar. Ölçmenin bilimdeki önemi, bir deneysel yöntemin kurulmasına temel oluşturan güvenilir ve geçerli ölçme sonuçlarının elde edilmesinde yatar. Sosyal bilimlerde yapılan bilimsel araştırmalardaki değişkenlerin doğasından ve karmaşıklığından sosyal bilimlerde doğru ölçmelerin yapılması ve yorumlanması çok daha güç olmakla birlikte bir o kadar da önemlidir.
Yapılan ölçme tanımlamalarından anlaşılacağı gibi ölçme, bir betimleme işidir. Betimleme sürecine konu olan şey ise bir nesnenin ya da bireylerin belli bir özelliğidir. Gözlemlenen bu özellikler, ölçme işleminde sayı ya da sembollerle ifade edilmektedir. Ölçmeye konu olan özellik/özellikler, doğrudan ya da dolaylı olarak gözlemlenebildiğinden (ölçülebildiğinden) doğrudan ya da dolaylı ölçme kavramlarını ve pek tabi yöntemlerini ortaya çıkarmıştır. Sosyal bilimlerde araştırmaya konu olan zeka, başarı gibi insana ait özellikler dolaylı ölçme yöntemleriyle ölçülmektedir.
Değerlendirme, �ölçme sonuçlarını bir ölçüte vurarak, ölçülen nitelik hakkında bir değer yargısına varma süreci� olarak tanımlanmaktadır (Turgut,1992:3). Değerlendirme, ölçümlerden bir anlam çıkarmak ve ölçülen nesneler hakkında bir değer yargısına ulaşmaktır. Elde edilen ölçümlerden bir anlam çıkarmak için söz konusu ölçümlerin bir ölçüt ile karşılaştırılması gerekir. Açıkça ifade edilmemiş olsa bile, her değer yargısı, kesinlikle, bir ölçme sonucu ile karşılaştırılmasına dayanır (Tekin,2000:39). Ölçme bir betimleme işi iken değerlendirme bir yargılama, karar verme işidir. Tanımlardan da anlaşılacağı gibi değerlendirme süreci ölçme sonuçları, ölçüt ve karar olmak üzere üç öğeden oluşmaktadır.
Niçin değerlendirme yapıyoruz? (Baykul,2001:5)
a) Öğretim programının değerlendirilmesi için b) Öğretimin etkinliğinin değerlendirilmesi için c) Öğrenme eksikliklerinin saptanması için d) Öğrencilerin ilgi ve yeteneklerinin saptanması için e) Öğrenci başarısının değerlendirilmesi için değerlendirme yapıyoruz.
Yapılan değerlendirmeler bilgi verici olmasının yanı sıra yapılan doğru ölçmeler ve değerlendirmeler sistemin beslenmesinin ve devamlılığını sağlamaktadırlar.
Eğitimde değerlendirme türleri çok çeşitli olup değerlendirme sınıflamaları amaca göre çeşitlilik göstermektedir. Programa girişte, süreçte ve çıkışta yapılan değerlendirme ölçütlerine göre,
1- Tanıma-yerleştirmeye dönük değerlendirme: Programa girişte yapılan bu değerlendirme programa başlamadan önce ön koşul niteliğindeki bilişsel davranış, duyuşsal özelik ve devinişsel becerilerini tanılamak için yapılır (Demirel,1997:160). Hazır bulunuşluk testleri, yabancı dil sınav kurları, LGS, ÖSS testleri bu amaca dönük değerlendirmeye örnek gösterilebilir.
2- Biçimlendirme-yetiştirmeye dönük değerlendirme: Program sürecinde yapılan değerlendirmedir. Bu süreç içinde öğrencilerin öğrenme güçlüklerini ortaya çıkarmak ve gerekli düzeltmeleri yapmak için yapılan değerlendirmelerdir. (Demirel,1997:160). Bu amaçla yapılan testlere de formaif testler ya da izleme testleri adı verilir. Ünite sonlarındaki ünite testleri, konu tarama testleri bu değerlendirmeye dönük hazırlanmış testlerdir.
İzleme Testleri, Bilişsel nitelikteki davranışsal özelliklerle ilgili öğrenme eksiklikleri ile bu öğrenme eksikliklerine yol açan güçlüklerin belirlenmesinde kullanılır.. Bu testlerin kullanılmasındaki amaç, öğrenmeyi hızlandırarak öğretimin etkililiğini, öğrenmedeki verimliliği artırmaktır. Öğretimin �en küçük anlamlı birimleri� olan ünitelerin (konuların) bitiminde uygulanır. Bunun başlıca nedeni öğrenme eksikliklerini, ön koşulları oldukları öteki öğrenmeleri engellemeden giderme arzusudur (Özçelik,1982:75). Bu bakımdan öğrenme öğretme sürecinin bir parçası olan izleme testlerinin sonuçlarına dayalı olarak not verme veya başka amaçlarla öğrenci başarısını değerlendirme yoluna gidilmemesi gerekir.
3- Düzey belirlemeye dönük değerlendirme: Program çıkışında yapılan değerlendirmedir. Programın sonunda öğrencilerin kazanılmış bilişsel davranış, duyuşsal özelik ve devinişsel becerilerini ölçmeye yarayan değerlendirme türüdür (Demirel,1997:160). Dönem ya da yıl sonunda yapılan final veya genel sınavlar bu değerlendirme türüne örnektir. Bu tür yapılan değerlendirmeler erişiyi saptamak amaçlıdır. Bu değerlendirmeler başarı testleri ya da yeterlilik testleri ile yapılmaktadır.
Düzey Belirleme Testleri: Eğitimin hedefleri olarak belirlenen davranışsal özellikleri (hedeflerin kendilerini) kapsayan ve onları eğitim programında belirlenmiş olan yetkinlik ve kararlılık dereceleriyle yoklayan testlerdir. Hedef alınan davranışsal özelliklerin yeterli bir örneklemi ile örneklenen özelliklerin belirleyicisi olan kritik davranışlardan başlıcalarının ölçme aracında kapsanması yeterli olabilir. Duruma göre bir ders ya da kursun sonunda, ortasında ve sonunda ya da çeyreklerinde ve sonunda kullanılabilir. Düzey belirleme testleri, verildikleri zamanın yanı sıra öğrenilmiş olan ünitelerin tümünü kapsama bakımından da izleme testlerinden daha geniş kapsamlı olma durumundadırlar Değerlendirme kapsam açısından daha geniş bir kavramdır. Ölçmenin temel özelliği, sonuçların �sayısal� olarak ifade edilmesi iken değerlendirme, ölçme sonuçlarının belirli ölçütlere göre yorumlanarak yargılara varma sürecidir.ÖLÇMEDE
GEÇERLİK VE GÜVENİRLİK
GEÇERLİLİK Geçerlik, bir ölçme aracının ölçmeyi amaçladığı özelliği, başka herhangi bir özellikle karıştırmadan, doğru olarak ölçebilme derecesidir. Başka bir deyimle bir ölçme aracının, geliştirilmiş bulunduğu konuda maksada hizmet etmesidir . Sözgelimi, uzunluk ölçmek için geliştirilmiş bir araç olan metre, kişilerin boylarını ölçme maksadına hizmet eder; fakat kişilerin ağırlıklarını ölçme maksadına hizmet etmez. Bu demektir ki, bir ölçme aracı olarak metre uzunluk ölçmede geçerlidir; fakat ağırlık ölçmede geçerli değildir. Aslında bir aracın sadece kullanıldığı maksat için geçerliğe sahip olması söz konusudur. Bu durum, şöyle bir örnekle somutlaştırılabilir: Bir okuduğunu anlama testi, okuduğunu anlama yeteneğini ölçmede yüksek bir geçerliğe sahip olabilir, fakat aynı test, çok büyük bir olasılıkla, matematikte problem çözme yeteneğini ölçmede geçerliğe sahip değildir.
Bir testin geçerliği, çoğun, o testten elde edilen puanlarla belli bir ölçüt yada ölçütler takımı arasındaki ilişki bakımından belirlenir. Geçerliğin, istatistiksel olarak belirlenmesidir bu. Bu işlemde ölçüt ya da ölçütler takımı olarak neyin alınmış olduğu ya da alınması gerektiği, testin kullanış maksadına bağlıdır. Test puanlarıyla ölçüt ya da ölçütler takımı arasındaki ilişki katsayısına geçerlik katsayısı adı verilir. Geçerlik katsayısı, (-1,00) ile (+1,00) arasında değişir.
GÜVENİRLİK
Bir ölçme aracı neyi ölçüyorsa ya da neyi ölçmek için hazırlanmışsa onu, kararlı bir şekilde ölçmelidir. Buna ölçme aracının güvenirliği denir. Güvenirlik bir anlamda yapılan ölçmelerin hatalardan arınıklık derecesidir.
Bir testin güvenirliği arttırıldığı oranda geçerlik katsayısı da artış gösterir, ancak bu artış güvenirlik katsayısı kadar olmaz. Hata kaynakları kontrol edildiği oranda güvenilirlik artış gösterir Bu durum geçerlidir...ÖLÇMEDE HATA
Hata: ölçülen değerle gerçek değer arasındaki farka denir.
Hatanın gelebileceği kaynaklar şunlardır; 1- Ölçenden (ölçen kişiden kaynaklanan hatalar): Ölçen kişinin fiziksel yetersizliği, yaşı, öğrenim durumu gibi kişisel özellikleri hataya sebep olabilir. Ölçme yaptığı esnadaki fiziksel ve psikolojik durumu, yorgunluk, uykusuzluk, gerginlik gibi durumlar hataya sebep olabilir.
2- Ölçülenden (ölçülen özellikten gelen hatalar): Şartların ölçülen özelliğe etkisi de hataya sebep olabilir. Ayrıca ölçülen özellik hakkında ye-terli bilgi sahibi değilsek yine hatalar ortaya çıkar. Örneğin, elektrik telleri kışın gerginleşir yazın ise kendini salıverir. Eğer bu özelliği bilmiyor isek doğru ölçüm yapmamız mümkün olmaz.
3- Ölçü aracından kaynaklanan hatalar: Ölçü aracının ayarsız, bozuk olması vb. hatalardır. Eğitimde ölçme aracının basımından doğacak hatalarda bu tür hatalardandır. Hatanın bunlardan hangisinden geldiğini bilebilirsek belki hatayı giderebiliriz. Ancak, çoğu zaman bunu bilemeyeceğimiz gibi pozitif yönlü mü? Negatif yönlü mü? Olduğunu da bilemeyiz. O zaman yapılabilecek en iyi şey hatayı küçültmeye çalışmaktır. Hatayı küçültmenin en iyi yolu da birimi küçük ölçü aracı kullanmaktır.
II. 3. Üç çeşit hata vardır;
II. 3. a)Sabit hatalar: Her bir ölçme için miktarı değişmeyen hatalara sabit hatalar denir. Bir bakkal terazisinin her tarttığı nesneyi 50 gram eksik göstermesi, bir öğretmenin her okuduğu sı-nav kâğıdına 5 puan fazla vermesi bir sabit hatadır. Bu tür hatalar ortalamayı yüksek veya düşük gösterebilir ancak, dağılım ölçülerini değiştirici bir etkisi yoktur.
II. 3. b)Sistemli hatalar: Puanlayıcı yanlışlıklarını yansıtan tüm hatalar sistemli hata türü-dür. Bir öğretmen kızlara ait sınav kâğıtlarına 5 puan fazla veriyor erkeklere vermiyorsa, yazısı güzel olanlara 10 puan fazla verip diğerlerine vermiyorsa, bu tür hatalar sistemlidir. Bu tür hatalar bütün ölçümler için sabit değildir.
II. 3. c)Rastgele (tesadüfi) hatalar: Şansla ortaya çıkan ve ne yönde etki ettiği belli olma-yan hatalardır. Çoğu kez bilinmeyen nedenlere bağlıdır. Aynı özellikle ilgili çok sayıda ölçme ya-pılacak olursa tesadüfî hataların ortalaması sıfıra yaklaşır. Öğretmenlerin yazılı sınav kâğıtlarını dikkatsizce okuması rastgele hatalara yol açar. Bir ölçme işleminde bu hataların biri, ikisi veya her üçü de birlikte olabilir. Yapılacak değer-lendirmelerin isabetli olabilmesi için ölçmelerin bir dereceye kadar bu hatalardan arındırılması gerekir. Özellikle rastlantısal hatalar ölçme aracının güvenirliğini etkilemektedir.
|