410 likes | 751 Views
ÖLÇME: ARAÇ ve YÖNTEMLERİN NİTELİKLERİ Y. Doç. Dr. Serap EMİR İstanbul Üniversitesi Hasan Ali Yücel Eğitim Fakültesi emirserap@gmail.com. Ölçme Araç ve Yöntemlerin Nitelikleri.
E N D
ÖLÇME: ARAÇ ve YÖNTEMLERİN NİTELİKLERİ Y. Doç. Dr. Serap EMİR İstanbul Üniversitesi Hasan Ali Yücel Eğitim Fakültesi emirserap@gmail.com
Ölçme Araç ve Yöntemlerin Nitelikleri • Ölçme araçlarının nitelikleri ölçme hataları ile doğrudan ilgili olduğundan öncelikle hata ve hata türlerine incelenmelidir. • Okulda öğrenci başarılarının ölçülmesinde farklı ölçme araç ve yöntemleri belirli oranlarda kullanılmaktadır. Bu araçlarla yapılan ölçme uygulamalarında ne kadar dikkatli olunsa da, ölçme sonuçlarına bir miktar hata karışır. Bu hataların neler olduğu aşağıda gösterilmektedir.
Ölçmede Hata Hata: Ölçme sonuçlarına istenmeyen değişkenlerin karışmasıdır. Hataların bir kısmı kontrol dışında ölçme sonuçlarına karışabilir. Bu nedenle çok iyi sanılan ölçme araçlarıyla yapılan ölçmelerde bile bir miktar hata vardır.
Hata Kaynakları Bu hatalar, • ölçme araçları (terazi, cetvel, metre, test gibi), • ölçme yöntemi (yazılı, sözlü, kısa cevaplı...), • ölçme işlemini yapan kişi, • ölçmenin yapıldığı ortam, • bireyin kişisel özelliklerinden kaynaklanabilir.
Ölçme Hataları Ölçülen nesnenin gerçek değeri ile gözlem ya da ölçme sonucunda elde edilen değer arasındaki farka ‘Ölçme Hatası’ denir. Eğitimdeki ölçmelerin genellikle dolaylı olması, eğitimdeki ölçme sonuçlarında daha çok hata çıkmasına neden olabilmektedir.
Hata Türleri 1) Sabit hata, 2) Sistematik hata, 3) Tesadüfi hata.
1) Sabit hata Bir ölçmeden diğerine miktarı değişmeyen hatalardır. Ölçüm aracındaki bir hatanın tüm ölçümleri aynı şekilde etkilemesi… Örneğin, bütün öğrencilerin test puanlarına 5 puan eklemek, cetveldeki bir santimlik kısalık gibi.
2) Sistematik hata Ölçülen büyüklüğe, ölçmeciye ya da ölçme koşullarına bağlı olarak miktarı değişen hatalardır. Örneğin, yapılan sınavda çalışkan olduğu düşünülen öğrencilere öğretmenlerin fazladan puan vermesi ya da çalışkan olmadığı düşünülen öğrencilere düşük puan vermesi gibi.
3) Tesadüfi hata Yönü, miktarı ve kaynağı belli olmayan hatalardır. Sabit ve sistematik hataların miktarı ve yönü çeşitli yollarla belirlenebilmekte ve dolayısı ile ölçme sonuçları bu hatalardan arındırılabilmektedir. Ancak tesadüfi hatalar için aynı durum söz konusu değildir
Hata Kaynakları Ölçme sonuçlarına karışan hatalar genel olarak; • Ölçmeyi yapan kişilerden • Ölçmenin yapıldığı araçtan • Ölçme ortamından • Ölçmenin yapıldığı gruptan kaynaklanabilir.
Ölçmeyi Yapan Kişiden Kaynaklanan Hatalar • Ölçmeyi yapan kişinin ölçme yaparken; öznel puanlama eğilimi, dikkatsizliği, yorgunluğu vb. ölçme sonuçlarına hata karışmasına neden olabilir. • Puanlama aşamasında, puanlayıcının kendine ait yorumları puanlamaya etki edebilir. • Her puanlayıcı sınavları kendi bakış açısına ve anlayışına göre değerlendirecektir. • Eğitimde, özellikle yazılı yoklama ve ödevler puanlanırken; puanlayıcı kanıları, farklı bakış açıları hataya neden olabilir. • Puanlamanın nesnel olmaması, öznel kanılara dayalı olması hata kaynağıdır. • Bir testten elde edilen puanların, puanlayıcıya ve puanlama zamanına göre değişmemesi; • Puanlamadaki tesadüfi hataların azlığını yani, testin puanlama güvenirliğinin yüksekliğini gösterir.
Ölçmenin Yapıldığı Araçtan Kaynaklanan Hatalar • Ölçme aracının (testin) yapısından gelen hata kaynaklarından birisi testi oluşturan maddelerin örneklemidir. Ölçtükleri davranış ve kapsam bakımından homojen (benzeşik) maddelerden oluşan bir test, heterojen (farklı) maddelerden oluşan bir testten daha güvenilirdir. • Bu konuda hataya neden olan bir diğer faktör testte yer alan maddelerin kapsamı yeterince örnekleyememesidir. • Bir özelliği ölçmek üzere bir test geliştirilmişse, testin maddelerinin geliştirilmiş olduğu özelliğin kapsamına giren tüm konuları yeterince kapsaması, tüm davranışları iyi örneklemesi gereklidir • Testler yapılandırılırken maddelerin iyi ifade edilememesi, öğrencilerin soruları yanlış anlamasına ve hataya neden olacaktır. • Çoktan seçmeli ve doğru yanlış tipi objektif testlerde karşılaşılan ve şans başarısı olarak adlandırılan, yanıtlayıcının doğru yanıtı bilmediği halde tahmin yoluyla bulması yine bir hatadır.
Ölçmenin Yapıldığı Ortamdan Kaynaklanan Hatalar • Test uygulanırken ortaya çıkan testin yapıldığı ortamla ilgili bazı hata kaynaklan, testi alan bireylerin motivasyonunu ya da dikkatini etkileyebilir. Bu da ölçme sonuçlarına hata karışmasına neden olabilir. • Bu faktörlerin etkisiyle, birey alabileceği puanın altında veya üstünde puan alabilir. • Testin uygulanışı sırasında, sınavın uygulandığı dersliğin sıcaklığı, ışık, havalandırma, gürültü düzeyi, sınav düzeninin kopya çekmeye uygun olması gibi faktörler, ortamla ilgili hata kaynaklarına örnek olarak verilebilir • Teste ait uygulama koşulları, testi alan her öğrenci için aynı olmalıdır. Yani, testi alan tüm bireyler aynı koşul ve olanaklarda sınavı almalıdır.
Ölçmenin Yapıldığı Gruptan Kaynaklanan Hatalar • Ölçmenin yapıldığı gruba ait bireylerin, ölçme işlemi yapılırken içinde bulundukları motivasyon, heyecan, stres, uykusuzluk, dikkat dağınıklığı vb. gibi özel koşullar ya da ölçme işlemi yapılmadan önce geçirdikleri, kaza, şok, tartışma vb. gibi olumsuz yaşantılar, onların ölçülen özelliklerine ilişkin gerçek performanslarını ortaya koymalarını engelleyecektir. • Bu durumda bireylerden elde edilen puanlar olması gerekenden yani onların gerçek performansından farklı olacaktır. Bu da güvenirliği etkileyen bir hata kaynağıdır. • Bu sebeple, test verilmeden önce, testi alan bireylerin moral ve motivasyonu onları rahatlatıcı ve telkin edici sözlerle düzeltilmelidir.
Güvenirlik • Bir ölçme aracının güvenirliği, aracın, ölçmek istediği değişkeni ne derece duyarlıkla ölçtüğü, ya da ölçme sonuçlarının hatalardan arınıklık derecesidir. • Güvenirlik, tesadüfi hataların olası kaynaklarına göre çeşitli anlamlar almaktadır. Bunlar: duyarlılık, kararlılık ve tutarlılık anlamındaki güvenirlikler'dir.
Duyarlılık, Ölçme aracının birimi ile ilgilidir. Birimi küçük olan ölçme aracı ya da ölçme sonucu, birimi büyük olandan daha duyarlıdır. Örneğin gram bölmeli bir terazi ile yapılan ölçmeler ve elde edilen ölçme sonuçları, sadece kilogram bölmeli bir kantarla yapılan ölçmelerden ve elde edilen ölçme sonuçlarından daha duyarlı, dolayısıyla da daha güvenilirdir.
Kararlılık Ölçülen özelliğin aynı araçla değişik zamanlarda birden fazla ölçülmesi durumunda farklı değerler alıp almadığı ile ilgilidir. Eğer ölçme sonuçları bir ölçmeden diğerine değişiyorsa ölçme sonuçlarının kararlı olmadığı yani güvenilir olmadığı söylenebilir.
Tutarlılık Tutarlılık ise, testi oluşturan maddelerin testin bütünü ile olan tutarlılığı ile ilgilidir.
Güvenirlik Güvenirlik Katsayısıadı verilen bir katsayı ile ifade edilir ve korelasyona dayalı olarak hesaplanır. Korelasyon katsayısı -1 ile +1 arasında değişen değerler almakla birlikte güvenirlik katsayısı hemen her zaman sıfır (0) ile bir (+1) arasında değişen değerler almaktadır. Bir ölçme aracı ya da ölçme sonuçları bu katsayının +1'e yakınlığı oranında tesadüfi hatalardan arınık yani güvenilir olarak kabul edilir.
Güvenirlik Artırma Yolları 1)Güvenirliği artırmada en etkili yol, soru sayısını artırmaktır. Böylece birimin değeri küçülerek duyarlılık artar. 2)Öğrencilerin sınava güdülenmesi, 3)Ölçme aracını oluşturan soruların açık ve anlaşılır yazılması, 4)Soruların uygun büyüklükte puntoyla yazılması, 5)Soruların test formu içerisine düzgün yerleştirilmesi, 6)Baskı hatalarının olmaması, okunaklı olması vb.
Güvenirlik Artırma Yolları 7)Sınav süresinin yeterli verilmesi, 8)Sınav ortamının temiz, yeterli düzeyde ısı, aydınlık olması, 9)Gürültülü bir ortamda olmaması 10)Öğrencinin kaygı düzeyinin belli bir düzeyde olması. 11)Puanlamanın objektifliği
Güvenirlik Kestirme Yöntemleri 1) Test-tekrar test yöntemiyle güvenirlik 2) Paralel formlarla hesaplanan güvenirlik 3) Eşdeğer iki yarıyla hesaplanan güvenirlik 4)Testi oluşturan maddelerin birbiriyle uyumuna bakılarak güvenirliğin kestirilmesi
Test-Tekrar Test Yöntemi • Bu yöntemde, aynı ölçme aracı, değişik iki zamanda, aynı gruba uygulanarak bu iki uygulamadan elde edilen puanlar arasındaki korelasyon katsayısı bulunur. • Bu katsayının elde edilmesinde Pearson Çarpım Momentleri Korelasyon tekniğinden yararlanılır Elde edilen korelasyon katsayısı kararlılık anlamındaki güvenirlik katsayısı olarak kullanılır. • Bu yöntem daha çok ölçülen özelliğin uzun süreli değişim göstermediği durumlarda işe koşulmalıdır
Paralel Testler Yöntemi Paralel testler yöntemi, aynı özelliği ölçmeye yönelik olarak hazırlanmış olan iki paralel (eşdeğer) testin, aynı gruba aynı anda ya da ölçülen özellikte bir değişme olamayacak kadar kısa bir zaman aralığı ile uygulanması ve iki testten elde edilen puanlar arasındaki Pearson Çarpım Momentleri Korelasyon katsayısının hesaplanması esasına dayalıdır. Paralel testler yönteminde testlerin aynı gruba belirli bir zaman aralığı ile uygulanması durumunda elde edilen katsayı kararlılık anlamındaki güvenirliğe karşılık gelmektedir.
Testi Yarılama Yöntemi • Testi yarılama (eşdeğer iki yarı) yönteminde, bir gruba bir kez uygulanmış olan bir testin iki eşit yarıya bölünmesi ve öğrencilerin birinci ve ikinci yarıdan elde ettikleri puanlar arasındaki hesaplanması gerekmektedir. • Bu yolla hesaplanan katsayı testin bir yarısına ilişkin güvenirliği vermektedir. • Testin bütününe ilişkin güvenirliği bulmak için Spearman Brown düzeltme formülü kullanılır • Bu yöntemle elde edilen katsayı testin iç tutarlığının bir ölçüsü olarak yorumlanabilir.
İç Tutarlılık • İç tutarlılık anlamındaki güvenirliğin belirlenmesinde Kuder ve Richardson tarafından geliştirilmiş olan KR-20 ve KR-21 formüllerinden yararlanılabilir. • Bu formüllerle elde edilen güvenirlik katsayılarının yüksekliği bize test maddelerinin hem birbirleri ile hem de testin bütünü ile ne derece tutarlı olduğu hakkında bilgi verir.
Geçerlik • Geçerlik, bir ölçme aracının ölçmek istediği değişkeni ölçüp ölçmediği, ölçüyorsa onu başka değişkenlerden ne derece arınık olarak ölçtüğüdür . • Daha genel anlamda ölçme aracının amacını gerçekleştirebilme düzeyidir.
Geçerlik Türleri 1) Kapsam geçerliliği, 2) Yordama geçerliliği, 3) Yapı geçerliliği, 4) Uygunluk (benzer ölçekler) geçerliliği ve 5) Görünüş geçerliliği,
1) Kapsam Geçerliliği, • Sınav sorularının ölçmek istediği konu alanını kapsayıp kapsamadığı kapsam geçerliliğini gösterir. Soruların konu alanını yeterince kapsayıp kapsamadığı konu alanı uzmanlarının görüşü alınarak belirlenebilir.
2) Yordama Geçerliliği • Öğrencileri bir öğretim programına yerleştirmeden önce, seçme amacıyla yapılan sınavlardaki başarı ölçülerine bakarak, öğretim programındaki başarılarını kestirmek sınavın yordama geçerliliğini verir. Eğer sınavla seçilen öğrenciler, seçilmeyen öğrencilere göre daha başarılı olacaksa seçmede kullanılan aracın yordama geçerliliğinin olduğu söylenebilir.
Yapı Geçerliği • Yetenek, zeka, güvensizlik, içe dönüklük, dışa dönüklük vb. özellikler psikolojide yapı olarak adlandırılırlar. • Yapı, birbiri ile ilgili olduğu düşünülen belli öğelerin ya da öğeler arasındaki ilişkilerin oluşturduğu bir örüntüdür. • Bu türden özelliklerin ölçülmesinde kullanılacak araçların geliştirilmesi için önce söz konusu olan özellik yapı tanımlanır, daha sonra tanımlanmış yapıdan sınanabilir denenceler çıkarılarak bu denenceler üzerinde deneysel ve istatistiksel çalışmalar yapılır.
Geçerliği Düşüren Faktörler 1) Güvenirliği düşüren bütün etmenler geçerliği de düşürür. 2) Soruların dersin konularını yeterince kapsamaması 3) Soru sayısının azlığı, 4) Sınavın uygulama koşullarının olumsuzluğu 5) Sınav süresinin yetersizliği 6) Sınav stresi ve güdülenme yetersizliği 7) Puanlama hatası 8) Sınavın çok zor ve çok kolay olması 9) Ölçüt puanların güvenirliği
Kullanışlılık • Ölçme aracının ekonomik olması, uygulama süresinin kısalığı, ölçmeciden istediği beceriler, hazırlamasının ve uygulamasının kolaylığı, puanlamasının pratikliği gibi etkenler ölçme aracının kullanışlılığını gösterir. • Ölçme aracının kullanışlılığı, diğer iki özelliğini artırıcı yönde rol oynar.
Ölçme Aracının Kullanışlılığına İlişkin Kriterler • Ekonomiklik • Uygulanabilirlik • Puanlanabilirlik
Ekonomiklik • Ölçme aracının, zaman, para, emek açısından ekonomik olması demektir • Ölçme aracı, hazırlayan kişiye ve diğer okul personeline, çok fazla mali yük getirmemelidir. • Ekonomiklik; ne ucuz test ve yöntemleri gelişi güzel kullanmayla sağlanabilir, ne de pahalı araçları ya da yöntemleri tercih etmek doğrudur. • Ekonomiklik, ölçme aracının geçerlik ve güvenirlik gibi teknik özelliklerinin göz önünde tutularak, olabildiğince ucuza mal edilebilmesidir.
Uygulanabilirlik • Bir ölçme aracı ya da testin uygulanabilirlik özelliğine sahip olabilmesi için, • Ölçme aracının ya da testin, yönergesi (talimatları) ve testle ilgili açıklamalar, açık seçik ve öğrencilerin anlayabileceği biçimde olmalı, • Ölçme aracının ya da testin biçimsel özellikleri (formatı) uygun ve anlaşılır olmalı, • Eğer ölçme aracı ya da test çeşitli materyalleri veya parçaları içeriyorsa, bu parça veya materyaller kolayca ve anlamlı bir biçimde birleştirilebilir ve kullanılabilir olmalı, • Testi uygulayan kişi ya da kişiler gereksiz çaba sarf etmeden testi kullanabilmeli ya da uygulayabilmelidirler. • Teste, test materyallerine ve test durumlarına ilişkin açıklamalar, talimatlar vs. açık seçik, anlaşılır olmalıdır • Gerektiğinde, testin ya da (varsa) testin içindeki materyallerin kullanımına ilişkin örnekler açık seçik olmalıdır. • Testin, sayfa düzeni, yazı düzeni, satır aralıkları, yazı stili ve puntosu gibi genel biçimsel özelliklerine dikkat edilmeli, • Öğrencilerin test maddelerini kolayca algılayacağı biçimde düzenlenmelidir.
Puanlanabilirlik • Ölçme aracının puanlanabilirlik özelliğine sahip olabilmesi için, • Ölçme aracı ve/veya yanıt kağıdı (formu) öğrenci yanıtlarını uygun biçimde almak için, öğrencinin kolayca anlayabileceği ve algılayabileceği biçimde düzenlenmeli, • Yanıt anahtarı dikkatli, özenle ve doğru hazırlanmalı, kullanımı kolay, anlaşılır ve pratik olmalı, güvenilir bir puanlamaya olanak sağlamalı, • Puanlayıcı, ölçme aracına ilişkin puanları kolay, doğru ve hızlı elde edebilmelidir.