Ölçme ve Değerlendirme
ÖLÇME KAVRAMI
Ölçme Nedir?
Ölçme görünüşte basit olmasına rağmen, göründüğü kadar basit olmayıp oldukça karmaşık bir işlemdir.
Ölçme yapabilmek için sırasıyla şu soruları sorup cevap aramak gerekmektedir:
» Neyi ölçeceğiz?
» Nesini ölçeceğiz?
» Ne ile Ölçeceğiz?
» Kim ölçecek?
» Ne kadar?
Öyleyse bir ölçme işleminde şu üç öğenin mutlaka bulunması gerekmektedir:
1- Ölçülecek bir varlık (Varlığı bir veya birkaç niteliği yönünden ölçebiliriz.)
2- Ölçeceğimiz varlığı veya niteliği doğru olarak ölçebilen bir aracın olması,
3- Sonucun sayı ile anlatımı.
Bu üç öğenin dışında, ölçme işlemini gerçekleştirecek bir kişinin olacağı ve bu kişinin ölçme konusu ile ilgili bilgi ve beceriye sahip olması gerektiği de unutulmamalıdır.
Bir fikir vermesi bakımından bazı ölçme tanımları aşağıda verilmiştir.
Ölçme, bir ya da çok kişiye ilişkin bir değişken niteliğin, niceliğini ya da derecesini saptama ve sayısal
olarak belirtme işidir. (Dr. A. Ferhan Oğuzkan-Eğitim Terimleri Sözlüğü)
Ölçme, öğrencilerin belli bir alan ya da konudaki, gelişme ve başarılarını, uygun araçlar ve yöntemler uygulayarak sayısal sonuçlarla belirtme işidir. (Dr. A. Ferhan Oğuzkan-Eğitim Terimleri Sözlüğü)
Ölçme, gözlem sonuçlarının sayı ile ifade edilmesi demektir. (M. Fuat Turgut - Başarının Değerlendirilmesi (Broşür))
Ölçme, objelere, bireylere belirli bir özelliğe sahip oluş dereceleri*ni belirtmek için, belirli kurallara uyarak sembolik değerler verme işlemidir. (Dr. Saim Kaptan - Bilimsel Araştırma Teknikleri)
Ölçme, bir birimi kullanarak, bir varlığın bu birime göre farkını bulmadır. (Öğretmenlik Meslek Dersleri Sözlüğü)
Ölçme, en, boy, hacim, süre gibi nicelikleri, kendi cinsinden seçilmiş bir birimle karşılaştırıp, kaç birim geldiklerini belirtmektir. (Türkçe Sözlük)
Sonuç olarak ölçmeyi, «Bir varlığı veya varlıklara ait özellikleri, uygun araçlar kullanarak, bir birim cinsinden sayı ile ifade etmektir» şeklinde tanımlayabiliriz.
BİLİNMESİ GEREKEN ÖLÇME
Eğitimcilerin, özellikle öğretmenlerin, ölçme ve test tekniği konusunda bilmeleri gerekli görülen noktaların başlıcaları aşağıda sıralanmıştır.
1. Okutulan derslerdeki başarı ya da gelişmeleri ölçme amacı güden testler (bu arada özellikle standart testler) hakkında bilgi sahibi olmak: bu testleri hazırlama, uygulama, puanlama ve sonuçları doğru yorumlama ve kaydetme tekniklerini bilmek.
2. Test sonuçlarını çözümleme ve yorumlama için gerekli basit istatistiksel işlemlerle normların çeşit ve kullanılışını bilmek.
3. Ham puanları standart puanlara çevirebilmek.
4. Testlerin geçerlik ve güvenirlik katsayılarını yorumlayabilmek, bunların testin içeriği, madde sayısı, öğrenci grubunun özellikleri ve bunları etkileyen durumsal koşullarıyla olan ilişkileri bilmek.
5. Ölçme hatası kavramını bilmek, verilen herhangi bir puanı bu anlayışın ışığında yorumlayabilmek.
6. Çeşitli kollardaki eğitim-öğretim etkinlikleri çerçevesinde öğrencilerin tek tek ya da tüm sınıfın durumunu profille göstermek, değişme ve gelişmeleri profilden izlemek.
7. Bir test programının yapı, amaç ve özelliklerini bilmek, program gereğince kullanılan testleri amaca uygunluğu, uygulamaya elverişliliği yönlerinden eleştirebilmek, test programını daha yeterli ve etkin bir niteliğe kavuşturmak için gerekli önerilerde bulunabilmek ve bu yoldaki çalışmalara katılabilmek.
8. Sınav veya test sonuçlarının ve genellikle öğrencilerin tek tek veya grup olarak gösterdikleri gelişimleri anne-babalara, ilgililere ve gerektiğinde kamuya anlatabilmek.
9. Genel ve özel yetenek testleri ile başarı testlerinin kullanılış yer ve amaçlarını ayırt edebilmek, aralarındaki fark ve ilişkileri görebilmek.
10. Ölçme ve değerlendirmeyi bir eğitim süreci olarak kullanabilmek, sonuçları sınıflarda tartışarak öğrencilerin kendi kendilerini değerlendirme güçlerini geliştirmeyi sağlamak.
11. Ölçme ve değerlendirme etkinliğinin çok yanlı olduğunu bilmek; özellikle eğitim ve öğretimi çocukların öğrenme yeteneklerine ilgi ve kişisel eğilimlerine uygun düşecek yönde düzenlemek için ölçme ve değerlendirme sonuçlarından yararlanmak.
Ölçmenin Öğeleri
Varlık: Ölçme yönünden önemli olan varlığın canlı-cansız oluşu değil, somut-soyut oluşudur.
Ölçme aracı: Ölçme işlemlerinde kullanılan araçları, 1) standart. 2) standart olmayanlar, şeklinde iki gruba ayırabiliriz.
Sayısal sonuç: Ölçme aracı ile elde edilen sonuç birbiriyle yakından ilgilidir. Standart bir araç kullanarak yapılan ölçmede elde edilen sayısal sonuç kesinlik arzeder. Ölçmede kullanılan araç standart değilse, elde edilen sonuç kesin bir anlam taşımaz. Ölçülecek varlık veya özellik somut, ölçme aracı da standart ise sonuç kesin olacaktır.
Başlıca Ölçme Çeşitleri
Varlıkların veya ölçmek istediğimiz niteliklerin ölçülmesi, dolaylı (endirekt) ve dolaysız (direkt) olmak üzere iki şekilde olur. Ölçmede kullanılan ölçek ya da birime göre, elde edilen sonuç mutlak (kesin) veya bağıl (izafî) olabilir. Bu yönden de ölçme, mutlak ve bağıl olmak üzere ikiye ayrılmaktadır. Böylece ölçmeyi, yapılış şekline göre dolaylı ve dolaysız, kullanılan birim ve elde edilen sonuca göre de, mutlak ve bağıl olarak çeşitleyebiliyoruz.
Dolaylı ve dolaysız ölçme: Çoğunlukla, ölçülecek varlık ya da özellik, kullanılan araçla doğrudan ölçülebildiği halde, bazı hallerde varlığın kendisini doğrudan ölçmek mümkün olmamaktadır.
Mutlak ve bağıl ölçme : Bir uzunluk veya ağırlık söylendiği zaman herkes tarafından anlaşılan ve şüphe uyandırmayan bir kesinlik vardır. Bu şekil ölçmelere mutlak ölçme denir.
1- Mutlak ölçmede başlangıç noktası sıfırdır. Bağıl ölçmelerde, sıfır yokluğu göstermez.
2- Mutlak ölçme, her yerde ve herkes tarafından aynı anlamı taşır. Bağıl ölçmenin herkesçe kabul edilen kesin bir anlamı yoktur.
Ölçmede Hassaslık ve Hata Kavramı
Bir ölçme işleminde hatayı en az seviyeye indirebiliriz. Fakat, aracımız çok hassas bile olsa, tamamen hatasız bir ölçmeyi kolay kolay yapamayız.
Her ölçmede mutlaka hata payı vardır. Bu hata ölçme yönteminden, ölçmeyi yapan bireyden, ölçme yapılan ortamdan vb. olabilir.
Eğitimdeki ölçmelerde hatadan sakınmak için, hata kaynakları ve bu kaynakların ölçme sonuçlarını nasıl etkilediği bilinmelidir.
1- Ölçmeyi yapan kişiden gelen hatalar; Bireylerin, ölçme konusu ile ilgili bilgi ve becerilerinin noksan ve farklı oluşundan dolayı, herkes aynı derecede hassas bir ölçme yapamaz.
2- Ölçme aracından gelen hatalar; Bir araç ne kadar iyi yapılırsa yapılsın, zamanla hassaslığı bozulabilir.
3- Ölçen kişinin ve ölçme aracının çevre ile etkileşiminden doğan hatalar; Özellikle insanla ilgili ölçme çalışmalarında bu durum daha çok etkili olur. Ölçen kişi ile, ölçülen kişinin etkileşmesi, ölçme sonucunu olumlu ve olumsuz şekilde etkileyebilir.
4- Kaynağı belli olmayan hatalar; Kaynağı iyi bilinmeyen, ölçmeciye veya ölçme aracına bağlı olan ve ölçme sonuçlarına gelişigüzel yansıyan hatalara tesadüfi hatalar denir.
Bir aracın ölçülmek isteneni doğru olarak ölçmesi, bu aracın geçerli olduğunu gösterir. Her uygulanışta aynı sonucu vermesi de onun güvenilir olduğuna işarettir. İnsanın ruhsal yönü ile ilgili nitelikleri, birbirinden tam olarak ayırmak mümkün olmadığı gibi, bu niteliklerin birbirlerini etkilemesi ölçme işlemini daha da zorlaştırır. Bunun için de, eğitim ve öğretimde kullanılan ölçme araçlarının geçerliliği ve güvenilirliği tam değildir.
Değişkenler
Ölçülecek olan durum ve niteliklere genellikle obje denmektedir. Varlık ve olaylar arasında değişiklik gösteren objelere de değişken denir. Boy, ağırlık, renk, sıcaklık, basınç, zekâ hepsi birer değişkendir. Değişkenlerin bir kısmını sayılarla gösterebildiğimiz halde (boy, ağırlık, sıcaklık, yaş gibi), bazılarını ancak özellik olarak belirleyebiliyoruz. Bu nedenle değişkenler ikiye ayrılırlar.
1. Nicel değişkenler
2. Nitel değişkenler
Nicel değişkenler sayılarla gösterilebilen değişkenlerdir. Nitel değişkenler ise, kalite ve çeşit yönünden ifade edilebilirler. Cinsiyet, renk, din, ilgi, davranış gibi. Bunlar sıfatlarla gösterilirler. Bu bakımdan nitel değişkenler, ölçmeden çok gruplama, sıralama ve derecelemeye uygun düşerler. Nicel değişkenler, her çeşit ölçme araçları ile ölçülerek sayısal olarak belirlenirler. Nitel değişkenleri bu şekilde ölçme olanağı yoktur. Ancak, aynı özelliklere sahip olanlar gruplanır, grupların frekansı bulunarak sonuç sayı ile gösterilebilir. Bu da ölçme değil bir sayma olur.
Ölçek Çeşitleri
Ölçekler; değişkenlerin sayısal olarak gösterilmelerini sağlayan şekil ve yöntemlerdir. Ölçeklerin başlıcaları, en yetersizinden, en yeterli olana doğru şöylece sıralanmaktadır;
1-Sınıflandırma ölçekleri: Bu ölçeklere aynı zamanda gruplama ölçekleri de denmektedir. Benzer özelliklerden yararlanmak ve aynı özellikleri taşıyanları bir grupta toplamaktır. Nitel değişkenlerdir. Ölçmeye ve bir birim cinsinden sayı ile gösterilmeye uygun düşmediklerinden gruplamaya tabi tutulurlar. Gruplarda bulunan elemanları sayarak, frekans dağılımını ve modunu bulmak mümkündür. Daha ileri istatistik işlemleri uygulama olanağı yoktur.
2-Sıraya Dizme Ölçekleri: Sıralama genellikle, gruplamadan sonra yapılan bir işlemdir. Objeleri, herhangi bir özelliğe sahip olma derecelerine göre sıraya koymaktır. Benzer özellikler bakımından, en üstün olandan en geri olana doğru 1 inci, 2 inci, 3 üncü, 4 üncü seklinde sıralamaktır. Sıraya konulduktan sonra ortak özellik önemini kaybeder. Önemli kimin kimden daha çok, daha az veya küçük-büyük oluşudur.
3-Aralıklı ölçekler (Eşit aralık Ölçeği) : Bu çeşit ölçeklerde bir başlangıç noktası vardır. Başlangıç noktasından itibaren, ölçek eşit aralıklara bölünmüştür. Ancak başlangıç noktası kesin değildir, mutlak yokluğu göstermez, izafi olarak kabul edilmiş bir noktadır. Bu bakımdan birimler birbirinin iki katı veya yarısı değildir. Biri diğerinden şu kadar fazla ya da eksiktir.
Aralık ölçekleri, objeler arasındaki farkın miktarını göstermektedir. Onun için toplama, çıkarma gibi hesaplama işlemleri yapılabilir. Her tür istatistik işlemi uygulanabilir. Termometreler, puanlar aralık ölçeklerine örnektir.
4-Oran Ölçekleri: Ölçeklerin en üstünü bu ölçeklerdir. Bu tip öl*çeklerin aralıklı ölçeklerden tek farkı mutlak yokluğu gösteren bir başlangıç noktasının bulunmasıdır. Başlangıç izafi olarak kabul edilmiş bir nokta değil, mutlak yokluğu gösteren bir sıfır noktasıdır. Başlangıcının kesin yokluğu göstermesi ve aralıklarının eşit olması, bu ölçeklerle elde edilen sonuçlara her çeşit hesaplamanın uygulanabilmesini sağlar.
Oran ölçeklerinin kullanıldığı ölçmeler kesindir. Nicelik cinsinden değişkenler bu çeşit ölçeklerle ölçülür. Oran ölçekleriyle elde edilen verilere her tür istatistik işlemler uygulanabilir.
Fiziksel ve Sosyal Bilimlerde Ölçme
1. Fiziksel bilimlerin ölçme konusu somuttur, maddenin nicel yönü ile ilgilenir. Sosyal bilimlerin konusu ise daha çok soyuttur. Somutun kesin olarak ölçülmesi mümkün olduğu halde, soyutun ölçülmesi çok zordur. Soyutun ölçülmesinin zorluğu yanında elde edilen sonuçlar da kesin değildir. Bu nedenle, fiziksel bilimlerde ölçme, sosyal bilimlere oranla daha kolay ve kesindir.
2. Somut varlıkları ölçmek üzere standart ve hassas ölçme araçları geliştirilmiştir. Fiziksel bilimler ölçek olarak en üstün seviyedeki bu ölçekten yararlanırlar. Sosyal bilimlerde kullanılan ölçeklerin, en üstün seviyede olanı aralıklı ölçeklerdir. Böylece, sosyal bilimlerdeki ölçme araçlarının yetersizliği, yapılan ölçmenin de yetersiz kalmasına neden olmaktadır.
DEĞERLENDİRME KAVRAMI
Değerlendirme Nedir?
Ölçmeyi belli bir amaçla yaparız. Sonra da elde ettiğimiz sonucun amacımıza uygun olup olmadığını araştırırız. Ölçme sonucunu amacımıza göre yorumlamak, az, çok, yeterli, iyi, kötü şeklinde bazı değer hükümlerine ulaşmak bir değerlendirmedir. Böylece değerlendirme, ölçmeden sonra gelen ve onu takip eden bir işlemdir.
Değerlendirme, her ne kadar ölçmeyi takip eden bir işlemse de, ölçme sonucunu kendi başına değerlendirme olanağı yoktur. Ölçme sonucunun değer kazanabilmesi, ya da ona değer biçilebilmesi için, mutlaka onu karşılaştırabileceğimiz bazı dayanakların olması gerekir. Ölçme sonuçlarının değerlendirilmesi için karşılaştırmaya ve yorumlamaya esas alınan dayanaklara ölçüt denmektedir. Ölçüt olmadan değerlendirme olmaz.
Yukarıdaki açıklamalardan da anlaşılacağı gibi değerlendirme, üç basamaklı bir işlem olarak karşımıza çıkmaktadır. Bunlar sırasıyla şunlardır:
1- Ölçme ya da ölçme yerine geçebilen gözlem verileri: Ölçme yapılmazsa veya ölçme yerine geçebilecek gözlem verileri olmazsa değerlendirme olmaz. Çünkü, ortada değerlendirecek bir şey yok demektir.
2- Ölçme veya gözlem verilerini karşılaştıracak, yorumlamayı kolaylaştıracak dayanaklar: (Ölçüt, kıstas, kriter) Elimizdeki ölçme verilerine değer biçebilmek için, bazı dayanaklara gerek vardır.
3- Hüküm: Ölçme verilerinin ölçüt ya da ölçütlerle karşılaştırılması ile varılan sonuç. İyi, başarılı, başarısız, yeterli gibi değer hükümleri.
Bazı değerlendirme tanımları:
Değerlendirme, bir çalışmanın sonucu üzerinde varılan yargı, bir şeye değer biçmedir. (Türkçe Sözlük)
Değerlendirme, bir obje veya işin belli ölçütler karşısında niteliğini veya değerini tayin etme, bir konuda ölçütlerle gözlem verilerini karşılaştırmadır. (Öğretmenlik Meslek Dersleri Sözlüğü)
Değerlendirme, niceliği ya da niteliği üzerinde yapılan, çalışma sonucu varılan yargıdır. (Eğitim Terimleri Sözlüğü)
Değerlendirme, aynı biçimdeki olayların, birtakım ölçütlere göre önemini belirtmedir. (Eğitim Terimleri Sözlüğü)
Değerlendirme, türlü öğretim amaçlarının gerçekleşme oranını, değişik yollarla ölçme ve ortaya çıkan sonuçlar üzerinde değer biçmedir. (Eğitim Terimleri Sözlüğü)
Tanımlarda da görüldüğü gibi değerlendirme bir yorumlama işidir. Bunun için de yorumlanacak verilere ve bunların yorumlanmasını sağlayacak ölçütlere (dayanaklar) gerek vardır. Sonuç olarak bir tanım yaparsak, değerlendirme; «ölçme ya da gözlem verilerini, uygun ölçütlerle karşılaştırmak suretiyle, bazı değer hükümlerine (yargı) ulaşmaktır.» diyebiliriz.
ÖLÇME İLE DEĞERLENDİRMENİN İLİŞKİSİ
1-Ölçme bir değişkenin miktarını gösterir. Değerlendirme ise, bu miktarın yeterli olup olmadığını ya da amaca uygun olup olmadığını gösteren hükümdür.
2-Genel olarak ölçme objektiftir. Değerlendirme ise yargıya dayandığı ve ölçüte göre değiştiği için sübjektiftir.
3-Kapsam bakımından değerlendirme daha geniştir, ölçmeyi; içine alır.
4-Ölçme daha çok gözleme, değerlendirme ise, karşılaştırma; yorum ve yargıya dayanır.
İYİ BİR ÖLÇME ARACININ ÖZELLİKLERİ
Bir ölçme aracının en önemli özelliği, geçerli olmasıdır. Çünkü, geçerli olan bir araç, hemen hemen diğer bütün özelliklere de sahiptir. Aracın, bütün özellikleri birbiriyle ilgilidir. Her hangi bir özelliğin bulunup, bulunmayışı, aynı zamanda aracın diğer özelliklerine de tesir eder. İyi bir ölçme aracında bulunması gereken, en önemli altı özellik aşağıda açıklanmıştır.
İyi Bir Ölçme Aracı Geçerli Olmalıdır
Ölçme aracının ölçülmek istenen özelliği ölçme gücüne ölmedeki geçerliği denir.
Eğitim ve öğretimde kullanılan ölçme araçları tam standart olmadığı için geçerli bir ölçmenin yapılması oldukça zordur. Bir ölçme aracını oluşturan sorular tek tek geçerli ise, bu aracın tamamı da geçerlidir. Bundan dolayı, ölçme aracındaki soruları hazırlarken şu sorulara cevap aramalıyız.
1.Neyi ölçmek istiyoruz? Bu sorunun cevabını kesinlikle bilmeliyiz
2.Sorumuz, ölçmek istediğimizi doğru olarak ölçebilir mi?
* Uyum geçerliği
* Yapı geçerliği
Test geçerliğinin belirtilmesinde korelasyondan yararlanılır. Korelasyonun, değişik ölçülerle yapılan sıralamaların ne ölçüde birbirine benzediğini belirtmek için kullanışlı bir ölçü olması, onun bu amaçla da kullanılmasında önemli bir etkendir. Ancak, geçerlik göstergesi olarak kullanılan korelasyon, -1,00 ile 1,00 değerleri arasında değişebilir, ilişkinin miktarını korelasyonun mutlak değeri gösterdiğinden, sadece 1,00 veya ona yaklaşan değerler değil, -1,00 veya ona yaklaşan korelasyonlar da yüksek bir ilişki olduğunu gösterir. Ancak bu son durumda ilişkinin yönü terstir; birinin yüksek değerlerine ikincisinin düşük değerleri karşılık gelmektedir. Geçerlik göstergesi olan korelasyonun sıfıra yaklaşması, iki ölçü dizisi arasında ilişki bulunmadığını; geçerliğin düşük olduğunu gösterir.
PEARSON MOMENTLER ÇARPIMI KORELASYON KATSAYISININ HESAPLANMASI
( ån) ( åy)
R = åxy –
å (x2 – ( åx)2 ) í å y2 – ( å y)2 y
n n
İyi Bir Ölçme Aracı Güvenilir Olmalıdır
Aracın güvenilir olması, aynı şartlar altında hep aynı sonucu vermesi demektir. Buna kararlılık da denir. Bir testi aynı sınıfa değişik zamanlarda uyguladığımız zaman, aynı veya çok yakın sonuçları alıyorsak bu test güvenilir demektir. Her seferinde değişik sonuçlar alıyorsak, o taktirde test güvenilir değildir.
Saydığımız bu faktörleri dikkate almak suretiyle, bir ölçme aracının güvenilir olup olmadığını anlamak için, yapılabilecek başlıca çalışmaları şöylece sıralayabiliriz:
(a)Aracın tek ve çift sayılı sorularından iki ayrı araç elde edilir. Bu iki araç biraz arayla aynı sınıfa uygulanır. Elde edilen puanların bağıntısı (korelasyon) ne kadar yüksek ise, aracın güvenilirliği o derece iyi dernektir.
(b)Bir ölçme aracı hazırlanırken, eş değerli sorularla ikinci bir araç hazırlanır. Bu iki araç biraz arayla aynı sınıfa uygulanır. Alınan puanların bağıntısı bulunur. Bağıntı, katsayısının pozitif ve yük*sek olması aracın güvenilir olduğuna işarettir.
(c)Aynı araç belli aralıklarla, aynı sınıflara uygulanır, Puanlar arasındaki bağıntının derecesi bulunur. Böylece de, aracın güvenilir olup olmadığı anlaşılabilir.
(d)Sınıf eşit iki gruba ayrılır. Bu iki grubun aynı araçtan aldıkla*rı puanlar arasındaki bağıntının derecesi bulunur. Buna göre de aracın güvenilirlik durumu anlaşılır.
Geçerli olan her ölçme aracı güvenilir demektir. Fakat güvenilir olan her araç geçerli olmayabilir. Ölçmek istediğimizi en doğru şekilde ölçebilen araç geçerlidir. En doğru şekilde ölçtüğüne göre, aynı şartlar*da hep aynı sonucu verecektir. Bu bakımdan da güvenilir demektir. Aynı veya benzer şartlarda hep aynı sonucu veren -güvenilir- araç, ölçmek istediğimizi doğru olarak ölçmeyebilir.
Hangi yöntemle güvenirlik tahmini yapılırsa yapılsın, sonuçta 0.00 ile 1.00 arasında bir korelasyon elde edilir. Korelasyonun 1.00'e yakın olması testin güvenirliğinin yüksek olduğu, 0.00'a yakın olması ise düşük olduğu anlamına gelir. Testin güvenilirliğinin yüksek olması, test puanlarına yansıyan hataların az olduğu, güvenilirliğinin düşük olması ise hataların fazla olduğu anlamını taşır.
GÜVENİRLİK KATSAYISI HESAPLAMA
1. Güvenirlik katsayısı (R) "Kuder Rıchardsonz" formülü ile hesaplanabilir.
R = N / N-1 [ 1 – X (1-X/N) / S2 ]
N = madde (soru) sayısı
X = puanların ortalaması
S = standart sapma
Geçerlik ve güvenirlik ile ilgili bir noktanın daha belirtilmesinde yarar vardır. Testler için güvenirlik ve geçerliğin ikisinin de yüksek olması testin ölçülmek istenen özelliğinin gerçek değerine yakın değerler verdiğini gösterir. Ancak, testlerin geçerlikleri güvenirlikleri kadar yüksek olmaz. Örneğin, grup karşılaştırmasında kullanılmak üzere hazırlanan testlerin güvenirlikleri 0,60-0,80 arasında olabilir. Bireyler hakkında karar vermede kullanılacak testlerin güvenirliklerinin 0,80'in, karar çok ciddi sonuçlara yol açabilecekse 0,90'ın üzerinde olması beklenir. Öte yandan, grup karşılaştırmalarında kullanılacak testlerin geçerlikleri 0,20-0,60 arasında olabilirken bunun bireysel kararlar temel olacak ölçüleri elde etmede kullanılacak testler için biraz daha yüksek, 0,40-0,70 arasında olması iyi olur.
İyi Bir Ölçme Aracı Objektif (Nesnel) Olmalıdır
Ölçme aracının objektifliği (nesnelliği), aynı zamanda aracın geçerli ve güvenilir olmasına da etki eder. Objektiflik, kişiye göre değişmemesi ve kesin olması demektir. Ölçme aracının objektifliğinin 3 yönü vardır.
1-Sorularda objektiflik: Ölçme aracındaki soruların herkes tarafından aynı şekilde anlaşılması demektir.
2-Uygulamada objektiflik: Aracın uygulanışının kişiye göre değiş*memesi, herkes tarafından aynı şekilde uygulanabilmesi demektir.
3-Puanlamada objektiflik: Kâğıtları puanlayan kişinin, kanaatlerinin puanlamaya etki edememesi demektir.
Çoğunlukla, kısa cevaplı ve seçmeli tipindeki soruların objektifliği yüksektir. Uzun cevaplı kompozisyon tipindeki soruların objektifliği çok zayıftır.
İyi Bir Ölçme Aracı Ayırt edici Olmalıdır
Uygulanan aracın, bilenle bilmeyeni, zayıf ile başarılıyı birbirinden ayırması demektir. Bir soru bütün öğrenciler tarafından doğru olarak cevaplanmışsa veya hiçbir öğrenci tarafından doğru olarak cevaplanamamışsa, bu soru ayırdedici değildir. Bir sorunun ayırdediciliği, onun zorluk derecesi ile ilgilidir. Bir sorunun zorluk derecesi şöyle bulunur. Soruyu cevaplayanların sayısı, o soruyu cevaplamaya çalışanların (sınayanların) sayısına bölünüp, 100 ile çarpılır. Örneklersek; 45 kişilik bir sınıfta, testin son sorusuna doğru cevap veren 24, yanlış cevaplayan 16, erişemeyen de 5 kişi olsun. Demek ki, erişemeyen (son soruya kadar gelemeyen) 5 kişinin dışındaki 40 kişi soruyu sınamıştır. Bu sorunun güçlük derecesi, 24 : 40 x 100 = 60 eder. Sorunun güçlük derecesi ortanın üzerinde demektir.
Bir soruya doğru cevap verenlerin sayısı azaldıkça, sorunun ayırma gücü artar. Ancak, bir ölçme aracındaki soruların hepsinin ayırma gücünün yüksek olması gerekmez. Özellikle, başarı testleri değişik güçlükteki sorulardan oluşmalıdır. Seçme ve yarışma sınavlarında daha çok zor sorulara yer verilir. Aracın uygulanmasından elde edilen puanların, en düşüğü ile en yükseği arasındaki fark fazla ise, öğrencilerin puanları bu iki puan arasında dağılmışsa, bu araca ayırt edici denebilir.
İyi Bir Ölçme Aracı Örnekleyici Olmalıdır
En iyi ölçme, öğretilenlerin veya ölçülmek istenen alanın tamamını ölçmektir. Fakat bu çoğunlukla, özellikle ölçme alanımız çok geniş olduğu zaman pek mümkün olmaz. Bu durumda, yapılacak iş ölçme alanını en iyi şekilde örnekleyebilecek sorular seçmektir. Örneklemenin iyi ol*ması, bütünü kapsayacak şekilde çok sorunun sorulması ile sağlanır. Fakat, sadece çok soru sormak da bizi amacımıza ulaştırmaz. Sorunun çokluğu kadar, niteliği de önemlidir. Olanaklar ölçüsünde, her konudan soru çıkarılmalı, çıkarılan soru ilgili olduğu konuyu örnekleyebilmeli ve bu sorularla amaçların gerçekleşip gerçekleşmediği anlaşılabilmelidir. Hatta, sorular iyi hazırlandığı zaman, az soruyla bile örnekleme yapılabilir. Fakat çok sorunun ölçülecek alanı daha iyi örnekleyeceği muhakkaktır. Az sorulu klasik yazılı yoklamaların örnekleyiciliği azdır.
İyi Bir Ölçme Aracı Kullanışlı Olmalıdır
Ölçme aracının kullanışlı olması, kullanılışında bir takım kolaylıkların bulunmasıdır. Aracın kullanılışı ile ilgili olarak, aranan başlıca nitelikler şunlardır:
(1) Uygulanması kolay olmalıdır.
(2) Puanlaması kolay olmalı, uzun zaman almamalıdır.
(3) Kolay okunmalı, yanlış anlamaya fırsat vermemelidir.
(4) Aracın düzeni ve soruların yerleştirilmesi iyi olmalıdır.
(5) Ekonomik olmalı, farla masrafı gerektirmemelidir.
Süre ayarlaması iyi yapılmalı, verilen zaman az veya çok olmamalıdır.
(7) Ayrı cevap kağıdı varsa, test defteri ile ikisi birbirine uymalı, karışıklığa meydan vermemelidir.
Bir testin kullanışlılığı, güvenirlik ve geçerlikten sonra düşünülmesi gereken bir özeliktir. Amacı için yeterli olabilecek güvenirlik ve geçerlikte olan testler arasında en kullanışlı olan seçilmelidir. Aksi durumda çok kullanışlı olduğu halde güvenirliği ve geçerliği düşük olan bir test amaca uygun sonuç vermez.