A. Model Umum Reliabilitas
Pengukuran tentu saja akan ajeg membedakan kemampuan peserta didik,
misalnya siswa A lebih pintar dari siswa B karena skor yang diperoleh siswa A
lebih tinggi dari perolehan siswa B. Dalam kenyataannya, pengukuran kita tidak
pernah sempurna. Konsep dasar reliabilitas menggunakan kesalahan (tidak sempurna)
pengukuran tersebut.
Setiap skor yang diperoleh peserta tes terdiri atas tiga hal ; 1) skor
amatan atau skor perolehan (observed test
score), 2) skor yang sebenarnya atau skor yang sesuai dengan peserta tes
sebenarnya (true score), 3) kesalahan
pengukuran yang disebabkan oleh situasi yang mempengaruhi perolehan skor (error of measurement).
Secara umum konsep dasar tersebut dinyatakan dalam persamaan matematis
sebagai berikut :
Skor perolehan = Skor sebenarnya + Kesalahan Pengkuran atau X = T + e
Kesalahan pengukuran merupakan selisih antara skor
amatan (perolehan) dengan skor sebenarnya. Atau e = X + T.
Teori reliabilitas ditentukan berdasarkan varian antara skor perolehan yang
merupakan penjumlahan dari varian skor sebenarnya dengan varian kesalahan
pengukuran yaitu : . Persamaan ini menunjukkan bahwa skor tes ditentukan oleh
dua hal ; variabilitas skor sebenarnya dan variabilitas kesalahan pengukuran. Jika
kesalahan pengukuran itu memberikan kontribusi yang signifikan maka tes menjadi
tidak ajeg.
B. Metode Sederhana Mengestimasi Reliabilitas
Tujuan utama mengestimasi reliabilitas adalah untuk menentukan seberapa
besar variabilitas yang terjadi akibat adanya kesalahan pengukuran dan seberapa
besar variabilitas skor tes sebenarnya. Jadi, reliabilitas adalah kestabilan
skor yang diperoleh orang yang sama ketika diuji ulang dengan tes yang sama
pada situasi yang berbeda atau dari satu pengukuran ke pengukuran lainnya.
Jadi reliabilitas dapat dinyatakan sebagai tingkat keajegan atau
kemantapan hasil dari hasil dua pengukuran terhadap hal yang sama. Hasil pengukuran itu diharapkan akan sama
apabila pengukuran itu diulangi.
Reliabilitas memiliki dua
keajegan. Keajegan yang pertama adalah keajegan internal, yakni tingkat
sejauhmana butir soal itu homogen baik dari segi tingkat kesukaran maupun
bentuk soalnya. Keajegan yang kedua yaitu keajegan eksternal yakni sejauhmana
tingkat skor dihasilkan tetap sama sepanjang kemampuan orang yang diukur belum
berubah.
Perbedaan skor dari satu pengukuran
ke pengukuran lainnya dapat saja terjadi. Menurut Allen dan Yen (1979),
perbedaan skor dari satu pengukuran ke pengukuran lain ini terjadi karena
adanya standard error of measurement
atau standar kesalahan pengukuran.
Oleh karena itu koefesien reliabilitas harus benar-benar diperhitungkan lebih
dahulu standar kesalahan pengukuran itu. Untuk itu dalam pengukuran perlu
diidentifikasi sumber-sumber utama yang menyebabkan terjadinya kesalahan
pengukuran tersebut. Nunnaly (1981) menyebutkan bahwa sumber kesalahan pengukuran itu antara lain (1) variasi dalam
tes itu sendiri, (2) struktur sampel yang dipilih, (3) variasi diantara tes
yang sedang digunakan. Menurut Crocker dan Algina (1986) sumber utama kesalahan
pengukuran disebabkan oleh (1) perubahan dan kelebihan waktu yang diuji, (2)
isi bentuk ke bentuk, dan (3) sampel isi atau soal yang cacat. Sumber kesalahan
pengukuran bisa juga terjadi karena pengaruh teknik pemilihan sampel atau
situasi yang ada pada masing-masing individu yang dijadikan sampel.
Perbedaan pengertian
reliabilitasi sangat bergantung kepada bagaimana indeks reliabilitasi dihitung.
Paling tidak terdapat empat konsep reliabilitasi yaitu (1) paralel atau ekuivalen, (2) test-retest
atau stabilitas, (3) split-half atau belah dua dan (4) internal
consistencyi. Sebagian orang
berpendapat bahwa metode split-half
atau belah dua merupakan bagian dari
metode keajegan internal (internal
consistency) sehingga pembagian metode menjadi tiga bagian yaitu (1) ekuivalen, (2) stabilitas, (3) internal consistency.
Apabila hasil skor tes pertama sama dengan hasil skor tes kedua, maka tes
dikatakan memiliki reliabilitas tinggi atau terdapat korelasi yang tinggi
antara hasil tes pertama dengan hasil tes kedua. Demikian pula sebaliknya jika antara hasil tes
pertama dan kedua tidak terdapat hubungan atau hubungannya rendah, maka tes itu
dikatakan tidak reliabel.
Besar kecilnya reliabilitas suatu tes ditentukan oleh besar kecilnya
nilai korelasi hasil tes yang dinamakan indeks reliabilitas. Untuk mengestimasi
reliabilitas banyak formula yang dapat digunakan, diantaranya adalah dengan
memperhatikan sumber kesalahan utama melalui penggunaan koefisien, equivalensi,
dan keajegan internal.
Tinggi rendahnya koefisien reliabilitas dipengaruhi oleh beberapa faktor,
yaitu ; panjang suatu tes, kecepatan, homogenitas belahan, dan tingkat
kesukaran soal. Semakin sukar soal-soal dalam perangkat tes akan semakin besar
pula variasi skor yang diperoleh belahan. Untuk itu harus dihindari banyaknya
terkaan yang dilakukan peserta tes dan diusahakan menyesuaikan pengetahuan
peserta tes dengan materi tes yang akan diujikan kepada mereka.
C.
Metode Tes Ulang
Metode tes ulang atau test-retest
method sering pula dikatakan metode stabilitas merupakan pendekatan yang
paling tua yang digunakan untuk mengestimasi reliabilitas. Pendekatan
stabilitas sering pula dinamakan single-test-double-trial
method. Metode tes ulang sangat
berguna untuk melihat kestabilan pengukuran. Oleh karena itu, metode ini biasa
disebut metode kestabilan tes.
D. Ekuivalen
Metode ekuivalen (paralel) sering pula dinamakan alternate-forms methods atau double
test-double-trial method. Metode ini berkaitan dengan penggunaan dua buah
tes yang sama atau relatif sama kepada peserta didik yang sama. Kesamaan yang dimaksudkan pada tes adalah kesamaan
tujuan, tingkat kesukaran, dan susunan. Metode ini biasanya digunakan untuk
mengatasi kelemahan yang terjadi pada metode tes ulang. Akan tetapi pada metode
ini juga masih terdapat beberapa kekurangan.
E. Belah Dua (split half methods)
Dua metode yang diperkenalkan dalam bagian E dan F memiliki beberap
kelemahan. Pada bentuk double
test-double-trial method misalnya, guru harus mengembangkan lebih dari satu
tes paralel kemudian mencari reliabilitas dari tes paralel tersebut. Metode
belah dua dapat mengatasi semua kelemahan yang terdapat pada metode tes ulang
dan tes paralel.
F. Internal Konsistensi (internal consistency)
Metode internal konsisten sangat berbeda dengan tiga metode yang telah
kita bahas sebelumnya. Tes yang terdiri dari banyak soal, tentu sangat
dipengaruhi oleh validitas soal. Soal yang memiliki validitas yang baik, atau
daya pembeda yang baik, maka soal tersebut akan bersifat ajeg sebagai alat
ukur. Tes yang disusun atas soal-soal yang valid akan menghasilkan reliabilitas
yang baik pula.
Internal consistency didasarkan
pada homogenitas atau korelasi atau skor jawaban pada setiap butir tes. Tes ini
juga dipergunakan pada butir-butir yangdikotomi seperti soal pilihan ganda.
Jika korelasi rerata antar butir soal tinggi maka reliabilitasnya juga tinggi.
Jika korelasi mendekati nol, maka internal konsistensi nol pula dan
reliabilitasnya rendah.
G. Standar Kesalahan Pengukuran
Indeks reliabilitas menyajikan informasi yang sangat berguna untuk
mengevaluasi tes. Untuk mengetahui indikasi adanya pengaruh skor sebenarnya dan
skor kesalahan, indeks reliabilitas dapat digunakan dengan mengestimasi
seberapa besar skor berfluktuasi sebagai adanya kesalahan pengukuran.
H. Faktor yang Berpengaruh Terhadap
Reliabilitas
Tes yang terdiri atas soal-soal yang banyak akan lebih reliabel
dibandingkan dengan tes yang terdiri atas soal yang sedikit. Sebagai contoh
kita ambil dalam tes fisika untuk kenaikan kelas misalnya, terdiri dari 40 soal
akan memiliki reliabilitas yang berbeda dengan tes yang terdiri dari 60 soal.
Para ahli psikometri sepakat bahwa tidak
selamanya penambahan panjang tes akan mengakibatkan penambahan indeks
reliabilitas. Ada
batas-batas kejenuhan yang mengakibatkan indeks reliabilitas relatif tidak
berubah.
DAFTAR PUSTAKA
Purwanto, M. Ngalim., 2006.
Prinsip-prinsip dan Tekhnik Evaluasi
Pengajaran, cet. Ke-12, Bandung:
PT. Remaja Rosdakarya
Surapranata, Sumarna., 2004. Analisis,
Validitas, Reliabilitas dan Interpretasi Hasil Tes; Implementasi Kurikulum
2004, cet. Ke-1, Bandung:
PT. Remaja Rosdakarya
_________., 2004. Panduan Penulisan Tes Tertulis; Implementasi
Kurikulum 2004, cet. Ke-1, Bandung: PT. Remaja Rosdakarya
thxs, membantu.. :)
ReplyDelete