Welcome to www.jamal.com
go to my homepage
Go to homepage
WELLCOME TO SITUS LO HULONDHALO

Thursday, October 20, 2011

Tekhnik Pengujian Reliabilitas Tes Hasil Belajar


A.    Model Umum Reliabilitas
Pengukuran tentu saja akan ajeg membedakan kemampuan peserta didik, misalnya siswa A lebih pintar dari siswa B karena skor yang diperoleh siswa A lebih tinggi dari perolehan siswa B. Dalam kenyataannya, pengukuran kita tidak pernah sempurna. Konsep dasar reliabilitas menggunakan kesalahan (tidak sempurna) pengukuran tersebut.
Setiap skor yang diperoleh peserta tes terdiri atas tiga hal ; 1) skor amatan atau skor perolehan (observed test score), 2) skor yang sebenarnya atau skor yang sesuai dengan peserta tes sebenarnya (true score), 3) kesalahan pengukuran yang disebabkan oleh situasi yang mempengaruhi perolehan skor (error of measurement).
Secara umum konsep dasar tersebut dinyatakan dalam persamaan matematis sebagai berikut :
Skor perolehan = Skor sebenarnya + Kesalahan Pengkuran atau X = T + e
Kesalahan pengukuran merupakan selisih antara skor amatan (perolehan) dengan skor sebenarnya. Atau e = X + T. 
Teori reliabilitas ditentukan berdasarkan varian antara skor perolehan yang merupakan penjumlahan dari varian skor sebenarnya dengan varian kesalahan pengukuran yaitu : . Persamaan ini menunjukkan bahwa skor tes ditentukan oleh dua hal ; variabilitas skor sebenarnya dan variabilitas kesalahan pengukuran. Jika kesalahan pengukuran itu memberikan kontribusi yang signifikan maka tes menjadi tidak ajeg.

B.     Metode Sederhana Mengestimasi Reliabilitas
Tujuan utama mengestimasi reliabilitas adalah untuk menentukan seberapa besar variabilitas yang terjadi akibat adanya kesalahan pengukuran dan seberapa besar variabilitas skor tes sebenarnya. Jadi, reliabilitas adalah kestabilan skor yang diperoleh orang yang sama ketika diuji ulang dengan tes yang sama pada situasi yang berbeda atau dari satu pengukuran ke pengukuran lainnya.
Jadi reliabilitas dapat dinyatakan sebagai tingkat keajegan atau kemantapan hasil dari hasil dua pengukuran terhadap hal yang sama. Hasil pengukuran itu diharapkan akan sama apabila pengukuran itu diulangi.
Reliabilitas memiliki dua keajegan. Keajegan yang pertama adalah keajegan internal, yakni tingkat sejauhmana butir soal itu homogen baik dari segi tingkat kesukaran maupun bentuk soalnya. Keajegan yang kedua yaitu keajegan eksternal yakni sejauhmana tingkat skor dihasilkan tetap sama sepanjang kemampuan orang yang diukur belum berubah.
Perbedaan skor dari satu pengukuran ke pengukuran lainnya dapat saja terjadi. Menurut Allen dan Yen (1979), perbedaan skor dari satu pengukuran ke pengukuran lain ini terjadi karena adanya standard error of measurement atau standar kesalahan pengukuran. Oleh karena itu koefesien reliabilitas harus benar-benar diperhitungkan lebih dahulu standar kesalahan pengukuran itu. Untuk itu dalam pengukuran perlu diidentifikasi sumber-sumber utama yang menyebabkan terjadinya kesalahan pengukuran tersebut. Nunnaly (1981) menyebutkan bahwa sumber kesalahan  pengukuran itu antara lain (1) variasi dalam tes itu sendiri, (2) struktur sampel yang dipilih, (3) variasi diantara tes yang sedang digunakan. Menurut Crocker dan Algina (1986) sumber utama kesalahan pengukuran disebabkan oleh (1) perubahan dan kelebihan waktu yang diuji, (2) isi bentuk ke bentuk, dan (3) sampel isi atau soal yang cacat. Sumber kesalahan pengukuran bisa juga terjadi karena pengaruh teknik pemilihan sampel atau situasi yang ada pada masing-masing individu yang dijadikan sampel.
Perbedaan pengertian reliabilitasi sangat bergantung kepada bagaimana indeks reliabilitasi dihitung. Paling tidak terdapat empat konsep reliabilitasi yaitu (1) paralel atau ekuivalen, (2) test-retest atau stabilitas, (3) split-half atau belah dua dan (4) internal consistencyi.  Sebagian orang berpendapat bahwa metode split-half atau belah dua merupakan bagian dari metode keajegan internal (internal consistency) sehingga pembagian metode menjadi tiga bagian yaitu (1) ekuivalen, (2) stabilitas, (3) internal consistency.
Apabila hasil skor tes pertama sama dengan hasil skor tes kedua, maka tes dikatakan memiliki reliabilitas tinggi atau terdapat korelasi yang tinggi antara hasil tes pertama dengan hasil tes kedua.  Demikian pula sebaliknya jika antara hasil tes pertama dan kedua tidak terdapat hubungan atau hubungannya rendah, maka tes itu dikatakan tidak reliabel.
Besar kecilnya reliabilitas suatu tes ditentukan oleh besar kecilnya nilai korelasi hasil tes yang dinamakan indeks reliabilitas. Untuk mengestimasi reliabilitas banyak formula yang dapat digunakan, diantaranya adalah dengan memperhatikan sumber kesalahan utama melalui penggunaan koefisien, equivalensi, dan keajegan internal.
Tinggi rendahnya koefisien reliabilitas dipengaruhi oleh beberapa faktor, yaitu ; panjang suatu tes, kecepatan, homogenitas belahan, dan tingkat kesukaran soal. Semakin sukar soal-soal dalam perangkat tes akan semakin besar pula variasi skor yang diperoleh belahan. Untuk itu harus dihindari banyaknya terkaan yang dilakukan peserta tes dan diusahakan menyesuaikan pengetahuan peserta tes dengan materi tes yang akan diujikan kepada mereka.

C.    Metode Tes Ulang
Metode tes ulang atau test-retest method sering pula dikatakan metode stabilitas merupakan pendekatan yang paling tua yang digunakan untuk mengestimasi reliabilitas. Pendekatan stabilitas sering pula dinamakan single-test-double-trial method. Metode tes ulang sangat berguna untuk melihat kestabilan pengukuran. Oleh karena itu, metode ini biasa disebut metode kestabilan tes.

D.    Ekuivalen
Metode ekuivalen (paralel) sering pula dinamakan alternate-forms methods atau double test-double-trial method. Metode ini berkaitan dengan penggunaan dua buah tes yang sama atau relatif sama kepada peserta didik yang sama. Kesamaan yang dimaksudkan pada tes adalah kesamaan tujuan, tingkat kesukaran, dan susunan. Metode ini biasanya digunakan untuk mengatasi kelemahan yang terjadi pada metode tes ulang. Akan tetapi pada metode ini juga masih terdapat beberapa kekurangan.

E.     Belah Dua (split half methods)
Dua metode yang diperkenalkan dalam bagian E dan F memiliki beberap kelemahan. Pada bentuk double test-double-trial method misalnya, guru harus mengembangkan lebih dari satu tes paralel kemudian mencari reliabilitas dari tes paralel tersebut. Metode belah dua dapat mengatasi semua kelemahan yang terdapat pada metode tes ulang dan tes paralel.

F.     Internal Konsistensi (internal consistency)
Metode internal konsisten sangat berbeda dengan tiga metode yang telah kita bahas sebelumnya. Tes yang terdiri dari banyak soal, tentu sangat dipengaruhi oleh validitas soal. Soal yang memiliki validitas yang baik, atau daya pembeda yang baik, maka soal tersebut akan bersifat ajeg sebagai alat ukur. Tes yang disusun atas soal-soal yang valid akan menghasilkan reliabilitas yang baik pula.
Internal consistency didasarkan pada homogenitas atau korelasi atau skor jawaban pada setiap butir tes. Tes ini juga dipergunakan pada butir-butir yangdikotomi seperti soal pilihan ganda. Jika korelasi rerata antar butir soal tinggi maka reliabilitasnya juga tinggi. Jika korelasi mendekati nol, maka internal konsistensi nol pula dan reliabilitasnya rendah.

G.    Standar Kesalahan Pengukuran
Indeks reliabilitas menyajikan informasi yang sangat berguna untuk mengevaluasi tes. Untuk mengetahui indikasi adanya pengaruh skor sebenarnya dan skor kesalahan, indeks reliabilitas dapat digunakan dengan mengestimasi seberapa besar skor berfluktuasi sebagai adanya kesalahan pengukuran.

H.    Faktor yang Berpengaruh Terhadap Reliabilitas
Tes yang terdiri atas soal-soal yang banyak akan lebih reliabel dibandingkan dengan tes yang terdiri atas soal yang sedikit. Sebagai contoh kita ambil dalam tes fisika untuk kenaikan kelas misalnya, terdiri dari 40 soal akan memiliki reliabilitas yang berbeda dengan tes yang terdiri dari 60 soal.
Para ahli psikometri sepakat bahwa tidak selamanya penambahan panjang tes akan mengakibatkan penambahan indeks reliabilitas. Ada batas-batas kejenuhan yang mengakibatkan indeks reliabilitas relatif tidak berubah.
DAFTAR PUSTAKA

Purwanto, M. Ngalim., 2006. Prinsip-prinsip dan Tekhnik Evaluasi Pengajaran, cet. Ke-12, Bandung: PT. Remaja Rosdakarya

Surapranata, Sumarna., 2004. Analisis, Validitas, Reliabilitas dan Interpretasi Hasil Tes; Implementasi Kurikulum 2004, cet. Ke-1, Bandung: PT. Remaja Rosdakarya

_________., 2004. Panduan Penulisan Tes Tertulis; Implementasi Kurikulum 2004, cet. Ke-1, Bandung: PT. Remaja Rosdakarya

1 comment:

ANNOUNCEMENT