A. Pengertian Validitas
Sebagaimana telah dijelaskan sebelumnya bahwa Validitas adalah suatu
konsep yang berkaitan dengan sejauhmana tes telah mengukur apa yang seharusnya
diukur. Validitas sebuah tes selalu
dibedakan menjadi dua macam yaitu validitas logis dan validitas empiris. Validitas
logis sama dengan analisis kualitatif terhadap sebuah soal, yaitu untuk
menentukan berfungsi tidaknya suatu soal berdasarkan kriteria yang tela
ditentukan, yang dalam hal ini adalah kriteria materi, konstruksi, dan bahasa.
Validitas tes perlu ditentukan
untuk mengetahui kualitas tes dalam kaitannya dengan mengukur hal yang
seharusnya diukur. Nunnaly (1972) menyatakan bahwa pengertian validitas
senantiasa dikaitkan dengan penelitian empiris dan pembuktian-pembuktiannya
bergantung kepada macam validitas yang digunakan. Validitas tes perlu dilakukan
untuk mengetahui kualitas tes dalam kaitannya mengukur hal yang seharusnya
diukur. Menurut Anastasi (1988) validitas adalah suatu tingkatan yang
menyatakan bahwa suatu alat ukur telah sesuai dengan apa yang diukur. Sedangkan
Gronlund (1985) menyatakan bahwa validitas berkaitan dengan hasil suatu alat
ukur, menunjukan tingkatan, dan bersifat khusus sesuai dengan tujuan pengukuran
yang akan dilakukan. Para pengembang
tes memiliki tanggung jawab dalam membuat tes yang benar-benar reliabel dan
valid. Oleh karena itu variabel dapat digunakanuntuk memerikasa secara langsung
seberapa jauh suatu alat telah berfungsi.
B. Bentuk-Bentuk Validitas
Pengkajian yang dilakukan oleh para ahli terhadap bagaimana menentukan
dan menilai validitas, maka dapat diambil empat bentuk validitas yang digunakan
dalam menentukan validitas yaitu :
1.
Validitas Isi (content
validity)
Validitas isi (content validity)
sering dinamakan Validitas kurikulum yang mengandung arti bahwa suatu alat ukur
dipandang valid apabila sesuai dengan isi kurikulum yang hendak diukur. Salah satu
cara untuk memperoleh validitas isi adalah dengan melihat soal-soal yang
membentuk tes itu. Jika keseluruhan soal nampak mengukur apa yang seharusnya
tes itu digunakan, tidak diragukan lagi bahwa validitas isi sudah terpenuhi.
Dalam melakukan validitas isi ini dapat melalui prosedur ; a) mendefinisikan
domain yang hendak diukur, b) menentukan domain yang akan diukur oleh
masing-masing soal, c) membandingkan masing-masing soal dengan domain yang
sudah ditetapkan.
2.
Validitas Konstruk (construct
validity)
Konstruk (construct) adalah
sesuatu yang berkaitan dengan fenomena dan objek yang abstrak, tetapi gejalanya
dapat diamati dan diukur. Gravitasi,
massa, kemampuan matematika, kemampuan bahasa Inggris, kebahagiaan, dan
kesedihan antara lain walaupun termasuk konstruk. Gravitasi misalnya dapat
dijadikan sebagai contoh bagaimana memehami konstruk. Ketika buah apel jatuh
ketanah, konstruk tentang gravitasi dapat digunakan untuk menjelaskan dan
memperkirakan perilaku (jatuhnya buah apel misalnya) yang diamati. Validitas konstruk mengandung arti bahwa
suatu alat ukur dikatakan valid apabila telah cocok dengan konstruk teoritik di
mana tes itu dibuat. Konstruksi yang dimaksud pada validitas ini bukanlah
merupakan konstruksi seperti bangunan atau susunan, tetapi merupakan rekaan
psikologis yang berkaitan dengan aspek-aspek ingatan, pemahaman, aplikasi,
analisis, sintesis, dan evaluasi.
3.
Validitas prediktif (predictive validity)
Predictive validity menunjukan
kepada hubungan antara tes skor yang diperoleh peserta tes dengan keadaan yang
akan terjadi diwaktu yang akan datang. Sebuah tes dikatakan memiliki validitas
prediksi apabila mempunyai kemampuan untuk memprediksikan apa yang akan terjadi
di masa yang akan datang.
4. Validitas
konkuren (concurent validity)
Validitas concurent
atau validity ada sekarang menunjuk
pada hubungan antara tes skor dengan yang dicapai dengan keadaan sekarang.
Validitas ini dikenal dengan validitas empiris. Sebuah tes dikatakan memiliki concurent validity apabila hasilnya
sesuai dengan pengalaman.
C.
Mengukur Validitas
Untuk menentukan apakah tes
yang digunakan untuk mengukur introvert, intelegensi, kemampuan membaca,
kemampuan matematika, atau kemampuan fisika misalnya, tidak ada satupun lembaga
standarisasi tes yang dapat membandingkan tes yang dibuat tersebut. Para ahli pengukuran pendidikan lebih menyarankan untuk
menggunakan beberapa metode yang berasal dari fakta yang terdapat dari tes itu
sendiri digunakan.
Salah satu cara untuk menentukan validitas alat ukur adalah dengan
menggunakan korelasi product moment
dengan simpangan yang dikemukakan oleh Person seperti berikut :
rxy = koefisien
korelasi antara variabel x dan variabel y, dan variabel lain yang
dikorelasikan dan
= jumlah perkalian
antara x dan y
x2 = kuadrat dari x
y2 = kuadrat dari y
D. Validitas Soal
Validitas soal adalah indeks diskriminasi dalam membedakan antara peserta
tes yang berkemampuan tinggi dengan peserta tes yang berkemampuan rendah.
Validitas soal adalah indeks diskriminasi soal-soal yang ditetapkan dari
selisih proporsi yang menjawab dari masing-masing kelompok. Adapun tujuan
validitas soal adalah untuk menentukan dapat tidaknya soal tersebut membedakan
kelompok dalam aspek yang diukur sesuai dengan perbedaan yang ada dalam
kelompok itu.
Terdapat berbagai cara yang digunakan untuk menentukan validitas,
diantaranya dengan menggunakan ; 1) indeks diskriminasi, 2) indeks korelasi, 3)
indeks keselarasan. Tekhnik korelasi terdiri atas, 1) tekhnik point biserial,
2) tekhnik phi, 3) tekhnik biserial, 4)
tekhnik tetrachoric. Sebagaimana alat
ukur lainnya, korelasi dalam validitas soal memiliki prediktor dan kriterium.
Prediktor dalam validitas soal adalah skor
soal sedangkan kriteriumnya adalah skor total tes.
Korelasi biserial maupun korelasi point biserial adalah korelasi product
moment yang diterapkan pada data,
dimana variabel-variabel yang dikorelasikan sifatnya masing-masing berbeda satu
sama lain. Variabel butir soal bersifat dikotomi sedangkan variabel skor total
atau sub skor total bersifat kontinum. Korelasi biserial ditentukan dengan
menggunakan persamaan :
rbis =
Koefesien korelasi biserial
= Rerata skor pada tes dari peserta tes yang
memiliki jawaban benar
Mt = Rerata skor total
St = Standar deviasi skor total
P = Proporsi peserta tes yang jawabanya benar
pada soal (tingkat kesukaran)
q = 1 - p
E. Validitas Item Tes Hasil Belajar
Salah satu cara untuk memperbaiki proses belajar-mengajar yang paling
efektif ialah dengan jalan mengevaluasi tes hasil belajar yang diperoleh dari
proses belajar-mengajar itu sendiri. Dengan kata lain, hasil tes itu kita olah
sedemikian rupa sehingga dari hasil pengolahan itu dapat diketahui komponen-komponen
manakah dari proses belajar-mengajar itu yang masih lemah.
Pengolahan tes hasil belajar dalam rangka memperbaiki proses
belajar-mengajar dapat dilakukan dengan
berbagai cara, antara lain : a) dengan membuat analisis soal (item analysis);
b) dengan menghitung validitas dan keandalan tes.
Dalam pasal ini khusus akan dibicarakan cara yang pertama, yaitu teknik
analisis soal atau yang biasa disebut item
analisis. Analisis terhadap soal-soal (items) tes yang telah dijawab oleh
murid-murid mempunyai dua tujuan penting.
Pertama, jawaban-jawaban soal
itu merupakan informasi diagnostik untuk meneliti pelajaran dari kelas itu dan
kegagalaan-kegagalan belajarnya, serta selanjutnya untuk membimbing kearah cara
belajar yang lebih baik. Kedua, jawaban-jawaban
terhadap soal-soal yang terpisah dan perbaikan (review) soal-soal yang
didasarkan atas jawaban-jawaban itu merupakan basis bagi penyiapan tes-tes yang
lebih baik untuk tahun berikutnya.
Jadi, tujuan khusus dari item
analysis ialah mencari soal tes mana yang baik dan mana yang tidak baik,
dan mengapa item atau soal itu
dikatakan baik atau tidak baik. Dengan mengetahui soal-soal yang tidak baik itu
selanjutnya kita dapat mencari kemungkinan sebab-sebab mengapa item itu tidak baik. Dengan membuat
analisis soal, sedikitnya kita dapat mengetahui tiga hal penting yang dapat
diperoleh dari tiap soal, yaitu:
a. Sampai
di mana tingkat atau taraf kesulitan soal itu (difficulty level of an item).
Untuk menghitung taraf kesukaran soal
suatu tes dipergunakan rumus sebagai berikut :
TK =indeks TK atau taraf/tingkat kesukaran yang
dicari
U = jumlah
siswa yang termasuk dalam kelompok pandai yang menjawab benar
Untuk tiap soal
L = jumlah
siswa yang termasuk kelompok kurang yang menjawab benar
Untuk
tiap soal
T = jumlah siswa dari kelompok pandai dan
kurang.
b.
Apakah soal itu mempunyai daya pembeda (discriminating
power) sehingga dapat membedakan kelompok siswa yang pandai dengan kelompok
siswa yang bodoh. Daya pembeda dari suatu tes dapat dihitung dengan rumus
sebagai berikut :
DP = daya pembeda yang dicari
U, L dan T =
taraf kesukaran
c. Apakah semua alternatif jawaban (options)
menarik jawaban-jawaban, ataukah ada yang demikian tidak menarik sehingga tidak
perlu dimasukan kedalam soal.
DAFTAR PUSTAKA
Purwanto, M. Ngalim., 2006.
Prinsip-prinsip dan Tekhnik Evaluasi
Pengajaran, cet. Ke-12, Bandung: PT. Remaja Rosdakarya
Surapranata, Sumarna., 2004. Analisis,
Validitas, Reliabilitas dan Interpretasi Hasil Tes; Implementasi Kurikulum
2004, cet. Ke-1, Bandung:
PT. Remaja Rosdakarya
_________., 2004. Panduan Penulisan Tes Tertulis; Implementasi
Kurikulum 2004, cet. Ke-1, Bandung:
PT. Remaja Rosdakarya