Statistik Untuk Pengujian Validitas dan Reliabilitas Instrumen Penelitian
Table of Contents
Validitas dan Reliabilitas Instrumen
Dalam hal ini perlu dibedakan antara hasil penelitian yang valid dan reliable dengan instrument yang valid dan reliabel. Hasil penelitian yang valid bila terdapat kesamaan antara data yang terkumpul dengan data yang sesungguhnya terjadi pada objek yang diteliti. Kalau ada objek berwarna merah sementara data yang terkumpul memberikan data berwarna putih maka hasil penelitian tidak valid. Selanjutnya hasil penelitian yang reliable, bila terdapat kesamaan data dalam waktu yang berbeda. Jika dalam objek kemarin berwarna merah, maka sekarang dan besok tetap berwarna merah.
Instrument yang valid berarti alat ukur yang digunakan untuk mendapatkan data (mengukur) itu valid. Valid berarti instrument tersebut dapat digunakan untuk mengukur apa yang seharusnya diukur. Meteran yang valid dapat digunakan untuk mengukur panjang dengan teliti, karena meteran memang alat untuk mengukur panjang. Meteran tersebut menjadi tidak valid jika digunakan untuk mengukur berat. Instrumen yang reliabel adalah instrument yang bila digunakan beberapa kali untuk mengukur objek yang sama akan menghasilkan data yang sama. Alat ukur panjang dari karet adalah contoh instrument yang tidak reliable/konsisten.
Dengan menggunakan instrument yang valid dan reliabel dalam pengumpulan data , maka diharapkan hasil penelitian akan menjadi valid dan reliable. Jadi instrumen yang valid dan reliable merupakan syarat mutlak untuk mendapatkan hasil penelitian yang valid dan reliabel. Hal ini tidak berarti bahwa dengan menggunakan instrument yang telah teruji validitas dan reliabilitasnya, otomatis hasil penelitian menjadi valid dan reliabel. Hal ini masih akan dipengaruhi oleh kondisi objek yang diteliti, dan kemampuan orang yang menggunakan instrument penelitian untuk mengumpulkan data. Oleh karena itu, peneliti harus mampu mengendalikan objek yang diteliti dan meningkatkan kemampuan dan menggunakan instrument untuk mengukur variable yang diteliti.
Pada dasarnya terdapat dua macam instrumen, yaitu instrument yang berbentuk tes untuk mengukur prestasi belajar dan instrument nontes untuk mengukur sikap. Instrument yang berupa tes jawabannya adalah “salah atau benar”, sedangkan instrument sikap jawabannya bersifat “positif dan negatif”.
Instrumen yang valid harus memiliki validitas internal dan eksternal. Instrumen yang memunyai validitas eksternal dan internal, bila criteria yang ada dalam instrumen secara rasional telah mencerminkan apa yang diukur. Jadi kriterianya ada di dalam instrumen itu. Instrumen yang memiliki validitas eksternal bila criteria di dalam instrumen tersebut disusun berdasarkan fakta-fakta empiris yang telah ada. Kalau validitas internal instrumen dikembangkan menurut teori yang relevan, maka validitas eksternal instrumen dikembangkan melalui fakta empiris. Misalnya akan mengukur kiinerja sekelompok pegawai, maka tolak ukur yang digunakkan didasarkan pada tolak ukur yang telah ditetapkan di kepegawaian itu. Sedangkan validitas internal dikembangkan dari teori-teori tentang kinerja. Untuk itu penyusunan instrumen yang baik harus memerhatikan teori dan fakta di lapangan.
Penelitian yang memunyai validitas internal, bila data yang dihasilkan merupakan fungsi dari rancangan dan instrumen yang digunakan.instrumen tentang kepemimpinan akan menghasilkan data kepemimpinan, bukan motivasi. Penelitian yang memunyai validitas eksternal bila hasil penelitian dapat diterapkan pada sampel yang lain atau hasil penelitian itu dapat digeneralisasikan.
Validitas instrumen yang berupa tes harus memenuhi construct validity (validitas konstruksi) dan content validity (validitas isi). Sedangkan untuk instrumen nontes yang digunakan mengukur sikap cukup memenuhi validitas konstruksi. Sutrisno Hadi (1986) menyamakan construct validity sama dengan logical validity atau validity bu definition. Instrumen yang mempunyai validitas konstruksi, jika instrumen tersebut dapat digunakan untuk mengukur gejala social sesuai dengan yang didefinisikan. Misalnya akan mengukur efektivitas organisasi, maka perlu didefinisikan terlebih dahulu apa itu efektivitas organisasi. Setelah itu disiapkan instrumen yang digunakan untuk mengukur efektivitas organisasi sesuai dengan definisi yang dirumuskan tersebut. Untuk melahirkan definisi, maka diperlukan teori-teori. Dalam hal ini Sutrisno Hadi menyatakan bahwa “bila bangunan teorinya sudah benar, maka hasil pengukuran dengan alat ukur yang berbasis pada teori itu dipandang sebagai hasil yang valid.”
Instrumen yang harus memunyai validitas isi adalah instrumen yang berbentuk test yang sering digunakan untuk mengukur prestasi belajar dan mengukur efektivitas pelaksanaan program dan tujuan. Untuk menyusun instrumen prestasi belajar yang memunyai validitas isi, maka instrumen harus disusun berdasarkan materi pelajaran yang telah diajarkan. Sedangkan instrumen yang digunakan untuk mengetahui pelaksanaan program, maka instrumen disusun berdasarkan program yang telah direncanakan. Selanjutnya intrumen yang digunakan untuk mengukur tingkat tercapainya tujuan (efektivitas) maka instrumen harus disusun berdasarkan tujuan yang telah dirumuskan.
Validitas Instrumen
Instrumen dikatakan valid apabila instrumen tersebut dapat dengan tepat mengukur apa yang hendak diukur. Dengan kata lain validitas berkaitan dengan “ketepatan” alat ukur. Dengan instrumen yang valid akan menghasilkan data yang valid pula. Atau dapat juga dikatakan bahwa jika data yang dihasilkan dari sebuah instrumen valid, maka instrumen tersebut juga valid.
Istilah “valid” sangat sukar dicari penggantinya. Ada yang mengganti istilah valid dengan “sahih”, sehingga validitas diganti menjadi kesahihan. Ada pula yang menerjemahkan istilah valid dengan kata “tepat”, walaupun istilah “tepat” belum dapat mencakup semua arti yang tersirat dalam kata valid. Sehingga validitas diganti dengan dengan ketepatan. Istilah lain dari valid adalah “cermat” dan kemudian diterjemahkan dengan istilah “kecermatan”.
Sebagai contoh apabila kita ingin mengetahui berat ssebuah cincin emas, maka kita harus menggunakan timbangan emas agar hasil ukur itu dikatakan valid. Sebuah timbangan beras memang mengukut “berat”, tetapi tidak cukup cermat guna mengukur berat emas. Karena itu timbangan beras tidak valid guna mengukur emas. Demikian pula kita ingin menghitung waktu tempuh yang kita perlukan dari suatu kota ke kota lainnya dengan mengendarai mobil., sebuah jam tangan biasanya valid untuk digunakan. Tetapi jam tangan yang sama tidak cukup valid guna mengukur waktu yang diperlukan seeorang atlet pelari sprint dalam menempuk jarak 100 meter, karena kita memerlukan unit waktu terkecil sampai pada pecahan detik. Validitas instrumen secara garis besar dapat dibedakan menjadi validitas internal dan validitas eksternal.
A. Validitas Internal
Validitas internal ada yang menyebut juga dengan validitas logis (logical validity). Istilah validitas logis mengandung kata “logis” berasal dari kata logika yang berarti penalaran atau rasional. Dengan makna demikian maka validitas logis untuk sebuah instrumen menunjuk pada kondisi sebuah instrumen yang memenuhi syarat valid berdasarkan hasil penalaran atau rasional. Instrumen yang memunyai validitas internal atau rasional telah mencerminkan apa yang diukur. Jadi kriteria validitas instrumen ada di dalam instrumen itu sendiri. Validitas internal ini dibedakan menjadi dua, yaitu validitas dan validitas konstruk.
a. Validitas Konstruksi (Construct Validity)
Validitas konstruk mengacu pada sejauh mana suatu instrumen mengukur konsep dari suatu teori, yaitu menjadi dasar penyusunan instrumen. Definisi atau konsep yang diukur berasal dari teori yang digunakan. Oleh karena itu harus ada pembahasan mengenai teori tentang variabel yang akan diukur yang menjadi dasar penentuan konstruk suatu instrumen. Berdasarkan teori tentang variabel tersebut kemudian dirumuskan definisi konseptual dan definisi operasional dan selanjutnya ditentukan indikator yang akan diukur. Dari indikator tersebut kemudian dijabarkan menjadi butir-butir instrumen, baik dalam bentuk pertanyaan maupun penryataan.
Tanpa ada keterkaitan antara butir instrumen dengan indikator, definisi operasional dan konsep teori tentang variabel yang diukur maka instrumen tersebut dikatakan tidak valid secara konstruk dan tidak bias digunakan untuk mengukur variabel yang diteliti karena data tidak menggambarkan dan mewakili variabel yang diteliti. Untuk menguji validitas konstruksi, dapat digunakan pendapat dari para ahli (judgement experts). Dalam hal ini, setelah instrumen dikonstruksi tentang asspek-aspek yang akan diukur dengan berlandaskan teori tertentu, maka selanjutnya dikonsuktasikan dengan ahli. Para ahli diminta pendapatnya tentang instrumen yang telah disusun itu. Mungkin para ahli akan memberi keputusan: instrumen dapat digunakan tanpa perbaikan, ada perbaikan, dan mungkin diruombak total. Jumlah tenaga ahli yang digunakan minimal tiga orang dan umumnya mereka telah bergelar doktor sesuai dengan lingkup yang diteliti.
Setelah pengujian konstruksi dari para ahli dan berdasarkan pengalaman empiris di lapangan selessai, maka diteruskan dengan uji instrumen. Instrumen tersebut diujicobakan pada sampel dari mana populasi itu diambil. (pengujian pengalaman empiris ditunjukkan pada pengujian validitas eksternal). Jumlah anggota sampel yang digunakan sekitar 30 orang. Setelah data ditabulasikan, maka pengujian validitas konstruksi dilakukan dengan analisis faktor, yaitu dengan mengorelasikan antar skor item instrumen dalam suatu faktor dan mengorelasikan skor faktor dengan skor total.
b. Pengujian Validitas Isi (Content Validity)
Untuk instruen yang berbentuk tes, pengujian validitas isi dapat dilakukan dengan membandingkan antara isi instrumen dengan materi pelajaran yang telah diajarkan. Seorang dosen yang memberi ujian di luar pelajaran yang telah ditetapkan, berarti instrumen ujian tersebut tidak memunyai validitas isi. Untuk instrumen yang akan mengukur efektivitas pelaksanaan program, maka pengujian validitas isi dapat dilakukan dengan membandingkan antara isi instrumen dengan isi atau rancangan yang telah ditetapkan.
Untuk instruen yang berbentuk tes, pengujian validitas isi dapat dilakukan dengan membandingkan antara isi instrumen dengan materi pelajaran yang telah diajarkan. Seorang dosen yang memberi ujian di luar pelajaran yang telah ditetapkan, berarti instrumen ujian tersebut tidak memunyai validitas isi. Untuk instrumen yang akan mengukur efektivitas pelaksanaan program, maka pengujian validitas isi dapat dilakukan dengan membandingkan antara isi instrumen dengan isi atau rancangan yang telah ditetapkan.
Secara teknis pengujian validitas konstruksi dan validitas isi dapat dibantu dengan menggunakan kisi-kisi instrumen atau matrik pengembangan instrumen. Dalam kisi-kisi itu terdapat variabel yang diteliti, indikator sebagai tolak ukur dan nomor butir (item) pertanyaan atau pernyataan yang telah dijabarkan dari indicator. Dengan kisi-kisi intrumen itu maka pengujian validitas dapat dilakukan dengan mudah dan sistematis.
Pada setiap instrumen baik tes maupun nontes terdapat butir-butir (item) pertanyaan atau penyataan. Untuk menguji validitas butir-butir instrumen lebih lanjut, maka setelah dikonsultasikan dengan ahli, selanjutnya diujicobakan, dan dianalisis dengan analisis item atau uji beda. Analisis item dilakukan dengan menghitung korelasi antara skor butir instrumen dengan skor total dan uji beda dilakukan dengan menguji signifikansi perbedaan antara 27% skor kelompok atas dan 27% skor kelompok bawah.
B. Validitas Eksternal
Validitas eksternal ada menyebut dengan validitas empiris. Kalau validitas internal didasarkan pada kriteria yang ada pada instrumen tersebut, maka pada validitas eksternal, kriteria validitas didasarkan pada kriteria yang ada di luar instrumen yaitu berdasarkan fakta empiris atau pengalaman. Kriteria yang digunakan sebagai pembanding instrumen ada dua, yaitu yang sudah tersedia dan belum tersedia akan tetapi terjadi di waktu yang akan datang. Bagi instrumen yang sesuai dengan kriteria yang sudah tersedia atau sudah ada lebih dikenal dengan validitas “kesejajaran”, sedangkan instrumen yang sesuai dengan kriteria yang diramalkan akan terjadi dan dikenal dengan validitas ramalan atau validitas prediksi.
Validitas eksternal instrumen diuji dengan cara membandingkan (untuk mencari kesamaan) antara criteria yang ada pada instrumen dengan faka-fakta empiris yang terjadi di lapangan. Misalnya, instrumen untuk emngukur kinerja sekelompok pegawai, maka criteria kinerja pada instrumen itu dibandingkan dengan catatan-catatan di lapangan (empiris) tentang kinerja pegawai yang baik. Bila terdapat kesamaan antara kriteria dalam instrumen dengan fakta di lapangan, maka dapat dinyatakan instrumen tersebut memunyai validitas eksternal yang tinggi.
Instrumen penelitian yang memunyai validitas eksternal yang tinggi akan mengakibatkan hasil penelitian memunyai validitas eksternal yang tinggi pula. Penelitian memunyai validitas eksternal bila hasil penelitian dapat digeneralisasikan atau diterapkan pada sampel lain dalam populasi yang diteliti. Untuk meningkatkan validitas eksternal instrumen, maka dapat dilakukan dengan memperbesar jumlah sampel.
a. Validitas Kesejajaran
Sebuah instrumen dikatakan memiliki validitas kesejajaran apabila hasilnya sesuai dengan kriteria yang sudah ada, dalam arti memiliki kesejajaran dengan kriteria yang sudah ada. Kriteria yang sudah ada dapat berupa instrumen lain yang mengukur hal yang sama tetapi sudah diakui validitasnya misalnya dengan tes terstandar, namun kriteria dapat juga dengan catatan-catatan di lapangan. Misalnya instrumen untuk mengukur kinerja kelompok pegawai maka kriteria kinerja pada instrumen itu dibandingkan dengan catatan-catatan di lapangan (empiris) tentang kinerja pegawai yang baik. Validitas kesejajaran dapat digunakan untuk menguji validitas instrumen baik berbentuk tes maupun nontes.
b. Validitas Prediksi
Memprediksi artinya memperkirakan/meramal mengenai hal yang akan terjadi pada masa yang akan datang, jadi sekarang belumlah terjadi. Sebuah instrumen dikatakan memiliki validitas prediksi atau validitas ramalan apabila mempunyai kemampuan untuk meramalkkkan apa yang akan terjadi di masa yang akan datang mengenai hal yang sama. Validitas prediktif ini biasanya digunakan untuk menguji validitas instrumen berbentuk tes.
Validitas prediktif diperoleh apabila pengambilan skor kriteria tidak bersamaan dengan pengambilan skor tes. Setelah subjek dikenai tes yang akan dicari validitas prediktifnya, lalu diberikan tenggang waktu tertentu sebelum skor kriteria diambil dari subjek yang sama.
Misalnya, tes masuk perguruan tinggi adalah sebuah tes yang diperkirakan mampu meramalkan keberhasilan peserta tes dalam mengikuti kuliah di masa yang akan datang. Calon yang tersaring berdasarkan hasil tes diharapkan mencerminkan tinggi rendahnya kemampuan mengikuti kuliah. Jika nilai tesnya tinggi tentu menjamin keberhasilan kelak. Sebaliknya, seorang calon dikatakan tidak lulus tes karena memiliki nilai tes rendah sehingga diperkirakan akan tidak mampu mengikuti perkuliahan yang akan datang.
Sebagai alat pembanding validitas prediksi adalah nilai-nilai yang diperoleh setelah peserta tes mengikuti perkuliahan di perguruan tinggi. Jika ternyata siapa memiliki nilai tes lebih tinggi gagal dalam ujian semester I dibandingkan dengan yang dahulu nilai tesnya rendah maka tes masuk yang dimaksud tidak memiliki validitas prediksi. Dengan demikian untuk melihat tingkat validitas prediktif ini skor tes masuk perguruan tinggi dikorelasikan dengan skor hasil ujian semester. Prosedur validasi prediktif memerlukan waktu yang lama dan biaya yang besar karena prosedur ini pada dasarnya bukan pekerjaan yang dianggap selesai setelah sekali melakukan analisis, melainkan berlangsung terus menerus dalam pengembangan tes sebagai predictor yang baik.
Reliabilitas Instrumen
Kata reliabilitas dalam bahasa Indonesia diambil dari kata reliable dalam bahasa Inggris yang memiliki arti dapat dipercaya. Instrumen tes dikatakan dapat dipercaya jika memberikan hasil yang tetap atau ajeg apabila diteskan berkali-kali. Jika kepada siswa diberikan tes yang sama pada waktu yang berlainan, maka setiap siswa akan tetap berada dalam urutan (ranking) yang sama atau ajeg dalam kelompoknya.
Ajeg atau tetap tidak selalu harus sama skornya, skor dapat berubah tetapi mengikuti perubahan secara ajeg. Jika keadaan A mula-mula berada lebih rendah dibandingkan dengan B, maka jika diadakan pengukuran ulang, si A tetap berada lebih rendah dari B. itulah yang dikatakan ajeg atau tetap, yaitu tetap dalam kedudukan siswa di antara anggota kelompok yang lain. Jika dihubungkan dengan validitas maka validitas berhubungan dengan ketepatan sedangkan reliabilitas berhubungan dengan keajegan.
Berdasarkan beragam makna tersebut, dalam bidang pengukuran ada aneka ragam istilah untuk menunjuka pada istilah reliabilitas, yaitu di antaranya ada yang menggunakan istilah konsistensi, keajegan, ketetapan, kestabilan, dan keandalan. Instrumen yang reliabel belum tentu valid. Mistar yang putus di bagian ujungnya, bila digunakan berkali-kali akan menghasilkan data yang sama (reliabel) tetapi selalu tidak valid. Hal ini disebabkan karena mistar tersebut rusak. Reliabiitas instrumen merupakan syarat untuk pengujian validitas instrumen. Oleh karena itu walaupun instrumen yang valid pada umumnya reliabel, tetapi pengujian reliabilitas instrumen perlu dilakukan.
Pengujian reliabilitas instrumen dapat dilakukan secara eksternal maupun internal. Secara eksternal pengujian dapat dilakukan dengan test-retest (stability), equivalent, dan gabungan keduanya. Secara internal reliabilitas instrumen dapat diuji dengan menganalisis konsistensi butir-butir yang ada pada instrumen dengan teknik tertentu.
a. Test-retest
Metode ini dilakukan untuk menghindari penyusunan instrumen dua kali. Dengan menggunakan metode ini, kita hanya menyusun satu perangkat instrumen. Instrumen tersebut diujicobakan pada sekelompok responden, kemudian hasilnya dicatat. Pada kesempatan lain instrumen tersebut diberikan pada kelompok responden yang semua untuk diujicobakan kembali, dan hasil yang kedua juga dicatat. Kemudian kedua hasil tersebut dikorelasikan. Perhitungan dan penafsiran hasil korelasi menggunakan aturan yang sama dengan metode parallel (ekuivalen).
Untuk tes yang banyak mengungkap pengetahuan (ingatan) dan pemahaman, metode ini kurang mengena karena responden masih ingat akan butir-butir soalnya. Oleh karena itu, tenggang waktu antara tes pertama dan tes kedua menjadi permasalahan sendiri. Jika tenggang waktu terlalu dekat, siswa masih banyak yang ingat materi. Sebaliknya, apabila tenggang waktu terlalu lama, maka faktor-faktor ini akan berpengaruh terhadap reliabilitas. Pada umumnya hasil tes yang kedua cenderung lebih baik daripada tes pertama. Hal ini dimungkinkan karena adanya carry over effect. Metode ini pada umumnya juga untuk menguji reliabilitas bentuk tes.
Instrumen penelitian yang reliabilitasnya diuji dengan test-retest dilakukan dengan cara mencobakan instrumen beberapa kali pada responden. Jadi, dalam hal ini instrumennya sama, respondennya sama, dan waktunya yang berbeda. Reliabilitas diukur dari koefisien korelasi antara percobaan pertama dengan yang berikutnya. Bila koefisien positif dan signifikan maka instrumen tersebut sudah dinyatakan reliabel. Pengujian cara ini sering juga disebut stability.
b. Ekuivalen
Instrumen ekuivalen adalah dua buah instrumen yang memunyai kesamaan tujuan, tingkat kesulitan, dan susunan, tetapi butir pertanyaan/pernytaannya berbeda. Sebagai contoh penggunaan metode ini, dua buah tes yang parallel, misalnya tes Bahasa Inggris Seri A yang akan dicari reliabilitasnya dan Seri B diujikan pada sekelompok siswa yang sama, kemudian hasilnya dikorelasikan. Koefisien korelasi dari kedua hasil tes inilah yang menunjukkan koefisien reliabilitas tes Seri A. untuk menentukan apakah instrumen tersebut reliabel atau tidak, koefisien korelasi hasil perhitungan atau r hitung (rh) dikonsultasikan dengan r table dalam table korelasi product moment. Apabila r hitung lebih besar atau sama dengan r table (rh≥rt) diartikan ada korelasi yang signifikan, instrumen dianggap reliabel. Sebaliknya apa bila r hitung lebih kecil dari r table (rh<rt) diartikan tidak ada korelasi yang signifikan. Kesimpulan instrumen dianggap tidak reliabel.
Instrumen yang ekuivalen adalah pertanyaan yang secara bahasa berbeda tetapi maknanya sama. Sebagai contoh: Berapa tahun pengalaman kerja Anda di lembaga ini? Pertanyaan tersebut dapat ekuivalen dengan pertanyaan berikut. Tahun berapa Anda mulai bekerja di lembaga ini?
c. Gabungan
Pengujian reliabilitas ini dilakukan dengan cara mencobakan dua instrumen yang ekuivalen itu beberapa kali ke responden yang sama. Jadi, cara ini merupakan gabungan pertama dan kedua. Reliabilitas instrumen dilakukan dengan mengorelasikan dua instrumen, setelah itu dikorelasikan pada pengujian kedua dan selanjutnya dikorelasikan secara silang. Jika dengan dua kali pengujian dalam waktu berbeda, akan dapat dianalisis enam koefisien reliabilitas. Bila keenam koefisien korelasi itu semuanya positif dan signifikan, maka dapat dinyatakan bahwa instrumen tersebut reliabel.
d. Interenal Consistency
Pengujian reliabilitas dengan internal consistency dilakukan dengan cara mencobakan instrumen sekali saja, kemudian data yang diperoleh dianalisis dengan teknik tertentu. Hasil analisis dapat digunakan untuk memprediksi reliabilitas instrumen. Pengujian instrumen dapat dilakukan dengan teknik belah dua dari Spearman Brown (Split Half), KR 20, KR 21 dan Anova Hoyt.
Sumber Pustaka
Widoyoko, Eko Putro. 2012. Teknik Penyusunan Instrumen. Yogyakarta: Putaka Pelajar.
Sugiyono. 2008. Metode Penelitian Kuantitatif Kualitatif dan R&D. Bandung: Alfabeta.