Cari disini / searching.....

Selasa, 30 Desember 2014

VALIDITAS DAN RELIABILITAS

VALIDITAS DAN RELIABILITAS
Sebagaimana telah disinggung sebelumnya, instrument sebelum digunakan dalam kegiatan pengumpulan data harus diuji cobakan terlebih dahulu. Tujuan daru kegiatan uji coba adalah untuk memastikan bahwa instrument telah benar-benar siap dan layak untuk digunakan dalam kegiatan pengumpulan data. kelayakan inilah yang nantinya akan menghasilkan data yang cukup berbobot untuk selanjutnya dianalisis dan mendapatkan kesimpulan penelitian. Karena kesimpulan yang baik berasal dari data yang baik pula.
Terkait dengan uji coba instrument, ada dua hal yang perlu dilakukan, yaitu: (1) analisis instrument dan (2) analisis butir instrument. Analisis instrument meliputi Uji Validitas dan Uji Reliabilitas, sedangkan analisis butir instrument meliputi Uji Tingkat Kesukaran, Uji Daya Pembeda, dan Uji Berfungsinya Pengecoh. Ada beberapa ahli yang mengatakan bahwa, analisis atau uji yang dilakukan pada instrument setidaknya adalah melakukan Uji Validitas dan Uji Reliabilitas. Salah satunya adalah Ibnu Hadjar (1996:160), kualitas instrumen ditentukan oleh dua kriteria utama: validitas dan reliabilitas. Oleh karena itu pada buku ini hanya akan disajikan uji Validitas dan Uji Reliabilitas saja. Sedangkan analisis butir instrument (Tingkat Kesukaran, Daya Pembeda, dan Berfungsinya Pengecoh) akan di bahas pada mata kuliah Evaluasi Pembelajaran.
A.    Validitas
1.      Definisi Validitas  
Nunnaly dan Allen dan Yen dalam Budiyono (2003: 55) mengatakan bahwa “Instrumen disebut valid jika dapat mengukur apa yang seharusnya diukur”. Guilford dalam Budiyono (2003: 56) mendefinisikan validitas dengan mengaitkannya dengan skor tes, ia mengatakan “Istilah validitas menunjukkan kepada sejauh mana skor tes dapat memprediksi criteria yang telah ditentukan”. Sumadi Suryabrata (2008:60) mengemukakan bahwa “validitas instrumen didefinisikan sebagai sejauh mana instrumen itu merekam/mengukur apa yang dimaksudkan untuk direkam/diukur”. Selanjutnya Sutrisno Hadi (1991: 1) berpendapat bahwa “Kesahihan atau validitas dibatasi sebagai tingkat kemampuan suatu instrumen untuk mengungkapkan sesuatu yang menjadi sasaran pokok pengukuran yang dilakukan dengan instrument tersebut”. Suatu instrumen  dinyatakan sahih jika instrument itu mengukur apa saja yang hendak diukurnya, mampu mengungkapkan apa saja yang ingin diungkapkan.
Dari beberapa pendapat di atas, dapat disimpulkan bahwa instrument dikatakan valid jika instrument tersebut dapat mengungkapkan apa yang seharusnya atau hendak diukur. Penentuan apa yang hendak diukur ini harus disesuaikan dengan definisi operasional dari variabel yang telah diidentifikasi, sehingga criteria-kriteria yang ada pada definisi operasional dapat teridentifikasi dan terukur dengan baik.
2.      Jenis-jenis Validitas
Jenis-jenis validitas berkembang dari waktu ke waktu. Sugiyono mengatakan bahwa ada tiga jenis pengujian validitas instrument.
a)      Validitas Isi
Standards dalam Budiyono (2003: 57) dikatakan bahwa “Validitas isi bertujuan untuk menentukan apakah yang ditampakkan secara individual dapat pula ditampakkan pada keseluruhan situasi”. Selanjutnya Budiyono (2003: 58) mengatakan bahwa “Suatu instrument dikatakan valid menurut validitas isi apabila isi instrument tersebut telah merupakan sampel yang representative dari keseluruhan isi hal yang akan diukur”. Pada kasus ini validitas tidak dapat ditentukan dengan mengkorelasikannya dengan suatu criteria, sebab tes itu sendiri adalah criteria dari suatu kinerja.
Nunnaly dalam Budiyono (2003: 58) mengatakan bahwa “Ada dua standar utama untuk meyakinkan adanya validitas isi, yaitu, (1) koleksi butir-butir soal yang representative terhadap semestanya, dan (2) metode penyusunan tes yang masuk akal (sensible)”. Dalam tes prestasi, untuk meyakinkan bahwa butir-butir soal telah mewakili tujuan pembelajaran, diperlukan outline rinci, atau blue-print (kisi-kisi) yang memuat pertanyaan atau masalah apa yang harus diujikan. Senada dengan hal tersebut apa yang disampaikan oleh Sumarna Surapranata (2006: 51) menyatakan bahwa “Validitas isi (content validity) sering pula dinamakan validitas kurikulum yang mengandung arti bahwa suatu alat ukur dipandang valid apabila sesuai dengan isi kurikulum yang hendak diukur”. Untuk menyusun instrumen prestasi belajar yang mempunyai validitas isi, maka instrumen harus disusun berdasarkan materi pelajaran yang telah diajarkan. Salah satu caranya adalah dengan melihat item-item soal yang membentuk tes tersebut. Untuk instrumen yang berbentuk tes, maka pengujian validitas isi dapat dilakukan dengan membandingkan antara isi instrumen dengan materi pelajaran yang telah diajarkan. Jika dosen/ guru memberikan ujian di luar pelajaran yang telah ditetapkan, berarti instrumen ujian tersebut tidak mempunyai validitas isi.sebagai kesimoulannya, jika keseluruhan item soal nampak mengukur apa yang seharusnya tes itu digunakan, tidak diragukan lagi bahwa validitas isi sudah terpenuhi.
Dari beberapa hal yang telah dikemukakan di atas, secara teknis, pengujian validitas isi dapat dibantu dengan menggunakan kisi-kisi instrumen. Dalam kisi-kisi itu terdapat variabel yang diteliti, indikator sebagai tolok ukur, dan nomor butir (item) pertanyaan atau pernyataan yang telah dijabarkan dari indikator. Dengan kisi-kisi instrumen itu, maka pengujian validitas dapat dilakukan dengan mudah dan sistematis. Oleh karena itu, penilaian terhadap kisi-kisi merupakan hal yang paling penting untuk menilai sejauh mana validitas isi terpenuhi. Oleh karena itu agar tes mempunyai validitas isi, harus diperhatikan yang berikut ini (Budiyono, 2003: 58).
               i.            Tes harus dapat mengukur sampai seberapa jauh tujuan pembelajaran tercapai ditinjau dari materi yang diajarkan.
             ii.            Penekanan materi yang akan diujikan seimbang dengan penekanan materi yang diajarkan.
           iii.            Materi pelajaran untuk menjawab soal-soal ujian sudah dipelajari dan dapat dipahami oleh tester.

Sebagian ahli tes berpendapat bahwa tidak ada satupun pendekatan statistik yang dapat digunakan untuk menentukan validitas isi suatu tes. Menurut Guion dalam Sumarna Surapranata (2006: 53), “Validitas isi hanya dapat dilakukan berdasarkan judgement para ahli. Penilaian oleh Expert Judgemnet (penilaian yang dilakukan oleh para pakar) dapat dilakukan dengan langkah sebagai berikut.
i.          Menilai apakah kisi-kisi yang dibuat oleh pengembang tes telah menunjukkan bahwa klasifikasi kisi-kisi telah mewakili isi (substansi) yang akan diukur.
ii.        Para penilai akan menilai apakah masing-masing butir tes yang telah disusun telah cocok atau relevan dengan klasifikasi kisi-kisi yang telah ditentukan. Cara ini sering disebut relevance ratings.
iii.      Penilai akan diberikan suatu rentangan skala tertentu (misalnya 1 – 10, dimana 1 menunjukan sanga-sangat tidak relevan dan 10 menunjukkan sangat-sangat relevan) untuk melihat relevansi antara butir tes dengan kisi-kisi yang telah disusun.
iv.      Penilai kemudian memberikan suatu rating (rataan nilai dari para penilai) untuk masing-masing klasifikasi kisi-kisi dan masing-masing butir soal.
v.        Mengambil keputusan, apakah memodifikasi kisi-kisi atau butir soal, atau bahkan keduanya.
Berapa jumlah ahli yang sebaiknya digunakan dalam penilaian validitas isi? Penulis berpendapat, bahwa jumlah ahli yang dibutuhkan setidaknya ada 3 orang (usahakan berjumlah ganjil). Pertimbangannya, jika ada 1 orang ahli mengatakan bahwa item soal tidak valid sedangkan 1 orang ahli mengatakan item tersebut adalah valid, maka orang ketigalah yang akan menjadi penentunya.

Contoh kegiatan validasi isi
KISI-KISI TES PRESTASI BELAJAR
Bidang Studi
:
Matematika

Standar Kompetensi
:
Menggunakan pecahan dalam pemecahan masalah

Kompetensi Dasar
:
1.      Mengubah pecahan ke bentuk persen dan desimal serta sebaliknya
2.      Menjumlahkan dan  mengurangkan berbagai bentuk pecahan
3.      Mengalikan dan membagi berbagai bentuk pecahan
4.      Menggunakan pecahan dalam masalah perbandingan

Materi
C1
C2
C3
C4
C5
C6
No Soal
Pengenalan Pecahan





1
Menyederhanakn pecahan





2
Pecahan yang senilai





3, 24
Mengubah pecahan





20, 23
Mengurutkan Pecahan





21, 22
Penjumlahan pecahan





5, 6, 7, 25
Pengurangan pecahan





4, 11, 29
Perkalian Pecahan





8, 10, 15, 19, 28
Pembagian Pecahan





12,14, 17, 27
Menggunakan pecahan dalam masalah perbandingan





9, 13





16





18





26





30, 33





31, 32, 34





35

UJI VALIDITAS INSTRUMEN TES PRESTASI BELAJAR MATEMATIKA
Petunjuk :
Berilah tanda cek ( √ ) untuk kolom yang memenuhi kriteria, tanda silang ( × ) yang tidak memenuhi kriteria, dan tanda ( R ) untuk kolom yang harus direvisi.
Validator : _____________________

Kriteria Validiatas Isi
Butir soal
1
2
3
4
5
Dst
A.      Materi

Item soal sesuai dengan SK dan KD






Item pertanyaan telah sesuai dengan kompetensi (urgensi, kontinyuitas, dan keterpakaian sehari-hari)






Item soal telah mengacu pada ranah kognitif

1.       C1 (mengetahui dan mengingat)






2.       C2 (Pemahaman)






3.       C3 (Aplikasi, penerapan ide atau rumus)






4.       C4 (Analisis/ kemampuan menguraikan)






5.       C5 (Sintesis)






6.       C6 (evaluasi/ menilai)






Tiap item soal hanya memiliki satu jawaban benar






Item soal sudah dibelajarkan kepada siswa sebelumnya.






Butir soal telah mampu dipahami oleh siswa






B.      Konstruksi

Pokok soal dirumuskan dengan singkat, jelas, dan tegas.






Item soal tidak memberikan petunjuk yang mengarahkan kepada kunci jawaban.






Item soal tidak memerlukan pengetahuan lain dalam menjawabnya






Pilihan jawaban disusun secara logis






Gambar, grafik, tabel disajikan dengan jelas dan sesuai dengan fungsinya.






Panjang pilihan jawaban relatif sama






Pilihan jawaban disusun berdasarkan urutan besar kecilnya angka atau kronologisnya.






Item soal tidak berdasarkan atau bergantung pada soal sebelumnya.






C.      Bahasa

Item soal tidak mengandung pertanyaan yang ambigu (makna ganda)






Item soal menggunakan kaidah Bahasa Indonesia yang baik dan benar (sesuai EYD)






Tidak menggunakan bahasa yang bersifat kedaerahan






Tidak menggunakan bahasa atau kalimat yang bersifat negatif







Catatan validator:
1.      _____________________________________________________
2.      _____________________________________________________
3.      _____________________________________________________
4.      _____________________________________________________
Validator

(              )
b)      Validitas Kriteria
Allen dan Yen dalam Budiyono (2003: 61) mengatakan bahwa “Validitas berdasarkan criteria digunakan ketika skor tes dapat dihubungkan dengan sebuah criteria tertentu”. Sedangkan APA (American Psychological Assosiation) menyebutkan “Validitas berdasarkan criteria bertujuan untuk memprediksi keadaan masa depan individual atau keadaannya sekarang berdasar beberapa variabel yang berbeda dengan tes yang ditempuhnya”. Oleh karena itu, dalam validitas berdasarkan criteria dapat dipandang ada dua buah instrument, instrument yang satu dipandang sebagai kriterium dan instrument yang satunya lagi dipandang sebagai instrument yang akan diukur/ ditentukan validitasnya. Maka Budiyono (2003: 61) mengatakan bahwa “Validitas berdasarkan criteria adalah validitas yang ditinjau dari segi hubungan dengan alat pengukur lain yang dipandang sebagai criteria untuk menentukan tinggi rendahnya validtas alat ukur yang sedang dipersoalkan”.
Pada validitas criteria sebenarnya lebih ditekankan pada persoalan criteria tersebut, bukan pada instrument yang sedang dipersoalkan. Kalau pada validitas isi tidak ada satupun pendekatan statistic yang digunakan, namun pada validitas criteria ini digunakan rumus korelasi sebagai berikut.
Keterangan:
rxy      : indeks konsistensi internal untuk butir ke-i
n        : cacah subyek yang dikenai tes (instrumen)
X       : skor untuk butir ke-i
Y        : total skor 
Acuan penafsiran validitas oleh Jacobs dan Chasse (1992: 35) sebagai berikut.
Besar nilai r
Kategori/ tafsiran
0,80 – 1,00
Sangat tinggi
0,60 – 0,79
Tinggi
0,40 – 0,59
Cukup
0,20 – 0,39
Rendah
0,0 – 0,19
Sangat rendah (tak berkorelasi)
Ciri-ciri yang harus dimiliki oleh suatu ukuran criteria adalah, relevansi, reliable, dan bebas dari bias.
1.      Relevansi
Peneliti harus dapat memberikan gambaran yang tepat dan memberikan jaminan bahwa criteria yang dipilih, benar-benar menggambarkan cirri-ciri yang tepat dari tingkah laku yang diselidiki.
2.      Reliabel
Ukuran harus bersifat reliable (ajeg) bagi atribut tersebut. Ajeg dalam arti memiliki sifat yang tetap dari waktu ke watu dan dari situasi satu ke situasi yang lain. Apabila criteria tidak konsisten, maka tidak ada gunanya criteria tersebut digunakan.
3.      Bebas dari bias
Pemberian skor pada criteria yang ada tidak dipengaruhi oleh factor-faktor selain karakteristik sebenarnya pada criteria tersebut.
Validitas criteria dikelompokkan menjadi dua jenis, yaitu validitas prediktif dan validitas konuren.
1.      Validitas prediktif
Skor tes yang dipakai untuk memprediksi behavior tidak tersedia ketika tes dilakukan, tetapi tersedia di kemudian hari. Jadi, criteria tidak tersedia pada saat tes berlangsung namun kriterianya baru dapat ditentukan setelah selang waktu tertentu.
2.      Validitas konkuren
Kriteria yang dipakai untuk mengkorelasikan hasil tes telah ada pada saat tes berlangsung. Selanjutnya instrument yang telah ada tersebut (kriterium) diujikan pada sekelompok siswa yang sama pada saat yang beramaan dengan instrument yang dipersoalkan (akan dihitung validitasnya). Selanjutnya masing-masing skor dari kedua instrumen tes tersebut dikorelasikan.
Persoalan mengenai validitas berdasarkan criteria ini cukup menarik untuk didiskusikan lebih lanjut. Mengingat banyak sekali mahasiswa yang dalam penentuan validitas instrument penelitiannya menggunakan jenis validitas ini. Sebagai contoh disajikan studi kasus sebagai berikut.
Seorang peneliti ingin melakukan penelitian eksperimentasi suatu metode pembelajaran tertentu pada materi integral. Kebetulan materi integral muncul pada kelas XII semester II. Selanjutnya penelitia membuat instrument berupa tes prestasi materi integral. Untuk mengukur validitas instrumennya, digunakan validitas berdasarkan criteria (validitas ekternal dengan angka kasar). Peneliti menggunakan nilai rapor kelas XII semester I sebagai kriterium. Bagaimana pendapat Anda?
Hal-hal yang dapat didiskusikan adalah sebagai barikut:
1.      Apakah kriterium yang dipakai telah memenuhi syarat criteria yang telah ditetapkan?
2.      Jenis validitas criteria yang bagaimanakah yang digunakan peneliti? Prediktif atau konkuren?
Ketika pertanyaan ini diajukan penulis pada saat persidangan skripsi maupun bimbingan, banyak mahasiswa yang tidak mampu menjelaskannya dengan baik. Pada akhirnya penulis berpendapat, sangat salah jika digunakan validitas berdasarkan criteria berdasarkan keadaan di atas, kedua pertanyaan tadi tidak akan dapat dijelaskan dan terjawab. Oleh karena itu dalam kasus tersebut, sebaiknya tidak digunakan validitas berdasarkan criteria.
c)      Validitas Konstruk
Validitas konstruk merupakan validitas yang paling akhir dikembangkan oleh orang sekaligus juga merupakan validitas yang terus dapat dikembangkan sejalan dengan berkembangnya definisi dari variabel yang ingin diketahui validitasnya. Hal ini terjadi karena suatu definisi operasional dari suatu variabel merupakan konstruksi dari berbagai aspek atau factor yang terus berkembang pula. Budiyono (2003: 63) menyatakan bahwa “Validitas konstruk suatu tes adalah sejauh mana tes tersebut mengukur konstruk atau trait (kemampuan) yang dimaksudkan untuk diukur”. Cronbach dalam Budiyono (2003: 58) mengatakan bahwa “the end goal of validation is explanation and understanding, sehingga ia sampai pada kesimpulan bahwa pada dasarnya validitas adalah validitas konstruk (the profession is coming around to the view that all validation is construct validation)”.
 Apa yang disebut konstruk? Budiyono (2003: 63) menjelaskan bahwa “Pada tingkatan tertentu, sebuah variabel adalah abstrak. Untuk hal yang demikian, peneliti harus mendefinisikan variabel sehingga dapat dioperasionalkan sehingga menjadi sesuatu yang konkrit. Dari definisi tersebut, tentunya dibangun atau dikonstruksi dari berbagai aspek atau factor yang ada. Dengan demikian definisi dari suatu variabel dipandang sebagai suatu konstruk”.
Validitas konstruk merupakan salah satu tipe validitas internal rasional suatu instrumen yang menunjukkan sejauh mana instrumen tersebut mengungkap suatu trait atau konstruk teoretik yang hendak diukurnya. Dalam hal ini konstruk merupakan kerangka dari suatu konsep. Pengertian konstruk ini bersifat terpendam dan abstrak sehingga berkaitan dengan banyak indikator perilaku empiris yang menuntut adanya uji analisis seperti analisis faktor. 
Menurut Suryabrata (2000), validitas konstruk (construct validity) menyatakan sejauh mana skor-skor hasil pengukuran dengan suatu instrumen itu merefleksikan konstruk teoretik yang mendasari penyusunan instrumen tersebut.
Sutrisno Hadi (2001) menyamakan construct validity dengan logical validity atau validity by definition. Suatu instrumen non tes mempunyai validitas konstruk, jika instrumen tersebut dapat digunakan untuk mengukur gejala sesuai dengan yang didefinisikan. Misalnya untuk mengukur minat terhadap matematika, perlu didefinisikan terlebih dahulu apa itu minat terhadap matematika, demikian juga untuk mengukur kemandirian belajar siswa maka perlu terlebih dahulu didefinisikan mengenai apa itu kemandirian belajar  siswa. Setelah konsep atau defenisi itu diperoleh selanjutnya disiapkan instrumen yang digunakan untuk mengukur minat terhadap matematika sesuai definisi.
Dalam hal ini, untuk melahirkan definisi tentu saja diperlukan teori-teori. Sutrisno Hadi menyatakan bahwa jika memang bangunan teorinya sudah benar, maka hasil pengukuran dengan alat pengukur yang berbasis pada teori itu sudah dipandang sebagai hasil yang valid. Namun demikian, walaupun secara teoritis dapat dikatakan sudah valid, pengujian secara empiris terhadap suatu instrumen non-tes tetap diperlukan untuk mengungkap seberapa jauh setiap variabel yang akan diukur dapat dijelaskan oleh setiap dimensi dalam instrumen yang telah disusun. 
Sebagaimana telah dikemukakan di atas, analisis faktor merupakan salah satu prosedur yang dapat digunakan untuk menguji validitas konstruk suatu instrumen non-tes seperti angket. Suryanto (1988) mengemukakan bahwa analisis faktor merupakan kajian tentang kesaling tergantungan antara variabel-variabel, dengan tujuan untuk menemukan himpunan variabel-variabel baru yang lebih sedikit jumlahnya daripada variabel semula dan yang menunjukkan mana di antara variabel-variabel semula itu sebagai faktor-faktor persekutuan. Dengan demikian, dapat diartikan bahwa analisis faktor digunakan untuk mereduksi data, yakni proses untuk meringkas sejumlah variabel menjadi lebih sedikit dan menamakannya sebagai faktor.
Langkah-langkah yang dilakukan untuk melakukan uji validitas konstruk adalah sebagai berikut.
1.      Berikan definisi operasional dari variabel yang akan diteliti.
2.      Pebahlah definisi tersebut menjadi beberapa factor. Factor-faktor tersebut kemudian dibagi menjadi beberapa indicator. Dari indicator ituah yang nantinya akan disusun sejumlah pertanyaan.
3.      Gunakan penilaian expert judgement atas seperangkat instrument yang telah dibuat untuk mengetahui apakah aspek dan indicator benar-benar telah mencerminkan konstruk dari variabel.
4.      Lakukan analisis factor, dengan mengkorelasikan skor-skor antar factor dan skor factor dengan skor total.
Contoh. Misalnya suatu definisi dikonstruksikan oleh 3 buah factor. Sehingga korelasi skor-skor antar factor dilakukan sebagai berikut:
a)      Korelasi factor 1 dengan factor 2
b)      Korelasi factor 1 dengan factor 3
c)      Korelasi factor 2 dengan factor 3
Sesudah itu dapat dicari korelasi skor factor dengan skor totalnya.
a)      Korelasi julah skor factor 1 dengan sor total
b)      Korelasi jumlah skor factor 2 dengan skor total
c)      Korelasi jumlah skor factor 3 dengan skor total.
5.      Ambil kesimpulan.

Contoh analisis antar factor adalah sebagai berikut.
Korelasi skor antar factor
Dengan menggunakan rumus korelasi Product moment diperolah rxy= 0,82 (korelasi sangat tinggi)
Diperolah rxy= 0,91 (korelasi sangat tinggi)
Diperolah rxy= 0,72 (korelasi tinggi)
Korelasi skor factor dengan skor total
Diperoleh rxy = 0,88 (koreasi sangat tinggi)
 Diperoleh rxy = 0,95 (koreasi sangat tinggi)
Diperoleh rxy = 0,79 (koreasi tinggi)

Dari contoh di atas, maka dapat dikatakan bahwa instrument telah memenuhi validitas berdasarkan konstruk.

B.     Konsistensi Internal
Sebuah instrument tentu terdiri dari sejumlah butir-butir instrument. Kesemua butir itu harus mengukur hal yang sama dan menunjukkan kecenderungan yang sama. Oleh karena itu harus ada korelasi positif antara skor masing-masing butir tersebut dengan skor keseluruhan butir. Oleh karena itu indeks konsistensi internal ini lebih menunjukkan korelasi skor butir-butir tersebut dengan skor totalnya. Untuk menghitung konsistensi internal butir ke-i digunakan rumus Karl Pearson sebagai berikut.

Keterangan:
rxy         : indeks konsistensi internal untuk butir ke-i
n          : cacah subyek yang dikenai tes (instrumen)
X          : skor untuk butir ke-i
Y          : total skor

Indeks konsistensi internal yang biasa dipakai dalam penelitian adalah harus > 0,3. Jika indeks konsistensi internalnya kurang dari 0,3 maka butir soal tersebut harus dibuang.
Konsistensi internal sering pula disebut sebagai daya pembeda. Pada tes prestasi, maka butir dengan indeks konsistensi internal tinggi menunjukkan bahwa butir soal dapat membedakan antara siswa pandai dan kurang pandai. Pada angket, tidak dikenal adanya daya pembeda. Oleh karena itu pada analisis butir angket dapat menggunakan analisis konsistensi internal ini.

Contoh.

C.    Reliabilitas
1.      Definisi Reliabilitas Tes
Reabilitas tes adalah tingkat keajegan (konsitensi) suatu tes, yakni sejauh mana suatu tes dapat dipercaya untuk menghasilkan skor yang ajeg, relatif tidak berubah walaupun diteskan pada situasi yang berbeda-beda. Reliabilitas suatu tes adalah taraf sampai dimana suatu tes mampu menunjukkan konsisten hasil pengukurannya yang diperlihatkan dalam taraf ketetapan dan ketelitian hasil.  Reliabel tes berhubungan dengan ketetapan hasil tes. 
Pengertian Reliabilitas adalah serangkaian pengukuran atau serangkaian alat ukur yang memiliki konsistensi bila pengukuran yang dilakukan dengan alat ukur itu dilakukan secara berulang. Kondisi itu ditengarai dengan konsistensi hasil dari penggunaan alat ukur yang sama yang dilakukan secara berulang dan memberikan hasil yang relatif sama dan tidak melanggar kelaziman. Untuk pengukuran subjektif, penilaian yang dilakukan oleh minimal dua orang bisa memberikan hasil yang relatif sama (reliabilitas antar penilai).
Dalam kajian teoritis, reliabilitas adalah sejauh mana pengukuran dari suatu uji coba yang dilakukan tetap memiliki hasil yang sama meskipun dilakukan secara berulang-ulang terhadap subjek dan dalam kondisi yang sama. Instrumen alat ukur dianggap bisa diandalkan apabila memberikan hasil yang konsisten untuk pengukuran yang sama dan tidak bisa diandalkan bila pengukuran yang dilakukan secara berulang-ulang itu memberikan hasil yang relatif tidak sama. Pengujian reliabilitas instrumen untuk memperoleh hasil yang reliabel bisa dilakukan dengan berbagai metode statistik.
Pada umumnya tidak pernah dapat ditemukan suatu instrument yang memiliki reliabilitas sempurna, artinya setiap kali instrument tersebut digunakan dalam proses pengukuran terhadap subjek yang sama biasanya diperoleh hasil yang berbeda. Hal ini terjadi karena adanya kesalahan pada instrument itu sendiri atau pada subjek pengguna instrument itu sendiri. Dengan demikian, sebuah instrument mempunyai reliabilitas yang tinggi apabila derajat kesalahannya kecil. Dalam suatu penelitian, biasanya dipersyaratkan adanya batas minimal indeks reliabilitas yang harus dipenuhi oleh instrument penelitian. Batas minimal indeks reliabilitas instrument yang biasanya digunakan dalam suatu penelitian adalah 0,75. Hal ini berarti, instrument tersebut sudah cukup baik jika digunakan dalam proses pengukuran.
Lebih lanjut indeks reliabilitas dapat dipilah-pilah sebagai berikut.
Kriteria reliabilitas:
0,00 < r11 < 0,20          reliabilitas sangat rendah
0,20 < r11 < 0,40          reliabilitas rendah
0,40 < r11 < 0,60          reliabilitas cukup
0,60 < r11 < 0,80          reliabilitas tinggi
0,80 < r11 < 1,00          reliabilitas sangat tinggi
(Suharsimi Arikunto, 1998: 71)

2.      Faktor-faktor yang memppengaruhi indeks reliabilitas.
Budiyono (2003: 72) menjelaskan ada beberapa factor yang mempengaruhi indeks reliabilitas dari instrument, antara lain sebagai berikut.
a.       Panjang tes. Pada umumnya semakin panjang tes (cacah butir tes semakin banyak) makin tinggi reliabilitasnya. Hal ini disebabkan tes dengan cacah butir yang banyak akan memuat cukup banyak tingkah laku yang diukur dan skornya tidak dipengaruhi oleh factor tebakan.
b.      Penyebaran skor. Indeks reliabilitas dipengaruhi oleh penyebaran skor. Makin lebar penyebaran skor makin tinggi estimasi reliabilitasnya. Hal ini disebabkan koefisien reliabilitas akan semakin tinggi apabila individu-individu cenderung tetap pada kedudukan relatifnya terhadap kelompoknya.
c.       Tingkat kesukaran tes. Tes yang terlalu sukar atau terlalu mudah cenderung menurunkan indeks reliabilitasnya. Hal ini disebabkan tes yang terlalu sukar atau terlalu udah menghasilkan sebaran yang terbatas dan terkumpul di ujung bawah atau ujung atas.
d.      Objekstivitas. Objektivitas suatu tes menunjukkan seberapa jauh dua orang yang mempunyai kemampuan sama mendapatkan hasil yang sama.dalam hal ini skor yang diperoleh oleh subjek yang dikenai tes tidak dipengaruhi oleh keputusan dan perasaan orang yang member skor. Tes yang objektivitasnya tinggi cenderung mempunyai indeks reliabilitas yang tinggi pula

3.      Cara Pengukuran Reliabilitas
Pendekatan yang digunakan untuk mengestimasi indkes reliabilitas instrument dapat dikelompokkan menjadi tiga golongan besar, yaitu (a) metode satu kali tes, (b) metode tes ulang, dan (c) metode bentuk sejajar.

a.       Metode satu kali tes
Metode ini dilakukan oleh peneliti dengan hanya melakukan pengukuran terhadap sekelompok subjek satu kali saja. Artinya, tes dibagikan kepada subjek penelitian, selanjutnya subjek diminta untuk mengerjakan, dan akhirnya hasil pekerjaan tersebut dianalisis untuk diukur indkes reliabilitasnya.
Metode yang banyak dipakai adalah Teknik Sperman-Brown, Teknik Flanagan, Teknik Rulon, Teknik Kuder-Richardson, dan Teknik Alpha Cronbach.

Teknik Kuder Richardson
Rumus Kuder-Richardson juga biasanya disebut sebagai rumus KR. Terdapat dua macam rumus KR, yaitu KR-20 dan KR-21.

Rumus KR-20

Keterangan:

       : indeks reliabilitas soal
n          : banyaknya butir instrument
pi         : proporsi banyaknya subjek yang menjawab benar pada butir ke-i
qi            : 1 - pi
       : variansi total

Contoh.


Dari contoh di atas, indeks reliabilitasnya adalah 0,803. Sehingga terkategorikan sebagai instrument dengan reliabilitas tinggi.

Rumus KR-21


Keterangan:

       : indeks reliabilitas soal
n          : banyaknya butir instrument
R          : Rerata Total
       : variansi total






Contoh.


Pada perhitungan dengan menggunakan KR-20 maupun KR-21 biasanya menghasilkan indeks reliabilitas yang tidak jauh berbeda.
Pada Rumus KR-20 ini memuat proporsi banyak subjek yang menjawab benar untuk suatu butir tertentu. Sehingga Rumus KR-20 sangat baik jika diterapkan pada uji reliabilitas tes prestasi. Karena pada tes prestasi, skor benar-salah untuk tiap butir dapat ditentukan. Namun pada angket bisa saja akan sulit diterapkan. Pada umumnya jawaban responden untuk menjawab butir soal angket akan bernilai benar semua. Mengingat pada angket, skor yang ditetapkan berupa skala. Sehingga skor benar-salahnya tidak dapat ditentukan. Dengan demikian, proporsi benar pada butir tertentu tidak dapat ditentukan.
Oleh karena itu, pada angket, penulis tidak menganjurkan untuk menggunakan rumus KR-20. Kecuali angket dengan skala Gutterman yang hanya memiliki 2 pilihan jawaban (benar-salah, setuju-tidak setuju, dst).

Teknik Alpha Cronbach
Rumus Alpha Cronbach adalah sebagai berikut.
       : indeks reliabilitas soal
n          : banyaknya butir instrument
       : variansi butir ke-i
       : variansi total

Contoh.
1.      Perhitungan indeks reliabilitas pada tes prestasi belajar.


Contoh.
2.      Perhitungan indeks reliabilitas pada nagket dengan skala 1 – 4.
Berbeda dengan KR-20 dan KR-21, rumus Alpha Cronbach ini dapat diterapkan pada tes dan angket sekaligus.

b.      Metode tes ulang
Pada metode ini dilakukan pengukuran kepada sekelompok subjek dua kali dengan instrument yang sama dalam kurun waktu yang hampir bersamaan. Indeks reliabilitasnya dihitung dengan mencari koefisien korelasi antara hasil pengukuran pertama dan kedua. Koefisien korelasi dengan menggunakan Rumus Karl Pearson. Koefisien yang diperoleh sekaligus menjadi indkes reliabilitas.

c.       Metode bentuk sejajar

Pada metode ini dibuat dua instrument yang setara (sejajar). Selanjutnya kedua instrument tersebut diujikan pada sekelompok subjek yang sama pada waktu yang hampir bersamaan. Selanjutnya, sama dengan metode tes ulang, indeks reliabilitas dihitung dengan mencari koefisien orelasi antara hasil pertama dengan hasil kedua.

1 komentar:

  1. Video Tutorial Uji Validitas dan Reliabilitas STATA 16 Lengkap
    (Dilengkapi File Materi Dan Software STATA 16)
    Merupakan Panduan Yang Lengkap Dan Detail
    Klik Link Dibawah Untuk Mendapatkannya
    https://bit.ly/UjiSTATA

    BalasHapus