VALIDITAS DAN RELIABILITAS
Sebagaimana
telah disinggung sebelumnya, instrument sebelum digunakan dalam kegiatan
pengumpulan data harus diuji cobakan terlebih dahulu. Tujuan daru kegiatan uji
coba adalah untuk memastikan bahwa instrument telah benar-benar siap dan layak
untuk digunakan dalam kegiatan pengumpulan data. kelayakan inilah yang nantinya
akan menghasilkan data yang cukup berbobot untuk selanjutnya dianalisis dan
mendapatkan kesimpulan penelitian. Karena kesimpulan yang baik berasal dari
data yang baik pula.
Terkait dengan
uji coba instrument, ada dua hal yang perlu dilakukan, yaitu: (1) analisis
instrument dan (2) analisis butir instrument. Analisis instrument meliputi Uji
Validitas dan Uji Reliabilitas, sedangkan analisis butir instrument meliputi
Uji Tingkat Kesukaran, Uji Daya Pembeda, dan Uji Berfungsinya Pengecoh. Ada
beberapa ahli yang mengatakan bahwa, analisis atau uji yang dilakukan pada
instrument setidaknya adalah melakukan Uji Validitas dan Uji Reliabilitas. Salah
satunya adalah Ibnu Hadjar (1996:160), kualitas instrumen ditentukan oleh dua
kriteria utama: validitas dan reliabilitas. Oleh karena itu pada buku ini hanya
akan disajikan uji Validitas dan Uji Reliabilitas saja. Sedangkan analisis
butir instrument (Tingkat Kesukaran, Daya Pembeda, dan Berfungsinya Pengecoh)
akan di bahas pada mata kuliah Evaluasi Pembelajaran.
A.
Validitas
1.
Definisi Validitas
Nunnaly dan
Allen dan Yen dalam Budiyono (2003: 55) mengatakan bahwa “Instrumen disebut
valid jika dapat mengukur apa yang seharusnya diukur”. Guilford dalam Budiyono
(2003: 56) mendefinisikan validitas dengan mengaitkannya dengan skor tes, ia
mengatakan “Istilah validitas menunjukkan kepada sejauh mana skor tes dapat
memprediksi criteria yang telah ditentukan”. Sumadi Suryabrata (2008:60) mengemukakan
bahwa “validitas instrumen didefinisikan sebagai sejauh mana instrumen itu
merekam/mengukur apa yang dimaksudkan untuk direkam/diukur”. Selanjutnya Sutrisno Hadi
(1991: 1) berpendapat bahwa “Kesahihan atau validitas dibatasi sebagai tingkat
kemampuan suatu instrumen untuk mengungkapkan sesuatu yang menjadi sasaran
pokok pengukuran yang dilakukan dengan instrument tersebut”. Suatu
instrumen dinyatakan sahih jika instrument itu mengukur apa saja yang
hendak diukurnya, mampu mengungkapkan apa saja yang ingin diungkapkan.
Dari beberapa pendapat di
atas, dapat disimpulkan bahwa instrument dikatakan valid jika instrument
tersebut dapat mengungkapkan apa yang seharusnya atau hendak diukur. Penentuan
apa yang hendak diukur ini harus disesuaikan dengan definisi operasional dari
variabel yang telah diidentifikasi, sehingga criteria-kriteria yang ada pada
definisi operasional dapat teridentifikasi dan terukur dengan baik.
2.
Jenis-jenis Validitas
Jenis-jenis
validitas berkembang dari waktu ke waktu. Sugiyono mengatakan bahwa ada tiga
jenis pengujian validitas instrument.
a)
Validitas Isi
Standards dalam
Budiyono (2003: 57) dikatakan bahwa “Validitas isi bertujuan untuk menentukan
apakah yang ditampakkan secara individual dapat pula ditampakkan pada
keseluruhan situasi”. Selanjutnya Budiyono (2003: 58) mengatakan bahwa “Suatu
instrument dikatakan valid menurut validitas isi apabila isi instrument
tersebut telah merupakan sampel yang representative dari keseluruhan isi hal
yang akan diukur”. Pada kasus ini validitas tidak dapat ditentukan dengan mengkorelasikannya
dengan suatu criteria, sebab tes itu sendiri adalah criteria dari suatu
kinerja.
Nunnaly dalam
Budiyono (2003: 58) mengatakan bahwa “Ada dua standar utama untuk meyakinkan
adanya validitas isi, yaitu, (1) koleksi butir-butir soal yang representative
terhadap semestanya, dan (2) metode penyusunan tes yang masuk akal (sensible)”. Dalam tes prestasi, untuk
meyakinkan bahwa butir-butir soal telah mewakili tujuan pembelajaran,
diperlukan outline rinci, atau blue-print (kisi-kisi) yang memuat
pertanyaan atau masalah apa yang harus diujikan. Senada dengan hal tersebut apa
yang disampaikan oleh Sumarna Surapranata (2006: 51) menyatakan bahwa “Validitas isi (content validity) sering pula dinamakan
validitas kurikulum yang mengandung arti bahwa suatu alat ukur dipandang valid
apabila sesuai dengan isi kurikulum yang hendak diukur”. Untuk menyusun instrumen prestasi belajar yang mempunyai validitas
isi, maka instrumen harus disusun berdasarkan materi pelajaran yang telah
diajarkan. Salah
satu caranya adalah dengan melihat item-item soal yang membentuk tes tersebut. Untuk instrumen yang berbentuk tes, maka pengujian validitas isi
dapat dilakukan dengan membandingkan antara isi instrumen dengan materi
pelajaran yang telah diajarkan. Jika dosen/ guru memberikan ujian di luar
pelajaran yang telah ditetapkan, berarti instrumen ujian tersebut tidak
mempunyai validitas isi.sebagai kesimoulannya, jika keseluruhan item soal nampak
mengukur apa yang seharusnya tes itu digunakan, tidak diragukan lagi bahwa
validitas isi sudah terpenuhi.
Dari beberapa
hal yang telah dikemukakan di atas, secara teknis, pengujian validitas isi
dapat dibantu dengan menggunakan kisi-kisi instrumen. Dalam kisi-kisi itu
terdapat variabel yang diteliti, indikator sebagai tolok ukur, dan nomor butir
(item) pertanyaan atau pernyataan yang telah dijabarkan dari indikator. Dengan
kisi-kisi instrumen itu, maka pengujian validitas dapat dilakukan dengan mudah
dan sistematis. Oleh karena itu, penilaian terhadap kisi-kisi merupakan hal
yang paling penting untuk menilai sejauh mana validitas isi terpenuhi. Oleh karena
itu agar tes mempunyai validitas isi, harus diperhatikan yang berikut ini
(Budiyono, 2003: 58).
i.
Tes harus dapat mengukur sampai seberapa jauh tujuan pembelajaran
tercapai ditinjau dari materi yang diajarkan.
ii.
Penekanan materi yang akan diujikan seimbang
dengan penekanan materi yang diajarkan.
iii.
Materi pelajaran untuk menjawab soal-soal ujian
sudah dipelajari dan dapat dipahami oleh tester.
Sebagian ahli tes berpendapat bahwa tidak ada satupun
pendekatan statistik yang dapat digunakan untuk menentukan validitas isi suatu
tes. Menurut Guion dalam Sumarna Surapranata (2006: 53), “Validitas isi hanya
dapat dilakukan berdasarkan judgement
para ahli”. Penilaian oleh Expert Judgemnet (penilaian yang dilakukan oleh para pakar) dapat
dilakukan dengan langkah sebagai berikut.
i.
Menilai
apakah kisi-kisi yang dibuat oleh pengembang tes telah menunjukkan bahwa
klasifikasi kisi-kisi telah mewakili isi (substansi) yang akan diukur.
ii.
Para
penilai akan menilai apakah masing-masing butir tes yang telah disusun telah
cocok atau relevan dengan klasifikasi kisi-kisi yang telah ditentukan. Cara ini
sering disebut relevance ratings.
iii.
Penilai
akan diberikan suatu rentangan skala tertentu (misalnya 1 – 10, dimana 1
menunjukan sanga-sangat tidak relevan dan 10 menunjukkan sangat-sangat relevan)
untuk melihat relevansi antara butir tes dengan kisi-kisi yang telah disusun.
iv.
Penilai
kemudian memberikan suatu rating (rataan nilai dari para penilai) untuk
masing-masing klasifikasi kisi-kisi dan masing-masing butir soal.
v.
Mengambil
keputusan, apakah memodifikasi kisi-kisi atau butir soal, atau bahkan keduanya.
Berapa
jumlah ahli yang sebaiknya digunakan dalam penilaian validitas isi? Penulis
berpendapat, bahwa jumlah ahli yang dibutuhkan setidaknya ada 3 orang (usahakan
berjumlah ganjil). Pertimbangannya, jika ada 1 orang ahli mengatakan bahwa item
soal tidak valid sedangkan 1 orang ahli mengatakan item tersebut adalah valid,
maka orang ketigalah yang akan menjadi penentunya.
Contoh kegiatan validasi isi
KISI-KISI TES PRESTASI BELAJAR
Bidang Studi
|
:
|
Matematika
|
||||||||
Standar Kompetensi
|
:
|
Menggunakan
pecahan dalam pemecahan masalah
|
||||||||
Kompetensi
Dasar
|
:
|
1.
Mengubah
pecahan ke bentuk persen dan desimal serta sebaliknya
2.
Menjumlahkan
dan mengurangkan berbagai bentuk
pecahan
3.
Mengalikan
dan membagi berbagai bentuk pecahan
4.
Menggunakan
pecahan dalam masalah perbandingan
|
||||||||
Materi
|
C1
|
C2
|
C3
|
C4
|
C5
|
C6
|
No Soal
|
|||
Pengenalan
Pecahan
|
√
|
|
|
|
|
|
1
|
|||
Menyederhanakn
pecahan
|
|
√
|
|
|
|
|
2
|
|||
Pecahan
yang senilai
|
|
√
|
|
|
|
|
3, 24
|
|||
Mengubah
pecahan
|
|
√
|
|
|
|
|
20, 23
|
|||
Mengurutkan
Pecahan
|
|
|
|
|
|
√
|
21, 22
|
|||
Penjumlahan
pecahan
|
|
|
√
|
|
|
|
5, 6, 7,
25
|
|||
Pengurangan
pecahan
|
|
|
√
|
|
|
|
4, 11,
29
|
|||
Perkalian
Pecahan
|
|
|
√
|
|
|
|
8, 10,
15, 19, 28
|
|||
Pembagian
Pecahan
|
|
|
√
|
|
|
|
12,14,
17, 27
|
|||
Menggunakan pecahan dalam masalah perbandingan
|
|
|
√
|
|
|
|
9, 13
|
|||
|
|
|
√
|
|
|
16
|
||||
|
|
|
√
|
|
|
18
|
||||
|
|
√
|
|
|
|
26
|
||||
|
|
|
√
|
|
|
30, 33
|
||||
|
|
|
|
√
|
|
31, 32,
34
|
||||
|
|
|
|
|
√
|
35
|
||||
UJI VALIDITAS INSTRUMEN TES PRESTASI
BELAJAR MATEMATIKA
Petunjuk
:
Berilah
tanda cek ( √ ) untuk kolom yang memenuhi kriteria, tanda silang ( × ) yang tidak memenuhi
kriteria, dan tanda ( R ) untuk kolom yang harus direvisi.
Validator
: _____________________
Kriteria
Validiatas Isi
|
Butir soal
|
|||||
1
|
2
|
3
|
4
|
5
|
Dst
|
|
A. Materi
|
|
|||||
Item soal sesuai dengan SK dan KD
|
|
|
|
|
|
|
Item pertanyaan telah sesuai dengan
kompetensi (urgensi, kontinyuitas, dan keterpakaian sehari-hari)
|
|
|
|
|
|
|
Item soal telah mengacu pada ranah kognitif
|
|
|||||
1.
C1
(mengetahui dan mengingat)
|
|
|
|
|
|
|
2.
C2
(Pemahaman)
|
|
|
|
|
|
|
3.
C3 (Aplikasi,
penerapan ide atau rumus)
|
|
|
|
|
|
|
4.
C4 (Analisis/
kemampuan menguraikan)
|
|
|
|
|
|
|
5.
C5 (Sintesis)
|
|
|
|
|
|
|
6.
C6 (evaluasi/
menilai)
|
|
|
|
|
|
|
Tiap item soal hanya memiliki satu
jawaban benar
|
|
|
|
|
|
|
Item soal sudah dibelajarkan kepada
siswa sebelumnya.
|
|
|
|
|
|
|
Butir soal telah mampu dipahami oleh
siswa
|
|
|
|
|
|
|
B. Konstruksi
|
|
|||||
Pokok
soal dirumuskan dengan singkat, jelas, dan tegas.
|
|
|
|
|
|
|
Item
soal tidak memberikan petunjuk yang mengarahkan kepada kunci jawaban.
|
|
|
|
|
|
|
Item
soal tidak memerlukan pengetahuan lain dalam menjawabnya
|
|
|
|
|
|
|
Pilihan
jawaban disusun secara logis
|
|
|
|
|
|
|
Gambar,
grafik, tabel disajikan dengan jelas dan sesuai dengan fungsinya.
|
|
|
|
|
|
|
Panjang
pilihan jawaban relatif sama
|
|
|
|
|
|
|
Pilihan
jawaban disusun berdasarkan urutan besar kecilnya angka atau kronologisnya.
|
|
|
|
|
|
|
Item
soal tidak berdasarkan atau bergantung pada soal sebelumnya.
|
|
|
|
|
|
|
C. Bahasa
|
|
|||||
Item soal tidak mengandung pertanyaan
yang ambigu (makna ganda)
|
|
|
|
|
|
|
Item soal menggunakan kaidah Bahasa Indonesia
yang baik dan benar (sesuai EYD)
|
|
|
|
|
|
|
Tidak menggunakan bahasa yang bersifat
kedaerahan
|
|
|
|
|
|
|
Tidak menggunakan bahasa atau kalimat yang
bersifat negatif
|
|
|
|
|
|
|
Catatan validator:
1. _____________________________________________________
2.
_____________________________________________________
3.
_____________________________________________________
4.
_____________________________________________________
Validator
( )
b)
Validitas Kriteria
Allen dan Yen dalam Budiyono (2003: 61) mengatakan bahwa “Validitas
berdasarkan criteria digunakan ketika skor tes dapat dihubungkan dengan sebuah
criteria tertentu”. Sedangkan APA (American
Psychological Assosiation) menyebutkan “Validitas berdasarkan criteria
bertujuan untuk memprediksi keadaan masa depan individual atau keadaannya
sekarang berdasar beberapa variabel yang berbeda dengan tes yang ditempuhnya”.
Oleh karena itu, dalam validitas berdasarkan criteria dapat dipandang ada dua
buah instrument, instrument yang satu dipandang sebagai kriterium dan
instrument yang satunya lagi dipandang sebagai instrument yang akan diukur/
ditentukan validitasnya. Maka Budiyono (2003: 61) mengatakan bahwa “Validitas
berdasarkan criteria adalah validitas yang ditinjau dari segi hubungan dengan
alat pengukur lain yang dipandang sebagai criteria untuk menentukan tinggi
rendahnya validtas alat ukur yang sedang dipersoalkan”.
Pada validitas criteria sebenarnya lebih ditekankan pada persoalan
criteria tersebut, bukan pada instrument yang sedang dipersoalkan. Kalau pada
validitas isi tidak ada satupun pendekatan statistic yang digunakan, namun pada
validitas criteria ini digunakan rumus korelasi sebagai berikut.
Keterangan:
rxy :
indeks konsistensi internal untuk butir ke-i
n : cacah subyek yang dikenai
tes (instrumen)
X : skor untuk butir ke-i
Y : total skor
Acuan penafsiran
validitas oleh Jacobs dan Chasse (1992: 35) sebagai berikut.
Besar
nilai r
|
Kategori/
tafsiran
|
0,80 –
1,00
|
Sangat
tinggi
|
0,60 –
0,79
|
Tinggi
|
0,40 –
0,59
|
Cukup
|
0,20 –
0,39
|
Rendah
|
0,0 –
0,19
|
Sangat
rendah (tak berkorelasi)
|
Ciri-ciri yang harus dimiliki oleh suatu ukuran criteria adalah,
relevansi, reliable, dan bebas dari bias.
1.
Relevansi
Peneliti harus dapat
memberikan gambaran yang tepat dan memberikan jaminan bahwa criteria yang
dipilih, benar-benar menggambarkan cirri-ciri yang tepat dari tingkah laku yang
diselidiki.
2.
Reliabel
Ukuran harus bersifat
reliable (ajeg) bagi atribut tersebut. Ajeg dalam arti memiliki sifat yang
tetap dari waktu ke watu dan dari situasi satu ke situasi yang lain. Apabila
criteria tidak konsisten, maka tidak ada gunanya criteria tersebut digunakan.
3.
Bebas dari bias
Pemberian skor pada
criteria yang ada tidak dipengaruhi oleh factor-faktor selain karakteristik
sebenarnya pada criteria tersebut.
Validitas criteria dikelompokkan menjadi dua jenis, yaitu validitas
prediktif dan validitas konuren.
1.
Validitas prediktif
Skor tes yang dipakai
untuk memprediksi behavior tidak tersedia ketika tes dilakukan, tetapi tersedia
di kemudian hari. Jadi, criteria tidak tersedia pada saat tes berlangsung namun
kriterianya baru dapat ditentukan setelah selang waktu tertentu.
2.
Validitas konkuren
Kriteria yang dipakai
untuk mengkorelasikan hasil tes telah ada pada saat tes berlangsung.
Selanjutnya instrument yang telah ada tersebut (kriterium) diujikan pada
sekelompok siswa yang sama pada saat yang beramaan dengan instrument yang
dipersoalkan (akan dihitung validitasnya). Selanjutnya masing-masing skor dari
kedua instrumen tes tersebut dikorelasikan.
Persoalan mengenai validitas berdasarkan criteria ini cukup menarik
untuk didiskusikan lebih lanjut. Mengingat banyak sekali mahasiswa yang dalam
penentuan validitas instrument penelitiannya menggunakan jenis validitas ini.
Sebagai contoh disajikan studi kasus sebagai berikut.
Seorang peneliti ingin melakukan penelitian eksperimentasi suatu
metode pembelajaran tertentu pada materi integral. Kebetulan materi integral
muncul pada kelas XII semester II. Selanjutnya penelitia membuat instrument
berupa tes prestasi materi integral. Untuk mengukur validitas instrumennya,
digunakan validitas berdasarkan criteria (validitas ekternal dengan angka
kasar). Peneliti menggunakan nilai rapor kelas XII semester I sebagai
kriterium. Bagaimana pendapat Anda?
Hal-hal yang dapat didiskusikan adalah sebagai barikut:
1.
Apakah kriterium yang dipakai
telah memenuhi syarat criteria yang telah ditetapkan?
2.
Jenis validitas criteria yang
bagaimanakah yang digunakan peneliti? Prediktif atau konkuren?
Ketika pertanyaan ini diajukan penulis pada saat persidangan skripsi
maupun bimbingan, banyak mahasiswa yang tidak mampu menjelaskannya dengan baik.
Pada akhirnya penulis berpendapat, sangat salah jika digunakan validitas
berdasarkan criteria berdasarkan keadaan di atas, kedua pertanyaan tadi tidak
akan dapat dijelaskan dan terjawab. Oleh karena itu dalam kasus tersebut,
sebaiknya tidak digunakan validitas berdasarkan criteria.
c)
Validitas Konstruk
Validitas
konstruk merupakan validitas yang paling akhir dikembangkan oleh orang
sekaligus juga merupakan validitas yang terus dapat dikembangkan sejalan dengan
berkembangnya definisi dari variabel yang ingin diketahui validitasnya. Hal ini
terjadi karena suatu definisi operasional dari suatu variabel merupakan
konstruksi dari berbagai aspek atau factor yang terus berkembang pula. Budiyono
(2003: 63) menyatakan bahwa “Validitas konstruk suatu tes adalah sejauh mana
tes tersebut mengukur konstruk atau trait (kemampuan) yang dimaksudkan untuk
diukur”. Cronbach dalam Budiyono (2003: 58) mengatakan bahwa “the end goal of validation is explanation
and understanding, sehingga ia sampai pada kesimpulan bahwa pada dasarnya
validitas adalah validitas konstruk (the
profession is coming around to the view that all validation is construct
validation)”.
Apa yang disebut konstruk?
Budiyono (2003: 63) menjelaskan bahwa “Pada tingkatan tertentu, sebuah variabel
adalah abstrak. Untuk hal yang demikian, peneliti harus mendefinisikan variabel
sehingga dapat dioperasionalkan sehingga menjadi sesuatu yang konkrit. Dari
definisi tersebut, tentunya dibangun atau dikonstruksi dari berbagai aspek atau
factor yang ada. Dengan demikian definisi dari suatu variabel dipandang sebagai
suatu konstruk”.
Validitas konstruk merupakan salah satu tipe validitas internal
rasional suatu instrumen yang menunjukkan sejauh mana instrumen tersebut
mengungkap suatu trait atau konstruk teoretik yang hendak diukurnya. Dalam hal
ini konstruk merupakan kerangka dari suatu konsep. Pengertian konstruk ini
bersifat terpendam dan abstrak sehingga berkaitan dengan banyak indikator
perilaku empiris yang menuntut adanya uji analisis seperti analisis
faktor.
Menurut Suryabrata (2000), validitas konstruk (construct validity)
menyatakan sejauh mana skor-skor hasil pengukuran dengan suatu instrumen itu
merefleksikan konstruk teoretik yang mendasari penyusunan instrumen tersebut.
Sutrisno Hadi (2001) menyamakan construct validity dengan logical
validity atau validity by definition. Suatu instrumen non tes mempunyai
validitas konstruk, jika instrumen tersebut dapat digunakan untuk mengukur
gejala sesuai dengan yang didefinisikan. Misalnya untuk mengukur minat terhadap
matematika, perlu didefinisikan terlebih dahulu apa itu minat terhadap matematika,
demikian juga untuk mengukur kemandirian belajar siswa maka perlu terlebih
dahulu didefinisikan mengenai apa itu kemandirian belajar siswa. Setelah konsep atau defenisi itu
diperoleh selanjutnya disiapkan instrumen yang digunakan untuk mengukur minat terhadap
matematika sesuai definisi.
Dalam hal ini, untuk melahirkan definisi tentu saja diperlukan
teori-teori. Sutrisno Hadi menyatakan bahwa jika memang bangunan teorinya sudah
benar, maka hasil pengukuran dengan alat pengukur yang berbasis pada teori itu
sudah dipandang sebagai hasil yang valid. Namun demikian, walaupun secara
teoritis dapat dikatakan sudah valid, pengujian secara empiris terhadap suatu
instrumen non-tes tetap diperlukan untuk mengungkap seberapa jauh setiap
variabel yang akan diukur dapat dijelaskan oleh setiap dimensi dalam instrumen
yang telah disusun.
Sebagaimana telah dikemukakan di atas, analisis faktor merupakan
salah satu prosedur yang dapat digunakan untuk menguji validitas konstruk suatu
instrumen non-tes seperti angket. Suryanto (1988) mengemukakan bahwa analisis
faktor merupakan kajian tentang kesaling tergantungan antara variabel-variabel,
dengan tujuan untuk menemukan himpunan variabel-variabel baru yang lebih
sedikit jumlahnya daripada variabel semula dan yang menunjukkan mana di antara
variabel-variabel semula itu sebagai faktor-faktor persekutuan. Dengan
demikian, dapat diartikan bahwa analisis faktor digunakan untuk mereduksi data,
yakni proses untuk meringkas sejumlah variabel menjadi lebih sedikit dan
menamakannya sebagai faktor.
Langkah-langkah yang dilakukan untuk melakukan uji validitas
konstruk adalah sebagai berikut.
1.
Berikan definisi operasional
dari variabel yang akan diteliti.
2.
Pebahlah definisi tersebut
menjadi beberapa factor. Factor-faktor tersebut kemudian dibagi menjadi
beberapa indicator. Dari indicator ituah yang nantinya akan disusun sejumlah
pertanyaan.
3.
Gunakan penilaian expert judgement atas seperangkat
instrument yang telah dibuat untuk mengetahui apakah aspek dan indicator
benar-benar telah mencerminkan konstruk dari variabel.
4.
Lakukan analisis factor, dengan
mengkorelasikan skor-skor antar factor dan skor factor dengan skor total.
Contoh. Misalnya suatu
definisi dikonstruksikan oleh 3 buah factor. Sehingga korelasi skor-skor antar
factor dilakukan sebagai berikut:
a)
Korelasi factor 1 dengan factor
2
b)
Korelasi factor 1 dengan factor
3
c)
Korelasi factor 2 dengan factor
3
Sesudah itu dapat dicari
korelasi skor factor dengan skor totalnya.
a)
Korelasi julah skor factor 1
dengan sor total
b)
Korelasi jumlah skor factor 2
dengan skor total
c)
Korelasi jumlah skor factor 3
dengan skor total.
5.
Ambil kesimpulan.
Contoh analisis antar factor adalah
sebagai berikut.
Korelasi skor antar factor
Dengan menggunakan rumus korelasi
Product moment diperolah rxy= 0,82 (korelasi sangat tinggi)
Diperolah rxy= 0,91
(korelasi sangat tinggi)
Diperolah rxy= 0,72
(korelasi tinggi)
Korelasi skor factor dengan skor total
Diperoleh rxy = 0,88
(koreasi sangat tinggi)
Diperoleh rxy = 0,95 (koreasi sangat
tinggi)
Diperoleh rxy = 0,79
(koreasi tinggi)
Dari contoh di
atas, maka dapat dikatakan bahwa instrument telah memenuhi validitas
berdasarkan konstruk.
B.
Konsistensi Internal
Sebuah instrument tentu terdiri dari sejumlah butir-butir
instrument. Kesemua butir itu harus mengukur hal yang sama dan menunjukkan
kecenderungan yang sama. Oleh karena itu harus ada korelasi positif antara skor
masing-masing butir tersebut dengan skor keseluruhan butir. Oleh karena itu
indeks konsistensi internal ini lebih menunjukkan korelasi skor butir-butir
tersebut dengan skor totalnya. Untuk menghitung konsistensi internal butir ke-i digunakan rumus Karl Pearson sebagai
berikut.
Keterangan:
rxy :
indeks konsistensi internal untuk butir ke-i
n :
cacah subyek yang dikenai tes (instrumen)
X :
skor untuk butir ke-i
Y :
total skor
Indeks konsistensi internal yang biasa dipakai dalam penelitian adalah
harus > 0,3. Jika indeks konsistensi internalnya kurang dari 0,3 maka
butir soal tersebut harus dibuang.
Konsistensi internal sering pula disebut sebagai daya pembeda. Pada tes
prestasi, maka butir dengan indeks konsistensi internal tinggi menunjukkan
bahwa butir soal dapat membedakan antara siswa pandai dan kurang pandai. Pada
angket, tidak dikenal adanya daya pembeda. Oleh karena itu pada analisis butir
angket dapat menggunakan analisis konsistensi internal ini.
Contoh.
C.
Reliabilitas
1.
Definisi Reliabilitas Tes
Reabilitas tes adalah tingkat keajegan (konsitensi) suatu tes, yakni
sejauh mana suatu tes dapat dipercaya untuk menghasilkan skor yang ajeg,
relatif tidak berubah walaupun diteskan pada situasi yang berbeda-beda.
Reliabilitas suatu tes adalah taraf sampai dimana suatu tes mampu menunjukkan
konsisten hasil pengukurannya yang diperlihatkan dalam taraf ketetapan dan
ketelitian hasil. Reliabel tes
berhubungan dengan ketetapan hasil tes.
Pengertian Reliabilitas adalah serangkaian pengukuran atau
serangkaian alat ukur yang memiliki konsistensi bila pengukuran yang dilakukan
dengan alat ukur itu dilakukan secara berulang. Kondisi itu ditengarai dengan
konsistensi hasil dari penggunaan alat ukur yang sama yang dilakukan secara
berulang dan memberikan hasil yang relatif sama dan tidak melanggar kelaziman.
Untuk pengukuran subjektif, penilaian yang dilakukan oleh minimal dua orang bisa
memberikan hasil yang relatif sama (reliabilitas antar penilai).
Dalam kajian teoritis, reliabilitas adalah sejauh mana pengukuran
dari suatu uji coba yang dilakukan tetap memiliki hasil yang sama meskipun
dilakukan secara berulang-ulang terhadap subjek dan dalam kondisi yang sama.
Instrumen alat ukur dianggap bisa diandalkan apabila memberikan hasil yang
konsisten untuk pengukuran yang sama dan tidak bisa diandalkan bila pengukuran
yang dilakukan secara berulang-ulang itu memberikan hasil yang relatif tidak
sama. Pengujian reliabilitas instrumen untuk memperoleh hasil yang reliabel
bisa dilakukan dengan berbagai metode statistik.
Pada umumnya tidak pernah dapat ditemukan suatu instrument yang
memiliki reliabilitas sempurna, artinya setiap kali instrument tersebut
digunakan dalam proses pengukuran terhadap subjek yang sama biasanya diperoleh
hasil yang berbeda. Hal ini terjadi karena adanya kesalahan pada instrument itu
sendiri atau pada subjek pengguna instrument itu sendiri. Dengan demikian,
sebuah instrument mempunyai reliabilitas yang tinggi apabila derajat
kesalahannya kecil. Dalam suatu penelitian, biasanya dipersyaratkan adanya
batas minimal indeks reliabilitas yang harus dipenuhi oleh instrument
penelitian. Batas minimal indeks reliabilitas instrument yang biasanya
digunakan dalam suatu penelitian adalah 0,75. Hal ini berarti, instrument
tersebut sudah cukup baik jika digunakan dalam proses pengukuran.
Lebih lanjut indeks reliabilitas dapat dipilah-pilah sebagai
berikut.
Kriteria reliabilitas:
0,00 < r11
< 0,20 reliabilitas sangat
rendah
0,20 < r11 < 0,40 reliabilitas rendah
0,40 < r11 < 0,60 reliabilitas cukup
0,60 < r11
< 0,80 reliabilitas tinggi
0,80 < r11
< 1,00 reliabilitas sangat
tinggi
(Suharsimi
Arikunto, 1998: 71)
2.
Faktor-faktor yang memppengaruhi
indeks reliabilitas.
Budiyono (2003: 72) menjelaskan ada beberapa factor yang
mempengaruhi indeks reliabilitas dari instrument, antara lain sebagai berikut.
a. Panjang tes. Pada umumnya semakin panjang tes (cacah butir tes
semakin banyak) makin tinggi reliabilitasnya. Hal ini disebabkan tes dengan
cacah butir yang banyak akan memuat cukup banyak tingkah laku yang diukur dan
skornya tidak dipengaruhi oleh factor tebakan.
b. Penyebaran skor. Indeks reliabilitas dipengaruhi oleh penyebaran
skor. Makin lebar penyebaran skor makin tinggi estimasi reliabilitasnya. Hal
ini disebabkan koefisien reliabilitas akan semakin tinggi apabila
individu-individu cenderung tetap pada kedudukan relatifnya terhadap
kelompoknya.
c. Tingkat kesukaran tes. Tes yang terlalu sukar atau terlalu mudah
cenderung menurunkan indeks reliabilitasnya. Hal ini disebabkan tes yang
terlalu sukar atau terlalu udah menghasilkan sebaran yang terbatas dan
terkumpul di ujung bawah atau ujung atas.
d. Objekstivitas. Objektivitas suatu tes menunjukkan seberapa jauh dua
orang yang mempunyai kemampuan sama mendapatkan hasil yang sama.dalam hal ini
skor yang diperoleh oleh subjek yang dikenai tes tidak dipengaruhi oleh
keputusan dan perasaan orang yang member skor. Tes yang objektivitasnya tinggi
cenderung mempunyai indeks reliabilitas yang tinggi pula
3.
Cara Pengukuran Reliabilitas
Pendekatan yang digunakan untuk mengestimasi indkes reliabilitas
instrument dapat dikelompokkan menjadi tiga golongan besar, yaitu (a) metode
satu kali tes, (b) metode tes ulang, dan (c) metode bentuk sejajar.
a. Metode satu kali tes
Metode ini dilakukan oleh peneliti dengan hanya melakukan pengukuran
terhadap sekelompok subjek satu kali saja. Artinya, tes dibagikan kepada subjek
penelitian, selanjutnya subjek diminta untuk mengerjakan, dan akhirnya hasil
pekerjaan tersebut dianalisis untuk diukur indkes reliabilitasnya.
Metode yang banyak dipakai adalah Teknik Sperman-Brown, Teknik
Flanagan, Teknik Rulon, Teknik Kuder-Richardson, dan Teknik Alpha Cronbach.
Teknik Kuder Richardson
Rumus Kuder-Richardson juga biasanya disebut sebagai rumus KR.
Terdapat dua macam rumus KR, yaitu KR-20 dan KR-21.
Rumus KR-20
Keterangan:
n : banyaknya butir instrument
pi : proporsi banyaknya subjek yang menjawab benar
pada butir ke-i
qi : 1 - pi
Contoh.
Dari contoh di atas, indeks
reliabilitasnya adalah 0,803. Sehingga terkategorikan sebagai instrument dengan
reliabilitas tinggi.
Rumus KR-21
Keterangan:
n : banyaknya butir instrument
R : Rerata Total
Contoh.
Pada perhitungan
dengan menggunakan KR-20 maupun KR-21 biasanya menghasilkan indeks reliabilitas
yang tidak jauh berbeda.
Pada Rumus KR-20
ini memuat proporsi banyak subjek yang menjawab benar untuk suatu butir
tertentu. Sehingga Rumus KR-20 sangat baik jika diterapkan pada uji
reliabilitas tes prestasi. Karena pada tes prestasi, skor benar-salah untuk
tiap butir dapat ditentukan. Namun pada angket bisa saja akan sulit diterapkan.
Pada umumnya jawaban responden untuk menjawab butir soal angket akan bernilai
benar semua. Mengingat pada angket, skor yang ditetapkan berupa skala. Sehingga
skor benar-salahnya tidak dapat ditentukan. Dengan demikian, proporsi benar
pada butir tertentu tidak dapat ditentukan.
Oleh karena itu,
pada angket, penulis tidak menganjurkan untuk menggunakan rumus KR-20. Kecuali
angket dengan skala Gutterman yang hanya memiliki 2 pilihan jawaban
(benar-salah, setuju-tidak setuju, dst).
Teknik Alpha Cronbach
Rumus Alpha Cronbach adalah sebagai berikut.
n : banyaknya butir instrument
Contoh.
1.
Perhitungan
indeks reliabilitas pada tes prestasi belajar.
Contoh.
2.
Perhitungan indeks reliabilitas
pada nagket dengan skala 1 – 4.
Berbeda dengan KR-20 dan KR-21, rumus Alpha Cronbach ini dapat
diterapkan pada tes dan angket sekaligus.
b. Metode tes ulang
Pada metode ini
dilakukan pengukuran kepada sekelompok subjek dua kali dengan instrument yang
sama dalam kurun waktu yang hampir bersamaan. Indeks reliabilitasnya dihitung
dengan mencari koefisien korelasi antara hasil pengukuran pertama dan kedua.
Koefisien korelasi dengan menggunakan Rumus Karl Pearson. Koefisien yang
diperoleh sekaligus menjadi indkes reliabilitas.
c. Metode bentuk sejajar
Pada metode ini
dibuat dua instrument yang setara (sejajar). Selanjutnya kedua instrument
tersebut diujikan pada sekelompok subjek yang sama pada waktu yang hampir
bersamaan. Selanjutnya, sama dengan metode tes ulang, indeks reliabilitas
dihitung dengan mencari koefisien orelasi antara hasil pertama dengan hasil
kedua.
Video Tutorial Uji Validitas dan Reliabilitas STATA 16 Lengkap
BalasHapus(Dilengkapi File Materi Dan Software STATA 16)
Merupakan Panduan Yang Lengkap Dan Detail
Klik Link Dibawah Untuk Mendapatkannya
https://bit.ly/UjiSTATA