Selasa, 16 Maret 2010

RELIABILITAS
oleh: Wahyudi, S. Pd

Pengertian Reliabilitas

Reliabilitas sama dengan kekonsistenan. Menurut The Standart for Educational and Psychological Testing, reliabilitas mengacu pada tingkat nilai tes yang bebas dari keasalahan dalam pengukuran (Popham,1994;21)



Reabilitas merupakan tingkatan hasil penilaian siswa yang sama ketika:
a. mereka menyelesaikan tugas yang sama dalam kesempatan yang berbeda
b. dua atau lebih guru menilai hasil pekerjaan mereka pada tugas yang sama
c. mereka menyelesaikan dua atau lebih tugas yang berbeda namun dengan tingkat kesulitan yang sama pada suatu kesempatan yang sama ataupun berbeda. (Nitko., 2007;67)
Allen (1979;72) menyatakan tes disebut reliable jika skor pengamatan dikorelasikan dengan tinggi dengan skor yang sebenarnya, dengan merupakan koefisien reabilitas tes. Reabilitas dapat diekspresikan sebagai koefisien korelasi antara skor pengamatan pada dua tes yang parallel. Jika dua tes parallel diberikan pada populasi yang diuji dan hasil skor pengamatan dikorelasikan, maka korelasi ini (symbol dimana X dan X’diamati skornya pada kedua tes paralelnya) adalah koefisien reabilitas.
Pada kasus umum, skor sebenarnya tidak dapat diperoleh, dan tidak mungkin untuk menguji apakah tes tersebut parallel. Oleh karena itu, reabilitas seharusnya diperkirakan dengan metode lain.

Realibilitas membatasi Validitas
Tingginya reliabilitas tidak menjamin diperoleh interpretasi atau keputusan yang valid. Meskipun tingginya validitas sangat menentukan nilai reliabilitas. Hal ini dikarenakan reliabilitas bukanlah satu-satunya kriteria di dalam menentukan validitas. (Nitko., 2007;67)
Sebagai ilustrasi: Nona Cortez mengajar aritmatika kelas tujuh. Beliau merefleksikan siswa-siswanya pada perhitungan yang mana diharapkan siswa-siswanya mampu menggunakannya dalam kehidupan sehari-hari dan mendata ketrampilannya ini. Dia kemudian membuat tes perhitungan dan problem solving untuk menilai kemampuan siswa-siswanya pada ketrampilannya. Karena tes tertulis yang dibuat sangat banyak item, nona cortes dapat percaya diri bahwa apa yang dibuatnya akan sangat reliable.
Strategi umum untuk menghitung koefisien reliabilitas adalah mengatur penilaian pada sekelompok siswa satu kali atau lebih dan diperoleh skor. Kemudian satu atau dua pendekatan digunakan untuk memeriksa kekonsistenan.
a. Dalam konteks skor kekonsistenan korelasi ini disebut sebagai koefisien reliabilitas.
b. Indeks pengekspresian variansi dalam skor kekonsistenan disebut sebagi standar eror pengukuran.
Reliablitas diperlukan untuk mengetahui validitas. Penilaian dari keandalan akan mempengaruhi kualitas (validitas). Berikut sebagi contoh pengambilan keputusan:
1. Nona Cortez memutuskan penguasaan 80% dari target yang diharapkan dalam perhitungan kelulusan. Bagaimanapun tes hanya mengambil contoh dari sub-sub yang harus dikuasai. Dari tes yang dilakukan beberapa siswa dapat menguasai 80% atau bahkan lebih dari target yang diharapkan (dikatakan lulus tes), dan beberapa dapat menguasai kurang dari 80% (dikatakan tidak lulus tes). Siswa yang tidak lulus tes ini dikelompokkan sebagai siswa yang kompetensinya masih kurang.
2. Seorang penasehat ingin mengetahui apakah kemampuan matematika siswa atau kemampuan komunikasi siswa tinggi. Skor siswa pada tes kemampuan matematika tidak seperti skor tes pada kemampuan bahasanya. Yang menjadi pertanyaan adalah apakah siswa mempunyai kemampuan yang berbeda dalam 2 kemampuan tersebut? Kemmapuan siswa dalam hal yang berbeda akan berbeda pula, penasehat membutuhkan seberapa besar perbedaan dari true skor dalam kaitan dengan kesalahan perhitungan. Jika jarak skor sangat jauh maka kemungkinan tidak reliable. Jika skor tidak reliable maka penasehat dapat dengan kurang percaya diri mengemukakan bahwa perbedaan skor mengindikasikan perbedaan dalam kemampuan komunikasi dan kemampuan matematika.

Kesalahan dalam Pengkuran atau Inkonsistensi
Reliabitas dan kesalahan pengukuran (measurement error ) adalah dua hal yang saling menentukan dalam assesmen. Reliabilitas memfocuskan pembahasan pada sejauh mana hasil penilaian konsisten. Sedangkan measurement error fokus pada ketidak konsistenan hasil penilaian. Inkosistensi dapat terjadi pada kasus-kasus yang berbeda tidak disetiap kasus. (Nitko., 2007;68)

Popham (1995;31) menyajikan satu rumus untuk mengukur error of measurement yang disebut standart of error of measurement = sx
Keterangan: sx = standar deviasi dari skor tes
= reliabilitas pada tes

Koefisien Reliabilitas
Secara empirik tinggi rendahnya reliabilitas ditunjukan oleh suatu angka yang disebut koefisien reliabilitas. Pada awalnya tinggi rendahnya reliabilitas tes dicerminkan oleh koefisien korelasi antara sekor pada dua tes yang parallel, yang dikenakan pada sekelompok individu yang sama. Semakin tinggi koefisien korelasi termaksud berarti konsistensi natara hasil pengenaan dua tes tersebut semakin baik dan hasil ukur kedua tes itu dikatakn semakin reliable.
Koefisien korelasi antara dua variable dilambangkan oleh huruf r. Apabila skor pada tes pertama diberi lambang X dan skor pada tes kedua diberi lambang X’, maka koefisien korelasi antara kedua tes tersebut adalah . Symbol inilah yang digunakan sebagai symbol koifisien korelasi.
Walaupun secara teoritik besarnya koifisien relibialitas berkisar mulai dari 0,0 dampai denga 1,0 akan tetapi kenyataanya koefisien sebesar 1,0 dan sekecil 0,0 tidak pernah dijumpai. Disamping itu, walaupun koifisien korelasi dapat saja betambah negative (-), koefisien reliabilitas selalu mengacu pada angka positif (+) dikarenakan angka negative tidak ada artinya bagi intefretasi reliabilitas hasil ukur. Koifisien korelasi = 1,0 berarti adanya konsistensi yang sempurna pada hasil ukur yang bersangkutan. Konsisten yang sempurna seperti itu tidak dapat terjadi dalam pengukuran aspek-aspek psikologis dan social yang menggunakan manusia sebagi subyeknya dikarenakan terdapatnya berbagai sumber eror dalam diri manusia dan dalam pelaksanaan pengukuran yang sangat mudah mempengaruhi kecermatan hasil pengkuran.
Dalam penilaian pendidikan, sering timbul pertanyaan bahwa apakah koefisien reabilitas dari soal yang digunakan cukup bagus? Koefisien yang sempuna adalah 1, akan tetapi dalam penilaian pendidikan yang subyeknya adalah manusia maka hal tersebut adalah tidak mungkin. Dari penilaian dengan tipe-tipe instrumen yang berbeda, mempunyai tingkatan yang berbeda pula tentang koefisien reliabilitasnya.
a. Standar penilaian untuk soal pilihan ganda, koefisien reliabilitasnya 0,85-0,90.
b. Standar penilaian untuk soal open ended, koefisien reliabilitasnya 0,65-0,80
c. Standar penilaian untuk soal portofolio, koefisien reliabilitasnya 0,40-0,60
Disamping tehnik-tehnik korelasi, berkembang pula tehnik analisis varians skor dan tehnik analisis varian eror. Walaupun demikian untuk melambangkan koifiseien reliabilitas umumnya tetap digunakan symbol .


Konsepsi mengenai Reliabilitas
Konsepsi reliabilitas dalam teori skor murni klasikal dapat dipahami dari beberapa intefretasi. Suatu tes dikatakan sebagi mmemilki reliabilitas tinggi apabila, misalnya, skor tampak tes itu berkorelasi tinggi dengan skor murninya sendiri. Reliabilitas dapat pula ditafsirkan sebagai seberapa tingginya korelasi antara skor tampak pada dua tes yang parallel.
Allen dan Yen (1979) menguraikan enam cara untuk memandang koefisien reliabilitas tes. Dalam uraian mereka, koefisien reliabilitas disombolkan oleh sebagai parameter reliabilitas populasi umum.

Interfretasi 1
= korelasi skor -tampak antara dua tes yang parallel
Interprestasi ini mngatakan bahwa reliabilitas tes ditentuka oleh sejauh mana skor-tampak pada dua tes yang paralelberkorelasi. Bila pada dua tes yang parallel setiap subyek memperoleh skor yang sama dan pada masing-masing tes terdapat varian skor subyek, yaitu varian skor-tampaknya tidak sama dengan 0, maka tes tersebut mempunyai reliabilitas sempurna dengan koifisien sebesar = 1,00. Sebaliknya apabila skor-tampak pada suatu tes tidak berkorelasi sama sekali dengan skor tampak pada tes paralelnya maka kedua tes tersebut sama sekali tidak reliable dan koifisien reliabilitasnya adalah . Interprestasi ini menjadi asumsi dasar dalam pendekatan reliabilitas bentuk parallel (parallel – forms) dan pendekatan reliabilitas bentuksejajar (alternate-form)

Interpretasi 2
2 = besarnya populasi varian X yang dijelaskan oleh hubungan antara liniernya dengan x’
Interpretasi ini berasal dari penafsiran koifisien determinasi sebgaimana biasanya dilakukan pada penafsiran koifisien korelasi linier pearson. Jadi didalam hal ini besarnya kuadrat koifisien reliabilitas dapat dipandang sebagai proporsi varians skor pada tes lainnya yang parallel.
Interpretasi 3
= t2 / x2
Koifisien reliabilitas merupakan besarnya perbandingan anara varian skor-murni dan varian skor-tampak pada suatu tes, atau merupakan provorsi varians skor-tampak yang berisi varian skor-murni. Suatu koifisien reliabilitas sebesar 0,8 berarti bahwa 80 persen dari varian skor merupakan varian skor murni

Bila semua perbedaan yang terjadi pada skor tampak subyek merefleksikan perbedaan skor murni yaitu x2 = t2, maka reliabilitas tes tersebut adalah sempurna dengan koefisien xx’ = 1,00.


Intertpretasi 4
= xt2
Koifisoen reliabilitas merupakan kuadrat koifisien korelasi antara skor-tampak dengan skor murni. Jadi apabila koefisien reliabilitas xx’ = 0,64 maka xt = = 0,80. Bila besarnya koifisien xx’ = 0,49 maka xt = = 0.70.
Dari kedua contoh itu tampak bahwa koefisien korelasi antara skor-tampak dengan skor-murni selalu akan lebih besar dari pada koefisien reliabilitasnya, selama koefisien reliabilitas itu tidak sama dengan 0 atau 1. Kalau skor tampak pada tes atau variable lain itu diberi symbol Y maka fakta tersebut mendukung pernyataan bahwa xt xy
Menurut interpretasi ini yaitu, = xt2 korelasi maksimal antara X dan Y adalah . Dalam simbolisasi valisitas, skor X sendiri meruipakan skor tes dan skor Y merupakan skor kriteria sedangakan koefisien validitas disimbolkan oleh xy.

Interpretasi 5
xx’ = 1 – xe2
Besarnya proporsi varian skor tampak yang berkaitan dengan varian error ditunjukan oleh xe2. Sedangkan semakin besar proporsi itu maka semakin eratlah kaitan antara skor-tampak yang diperoleh subyek dengan dengan eror dan semakin rendahnya reliabilitas tes. Idealnya antara skor tampak dan eror sama sekali tidak boleh berkorelasi sehingga xe = 0. Hal ini hanya terjadi apabila reliabilitas tes adalah maksimal.

Interpretasi 6
xx’ = e2 / x2
Interpretasi ini mengkaitkan reliabilitas dengan varian error dan varian skor tampak. Disisi lain kita dapat melihat bahwa derajat heterogenitas skor subyek yang ditunjukan oleh besarnya x2 mempunyai pengaruh pnting terhadap koefisien reliabilitas. Dengan asumsi varian error tetap, tinggi rendahnya koefisien reliabilitas akan tergantung pada besar kecilnya varian skor tampak pada subyek yang bersangklutan. Pada kelompok subyek yang homogen yaitu yang memiliki x2 kecil, harga e2 / x2 akan relative lebih kecil dibandingkan dengan hargannya pada kelompok subyek yang heterogen (yang terdistribusi dengan x2 besar)


Estimasi Reliabilitas
Estimasi reliabilitas dapat dilakukan melalui salah satu pendekatan umum yaitu pendekatan tes ulang (test – retest), pendekatan tes sejajar (alternetif – forms) dan pendekatan konsistensi interlan (internal-consistency)
• tes - retest reliabilitas mengukur stabilitas nilai.
Pendekatan ini menunjukan konsistensi pengukuran dari waktu kewaktu dan mnghasilkan koefisien reliabilitas yang sering disebut sebagai koefisien stabilitas. Prinsip estimasinya adalah dengan menggunakan suatu ionstrumen pengukur dua kali dengan tenggang waktu tertentu, terhadap sekelompok subyek yang sama.
Komputasi korelasi antara distribusi skor dari kedua penggunaan tersebut menghasilkan estimasi reliabilitas instrument yang bersangkutan.
Kelemahan pendekatan test – retest adalah kurang pralktisnya penggunaan tes dua kali dan besarnya kemungkinan terjadi efek bawaan (carry –over-effects) dari suatu penggunaan tes kepenggunaan yang kedua.
• Pendekatan tes sejajar (alternetif – forms)
Pendekataan tes sejajar hanya dapat dilakukan apabila tersedia dua bentuk instrument pengukur yang dapat dianggap memnuhi asumsi parallel.
Pada kenyataan dilapangan bentuk parallel tidak selalu ada, karena biasanya penilaian bentuk parallel:
1. Prosedur penilaian hanya sekali digunakan pada masing-masing siswa
2. Tindalkan penilaian mengubah siswa
3. Hanya ada satu tindakan untuk menilai kemampuan ketertarikan
4. Sangat mahal utnuk membangun bentuk parallel dari penilaian

Salah satu insikator terpenuhinya asumsi parlel adalah staranya korelasi antara skor kedua instrument tersebut dengan skor suatu ukuran lain.
Untuk dapat parallel kedua bentuk instrument harus disusun dengan tujuan mengukur objek psikologis yang sama berdasarkan blue print (pola rancangan) yang sama serta spesifikasi yang sama pula.
Estimasi reliabilitas dengan pendekatan bentuk sejajar dilakukan setelah kedua instrument tersebut dikenakan berturut-turut pada sekelimpok subyek. Komputasi koefisien korelasi antara distribusi skor dari penggunaan kedua instrimen itu menghasilkan koefisien reliabilitas yang berlaku bagi keduanya.
Kelemahan utama pendekatan ini terletak pada sulitnya menyusun dua alat ukur yang menuhi persyaratan paralel atau sejajar disamping pendekatan ini juga tidak menghilangkan sama sekali kemungkiana terjadinya efek bawaan.
• Pendekatan Konsistensi Internal (internal consistency)
Estimasi reliabilitas dengan pendekatan konsistensi internal didasarkan pada pada data dari sekali peggunaan satu bentuk alat uikur pada sekelompok subyek. Komputasi koefisien reliabilitasnya dilakukan setelah keselruhan instrument yang telah dikenakan pada subyek itu dibelah menjadi bebrapa bagian. Satu instrument dapat dibelah menjadi dua, tiga, empat atau lebih bagian bahkan dapat dibelah menjadi sebanyak sejumlah item-itemnya. Bentuk dan sifat alat ukur serta banyaknya belahan yang dibuat akan menentukan tehnik perhitungan koefisien relkiabilitasnya.
Diantara tehnik-tehnik komputasi reliabilitas konsistensi internal adalah:
a. Formula Spearman Brown
Dapat digunakan apabila jumlah item dalam tes adalah genap sehingga dapat dibelah menjadi dua bagian yang seimbang.
Pembelahan ini dapat dilakukan dengan mengelompokkan item-item bernomor ganjil menjadi satu dan item-itembernomor genap menjadi satu pula. Rumusnya

= koefisien korelasi antara antara skor belahan Y dan skor blahan Y’

b. Formula Rulon
Sebagaimana formula Sperman Brown juga dikenakan pada data skor suatu tes yang dibelah menjadi dua bagian yang seimbang.
Dan formula Rulon, komputasi reliabilitas didasarkan pada selisih skor subyek pada kedua belahan tersebut. Mrnurut Rulon selisih skor itulah sumber variasi eror dan karenannya bila dibandingkan dengan variasi skor akan dapat menjadi dasar mengestimasi reliabilitas tes.
Dirumuskan:

= variansi perbedaan skor belahan (d)
= variansi skor tes (X)

c. Formula Alfa
Untuk melakukan estimasi reliabilitas Alfa tes dapat dibelah menjadi beberapa bagian. Dalam pembelahan ini sangat penting untuk menjadikan banyaknya aitem dalam setiap belahan sama sehingga diharapkan belahan-belahan itu seimbang. Bila formula Allpa dikenakan pada tes yang dibelah tidak seimbang maka koefisien yang di peroleh akan rendah dan merupakan underestimasi terhadap reliabilitas sebelumnya.
Formula Alpa untuk tes yng dibelah dua

= koefisien relibilitas Alpa
= Varians skor tes (X)
= Varians skor belahan (y1)
= varians skor tes (y2)

d. Formula Kuder Richardson 20
Formula KR-20 sebetulnya sama denagn formaula Alfa, akan tetapi formula KR-20 hanya dapat dikenakan pada data skor dikotomi dari tes yang seolah-olah dibagi-bagi menjadi belahan sebanyak aitemnya.
Dirumuskan oleh:

N = banyaknya aitem
Pi = indeks kesukaran aitem
= varians skor tes (X)


Tidak ada komentar: