RELIABILITAS
A. Pengertian
Reliabilitas
Kata reliabilitas dalam bahasa Indonesia diambil
dari bahasa Inggris, yaitu reliability.
Kata itu berasal dari kata reliable
yang artinya ketepatan. Seseorang
dapat dikatakan dapat dipercaya jika orang tersebut tidak berubah-ubah
pembicaraannya dari waktu ke waktu. Demikian pula halnya dengan tes. Tes dapat
dipercaya jika memberikan hasil yang tetap apabila diteskan berkali-kali.
Reabilitas menunjuk kepada sejauh mana tes tersebut ajeg dalam mengukur apa yang diukur. Menurut Latief (2004:3), yang
membandingkan validitas dan reliabilitas yaitu jika validitas mengacu pada
tingkat kebenaran hasil pengukuran keterampilan menulis yang diukur,
reliabilitas hasil pengukuran keterampilan berbahasa mengacu pada ketepatan
hasil pengukuran keterampilan berbahasa dalam mewakili tingkat keterampilan
sesungguhnya dari peserta tes.
Hasil pengukuran keterampilan berbahasa memiliki
reliabilitas tinggi jika hasil tersebut secara tepat mewakili (sangat dekat,
atau tidak terlalu jauh, atau memberi perkiraan yang baik) tingkat sesungguhnya
dari keterampilan yang diukur. Dengan kata lain, jika hasil pengukuran
keterampilan berbahasa terlalu jauh berbeda dari tingkat sesungguhnya dari
keterampilan yang diukur, hasil pengukuran tersebut memiliki reliabilitas
rendah.
Menurut Nurgiantoro (2010:166), pengertian konsisten
dalam reliabilitas tes berhubungan dengan (a) tes dapat memberikan hasil yang
relatif tetap terhadap sesuatu yang diukur, (b) jawaban peserta didik terhadap
butir-butir tes secara relatif tetap, dan (c) hasil tes diperiksa oleh siapa pun juga akan menghasilkan
skor yang kurang lebih sama. Ketiga hal tersebut merupakan sesuatu yang akan mempengaruhi
tingi atau rendahnya kadar reliabilitas tes.
Berbeda dengan validitas yang pembuktiannya dapat
berupa penalaran, khususnya validitas isi, pembuktian reliabilitas sepenuhnya
bersifat empirik yang menyangkut perhitungan statistik. Perhitungan statistik
itu dimaksudkan untuk menunjukkan adanya korelasi dalam berbagai tingkatnya,
dalam bentuk koefisien korelasi (Djiwandono, 1996:98).
B.
Faktor-faktor yang Mempengaruhi Tingkat
Reliabilitas
Ada beberapa faktor
yang mempengaruhi hasil tes. Ebel dan Frisbic (dalam Latief, 2004:218)
mengatakan bahwa reliabilitas tergantung pada ciri kelompok yang diuji, isi
tes, serta kondisi-kondisi dalam pelaksanaan tes. Berikut diuraikan beberapa
hal yang mempemgaruhi tingkat reliabilitas.
1.
Penampilan
Peserta Tes yang Kurang Prima
Peserta tes tidak berada dalam keadaan prima pada saat
tes dilaksanakan sehubungan dengan keadaan fisik dan emosi. Mereka mungkin
sakit, letih, lapar, emosi tidak stabil, tidak konsentrasi, atau mengantuk saat
tes dilaksanakan. Jadi, pelaksana tes harus memilih kondisi yang paling tepat
untuk menyakinkan bahwa peserta tes tidak berada dalam kondisi yang merugikan
pada tes yang dilaksanakan.
2.
Penilaian
yang Tidak Objektif
Penilai tidak berada dalam kondisi fisik dan emosi yang
stabil. Mereka mungkin sedang sakit, tidak konsentrasi, letih, lapar, emosi
tidak stabil, atau mengantuk saat memberi nilai. Jadi, hal ini juga harus
dikondisikan oleh pelaksana tes.
3.
Tes
yang Terlalu Pendek
Sebuah tes untuk
pengetahuan tatabahasa dengan 100 butir soal akan menghasilkan skor dengan
reliabilitas lebih tinggi dibanding tes yang sama dengan hanya 25 butir soal.
Demikian pula halnya dengan sebuah tes wawancara untuk mengukur keterampilan
berbicara yang berdurasi 30 menit untuk setiap peserta tes akan menghasilkan
skor berbicara dengan reliabifitas yang lebih tinggi dibanding tes yang sama
dengan durasi 5 menit untuk setiap peserta tes. Jika segala sesuatunya sama
maka tes yang panjang akan lebih reliabel daripada tes yang pendek.
Reliabilitas belah dua
merupakan teknik yang tepat digunakan bila kita ingin menghindari fluktuasi
dari masa ke masa dalam menduga reliabilitas dan bila tes tersebut relatif
panjang. Untuk tes-tes yang pendek, sebaiknya digunakan teknik yang lain,
misalnya tes ulang atau bentuk setara.
4.
Soal
Tes Terlalu Mudah atau Terlalu Sulit
Sebuah tes untuk
keterampilan menyimak, misalnya, yang terialu sufit sehingga hanya 10 persen
dari peserta tes yang bisa menjawab benar, atau terialu mudah sehingga hampir semua
peserta tes bisa menjawab dengan benar akan menghasilkan skor dengan
reliabilitas rendah dibandingkan dengan tes yang sama dimana
pertanyaan-pertanyaan memiliki tingkat kesulitan sedang sehingga antara 35
sampai 85 persen dari peserta tes bisa menjawab semua pertanyaan dengan benar.
Jadi tingkat kesulitan sebuah tes mempengaruhi tingkat reliabilitas.
5.
Mencontek
dalam Tes
Jika peserta tes
tidak diawasi secara ketat dalam pelaksanaan sebuah tes, mereka mungkin saja mencontek
jawaban dari peserta lain atau mencontek dari catatan yang dipersiapkan dari
rumah. Jika hal ini terjadi tes akan menghasilkan skor dengan reliabilitas
rendah. Jadi, kejujuran peserta tes dalam menjawab soal tes ikut mempengaruhi
tingkat reliabilitas.
6.
Waktu
dan Tempat Yang Tidak Menyenangkan
Sebuah tes yang
dilaksanakan di sebuah ruangan yang tidak nyaman, terialu panas, terialu
dingin, bising atau pada waktu yang tidak menyenangkan, pada pukul 2 sore, hal
ini akan menghasilkan skor tes dengan reliabilitas rendah.
C.
Cara
Estimasi Reliabilitas
Ada sejumlah prosedur atau teknik yang dapat dipergunakan
untuk mengestimasi reliabilitas pengukuran, yaitu (a) teknik ulang uji (test
retes), (b) teknik belah dua (spit-half), (c) pengukuran dengan
rumus Kuder Richardson 20 dan 21, (d) teknik butir parallel (parallel-item),
dan (e) teknik bentuk paralel (alternate-forms).
a.
Reliabilitas Ulang Uji
Teknik tes ulang uji adalah teknik memperkirakan
tingkat reliabilitas tes dengan melakukan kegiatan pengukuran dua kali terhadap
tes yang sama kepada peserta didik yang sama pula. Hasil tes pertama dan kedua kemudian
dikorelasikan. Jika koefisien korelasi (r) yang diperoleh cukup tinggi, hasil
pengukuran tes yang diujicobakan itu dinyatakan reliabilitasnya tinggi. Reliabilitas
ulang uji ini mempunyai beberapa kelemahan.
Kelemahan-kelemahan yang dimaksud adalah sebagai berikut.
1. Sulit
untuk menghilangkan pengaruh jawaban tes yang pertama. Hal ini akan lebih
terasa untuk butir-butir tes yang mengukur sesuatu yang bersifat ingatan dan
pemahaman, dan tenggang waktu antara tes pertama dan kedua secara relatif tidak
lama.
2. Mungkin
terdapat faktor yang mempengaruhi hasil tes kedua, misalnya berupa meningkatnya
kemampuan peserta didik sebagai hasil belajar.
Masalah ini terjadi terutama jika tenggang waktu antara tes pertama dan
kedua cukup lama.
3. Sulit
untuk menciptakan dua kondisi diselenggarakannya dua kali tes yang sama. Ada
berbagai faktor yang mempengaruhi kondisi tersebut, baik berasal dari pihak
peserta didik (faktor internal) maupun pihak luar peserta didik (faktor eksternal)
seperti situasi dan kondisi yang ada di sekolah itu sendiri.
4. Menuntut
peserta didik untuk mengalami dua kali tes. Hal ini dirasa kurang menguntungkan
dan memberatkan peserta didik.
b.
Reliabilitas Belah Dua
Pengujian reliabilitas tes dengan teknik belah dua (split
half) dilakukan dengan memisahkan skor hasil ke dalam dua kelompok, yaitu
kelompok ganjil dan kelompok genap atau kelompok awal dan akhir. Namun, yang
lebih banyak dipergunakan orang adalah kelompok ganjil dan genap. Caranya ialah
dengan menghitung jumlah skor untuk butir-butir soal yang bernomor ganjil dan
yang bernomor genap. Kedua jumlah skor tersebut kemudian dikorelasikan untuk
mendapatkan koefisien korelasi (r) antara keduanya.
Akan tetapi, koefisien korelasi dari penghitungan
tersebut baru menunjukkan reliabilitas tes untuk separuh soal. Padahal, yang
kita harapkan adalah reliabilitas untuk seluruh soal. Untuk mendapatkan
koefisien korelasi reliabilitas seluruh tes, kita dapat mempergunakan rumus
Spearman-Brown. Rumus Spearman-Brown yang dimaksud adalah sebagai berikut.
Misalnya, berdasarkan penghitungan koefisien korelasi separuh soal
didapatkan r sebesar 0,713 (dihitung dengan langkah-langkah di bawah), maka tingkat kepercayaan seluruh
tes adalah sebagai berikut.
Kosfesien reliabilitas seluruh tes yang diperoleh (0,832)
termasuk kategori tinggi, maka tes yang diuji itu dinyatakan memiliki timgkat
reliabilitas yang tinggi pula. Artinya, hasil pengukuran yang dilakukan dengan
tes yang bersangkutan dapat dinyatakan konsisten.
Hasil pengukuran
yang akan diuji reliabilitasnya adalah bentuk tes objektif dengan jawaban dikotomis.
Jawaban benar mendapat skor 1, jawaban salah 0. Langkah pertama yang ditempuh
adalah menganalisis lembar-lembar jawaban peserta didik terhadap hasil
pengukuran tes yang akan diuji, menghitung jawaban benar atau salah per butir
soal per peserta didik. Dari kegiatan ini, akan didapatkan skor keseluruhan
tiap peserta didik, skor jawaban betui untuk kelompok butir soal bemomor ganjil
dan genap inilah yang dicari korelasinya.
Berikut dicontohkan
analisis jawaban peserta didik untuk menghitung skor kelompok ganjil dan genap,
misalnya terhadap hasil pengukuran tes kompetensi membaca dan bersastra.
Tabel 1
Analisis Butir Soal
untuk Persiapan Penghitungan Korelasi Teknik Reliabilitas Belah Dua
Nomor
Urut Peserta Tes
|
Nomor
Butir Soal
|
Skor
total
|
Skor
ganjil
|
Skor
genap
|
|||||||||
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
||||
1.
|
1
|
1
|
0
|
1
|
0
|
1
|
1
|
1
|
1
|
1
|
8
|
3
|
5
|
2.
|
1
|
0
|
1
|
1
|
1
|
1
|
0
|
0
|
0
|
1
|
6
|
3
|
3
|
3.
|
0
|
1
|
1
|
1
|
0
|
1
|
1
|
0
|
1
|
1
|
7
|
3
|
4
|
4.
|
0
|
1
|
1
|
1
|
1
|
0
|
1
|
1
|
1
|
1
|
8
|
4
|
4
|
5.
|
1
|
1
|
0
|
0
|
1
|
1
|
0
|
1
|
0
|
0
|
5
|
2
|
3
|
6.
|
1
|
1
|
1
|
1
|
0
|
1
|
1
|
1
|
1
|
1
|
9
|
4
|
5
|
7.
|
1
|
0
|
1
|
0
|
0
|
1
|
1
|
1
|
0
|
1
|
6
|
3
|
3
|
8.
|
0
|
0
|
1
|
1
|
1
|
0
|
0
|
1
|
0
|
0
|
4
|
2
|
2
|
Data hasil di atas dipergunakan untuk
menghitung koefisien korelasi skor ganjil (
) dan
skor genap (
)
berikut.
Nomor
Urut PcsertaTes
|
|
|
1
|
1
|
3
|
5
|
15
|
2
|
3
|
3
|
9
|
3
|
3
|
4
|
12
|
4
|
4
|
4
|
16
|
5
|
2
|
3
|
6
|
6
|
4
|
5
|
20
|
7
|
3
|
3
|
9
|
8
|
2
|
2
|
4
|
n
= 8
|
|
|
|
Data tersebut
kemudian dimasukan ke dalam rumus korelasi product moment angka kasar.
=
= 0,713
Koefisien korelasi
sebesar 0,713 yang diperoleh
tersebut baru menunjukkan tingkat reliabilitas separuh tes. Untuk mendapatkan
reliabilitas seluruh tes, ia harus dilanjutkan dengan penggunaan rumus
Spearman-Brown seperti dikemukakan di atas.
c.
Reliabilitas Rumus Kuder-Richardson
20 dan 21
Pengujian reliabilitas tes dengan mempergunakan
rumus Kuder-Richardson (K - R) 20 dan 21, dilakukan dengan membandingkan skor
butir-butir tes. Jika butir-butir tes itu menunjukkan tingginya tingkat
kesesuaian (degree of agreement), kita dapat menyimpulkan bahwa hasil
pengukuran tes itu konsisten. Rumus K-R 20 dan 21 menunjukkan seri karena kedua
orang itu mengembangkan banyak rumus yang diberi nomor seri. Dari banyak rumus
yang dikembangkan, kedua nomor seri itulah yang kemudian terkenal dan banyak
dipergunakan orang. Adapun rumus K-R 20 dan K-R 21 adalah sebagai berikut.
a. Rumus
K-R 20 =
Keterangan:
r = Koofesien reliabilitas tes
n = Jumlah butir soal
p = Proporsi jawaban betul
q = Proporsi jawaban salah
s = Simpangan baku,
b. Rumus
K-R 21 =
Keterangan:
X = rata-rata hitung (mean), sedangkan
simbol-simbol yang lain seperti keterangan di atas.
Sama halnya dengan
penghitungan koefisien reliabilitas belah dua, hasil pengukuran yang akan diuji
reliabilitasnya adalah bentuk tes objektif dengan jawaban dikotomis, jawaban
benar dengan skor 1, dan jawaban salah 0. Langkah persiapan untuk menghitung
koefisien keterpercayaan dengan
rumus K - R 20 adalah sebagai berikut.
Menganalisis
jawaban benar atau salah per butir soal per peserta didik langsung diletakkan
dalam sebuah label analisis butir soal. Selanjutnya, menghitung jawaban benar
per peserta didik (secara horisontal), dari data ini dapat ditemukan besamya
rata-rata hitung ( X ) dan simpangan
baku (s). Setelah itu, menghitung jawaban benar per butir soal (secara
vertikal), dari data ini dapat dihitung proporsi jawaban benar (p) dan jawaban
salah (q). Besarnya p = jumlah jawaban benar dibagi jumlah subjek, sedang q = 1
-p. Selanjutnya, dihitung berapa jumlah p x q (
).
Di bawah dicontohkan analisis dan
penghitungan yang dimaksud.
Tabel 2
Analisis Butir Soal
untuk Persiapan Penghitungan Koefisien
Reliabilitas dengan Rumus K-R 20
Nomor Urut
Peserta Tes
|
Nomor Butir Soal
|
Jumlah Skor
|
|||||||||
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
||
1
|
1
|
1
|
0
|
0
|
1
|
0
|
1
|
1
|
1
|
0
|
6
|
2
|
1
|
0
|
0
|
1
|
1
|
0
|
0
|
0
|
1
|
1
|
5
|
3
|
1
|
1
|
1
|
0
|
1
|
1
|
1
|
1
|
0
|
1
|
8
|
4
|
0
|
1
|
0
|
0
|
0
|
1
|
1
|
1
|
0
|
0
|
4
|
5
|
0
|
0
|
0
|
0
|
1
|
0
|
1
|
0
|
1
|
0
|
3
|
6
|
1
|
1
|
1
|
1
|
1
|
1
|
1
|
0
|
1
|
1
|
9
|
7
|
1
|
1
|
0
|
1
|
0
|
1
|
0
|
0
|
1
|
1
|
6
|
8
|
1
|
1
|
1
|
0
|
0
|
1
|
1
|
0
|
1
|
1
|
7
|
Jumlah
|
6
|
6
|
3
|
3
|
5
|
5
|
6
|
3
|
6
|
5
|
48
|
P
|
0,75
|
0,75
|
0,375
|
0,375
|
0,625
|
0,625
|
0,75
|
0,375
|
0.75
|
0,625
|
|
q
|
0,25
|
0:25
|
0,625
|
0,625
|
0,375
|
0,375
|
0.25
|
0,625
|
0,25
|
0,375
|
|
pq
|
0.19
|
0,19
|
0,234
|
0.234
|
3,234
|
0,234
|
0,19
|
0,234
|
0,19
|
0.234
|
2.164
|
n = 10
s = 1,87
X
= 6
|
Dari data di atas kota masukkan ke dalam rumus K-R 20 berikut.
= 1,11
(1-0,619)
= 1,11 x
0,381
= 0, 423
Data-data di atas
juga kita masukkan ke dalam rumus K-R 21. Akan tetapi, data yang dibutuhkan
hanya n = 10, X = 6, dan s = 1,87. Jadi, tidak memerlukan analisis butir
soal untuk mendapatkan jumlah proporsi pq (
)
seperti halnya pada K-R 20.
Pcrhitungan dengan rumus K-R 21 dicontohkan sebagai
berikut.
= 1,11 (1-0,686)
= 1,11 x 0,314
= 0,348
Sebagai catatan
perlu ditambahkan bahwa penggunaan rumus K-R 20 dan 21 mendasarkan diri
pada asumsi distribusi normal. Jadi, ia menghendaki penyebaran angka ke kanan
dan ke kiri secara merata dengan titik tengah letak kecenderungan sentral
nilai. Semakin tinggi jarak sebaran skor (range), atau semakin besar
nilai simpangan baku (s), akan semakin tinggi pula koefisien r yang diperoleh.
d.
Reliabilitas Alpha Cronbach
Jika rumus reliabilitas Kuder-Richardson 20 dan 21
di atas diterapkan pada tes yang memunyai skor dikotomi, artinya hanya ada dua
kemungkinan skor, yaitu benar dan salah, dengan skor 1 dan 0 saja, koefisien
reliabilitas Alpha -lengkapnya koefisien reliabihtas Alpha Cronbach- diterapkan
pada tes yang memunyai skor berskala dan dikotomis sekaligus. Artinya, prosedur
uji reliabilitas ini diterapkan pada hasil pengukuran yang berjenjang,
misalnya: 1-4, 1-5, 1-6, atau yang lain tergantung maksud penyusunannya.
Rumus koefisien reliabilitas Alpha Cronbach itu
adalah sebagai berikut.
Keterangan:
k
= Jumlah butir soal
Jumlah varian butir-butir
Varian total (untuk seluruh butir tes)
Teknik penghitungan koefisien reliabilitas Alpha
Cronbach ini cukup luas dipergunakan untuk keperluan uji hasil pengukuran di
dunia pendidikan. Dalam penghitungan indeks tingkat kesulitan (ITK) dan indeks
daya beda (IDB) butir soal lewat program komputer Iteman, indeks reliabilitas
yang dipergunakan juga koefisien reliabilitas Alpha Cronbach.
Reliabelitas Alpha
Cronbach ini salah satunya dapat digunakan pada bentuk tes uraian. Adapun
langkah-langkah persiapan untuk menghitung koefisien reliabilitas tes bentuk
uraian, tidak berbeda halnya dengan langkah-langkah dalam mencari koefisien
reliabilitas tes objektif dengan rumus K-R 20 di atas. Langkah-langkah yang
dimaksud adalah sebagai berikut.
1.
Menganalisis
jawaban peserta didik per butir tes. Skor tes uraian biasanya berskala,
misalnya skor minimum 1 dan maksimum 10, atau skor minimum 1 dan maksimum 5,
bahkan untuk tiap butir tes sendiri mungkin tidak sama (dalam contoh yang
diberikan di bawah ini skor minimum 1 dan maksimum 5).
2.
Menghitung
jumlah skor per peserta didik (secara horisontal) dan jumlah skor yang
diperoleh kemudian dikuadratkan, yaitu untuk mendapatkan skor total dan kuadrat
skor total (sebagai, persiapan mencari varian total).
3.
Menghitung
jumlah skor per butir tes (secara vertikal) dan jumlah kuadrat skor per butir
tes (dikuadratkan dulu kemudian dijumlah), serta jumlah seluruh kuadrat
(sebagai persiapan mencari varian per butir tes).
Berikut dicontohkan analisis butir tes dan
penghitungan-penghitungan yang
dimaksud.
Tabel 3
Analisis Butir Tes Esai untuk Persiapan Penghitugan
Koefisien Reliabilitas Tes
Nomor Unit Peserta Tes
|
Nomor Butir Soal
|
Skor Total
|
Kuadrat SkorToal
|
|||
1
|
2
|
3
|
4
|
|||
1
|
4
|
3
|
5
|
3
|
15
|
225
|
3
|
4
|
2
|
4
|
2
|
12
|
144
|
3
|
5
|
4
|
5
|
4
|
18
|
324
|
4
|
5
|
3
|
5
|
3
|
16
|
256
|
5
|
2
|
1
|
3
|
2
|
8
|
64
|
6
|
2
|
2
|
3
|
3
|
10
|
100
|
Jumlah
|
22
|
15
|
25
|
17
|
70
|
1.113
|
Jumlah Kuadrat
|
90
|
43
|
109
|
51
|
293
|
=
0,92
Dengan perhitungan yang sama diperoleh
0,81 dan
0,47.
=1,56
+ 0,92 + 0,81 + 0,47 = 3,76
= 12,14
Data-data
di atas kita masukkan ke dalam rumus
reliabilitas tes esai, atau rumus
Alpha di atas.
=
1,33 x 0,69
=
0,918
e.
Reliabilitas Bentuk Paralel
Pengujian reliabilitas hasil pengukuran tes dengan
teknik butir paralel dilakukan terhadap adanya dua perangkat tes yang bersifat
paralel. Kedua perangkat tes itu dimaksudkan untuk mengukur tujuan atau kompetensi
yang sama, dengan jumlah butir, susunan, dan tingkat kesulitan yang kurang
lebih sama pula. Jadi, dua perangkat tes yang dibuat berdasarkan spesifikasi
yang sama.
Untuk menguji reliabilitas hasil pengukuran tes,
kedua perangkat tes tersebut diujicobakan kepada sejumlah subjek yang sama,
kemudian hasilnya dikorelasikan. Tinggi rendahnya koefisien korelasi akan
mencerminkan reliabilitas hasil pengukuran kedua perangkat tes itu.
Teknik ini ada persamaannya dengan teknik ulang uji
jika dilihat dari banyaknya tes yang dialami pcserta didik, sama-sama menuntut
dua kali tes. Akan tetapi, teknik bentuk paralel mcngujikan dua perangkat tes
yang tidak sama. Hal ini dipandang sebagai keuntungan dibanding dengan teknik ulang
uji karena adanya "pengaruh jawaban dari tes pertama" (practice-effect
atau cary-over-effect) tidak akan terjadi pada tes yang kedua. Akan tetapi,
menyiapkan dua perangkat tes yang paralel bukan merupakan pekerjaan yang mudah.
Hal ini dipandang sebagai kelemahan teknik bentuk paralel sebagai prosedur
reliabilitas hasil pengukuran alat tes.
D.
Usaha
Penyusunan Tes yang Reliabel
Untuk
mengusahakan agar tes yang kita susun terpercaya, hal-hal yang
disarankan benkut perlu diperhatikan. Adapun hal-hal yang dimaksud adalah sebagai berikut.
a.
Susun Butir Soal Secukupnya
Jumlah butir tes yang relatif banyak akan lebih baik
daripada yang sedikit karena keadaan itu akan lebih mencerminkan sampel
penampilan (kompetensi dan keterampilan) peserta didik. Jika jumlah butir soal
hanya sedikit dan kebetulan peserta didik tidak dapat mengerjakannya, hal itu
tidak saja menunjukkan kegagalan peserta didik, melainkan juga kegagalan
pembelajaran dan alat pengukur (tes) itu sendiri.
Penambahan jumlah butir soal akan meningkatkan kadar
reliabilitas, semakin besar jumlah butir soal akan semakin besar pula kadar reliabihtasnya.
Akan tetapi, penambahan butir soal sampai dengan jumlah tertentu tidak akan
meningkatkan kadar reliabilitas secara seimbang. Tabel berikut akan mcnjelaskan hal yang dimaksud.
Tabel
4
Hubungan antara
Jumlah Butir Soal dan Reliabilitas Hasil Pengukuran
Jumlah Butir Soal
|
Reliabilitas
|
|
5
|
0,20
|
|
10
|
0,33
|
|
20
|
0,50
|
|
40
|
0,67
|
|
80
|
0,80
|
|
160
|
0,89
|
|
320
|
0,94
|
|
640
|
0,97
|
|
|
1,00
|
|
Penambahan
jumlah butir soal sampai dengan 80 buah masih menguntungkan karena peningkatan
kadar reliabilitas cukup tinggi. Akan tetapi, penambahan selanjutnya tidak
begitu menambah tingginya reliabilitas. Hal itu tidak seimbang dengan banyaknya
jumlah butir tes yang sebanyak itu.
b.
Pilih Butir Soal yang Bertaraf Kesulitan
Cukupan
Butir soal yang baik adalah butir yang tidak terlalu
sulit, dan sebaiknya tidak terlalu mudah. Butir tes yang terlalu sulit atau
mudah tidak mencerminkan secara memadai kompetensi yang diukur, di samping juga
tidak dapat membedakan antara peserta didik yang berprestasi dan yang tidak.
Indeks tingkat kesulitan sebuah butir soal dinyatakan dengan koefisien 0,00
sampai dengan 1,00. Butir soal yang indeks kesulitannya semakin mendekati nol
berarti soal itu semakin sulit, sebaliknya, semakin besar indeks kesulitan
berarti butir soal itu semakin mudah.
c.
Pilih Butir Soal yang Berdaya Beda
Cukup
Butir soal yang baik adalah butir yang mampu
membedakan antara peserta didik yang berprestasi dengan yang tidak. Daya
pembeda sebuah butir soal dinyatakan dengan indeks -1,00 sampai dengan 1,00.
Indeks suatu butir soal yang semakin tinggi mendekati 1,00 akan semakin baik
karena semakin mampu membedakan antara kedua kelompok tinggi dan rendah
tersebut. Sebaliknya, semakin kecil mendekati nol atau bahkan negatif butir
soal yang bersangkutan semakin tidak. Hal itu terutama berlaku untuk penafsiran
hasil ujian yang mempergunakan pendekatan norma atau kelompok.
d.
Perjelas Redaksi Soal Tes
Selain mempengaruhi validitas hasil pcngukuran,
kejelasan unsur bahasa juga mempengaruhi reliabilitas. Oleh karena itu, bahasa
yang dipergunakan dalam tes harus jelas, mudah dipahami, dan tidak bcrsifat
ambigu, serta tidak membingungkan. Kalimat yang tidak jelas akan mudah
menimbulkan kesalahpahaman dan hal itu akan menyebabkan kurangnya sifat keajegan
dan reliabilitas. Oleh karena itu, redaksi tes yang tidak jelas dan
membingungkan hendaknya direvisi. Hal ini seharusnya sudah ditemukan lewat
telaah kualitatif butir soal oleh sejawat.
e.
Bersikap Objektif dalam Menilai
Sikap objektif dalam menilai pekerjaan peserta
didik, khususnya untuk tes uraian, sangat diperlukan. Sikap objektivitas dalam
penilaian akan meningkatkan kekonsistenan hasil pengukuran sebuah tes. Dalam
tes objektif biasanya konsistensi dalam penyekoran lebih terjamin karena antara
jawaban benar dan salah sudah pasti dan terlihat jelas. Namun, tidak demikian
halnya dengan tes uraian yang jawabannya bersifat subjektif. Demikian juga
halnya dalam hal penilaian. Untuk mcngurangi adanya sikap subjektivitas dalam
menilai tes uraian, hendaknya terlebih dahulu dibuat pedoman penilaian dengan
membuat "porsi-porsi" tertentu dengan bobot yang tertentu pula, misalnya
porsi isi, organisasi, kreativitas, rasional, dan penyelesaian masalah. Hasil
penilaian tiap kategori itu dijumlahkan untuk mendapatkan skor total Cara ini
memungkinkan penilaian lebih konsisten dari waktu ke waktu dan dari peserta
didik ke peserta didik.
Memeriksa sebuah lembar jawaban peserta
didik sebaliknya dilakukan dua kali agar dapat memberikan pertimbangan yang
lebih tepat, minimum pada awal kegiatan penilaian. Selain itu, untuk lebih meningkatkan
sikap objektivitas, nama-nama peserta didik ada baiknya ditutup dan tidak usah
diketahui, pekerjaan siapa yang sedang diperiksa.
f.
Kontrol terhadap Kondisi
Pelaksanaan Tes
Kontrol terhadap kondisi pelaksanaan tes tidak hanya
mempengaruhi validitas hasil pengukuran, tetapi juga reliabilitasnya. Maka,
kondisi pelaksanaan tes harus diusahakan sedemikian rupa sehingga kondisi luar
yang dapat mempengaruhi penampilan peserta didik dalam tes dapat dicegah karena
hal itu juga berarti mempengaruhi hasil pengukuran. Kita perlu mengusahakan
agar setiap peserta didik bekerja sediri, percaya kepada diri sendiri, dan sedapat
mungkin mengurangi adanya kemungkinan peserta didik yang akan bekerja sama,
atau berusaha tidak jujur. Kondisi pelaksanaan tes yang tidak terkontrol hanya
akan memberikan data hasil belajar peserta didik yang tidak dapat
dipertanggungjawabkan. Hal itu berarti kegiatan tes yang dilakukan kurang
berarti.
g.
Kesalahan Baku Pengukuran
Skor peserta tes yang diperoleh lewat pengukuran
adalah skor yang memiliki
"kesalahan". Artinya, skor itu sebenamya bukan merupakan skor mereka
yang sesungguhnya (true score). Skor yang sesungguhnya, yaitu skor yang
benar-benar mewakili keadaan atau kompetensi peserta didik yang sebenamya dalam
bidang yang diukur itu tidak pemah diketahui secara pasti, dan hanya dapat
diperkirakan saja besamya. Cara untuk memeperkirakan skor yang sesungguhnya
adalah dengan mempergunakan kesalahan baku pengukuran (standard error of
measurement) terhadap skor hasil pengukuran yang diperoleh. Untuk membantu
kecermatan dalam pemberian pertimbangan terhadap hasil tes peserta didik, di
samping juga untuk memperkirakan skor sesungguhnya tiap peserta didik,
kesalahan baku pengukuran dalam tes sebaiknya juga dihitung.
Kesalahan baku pengukuran dihitung berdasarkan
besamya simpangan baku (s) dan indeks reliabilitas (r) alat tes yang
bersangkutan. Adapun rumus yang dipergunakan untuk menghitung kesalahan baku
pengukuran tersebut adalah sebagai berikut.
SEm
=
Keterangan:
SEm
= Standard
error of measurement, kesalahan
baku pengukuran yang dicari
s : Simpangan baku
r : Indeks reliabilitas
Misalnya, dalam penghitungan
reliabilitas dengan teknik K-R 20 yang berdasarkan tabel hasil pengukuran Tabel
2. Dari label itu diketahui bahwa s = s = 1,87, dan dalam penghitungan yang
dilakukan kemudian diperoleh indeks reliabilitas r = 0,423. Kedua data yang diperlukan itu
kemudian dimasukkan ke dalam rumus sebagai berikut.
SEm
=
=
187
=
1,42046 (dibulatkan: 1,42)
Besar kecilnya indeks simpangan baku
pengukuran mempengaruhi kualitas hasil pengukuran. Semakin kecil indeks itu
semakin baik. Hal itu dikarenakan dengan kecilnya indeks itu perkiraan besarnya
skor sesungguhnya tidak terlalu jauh. Artinya, skor sesungguhnya seorang
peserta didik tidak terlalu menyimpang dari skor yang diperoleh atau yang
tampak. Besarnya indeks simpangan baku kesalahan ditentukan oleh besarnya
indeks reliabilitas dan simpangan baku. Semakin besar indeks reliabilitas akan
semakin kecil indeks simpangan baku pengukuran, dan sebaliknya, semakin kecil
indeks reliabilitas akan semakin besar indeks kesalahan baku pengukuran.
Daftar
Pustaka
Djiwandono, M. Soenardi. 1996. Tes
Bahasa dalam Pengajaran. Bandung:
ITB Press.
Latief, Muhammad Adnan. 2004. Pembelajaran dan Penilaian Bahasa Inggris. Malang: Universitas
Negeri Press.
Nurgiyantoro, Burhan. 2010. Penilaian Pembelajaran Bahasa Berbasis Kompetensi. Yogyakarta:
Gajah Mada University Press.
Olah Data Jujur
ReplyDeleteOlah Data Yang Jujur
Olah Data Semarang Merupakan Olah Data Yang Jujur
https://s.id/Jujur
Peneliti Boleh Saja Salah, Tapi Ia Tak Boleh Berbohong
Kualitas Suatu Penelitian Terletak Pada Integritas Dan
Standar Moral Penelitinya