Sunday, June 12, 2016

Reliabilitas Alat Tes


http://trifanews.com/wp-content/uploads/2012/06/Rumus-reliabilitas-160x160.png


RELIABILITAS

A.    Pengertian Reliabilitas
Kata reliabilitas dalam bahasa Indonesia diambil dari bahasa Inggris, yaitu reliability. Kata itu berasal dari kata reliable yang artinya ketepatan. Seseorang dapat dikatakan dapat dipercaya jika orang tersebut tidak berubah-ubah pembicaraannya dari waktu ke waktu. Demikian pula halnya dengan tes. Tes dapat dipercaya jika memberikan hasil yang tetap apabila diteskan berkali-kali. Reabilitas menunjuk kepada sejauh mana tes tersebut ajeg dalam mengukur apa yang diukur. Menurut Latief (2004:3), yang membandingkan validitas dan reliabilitas yaitu jika validitas mengacu pada tingkat kebenaran hasil pengukuran keterampilan menulis yang diukur, reliabilitas hasil pengukuran keterampilan berbahasa mengacu pada ketepatan hasil pengukuran keterampilan berbahasa dalam mewakili tingkat keterampilan sesungguhnya dari peserta tes.
Hasil pengukuran keterampilan berbahasa memiliki reliabilitas tinggi jika hasil tersebut secara tepat mewakili (sangat dekat, atau tidak terlalu jauh, atau memberi perkiraan yang baik) tingkat sesungguhnya dari keterampilan yang diukur. Dengan kata lain, jika hasil pengukuran keterampilan berbahasa terlalu jauh berbeda dari tingkat sesungguhnya dari keterampilan yang diukur, hasil pengukuran tersebut memiliki reliabilitas rendah.
Menurut Nurgiantoro (2010:166), pengertian konsisten dalam reliabilitas tes berhubungan dengan (a) tes dapat memberikan hasil yang relatif tetap terhadap sesuatu yang diukur, (b) jawaban peserta didik terhadap butir-butir tes secara relatif tetap, dan (c) hasil tes diperiksa oleh siapa pun juga akan menghasilkan skor yang kurang lebih sama. Ketiga hal tersebut merupakan sesuatu yang akan mempengaruhi tingi atau rendahnya kadar reliabilitas tes.
Berbeda dengan validitas yang pembuktiannya dapat berupa penalaran, khususnya validitas isi, pembuktian reliabilitas sepenuhnya bersifat empirik yang menyangkut perhitungan statistik. Perhitungan statistik itu dimaksudkan untuk menunjukkan adanya korelasi dalam berbagai tingkatnya, dalam bentuk koefisien korelasi (Djiwandono, 1996:98).
 https://deceng3.files.wordpress.com/2013/08/validity_reliability.png

B.      Faktor-faktor yang Mempengaruhi Tingkat Reliabilitas
Ada beberapa faktor yang mempengaruhi hasil tes. Ebel dan Frisbic (dalam Latief, 2004:218) mengatakan bahwa reliabilitas tergantung pada ciri kelompok yang diuji, isi tes, serta kondisi-kondisi dalam pelaksanaan tes. Berikut diuraikan beberapa hal yang mempemgaruhi tingkat reliabilitas.
1.      Penampilan Peserta Tes yang Kurang Prima
Peserta tes tidak berada dalam keadaan prima pada saat tes dilaksanakan sehubungan dengan keadaan fisik dan emosi. Mereka mungkin sakit, letih, lapar, emosi tidak stabil, tidak konsentrasi, atau mengantuk saat tes dilaksanakan. Jadi, pelaksana tes harus memilih kondisi yang paling tepat untuk menyakinkan bahwa peserta tes tidak berada dalam kondisi yang merugikan pada tes yang dilaksanakan.
2.      Penilaian yang Tidak Objektif
Penilai tidak berada dalam kondisi fisik dan emosi yang stabil. Mereka mungkin sedang sakit, tidak konsentrasi, letih, lapar, emosi tidak stabil, atau mengantuk saat memberi nilai. Jadi, hal ini juga harus dikondisikan oleh pelaksana tes.
3.      Tes yang Terlalu Pendek
Sebuah tes untuk pengetahuan tatabahasa dengan 100 butir soal akan menghasilkan skor dengan reliabilitas lebih tinggi dibanding tes yang sama dengan hanya 25 butir soal. Demikian pula halnya dengan sebuah tes wawancara untuk mengukur keterampilan berbicara yang berdurasi 30 menit untuk setiap peserta tes akan menghasilkan skor berbicara dengan reliabifitas yang lebih tinggi dibanding tes yang sama dengan durasi 5 menit untuk setiap peserta tes. Jika segala sesuatunya sama maka tes yang panjang akan lebih reliabel daripada tes yang pendek.
Reliabilitas belah dua merupakan teknik yang tepat digunakan bila kita ingin menghindari fluktuasi dari masa ke masa dalam menduga reliabilitas dan bila tes tersebut relatif panjang. Untuk tes-tes yang pendek, sebaiknya digunakan teknik yang lain, misalnya tes ulang atau bentuk setara.
4.      Soal Tes Terlalu Mudah atau Terlalu Sulit
Sebuah tes untuk keterampilan menyimak, misalnya, yang terialu sufit sehingga hanya 10 persen dari peserta tes yang bisa menjawab benar, atau terialu mudah sehingga hampir semua peserta tes bisa menjawab dengan benar akan menghasilkan skor dengan reliabilitas rendah dibandingkan dengan tes yang sama dimana pertanyaan-pertanyaan memiliki tingkat kesulitan sedang sehingga antara 35 sampai 85 persen dari peserta tes bisa menjawab semua pertanyaan dengan benar. Jadi tingkat kesulitan sebuah tes mempengaruhi tingkat reliabilitas.
5.      Mencontek dalam Tes
Jika peserta tes tidak diawasi secara ketat dalam pelaksanaan sebuah tes, mereka mungkin saja mencontek jawaban dari peserta lain atau mencontek dari catatan yang dipersiapkan dari rumah. Jika hal ini terjadi tes akan menghasilkan skor dengan reliabilitas rendah. Jadi, kejujuran peserta tes dalam menjawab soal tes ikut mempengaruhi tingkat reliabilitas.
6.      Waktu dan Tempat Yang Tidak Menyenangkan
Sebuah tes yang dilaksanakan di sebuah ruangan yang tidak nyaman, terialu panas, terialu dingin, bising atau pada waktu yang tidak menyenangkan, pada pukul 2 sore, hal ini akan menghasilkan skor tes dengan reliabilitas rendah.

C.    Cara Estimasi Reliabilitas
Ada sejumlah prosedur atau teknik yang dapat dipergunakan untuk mengestimasi reliabilitas pengukuran, yaitu (a) teknik ulang uji (test retes), (b) teknik belah dua (spit-half), (c) pengukuran dengan rumus Kuder Richardson 20 dan 21, (d) teknik butir parallel (parallel-item), dan (e) teknik bentuk paralel (alternate-forms).
a.      Reliabilitas Ulang Uji
Teknik tes ulang uji adalah teknik memperkirakan tingkat reliabilitas tes dengan melakukan kegiatan pengukuran dua kali terhadap tes yang sama kepada peserta didik yang sama pula. Hasil tes pertama dan kedua kemudian dikorelasikan. Jika koefisien korelasi (r) yang diperoleh cukup tinggi, hasil pengukuran tes yang diujicobakan itu dinyatakan reliabilitasnya tinggi. Reliabilitas ulang uji ini mempunyai beberapa kelemahan. Kelemahan-kelemahan yang dimaksud adalah sebagai berikut.
1.      Sulit untuk menghilangkan pengaruh jawaban tes yang pertama. Hal ini akan lebih terasa untuk butir-butir tes yang mengukur sesuatu yang bersifat ingatan dan pemahaman, dan tenggang waktu antara tes pertama dan kedua secara relatif tidak lama.
2.      Mungkin terdapat faktor yang mempengaruhi hasil tes kedua, misalnya berupa meningkatnya kemampuan peserta didik sebagai hasil belajar.  Masalah ini terjadi terutama jika tenggang waktu antara tes pertama dan kedua cukup lama.
3.      Sulit untuk menciptakan dua kondisi diselenggarakannya dua kali tes yang sama. Ada berbagai faktor yang mempengaruhi kondisi tersebut, baik berasal dari pihak peserta didik (faktor internal) maupun pihak luar peserta didik (faktor eksternal) seperti situasi dan kondisi yang ada di sekolah itu sendiri.
4.      Menuntut peserta didik untuk mengalami dua kali tes. Hal ini dirasa kurang menguntungkan dan memberatkan peserta didik.
b.      Reliabilitas Belah Dua
Pengujian reliabilitas tes dengan teknik belah dua (split half) dilakukan dengan memisahkan skor hasil ke dalam dua kelompok, yaitu kelompok ganjil dan kelompok genap atau kelompok awal dan akhir. Namun, yang lebih banyak dipergunakan orang adalah kelompok ganjil dan genap. Caranya ialah dengan menghitung jumlah skor untuk butir-butir soal yang bernomor ganjil dan yang bernomor genap. Kedua jumlah skor tersebut kemudian dikorelasikan untuk mendapatkan koefisien korelasi (r) antara keduanya.
Akan tetapi, koefisien korelasi dari penghitungan tersebut baru menunjukkan reliabilitas tes untuk separuh soal. Padahal, yang kita harapkan adalah reliabilitas untuk seluruh soal. Untuk mendapatkan koefisien korelasi reliabilitas seluruh tes, kita dapat mempergunakan rumus Spearman-Brown. Rumus Spearman-Brown yang dimaksud adalah sebagai berikut.
Misalnya, berdasarkan penghitungan koefisien korelasi separuh soal didapatkan r sebesar 0,713 (dihitung dengan langkah-langkah di bawah), maka tingkat kepercayaan seluruh tes adalah sebagai berikut.
Kosfesien reliabilitas seluruh tes yang diperoleh (0,832) termasuk kategori tinggi, maka tes yang diuji itu dinyatakan memiliki timgkat reliabilitas yang tinggi pula. Artinya, hasil pengukuran yang dilakukan dengan tes yang bersangkutan dapat dinyatakan konsisten.
Hasil pengukuran yang akan diuji reliabilitasnya adalah bentuk tes objektif dengan jawaban dikotomis. Jawaban benar mendapat skor 1, jawaban salah 0. Langkah pertama yang ditempuh adalah menganalisis lembar-lembar jawaban peserta didik terhadap hasil pengukuran tes yang akan diuji, menghitung jawaban benar atau salah per butir soal per peserta didik. Dari kegiatan ini, akan didapatkan skor keseluruhan tiap peserta didik, skor jawaban betui untuk kelompok butir soal bemomor ganjil dan genap inilah yang dicari korelasinya.
Berikut dicontohkan analisis jawaban peserta didik untuk menghitung skor kelompok ganjil dan genap, misalnya terhadap hasil pengukuran tes kompetensi membaca dan bersastra.
Tabel 1
Analisis Butir Soal untuk Persiapan Penghitungan Korelasi Teknik Reliabilitas Belah Dua
Nomor Urut Peserta Tes

Nomor Butir Soal

Skor total

Skor ganjil

Skor genap

1

2

3

4

5

6

7

8

9

10

1.

1

1

0

1

0

1

1

1

1

1

8

3

5

2.

1

0

1

1

1

1

0

0

0

1

6

3

3

3.

0

1

1

1

0

1

1

0

1

1

7

3

4

4.

0

1

1

1

1

0

1

1

1

1

8

4

4

5.

1

1

0

0

1

1

0

1

0

0

5

2

3

6.

1

1

1

1

0

1

1

1

1

1

9

4

5

7.

1

0

1

0

0

1

1

1

0

1

6

3

3

8.

0

0

1

1

1

0

0

1

0

0

4

2

2


Data hasil di atas dipergunakan untuk menghitung koefisien korelasi skor ganjil ( ) dan skor  genap ( ) berikut.
Nomor Urut PcsertaTes




1
1

3

5

15
2

3

3

9
3

3

4

12
4

4

4

16
5

2

3

6
6

4

5

20
7

3

3

9
8

2

2

4
n = 8




Data tersebut kemudian dimasukan ke dalam rumus korelasi product moment angka kasar.
=  = 0,713
Koefisien korelasi sebesar 0,713 yang diperoleh tersebut baru menunjukkan tingkat reliabilitas separuh tes. Untuk mendapatkan reliabilitas seluruh tes, ia harus dilanjutkan dengan penggunaan rumus Spearman-Brown seperti dikemukakan di atas.
c.       Reliabilitas Rumus Kuder-Richardson 20 dan 21
Pengujian reliabilitas tes dengan mempergunakan rumus Kuder-Richardson (K - R) 20 dan 21, dilakukan dengan membandingkan skor butir-butir tes. Jika butir-butir tes itu menunjukkan tingginya tingkat kesesuaian (degree of agreement), kita dapat menyimpulkan bahwa hasil pengukuran tes itu konsisten. Rumus K-R 20 dan 21 menunjukkan seri karena kedua orang itu mengembangkan banyak rumus yang diberi nomor seri. Dari banyak rumus yang dikembangkan, kedua nomor seri itulah yang kemudian terkenal dan banyak dipergunakan orang. Adapun rumus K-R 20 dan K-R 21 adalah sebagai berikut.
a.       Rumus K-R 20 = 
Keterangan:
r    = Koofesien reliabilitas tes
n   = Jumlah butir soal
p   = Proporsi jawaban betul
q   = Proporsi jawaban salah
s   = Simpangan baku,
 
b.      Rumus K-R 21 =
Keterangan:
X = rata-rata hitung (mean), sedangkan simbol-simbol yang lain seperti keterangan di atas.

Sama halnya dengan penghitungan koefisien reliabilitas belah dua, hasil pengukuran yang akan diuji reliabilitasnya adalah bentuk tes objektif dengan jawaban dikotomis, jawaban benar dengan skor 1, dan jawaban salah 0. Langkah persiapan untuk menghitung koefisien keterpercayaan dengan rumus K - R 20 adalah sebagai berikut.
Menganalisis jawaban benar atau salah per butir soal per peserta didik langsung diletakkan dalam sebuah label analisis butir soal. Selanjutnya, menghitung jawaban benar per peserta didik (secara horisontal), dari data ini dapat ditemukan besamya rata-rata hitung ( X­ ) dan simpangan baku (s). Setelah itu, menghitung jawaban benar per butir soal (secara vertikal), dari data ini dapat dihitung proporsi jawaban benar (p) dan jawaban salah (q). Besarnya p = jumlah jawaban benar dibagi jumlah subjek, sedang q = 1 -p. Selanjutnya, dihitung berapa jumlah p x q ( ).
Di bawah dicontohkan analisis dan penghitungan yang dimaksud.
Tabel 2
Analisis Butir Soal untuk Persiapan Penghitungan Koefisien
 Reliabilitas dengan Rumus K-R 20
Nomor Urut Peserta Tes

Nomor Butir Soal

Jumlah  Skor

1

2

3

4

5

6

7

8

9

10

1

1

1

0

0

1

0

1

1

1

0

6

2

1

0

0

1

1

0

0

0

1

1

5

3

1

1

1

0

1

1

1

1

0

1

8

4

0

1

0

0

0

1

1

1

0

0

4

5

0

0

0

0

1

0

1

0

1

0

3

6

1

1

1

1

1

1

1

0

1

1

9

7

1

1

0

1

0

1

0

0

1

1

6

8

1

1

1

0

0

1

1

0

1

1

7

Jumlah

6

6

3

3

5

5

6

3

6

5

48

P

0,75

0,75

0,375

0,375

0,625

0,625

0,75

0,375

0.75

0,625



q

0,25

0:25

0,625

0,625

0,375

0,375

0.25

0,625

0,25

0,375

pq

0.19

0,19

0,234

0.234

3,234

0,234

0,19

0,234

0,19

0.234

2.164

n = 10       s = 1,87
     X = 6

Dari data di atas kota masukkan ke dalam rumus K-R 20 berikut.
= 1,11 (1-0,619)
= 1,11 x 0,381
= 0, 423
Data-data di atas juga kita masukkan ke dalam rumus K-R 21. Akan tetapi, data yang dibutuhkan hanya n = 10, X = 6, dan s = 1,87. Jadi, tidak memerlukan analisis butir soal untuk mendapatkan jumlah proporsi pq ( ) seperti halnya pada K-R 20.
Pcrhitungan dengan rumus K-R 21 dicontohkan sebagai berikut.
= 1,11 (1-0,686)
= 1,11 x 0,314
= 0,348
Sebagai catatan perlu ditambahkan bahwa penggunaan rumus K-R 20 dan 21 mendasarkan diri pada asumsi distribusi normal. Jadi, ia menghendaki penyebaran angka ke kanan dan ke kiri secara merata dengan titik tengah letak kecenderungan sentral nilai. Semakin tinggi jarak sebaran skor (range), atau semakin besar nilai simpangan baku (s), akan semakin tinggi pula koefisien r yang diperoleh.
d.      Reliabilitas Alpha Cronbach                     
Jika rumus reliabilitas Kuder-Richardson 20 dan 21 di atas diterapkan pada tes yang memunyai skor dikotomi, artinya hanya ada dua kemungkinan skor, yaitu benar dan salah, dengan skor 1 dan 0 saja, koefisien reliabilitas Alpha -lengkapnya koefisien reliabihtas Alpha Cronbach- dite­rapkan pada tes yang memunyai skor berskala dan dikotomis sekaligus. Artinya, prosedur uji reliabilitas ini diterapkan pada hasil pengukuran yang berjenjang, misalnya: 1-4, 1-5, 1-6, atau yang lain tergantung maksud penyusunannya.
Rumus koefisien reliabilitas Alpha Cronbach itu adalah sebagai berikut.
Keterangan:
k        = Jumlah butir soal
Jumlah varian butir-butir
 Varian total (untuk seluruh butir tes)
Teknik penghitungan koefisien reliabilitas Alpha Cronbach ini cukup luas dipergunakan untuk keperluan uji hasil pengukuran di dunia pendidikan. Dalam penghitungan indeks tingkat kesulitan (ITK) dan indeks daya beda (IDB) butir soal lewat program komputer Iteman, indeks reliabilitas yang dipergunakan juga koefisien reliabilitas Alpha Cronbach.
Reliabelitas Alpha Cronbach ini salah satunya dapat digunakan pada bentuk tes uraian. Adapun langkah-langkah persiapan untuk menghitung koefisien reliabilitas tes bentuk uraian, tidak berbeda halnya dengan langkah-langkah dalam mencari koefisien reliabilitas tes objektif dengan rumus K-R 20 di atas. Langkah-langkah yang dimaksud adalah sebagai berikut.
1.      Menganalisis jawaban peserta didik per butir tes. Skor tes uraian biasanya berskala, misalnya skor minimum 1 dan maksimum 10, atau skor minimum 1 dan maksimum 5, bahkan untuk tiap butir tes sendiri mungkin tidak sama (dalam contoh yang diberikan di bawah ini skor minimum 1 dan maksimum 5).
2.      Menghitung jumlah skor per peserta didik (secara horisontal) dan jumlah skor yang diperoleh kemudian dikuadratkan, yaitu untuk mendapatkan skor total dan kuadrat skor total (sebagai, persiapan mencari varian total).
3.      Menghitung jumlah skor per butir tes (secara vertikal) dan jumlah kuadrat skor per butir tes (dikuadratkan dulu kemudian dijumlah), serta jumlah seluruh kuadrat (sebagai persiapan mencari varian per butir tes).
Berikut dicontohkan analisis butir tes dan penghitungan-penghitungan yang dimaksud.


Tabel 3
Analisis Butir Tes Esai untuk Persiapan Penghitugan Koefisien Reliabilitas Tes
Nomor Unit Peserta Tes

Nomor Butir Soal

Skor Total

Kuadrat SkorToal

1

2

3

4

1

4

3

5

3

15

225

3

4

2

4

2

12

144

3

5

4

5

4

18

324

4

5

3

5

3

16

256

5

2

1

3

2

8

64

6

2

2

3

3

10

100

Jumlah

22

15

25

17

70


1.113

Jumlah Kuadrat

90

43

109

51

293



= 0,92
Dengan perhitungan yang sama diperoleh  0,81 dan  0,47.
 =1,56 + 0,92 + 0,81 + 0,47 = 3,76
   
   = 12,14
 Data-data di atas kita masukkan ke dalam rumus reliabilitas tes esai, atau   rumus Alpha di atas.
   = 1,33 x 0,69
   = 0,918
e.       Reliabilitas Bentuk Paralel
Pengujian reliabilitas hasil pengukuran tes dengan teknik butir paralel dilakukan terhadap adanya dua perangkat tes yang bersifat paralel. Kedua perangkat tes itu dimaksudkan untuk mengukur tujuan atau kompetensi yang sama, dengan jumlah butir, susunan, dan tingkat kesulitan yang kurang lebih sama pula. Jadi, dua perangkat tes yang dibuat berdasarkan spesifikasi yang sama.
Untuk menguji reliabilitas hasil pengukuran tes, kedua perangkat tes tersebut diujicobakan kepada sejumlah subjek yang sama, kemudian hasilnya dikorelasikan. Tinggi rendahnya koefisien korelasi akan mencerminkan reliabilitas hasil pengukuran kedua perangkat tes itu.
Teknik ini ada persamaannya dengan teknik ulang uji jika dilihat dari banyaknya tes yang dialami pcserta didik, sama-sama menuntut dua kali tes. Akan tetapi, teknik bentuk paralel mcngujikan dua perangkat tes yang tidak sama. Hal ini dipandang sebagai keuntungan dibanding dengan teknik ulang uji karena adanya "pengaruh jawaban dari tes pertama" (practice-effect atau cary-over-effect) tidak akan terjadi pada tes yang kedua. Akan tetapi, menyiapkan dua perangkat tes yang paralel bukan merupakan pekerjaan yang mudah. Hal ini dipandang sebagai kelemahan teknik bentuk paralel sebagai prosedur reliabilitas hasil pengukuran alat tes.
D.    Usaha Penyusunan Tes yang Reliabel
Untuk mengusahakan agar tes yang kita susun terpercaya, hal-hal yang disarankan benkut perlu diperhatikan. Adapun hal-hal yang dimaksud adalah sebagai berikut.
a.      Susun Butir Soal Secukupnya
Jumlah butir tes yang relatif banyak akan lebih baik daripada yang sedikit karena keadaan itu akan lebih mencerminkan sampel penampilan (kompetensi dan keterampilan) peserta didik. Jika jumlah butir soal hanya sedikit dan kebetulan peserta didik tidak dapat mengerjakannya, hal itu tidak saja menunjukkan kegagalan peserta didik, melainkan juga kegagalan pembelajaran dan alat pengukur (tes) itu sendiri.
Penambahan jumlah butir soal akan meningkatkan kadar reliabilitas, semakin besar jumlah butir soal akan semakin besar pula kadar reliabihtasnya. Akan tetapi, penambahan butir soal sampai dengan jumlah tertentu tidak akan meningkatkan kadar reliabilitas secara seimbang. Tabel berikut akan mcnjelaskan hal yang dimaksud.
Tabel 4
Hubungan antara Jumlah Butir Soal dan Reliabilitas Hasil Pengukuran
Jumlah Butir Soal

Reliabilitas

5

0,20

10

0,33

20

0,50

40

0,67

80

0,80

160

0,89

320

0,94

640

0,97



1,00





Penambahan jumlah butir soal sampai dengan 80 buah masih menguntungkan karena peningkatan kadar reliabilitas cukup tinggi. Akan tetapi, penambahan selanjutnya tidak begitu menambah tingginya reliabilitas. Hal itu tidak seimbang dengan banyaknya jumlah butir tes yang sebanyak itu.
b.      Pilih Butir Soal yang Bertaraf Kesulitan Cukupan
Butir soal yang baik adalah butir yang tidak terlalu sulit, dan sebaiknya tidak terlalu mudah. Butir tes yang terlalu sulit atau mudah tidak mencerminkan secara memadai kompetensi yang diukur, di samping juga tidak dapat membedakan antara peserta didik yang berprestasi dan yang tidak. Indeks tingkat kesulitan sebuah butir soal dinyatakan dengan koefisien 0,00 sampai dengan 1,00. Butir soal yang indeks kesulitannya semakin mendekati nol berarti soal itu semakin sulit, sebaliknya, semakin besar indeks kesulitan berarti butir soal itu semakin mudah.
c.       Pilih Butir Soal yang Berdaya Beda Cukup         
Butir soal yang baik adalah butir yang mampu membedakan antara peserta didik yang berprestasi dengan yang tidak. Daya pembeda sebuah butir soal dinyatakan dengan indeks -1,00 sampai dengan 1,00. Indeks suatu butir soal yang semakin tinggi mendekati 1,00 akan semakin baik karena semakin mampu membedakan antara kedua kelompok tinggi dan rendah tersebut. Sebaliknya, semakin kecil mendekati nol atau bahkan negatif butir soal yang bersangkutan semakin tidak. Hal itu terutama berlaku untuk penafsiran hasil ujian yang mempergunakan pendekatan norma atau kelompok.                                                                                                                                             
d.      Perjelas Redaksi Soal Tes
Selain mempengaruhi validitas hasil pcngukuran, kejelasan unsur bahasa juga mempengaruhi reliabilitas. Oleh karena itu, bahasa yang dipergunakan dalam tes harus jelas, mudah dipahami, dan tidak bcrsifat ambigu, serta tidak membingungkan. Kalimat yang tidak jelas akan mudah menimbulkan kesalahpahaman dan hal itu akan menyebabkan kurangnya sifat keajegan dan reliabilitas. Oleh karena itu, redaksi tes yang tidak jelas dan membingungkan hendaknya direvisi. Hal ini seharusnya sudah ditemukan lewat telaah kualitatif butir soal oleh sejawat.
e.       Bersikap Objektif dalam Menilai
Sikap objektif dalam menilai pekerjaan peserta didik, khususnya untuk tes uraian, sangat diperlukan. Sikap objektivitas dalam penilaian akan meningkatkan kekonsistenan hasil pengukuran sebuah tes. Dalam tes objektif biasanya konsistensi dalam penyekoran lebih terjamin karena antara jawaban benar dan salah sudah pasti dan terlihat jelas. Namun, tidak demikian halnya dengan tes uraian yang jawabannya bersifat subjektif. Demikian juga halnya dalam hal penilaian. Untuk mcngurangi adanya sikap subjektivitas dalam menilai tes uraian, hendaknya terlebih dahulu dibuat pedoman penilaian dengan membuat "porsi-porsi" tertentu  dengan bobot yang tertentu pula, misalnya porsi isi, organisasi, kreativitas, rasional, dan penyelesaian masalah. Hasil penilaian tiap kategori itu dijumlahkan untuk mendapatkan skor total Cara ini memungkinkan penilaian lebih konsisten dari waktu ke waktu dan dari peserta didik ke peserta didik.
Memeriksa sebuah lembar jawaban peserta didik sebaliknya dilakukan dua kali agar dapat memberikan pertimbangan yang lebih tepat, minimum pada awal kegiatan penilaian. Selain itu, untuk lebih meningkatkan sikap objektivitas, nama-nama peserta didik ada baiknya ditutup dan tidak usah diketahui, pekerjaan siapa yang sedang diperiksa.
f.       Kontrol terhadap Kondisi Pelaksanaan Tes
Kontrol terhadap kondisi pelaksanaan tes tidak hanya mempengaruhi validitas hasil pengukuran, tetapi juga reliabilitasnya. Maka, kondisi pelaksa­naan tes harus diusahakan sedemikian rupa sehingga kondisi luar yang dapat mempengaruhi penampilan peserta didik dalam tes dapat dicegah karena hal itu juga berarti mempengaruhi hasil pengukuran. Kita perlu mengusahakan agar setiap peserta didik bekerja sediri, percaya kepada diri sendiri, dan sedapat mungkin mengurangi adanya kemungkinan peserta didik yang akan bekerja sama, atau berusaha tidak jujur. Kondisi pelaksanaan tes yang tidak terkontrol hanya akan memberikan data hasil belajar peserta didik yang tidak dapat dipertanggungjawabkan. Hal itu berarti kegiatan tes yang dilakukan kurang berarti.
g.      Kesalahan Baku Pengukuran
Skor peserta tes yang diperoleh lewat pengukuran adalah skor yang memiliki "kesalahan". Artinya, skor itu sebenamya bukan merupakan skor mereka yang sesungguhnya (true score). Skor yang sesungguhnya, yaitu skor yang benar-benar mewakili keadaan atau kompetensi peserta didik yang sebenamya dalam bidang yang diukur itu tidak pemah diketahui secara pasti, dan hanya dapat diperkirakan saja besamya. Cara untuk memeperkirakan skor yang sesungguhnya adalah dengan mempergunakan kesalahan baku pengukuran (standard error of measurement) terhadap skor hasil pengukuran yang diperoleh. Untuk membantu kecermatan dalam pemberian pertimbangan terhadap hasil tes peserta didik, di samping juga untuk memperkirakan skor sesungguhnya tiap peserta didik, kesalahan baku pengukuran dalam tes sebaiknya juga dihitung.
Kesalahan baku pengukuran dihitung berdasarkan besamya simpangan baku (s) dan indeks reliabilitas (r) alat tes yang bersangkutan. Adapun rumus yang dipergunakan untuk menghitung kesalahan baku pengukuran tersebut adalah sebagai berikut.
SEm =
Keterangan:
SEm = Standard error of measurement, kesalahan baku pengukuran yang dicari
s : Simpangan baku
r : Indeks reliabilitas
Misalnya, dalam penghitungan reliabilitas dengan teknik K-R 20 yang berdasarkan tabel hasil pengukuran Tabel 2. Dari label itu diketahui bahwa s = s = 1,87, dan dalam penghitungan yang dilakukan kemudian diperoleh indeks reliabilitas   r = 0,423. Kedua data yang diperlukan itu kemudian dimasukkan ke dalam rumus sebagai berikut.
SEm =
= 187
= 1,42046 (dibulatkan: 1,42)
Besar kecilnya indeks simpangan baku pengukuran mempengaruhi kualitas hasil pengukuran. Semakin kecil indeks itu semakin baik. Hal itu dikarenakan dengan kecilnya indeks itu perkiraan besarnya skor sesung­guhnya tidak terlalu jauh. Artinya, skor sesungguhnya seorang peserta didik tidak terlalu menyimpang dari skor yang diperoleh atau yang tampak. Besarnya indeks simpangan baku kesalahan ditentukan oleh besarnya indeks reliabilitas dan simpangan baku. Semakin besar indeks reliabilitas akan semakin kecil indeks simpangan baku pengukuran, dan sebaliknya, semakin kecil indeks reliabilitas akan semakin besar indeks kesalahan baku pengukuran.


 https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEh498KyAO8NI60AEjrltZVy1nj9L8qAuMd_Ap5oCJA6z9wvYjpUsMB3o1qC_xESQOgsvvI2BofisKwlArKNzeIVEW6JVebiQ52E1Q-RJt_PbDK4tUfcwvapwLju4yvRB-9giGUXi7aJdbo/s1600/Thumb.png


Daftar Pustaka

Djiwandono, M. Soenardi. 1996. Tes Bahasa dalam Pengajaran. Bandung: ITB Press.

Latief, Muhammad Adnan. 2004. Pembelajaran dan Penilaian Bahasa Inggris. Malang: Universitas Negeri Press.

Nurgiyantoro, Burhan. 2010. Penilaian Pembelajaran Bahasa Berbasis Kompetensi. Yogyakarta: Gajah Mada University Press.

1 comment:

  1. Olah Data Jujur
    Olah Data Yang Jujur
    Olah Data Semarang Merupakan Olah Data Yang Jujur
    https://s.id/Jujur
    Peneliti Boleh Saja Salah, Tapi Ia Tak Boleh Berbohong
    Kualitas Suatu Penelitian Terletak Pada Integritas Dan
    Standar Moral Penelitinya

    ReplyDelete