TINGKAT KESULITAN
(Item Difficulty)
1.
Definisi Tingkat Kesulitan (Item Difficulty)
Oller dalam Nurgiantoro (2010:194), mendefinisikan
tingkat kesulitan sebagai sebuah pernyataan tentang seberapa mudah akau sulit
butir soal bagi perserta didik yang dikenai pengukuran. Indeks Tingkat Kesuitan
(ITK) adalah indeks yang menunjukkan seberapa mudah atau sulit suatu butir sola
bagi peserta tes yang diuji. Tentang istilah kesulitan tersebut Oller dalam
Nurgiantoro (2010:194), lebih suka mempergunakan istilah Item facility karena
hal yang sebenarnya dimaksud adalah seberapa besar suatu butir soal memberi
fasilitas atau kemudahan bagi peserta didik.
2.
Indeks Kesulitan
Menurut Nurgiantoro (2010:195) tingkat kesulitan suatu
butir soal dinyatakan dengan sebuah indeks yang berkisar antara 0,00 sampai
dengan 1,00. Indeks 0,00 berarti butir soal yang bersangkutan sangat sulit
karena tidak seorang peserta didik pun menjawabnya dengan benar. Sebaliknya,
indeks 1,00 berarti butir soal yang bersangkutan sangat mudah karena semua peserta
didik dapat menjawab dengan betul. Selanjutnya Oller dalam Nurgiantoro
(2010:195) mengemukakan bahwa semua butir soal dinyatakan layak jika indeks
tingkat kesulitannya berkisar antara 0,15 sampai dengan 0,85. Indeks yang
diluar itu berarti butir soal terlalu mudah atau sulit, maka soal itu perlu
direvisi atau diganti. Namun, rentangan interval tersebut masih terlalu luas, lagi
pula indeks 0,15 dan 0,85 juga masih terlihat ekstrim sulit dan mudah. Maka,
ITK yang dapat ditoleransi adalah yang berkisar antara 0,20 sampai 0,80
(Nurgiantoro:2009).
Rentang
Indeks Kesulitan
Kategori
|
|
0,00 - 0,19
|
Tidak
Baik (Terlalu Sulit)
|
0,20 - 0,80
|
Baik
|
0,81 – 1,00
|
Tidak
Baik (Terlalu Mudah)
|
Tingkat kesukaran untuk soal objektif dirumuskan oleh
(Nitko, 1996 dalam Safari 2005: 24) adalah dengan menghitung hasil bagi antara
jumlah peserta ujian menjawab benar pada soal tertentu dengan jumlah seluruh peserta
tes.
Keterangan :
TK : taraf kesukaran soal
B : jumlah siswa yang menjawab
benar
Js : jumlah seluruh siswa
(Arikunto.2002 a)
Hasil
perhitungan dengan menggunakan rumus di atas menggambarkan tingkat kesukaran
(TK) soal itu. Sebagai pedoman umum, klasifikasi TK dapat dicontohkan seperti
berikut ini:
0,00 – 0,30
|
soal tergolong sukar
|
0,31 – 0,70
|
soal tergolong sedang
|
0,71 – 1,00
|
soal tergolong mudah
|
Tingkat kesukaran di atas bersifat linier dengan Daya
Serap, artinya jika soal pada kemampuan yang diuji tergolong sukar atau tingkat
kesukaran semakin sukar atau mendekati 0,00 maka semakin kecil daya serap atau
0,00% peluang peserta ujian menjawab benar, sebaliknya jika tingkat kesukaran
semakin mudah atau mendekati 1,00 maka semakin besar daya serap atau 0,00%
peluang peserta ujian menjawab benar.
3.
Rumus Tingkat Menghitung Tingkat Kesukaran
Tingkat kesukaran sebenarnya lebih mudah dianalisis lewat
komputer, tetapi dapat juga dianalisis secara manual. ITK tidak lain adalah
penghitungan yang didasarkan pada proporsi jawaban benar, baik untuk kelompok
tinggi maupun rendah. Dengan rumus sebagai berikut.
|
Keterangan:
ITK : indeks tingkat kesulitan yang dicari
FKT : jumlah jawaban benar kelompok tinggi
FKR : jumlah jawaban benar kelompok rendah
N : jumlah peserta tes kedua kelompok
FKT,
dapat diperoleh dengan rumus sebagai berikut.
FKR,
dapat diperoleh dengan rumus sebagai berikut.
Sebelum menggunakan rumus ITK di atas tersebut, terlebih
dahulu diurutkan dari siswa yang mempunyai nilai yang lebih tinggi sampai nilai
yang terendah. Akan tetapi, jika hanya mau menghitung ITK saja, artinya tidak
dengan IDB (Indeks Daya Beda), sebenarnya tidak perlu membagi peserta didik
kedalam dua kelompok tersebut namun cukup dengan menjumlahkan jawaban benar
kemudian dibagi jumlah peserta tes.
Contoh:
Jika
peserta uji ada 40 orang dan yang mengerjakan dengan betul butir soal nomor 1
ada 30 orang, maka ITK butir soal nomor 1 dapat dihitung menggunakan rumus
berikut.
Keterangan :
TK : taraf kesukaran soal
B :
jumlah siswa yang menjawab benar
Js :
jumlah seluruh siswa (Arikunto.2002)
DAYA
BEDA
1.
Definisi
Daya Beda
Daya beda butir soal (item discrimination)
merupakan suatu pernyataan tentang seberapa besar daya sebuah butir soal dapat
membedakan kemampuan antara peserta kelompok tinggi dan kelompok rendah. Indeks
daya beda (IDB) adalah indeks yang menunjukkan seberapa besar daya sebuah butir
soal kemampuan antara peserta kelompok tinggi dan kelompok rendah.
Secara teoretis peserta uji kelompok tinggi haruslah
menjawab dengan benar butir-butir soal yang dikerjakan secara lebih banyak
daripada jawaban benar kelompok rendah. Jika terjadi jumlah jawaban benar
peserta kelompok rendah lebih banyak daripada kelompok tinggi, hal itu berarti
menyalahi logika dan tidak memiliki konsistensi internal sehingga butir soal
yang bersangkutan dinyatakan tidak baik. Sebuah butir soal yang baik adalah
yang memunyai daya untuk membedakan kemampuan antara peserta uji kedua kelompok
tersebut. Besarnya daya untuk membedakan kemampuan itulah yang kemudian
dinyatakan dengan indeks sehingga secara lengkap disebut sebagai indeks daya
beda (IDB) butir soal.
Untuk membedakan peserta uji ke dalam kelompok tinggi dan
rendah, pengurutan dari skor tertinggi ke skor-skor di bawahnya dan analisis
jawaban benar dan salah sebagaimana ditunjukkan pada Tabel 5.1 di atas memang
harus dilakukan. Namun, jika jumlah peserta uji relatif kecil, ia dapat
dilakukan dengan membagi menjadi dua kelompok saja, yaitu masing-masing sebesar
50%. Penggunaan label persiapan analisis itu justru untuk memermudah
penghitungan IDB. Jika hanya bermaksud menghitung ITK saja, kita bisa saja
tidak membedakan peserta uji tidak ke dalam dua kelompok.
2.
Indeks
Daya Beda
Secara teoretis besamya IDB dapat berkisar antara -1,00 -
+1,00, namun indeks yang mendekati bilangan 0 (nol) atau apalagi negatif
dinyatakan tidak layak. Sebagian ahli menyatakan bahwa sebuah butir soal dapat
dinyatakan layak (oke) jika paling tidak memiliki IDB sebesar 0,25, bahkan
sebagian yang lain menyatakan sebesar 0,30.
Pada kenyataannya memperoleh IDB yang memenuhi persyaratan tersebut tidak
mudah, apalagi jika kemampuan peserta uji hampir seimbang. Artinya, kemampuan
antara peserta kelompok tinggi dan rendah tidak terlalu besar, dan indikator
untuk itu dapat dilihat dari besamya simpangan baku (s) skor tes yang
bersangkutan. Oleh karena itu, untuk keperluan pembelajaran di kelas sendiri,
kiranya dapat diambil jalan yang lebih moderat, yaitu dengan menerima IDB
sebesar 0,20 sebagai indeks yang sudah dapat dinyatakan layak (oke). Di pihak
lain, untuk keperluan penelitian yang lebih besar yang melibatkan peserta uji
yang banyak, kita dapat menentukan persyaratan bahwa IDB yang layak adalah
minimum 0,25.
Besar kecilnya IDB sebuah butir soal menunjukkan tinggi
rendahnya daya sebuah butir soal untuk dapat membedakan kemampuan peserta uji
kelompok tinggi dan kelompok rendah. Semakin tinggi indeks yang dimiliki oleh
sebuah butir soal, akan semakin baik butir soal yang bersangkutan karena
memunyai daya untuk membedakan kemampuan peserta kedua kelompok itu. Demikian
juga sebaliknya. Bahkan, jika IDB menjadi negatif yang berarti peserta kelompok
rendah menjawab dengan benar lebih banyak daripada kelompok tinggi, butir soal
yang bersangkutan dinyatakan tidak layak dan harus dibuang karena dinyatakan
gugur.
3.
Rumus
Daya Beda
Untuk menghitung besamya IDB butir soal, secara sederhana
dapat dilakukan dengan cara berikut: jumlah jawaban benar kelompok tinggi
dikurangi jumlah jawaban benar kelompok rendah dan kemudian dibagi separuh dari
jumlah keduanya. Atau, jika dituliskan dengan rumus:
Keterangan:
IDB : Indeks daya beda yang dicari
FKT : Jumlah jawaban benar kelompok tinggi
FKR : Jumlah jawaban benar kelompok rendah
N : Jumlah peserta kelompok tinggi atau
rendah (27,5%)
Data dalam
tabel 4.1 di atas yang sudah dihitung ITK-nya, kini kita hitung IDB sebagai
berikut.
Butir nomor
1
Butir nomor 2
Butir nomor 3
Butir nomor 4
Butir nomor 4
Butir nomor
7
Butir nomor 40
Dari kelima butir soal yang dihitimg IDB-nya di atas
terlihat hanya butir tiga butir yang memenuhi persyaratan minimal 0,20, yaitu
butir nomor 1 (0,50), nomor 3 (0,33), dan nomor 4 (0,33), sedang yang lain
tidak memenuhi persyaratan sehingga dapat dinyatakan gugur atau tidak layak.
Namun, haruslah dipahami bahwa sebuah butir soal
dinyatakan layak (oke) jika baik ITK maupun IDB memenuhi persyaratan yang telah
ditentukan. Jadi, sebuah butir yang dari segi ITK memenuhi kelayakan, misalnya
0,58, sedang dari segi IDB tidak memenuhi kriteria, misalnya <0,20, butir
soal tersebut tetap dinyatakan tidak layak (tidak oke). Demikian juga sebaliknya.
Jadi, untuk butir soal nomor 1 dalam contoh penghitungan di atas yang telah
diketahui adalah sebagai berikut.
ITK=0,58 (oke)
IDB=0,50 (oke)
Butir soal tersebut
dinyatakan layak (oke). Artinya, butir soal tersebut dapat dipertahankan untuk
keperluan pengambilan data dalam penelitian yang dilakukan. Hal itu berlaku
jika kita memergunakan pendekatan acuan norma atau kelompok.
Namun, jika dalam sebuah penilaian dipergunakan acuan
kriteria, sebenamya kita cukup memergunakan ITK saja. Hal itu disebabkan
seorang peserta didik untuk dinyatakan lulus atau tidak bergantung pada tingkat
capaiannya sendiri, yaitu memenuhi syarat minimal kriteria yang ditentukan atau
tidak. Jika memenuhi, ia dinyatakan lulus, dan jika tidak memenuhi tidak lulus.
Kedudukan seorang siswa tidak tergantung pada posisisnya dalam kelompok seperti
halnya pada pendekatan norma. Kurikulum yang kini berlaku di Indonesia adalah
KTSP yang mempergunakan pendekatan criteria. Jadi, sebenarnya kita sucah cuku
menghitung ITK saja.
Jika menghitung ITK dan IDB hasil pengukuran untuk suatu
keperluan, jalannya penghitungan sebagaimana ditunjukkan di atas tidak perlu
ditampilkan dalam laporan. Hasil penghitungan itu biasanya ditampilkan dalam
sebuah tabel rangkuman yang dapat merangkum sebuah rangkaian penghitungan.
Tabel yang dimaksud dicontohkan pada tabel berikut. Dengan demikian, hanya
dalam satu lembar kertas kita dapat melihat kondisi tiap butir soal yang
dianalisis.
Tabel
Hasil Penghitungan Indeks Tingkat Kesulitan dan Indeks
Daya Beda
No. Butir soal
|
FKT
|
FKR
|
ITK
|
IDB
|
Keterangan
|
1.
|
5
|
2
|
0,58
|
0,5
|
Layak
|
2.
|
5
|
4
|
0,75
|
0,17*)
|
Gugur
|
3.
|
5
|
3
|
0,67
|
0,33
|
Layak
|
.
|
.
|
.
|
.
|
.
|
…
|
40.
|
5
|
4
|
0,67
|
0,17*)
|
Gugur
|
*) Indeks yang tidak memenuhi
persyaratan
Sebenarnya jika hanya diambil ITK saja, kesemua butir
soal di tabel di atas memenuhi persyaratan butir soal yang baik. Namun, jika
dilihat bersama dengan IDB ada dua butir yang tidak layak, dan itu disebabkan
oleh IDB yang kurang memenuhi syarat. Secara umum dapat dikatakan bahwa
persyaratan untuk IDB lebih sulit. hal itu tampaknya disebabkan kenyataan bahwa
kelas pada umumnya homogeny sehingga beda skor antara kelompok tinggi kelompok
rendah kecil.
ANALISIS BUTIR
PENGECOH
Analisis butir dalam model pengukuran klasik juga sampai
pada analisis distraktor, yaitu analisis jawaban peserta uji terhadap opsi yang
salah. Model itu beranggapan bahwa semua opsi harus efektif. Artinya, walau
opsi itu salah, opsi-opsi tersebut tetap saja harus ada sejumlah peserta uji
yang memilihnya. Opsi-salah yang baik adalah yang mampu berperan sebagaimana
fungsinya, yaitu sebagai perusak, penjebak, atau distraktor terhadap sebagian
peserta uji. Namun, tentunya peserta dari kelompok rendah yang lebih banyak
"terjebak" daripada kelompok tinggi. Untuk mengetahui bagaimana
efektivitas distraktor tiap butir soal, harus dilakukan analisis distraktor.
Namun, dalam penulisan ini hal itu sengaja tidak dilakukan, dan di bawah akan
langsung ditunjukkan lewat analisis program komputer.
1.
Kriteria
Butir Pengecor
Ada beberapa kriteria untuk menetapkan efektivitas
distraktor, yaitu (1) semua distraktor (opsi-salah) harus ada yang memilih, (2)
jumlah pemilih opsisalah dari peserta kelompok tinggi harus lebih sedikit
daripada kelompok rendah, dan (3) jika pemilih opsi-salah hanya satu, ia harus
dari kelompok rendah. Kriteria (2) dan (3) sering dipandang memberatkan, yang
pada intinya tidak berbeda dengan logika tuntutan IDB di atas, maka yang
digunakan secara efektif hanyalah kriteria (1). Opsi-opsi-salah yang tidak
efektif karena tidak ada peserta uji yang memilih, sebagai konsekuensinya,
haruslah dibuang dan atau direvisi.
Agar semua opsi dalam tiap butir soal efektif, penyusunan
opsi-opsi salah harus dilakukan sedemikian rupa sehingga tidak terlalu mencolok terlihat sebagai opsi
yang salah. Opsi-salah yang baik adalah yang "sempa tetapi tidak
sama" dengan opsi-benar sehingga memunyai peluang untuk dipilih oleh
peserta yang tidak hati-hati.
2.
Penghitungan Indeks Tingkat Kesulitan dan Daya Beda Soal
Uraian
Penghitungan ITK dan IDB dapat juga dilakukan untuk
bentuk soal uraian, namun rumus yang dipergunakan berbeda dengan tes objektif
di atas. Walau demikian, prosedur penghitungannya tidak banyak berbeda. Rumus
yang dipakai untuk menghitung ITK dan IDB yang dimaksud adalah sebagai berikut.
Keterangan:
St : Jumlah skor benar kelompok
tinggi
Sr : Jumlah skor benar kelompok
rendah
Skor maks : Skor maksimal suatu butir
Skor min : Skor minimal suatu butir
Langkah yang perlu
dilakukan sebelum menghitung ITK dan IDB hamper sama dengan langkah-langkah
soal objektif di atas, yaitu dimulai dengan mengelompokkan jawaban peserta
didik ke dalam kelompo tinggi dan rendah kemudian menganalisis jawaban
tersebut.
Pada soal uraian,
jawaban biasanya dibuat berskala, missal 1-4, 1-5, atau 1-6 tergantuk
kompleksitas masing-masing soal. Dibawah ini dicontohkan analisis jawaban per
soal per peserta didik dengan skala skor semua soal minimal 1 dan maksimal 5.
Analisis Jawaban
Soal Uraian Kelompok Tinggi aan Kelompok Rendah sebagai Persiapan Perhitungan
Indeks Tingkat Kesulitan dan Indeks Daya Beda
No. Urut
|
Nomor Butir Soal
|
|
No. Urut
|
Nomor Butir Soal
|
||||||
1
|
2
|
3
|
4
|
1
|
2
|
3
|
4
|
|||
1.
|
4
|
4
|
5
|
5
|
1.
|
3
|
2
|
2
|
4
|
|
2.
|
4
|
4
|
3
|
5
|
2.
|
3
|
1
|
2
|
4
|
|
3.
|
3
|
3
|
5
|
4
|
3.
|
2
|
2
|
1
|
4
|
|
4.
|
5
|
3
|
3
|
4
|
4.
|
1
|
3
|
2
|
3
|
|
5.
|
3
|
4
|
4
|
3
|
5.
|
2
|
1
|
2
|
3
|
|
6.
|
3
|
2
|
3
|
4
|
6.
|
2
|
1
|
2
|
3
|
|
Jumlah
|
22
|
20
|
23
|
25
|
Jumlah
|
13
|
10
|
11
|
21
|
Berdasarkan data-data tabel di atas kemudian dapat
dihitung ITK dan IDB untuk keempat butir soal uraian yang ada.
(1)
Butir Nomor 1:
=
0,48
IBD
= 0,38
(2)
Butir Nomor 2:
=
0,38
IBD
= 0,42
(3)
Butir Nomor 3:
=
0,46
IBD
= 0,50
(4)
Butir Nomor 4:
=
0,71
IBD
= 0,178
Dengan memergunakan kriteria
kelayakan butir soal seperti di atas, yaitu ITK 0,20 - 0,80 dan IDB 0,20 ke atas, dari keempat butir soal
uraian di atas hanya nomor empat yang kurang layak karena IDB yang terlalu
kecil.
Daftar Pustaka
Nurgiantoro,
Burhan. 2010. Penilaian Pembelajaran
Bahasa. Yogjakarta: BPFE-Yogyakarta
Safari, Achmad. 2005. Panduan Analisis Soal. Jakarta: Gramedia
TINGKAT KESULITAN
(Item Difficulty)
1.
Definisi Tingkat Kesulitan (Item Difficulty)
Oller dalam Nurgiantoro (2010:194), mendefinisikan
tingkat kesulitan sebagai sebuah pernyataan tentang seberapa mudah akau sulit
butir soal bagi perserta didik yang dikenai pengukuran. Indeks Tingkat Kesuitan
(ITK) adalah indeks yang menunjukkan seberapa mudah atau sulit suatu butir sola
bagi peserta tes yang diuji. Tentang istilah kesulitan tersebut Oller dalam
Nurgiantoro (2010:194), lebih suka mempergunakan istilah Item facility karena
hal yang sebenarnya dimaksud adalah seberapa besar suatu butir soal memberi
fasilitas atau kemudahan bagi peserta didik.
2.
Indeks Kesulitan
Menurut Nurgiantoro (2010:195) tingkat kesulitan suatu
butir soal dinyatakan dengan sebuah indeks yang berkisar antara 0,00 sampai
dengan 1,00. Indeks 0,00 berarti butir soal yang bersangkutan sangat sulit
karena tidak seorang peserta didik pun menjawabnya dengan benar. Sebaliknya,
indeks 1,00 berarti butir soal yang bersangkutan sangat mudah karena semua peserta
didik dapat menjawab dengan betul. Selanjutnya Oller dalam Nurgiantoro
(2010:195) mengemukakan bahwa semua butir soal dinyatakan layak jika indeks
tingkat kesulitannya berkisar antara 0,15 sampai dengan 0,85. Indeks yang
diluar itu berarti butir soal terlalu mudah atau sulit, maka soal itu perlu
direvisi atau diganti. Namun, rentangan interval tersebut masih terlalu luas, lagi
pula indeks 0,15 dan 0,85 juga masih terlihat ekstrim sulit dan mudah. Maka,
ITK yang dapat ditoleransi adalah yang berkisar antara 0,20 sampai 0,80
(Nurgiantoro:2009).
Rentang
Indeks Kesulitan
Kategori
|
|
0,00 - 0,19
|
Tidak
Baik (Terlalu Sulit)
|
0,20 - 0,80
|
Baik
|
0,81 – 1,00
|
Tidak
Baik (Terlalu Mudah)
|
Tingkat kesukaran untuk soal objektif dirumuskan oleh
(Nitko, 1996 dalam Safari 2005: 24) adalah dengan menghitung hasil bagi antara
jumlah peserta ujian menjawab benar pada soal tertentu dengan jumlah seluruh peserta
tes.
Keterangan :
TK : taraf kesukaran soal
B : jumlah siswa yang menjawab
benar
Js : jumlah seluruh siswa
(Arikunto.2002 a)
Hasil
perhitungan dengan menggunakan rumus di atas menggambarkan tingkat kesukaran
(TK) soal itu. Sebagai pedoman umum, klasifikasi TK dapat dicontohkan seperti
berikut ini:
0,00 – 0,30
|
soal tergolong sukar
|
0,31 – 0,70
|
soal tergolong sedang
|
0,71 – 1,00
|
soal tergolong mudah
|
Tingkat kesukaran di atas bersifat linier dengan Daya
Serap, artinya jika soal pada kemampuan yang diuji tergolong sukar atau tingkat
kesukaran semakin sukar atau mendekati 0,00 maka semakin kecil daya serap atau
0,00% peluang peserta ujian menjawab benar, sebaliknya jika tingkat kesukaran
semakin mudah atau mendekati 1,00 maka semakin besar daya serap atau 0,00%
peluang peserta ujian menjawab benar.
3.
Rumus Tingkat Menghitung Tingkat Kesukaran
Tingkat kesukaran sebenarnya lebih mudah dianalisis lewat
komputer, tetapi dapat juga dianalisis secara manual. ITK tidak lain adalah
penghitungan yang didasarkan pada proporsi jawaban benar, baik untuk kelompok
tinggi maupun rendah. Dengan rumus sebagai berikut.
|
Keterangan:
ITK : indeks tingkat kesulitan yang dicari
FKT : jumlah jawaban benar kelompok tinggi
FKR : jumlah jawaban benar kelompok rendah
N : jumlah peserta tes kedua kelompok
FKT,
dapat diperoleh dengan rumus sebagai berikut.
FKR,
dapat diperoleh dengan rumus sebagai berikut.
Sebelum menggunakan rumus ITK di atas tersebut, terlebih
dahulu diurutkan dari siswa yang mempunyai nilai yang lebih tinggi sampai nilai
yang terendah. Akan tetapi, jika hanya mau menghitung ITK saja, artinya tidak
dengan IDB (Indeks Daya Beda), sebenarnya tidak perlu membagi peserta didik
kedalam dua kelompok tersebut namun cukup dengan menjumlahkan jawaban benar
kemudian dibagi jumlah peserta tes.
Contoh:
Jika
peserta uji ada 40 orang dan yang mengerjakan dengan betul butir soal nomor 1
ada 30 orang, maka ITK butir soal nomor 1 dapat dihitung menggunakan rumus
berikut.
Keterangan :
TK : taraf kesukaran soal
B :
jumlah siswa yang menjawab benar
Js :
jumlah seluruh siswa (Arikunto.2002)
DAYA
BEDA
1.
Definisi
Daya Beda
Daya beda butir soal (item discrimination)
merupakan suatu pernyataan tentang seberapa besar daya sebuah butir soal dapat
membedakan kemampuan antara peserta kelompok tinggi dan kelompok rendah. Indeks
daya beda (IDB) adalah indeks yang menunjukkan seberapa besar daya sebuah butir
soal kemampuan antara peserta kelompok tinggi dan kelompok rendah.
Secara teoretis peserta uji kelompok tinggi haruslah
menjawab dengan benar butir-butir soal yang dikerjakan secara lebih banyak
daripada jawaban benar kelompok rendah. Jika terjadi jumlah jawaban benar
peserta kelompok rendah lebih banyak daripada kelompok tinggi, hal itu berarti
menyalahi logika dan tidak memiliki konsistensi internal sehingga butir soal
yang bersangkutan dinyatakan tidak baik. Sebuah butir soal yang baik adalah
yang memunyai daya untuk membedakan kemampuan antara peserta uji kedua kelompok
tersebut. Besarnya daya untuk membedakan kemampuan itulah yang kemudian
dinyatakan dengan indeks sehingga secara lengkap disebut sebagai indeks daya
beda (IDB) butir soal.
Untuk membedakan peserta uji ke dalam kelompok tinggi dan
rendah, pengurutan dari skor tertinggi ke skor-skor di bawahnya dan analisis
jawaban benar dan salah sebagaimana ditunjukkan pada Tabel 5.1 di atas memang
harus dilakukan. Namun, jika jumlah peserta uji relatif kecil, ia dapat
dilakukan dengan membagi menjadi dua kelompok saja, yaitu masing-masing sebesar
50%. Penggunaan label persiapan analisis itu justru untuk memermudah
penghitungan IDB. Jika hanya bermaksud menghitung ITK saja, kita bisa saja
tidak membedakan peserta uji tidak ke dalam dua kelompok.
2.
Indeks
Daya Beda
Secara teoretis besamya IDB dapat berkisar antara -1,00 -
+1,00, namun indeks yang mendekati bilangan 0 (nol) atau apalagi negatif
dinyatakan tidak layak. Sebagian ahli menyatakan bahwa sebuah butir soal dapat
dinyatakan layak (oke) jika paling tidak memiliki IDB sebesar 0,25, bahkan
sebagian yang lain menyatakan sebesar 0,30.
Pada kenyataannya memperoleh IDB yang memenuhi persyaratan tersebut tidak
mudah, apalagi jika kemampuan peserta uji hampir seimbang. Artinya, kemampuan
antara peserta kelompok tinggi dan rendah tidak terlalu besar, dan indikator
untuk itu dapat dilihat dari besamya simpangan baku (s) skor tes yang
bersangkutan. Oleh karena itu, untuk keperluan pembelajaran di kelas sendiri,
kiranya dapat diambil jalan yang lebih moderat, yaitu dengan menerima IDB
sebesar 0,20 sebagai indeks yang sudah dapat dinyatakan layak (oke). Di pihak
lain, untuk keperluan penelitian yang lebih besar yang melibatkan peserta uji
yang banyak, kita dapat menentukan persyaratan bahwa IDB yang layak adalah
minimum 0,25.
Besar kecilnya IDB sebuah butir soal menunjukkan tinggi
rendahnya daya sebuah butir soal untuk dapat membedakan kemampuan peserta uji
kelompok tinggi dan kelompok rendah. Semakin tinggi indeks yang dimiliki oleh
sebuah butir soal, akan semakin baik butir soal yang bersangkutan karena
memunyai daya untuk membedakan kemampuan peserta kedua kelompok itu. Demikian
juga sebaliknya. Bahkan, jika IDB menjadi negatif yang berarti peserta kelompok
rendah menjawab dengan benar lebih banyak daripada kelompok tinggi, butir soal
yang bersangkutan dinyatakan tidak layak dan harus dibuang karena dinyatakan
gugur.
3.
Rumus
Daya Beda
Untuk menghitung besamya IDB butir soal, secara sederhana
dapat dilakukan dengan cara berikut: jumlah jawaban benar kelompok tinggi
dikurangi jumlah jawaban benar kelompok rendah dan kemudian dibagi separuh dari
jumlah keduanya. Atau, jika dituliskan dengan rumus:
Keterangan:
IDB : Indeks daya beda yang dicari
FKT : Jumlah jawaban benar kelompok tinggi
FKR : Jumlah jawaban benar kelompok rendah
N : Jumlah peserta kelompok tinggi atau
rendah (27,5%)
Data dalam
tabel 4.1 di atas yang sudah dihitung ITK-nya, kini kita hitung IDB sebagai
berikut.
Butir nomor
1
Butir nomor 2
Butir nomor 3
Butir nomor 4
Butir nomor 4
Butir nomor
7
Butir nomor 40
Dari kelima butir soal yang dihitimg IDB-nya di atas
terlihat hanya butir tiga butir yang memenuhi persyaratan minimal 0,20, yaitu
butir nomor 1 (0,50), nomor 3 (0,33), dan nomor 4 (0,33), sedang yang lain
tidak memenuhi persyaratan sehingga dapat dinyatakan gugur atau tidak layak.
Namun, haruslah dipahami bahwa sebuah butir soal
dinyatakan layak (oke) jika baik ITK maupun IDB memenuhi persyaratan yang telah
ditentukan. Jadi, sebuah butir yang dari segi ITK memenuhi kelayakan, misalnya
0,58, sedang dari segi IDB tidak memenuhi kriteria, misalnya <0,20, butir
soal tersebut tetap dinyatakan tidak layak (tidak oke). Demikian juga sebaliknya.
Jadi, untuk butir soal nomor 1 dalam contoh penghitungan di atas yang telah
diketahui adalah sebagai berikut.
ITK=0,58 (oke)
IDB=0,50 (oke)
Butir soal tersebut
dinyatakan layak (oke). Artinya, butir soal tersebut dapat dipertahankan untuk
keperluan pengambilan data dalam penelitian yang dilakukan. Hal itu berlaku
jika kita memergunakan pendekatan acuan norma atau kelompok.
Namun, jika dalam sebuah penilaian dipergunakan acuan
kriteria, sebenamya kita cukup memergunakan ITK saja. Hal itu disebabkan
seorang peserta didik untuk dinyatakan lulus atau tidak bergantung pada tingkat
capaiannya sendiri, yaitu memenuhi syarat minimal kriteria yang ditentukan atau
tidak. Jika memenuhi, ia dinyatakan lulus, dan jika tidak memenuhi tidak lulus.
Kedudukan seorang siswa tidak tergantung pada posisisnya dalam kelompok seperti
halnya pada pendekatan norma. Kurikulum yang kini berlaku di Indonesia adalah
KTSP yang mempergunakan pendekatan criteria. Jadi, sebenarnya kita sucah cuku
menghitung ITK saja.
Jika menghitung ITK dan IDB hasil pengukuran untuk suatu
keperluan, jalannya penghitungan sebagaimana ditunjukkan di atas tidak perlu
ditampilkan dalam laporan. Hasil penghitungan itu biasanya ditampilkan dalam
sebuah tabel rangkuman yang dapat merangkum sebuah rangkaian penghitungan.
Tabel yang dimaksud dicontohkan pada tabel berikut. Dengan demikian, hanya
dalam satu lembar kertas kita dapat melihat kondisi tiap butir soal yang
dianalisis.
Tabel
Hasil Penghitungan Indeks Tingkat Kesulitan dan Indeks
Daya Beda
No. Butir soal
|
FKT
|
FKR
|
ITK
|
IDB
|
Keterangan
|
1.
|
5
|
2
|
0,58
|
0,5
|
Layak
|
2.
|
5
|
4
|
0,75
|
0,17*)
|
Gugur
|
3.
|
5
|
3
|
0,67
|
0,33
|
Layak
|
.
|
.
|
.
|
.
|
.
|
…
|
40.
|
5
|
4
|
0,67
|
0,17*)
|
Gugur
|
*) Indeks yang tidak memenuhi
persyaratan
Sebenarnya jika hanya diambil ITK saja, kesemua butir
soal di tabel di atas memenuhi persyaratan butir soal yang baik. Namun, jika
dilihat bersama dengan IDB ada dua butir yang tidak layak, dan itu disebabkan
oleh IDB yang kurang memenuhi syarat. Secara umum dapat dikatakan bahwa
persyaratan untuk IDB lebih sulit. hal itu tampaknya disebabkan kenyataan bahwa
kelas pada umumnya homogeny sehingga beda skor antara kelompok tinggi kelompok
rendah kecil.
ANALISIS BUTIR
PENGECOH
Analisis butir dalam model pengukuran klasik juga sampai
pada analisis distraktor, yaitu analisis jawaban peserta uji terhadap opsi yang
salah. Model itu beranggapan bahwa semua opsi harus efektif. Artinya, walau
opsi itu salah, opsi-opsi tersebut tetap saja harus ada sejumlah peserta uji
yang memilihnya. Opsi-salah yang baik adalah yang mampu berperan sebagaimana
fungsinya, yaitu sebagai perusak, penjebak, atau distraktor terhadap sebagian
peserta uji. Namun, tentunya peserta dari kelompok rendah yang lebih banyak
"terjebak" daripada kelompok tinggi. Untuk mengetahui bagaimana
efektivitas distraktor tiap butir soal, harus dilakukan analisis distraktor.
Namun, dalam penulisan ini hal itu sengaja tidak dilakukan, dan di bawah akan
langsung ditunjukkan lewat analisis program komputer.
1.
Kriteria
Butir Pengecor
Ada beberapa kriteria untuk menetapkan efektivitas
distraktor, yaitu (1) semua distraktor (opsi-salah) harus ada yang memilih, (2)
jumlah pemilih opsisalah dari peserta kelompok tinggi harus lebih sedikit
daripada kelompok rendah, dan (3) jika pemilih opsi-salah hanya satu, ia harus
dari kelompok rendah. Kriteria (2) dan (3) sering dipandang memberatkan, yang
pada intinya tidak berbeda dengan logika tuntutan IDB di atas, maka yang
digunakan secara efektif hanyalah kriteria (1). Opsi-opsi-salah yang tidak
efektif karena tidak ada peserta uji yang memilih, sebagai konsekuensinya,
haruslah dibuang dan atau direvisi.
Agar semua opsi dalam tiap butir soal efektif, penyusunan
opsi-opsi salah harus dilakukan sedemikian rupa sehingga tidak terlalu mencolok terlihat sebagai opsi
yang salah. Opsi-salah yang baik adalah yang "sempa tetapi tidak
sama" dengan opsi-benar sehingga memunyai peluang untuk dipilih oleh
peserta yang tidak hati-hati.
2.
Penghitungan Indeks Tingkat Kesulitan dan Daya Beda Soal
Uraian
Penghitungan ITK dan IDB dapat juga dilakukan untuk
bentuk soal uraian, namun rumus yang dipergunakan berbeda dengan tes objektif
di atas. Walau demikian, prosedur penghitungannya tidak banyak berbeda. Rumus
yang dipakai untuk menghitung ITK dan IDB yang dimaksud adalah sebagai berikut.
Keterangan:
St : Jumlah skor benar kelompok
tinggi
Sr : Jumlah skor benar kelompok
rendah
Skor maks : Skor maksimal suatu butir
Skor min : Skor minimal suatu butir
Langkah yang perlu
dilakukan sebelum menghitung ITK dan IDB hamper sama dengan langkah-langkah
soal objektif di atas, yaitu dimulai dengan mengelompokkan jawaban peserta
didik ke dalam kelompo tinggi dan rendah kemudian menganalisis jawaban
tersebut.
Pada soal uraian,
jawaban biasanya dibuat berskala, missal 1-4, 1-5, atau 1-6 tergantuk
kompleksitas masing-masing soal. Dibawah ini dicontohkan analisis jawaban per
soal per peserta didik dengan skala skor semua soal minimal 1 dan maksimal 5.
Analisis Jawaban
Soal Uraian Kelompok Tinggi aan Kelompok Rendah sebagai Persiapan Perhitungan
Indeks Tingkat Kesulitan dan Indeks Daya Beda
No. Urut
|
Nomor Butir Soal
|
|
No. Urut
|
Nomor Butir Soal
|
||||||
1
|
2
|
3
|
4
|
1
|
2
|
3
|
4
|
|||
1.
|
4
|
4
|
5
|
5
|
1.
|
3
|
2
|
2
|
4
|
|
2.
|
4
|
4
|
3
|
5
|
2.
|
3
|
1
|
2
|
4
|
|
3.
|
3
|
3
|
5
|
4
|
3.
|
2
|
2
|
1
|
4
|
|
4.
|
5
|
3
|
3
|
4
|
4.
|
1
|
3
|
2
|
3
|
|
5.
|
3
|
4
|
4
|
3
|
5.
|
2
|
1
|
2
|
3
|
|
6.
|
3
|
2
|
3
|
4
|
6.
|
2
|
1
|
2
|
3
|
|
Jumlah
|
22
|
20
|
23
|
25
|
Jumlah
|
13
|
10
|
11
|
21
|
Berdasarkan data-data tabel di atas kemudian dapat
dihitung ITK dan IDB untuk keempat butir soal uraian yang ada.
(1)
Butir Nomor 1:
=
0,48
IBD
= 0,38
(2)
Butir Nomor 2:
=
0,38
IBD
= 0,42
(3)
Butir Nomor 3:
=
0,46
IBD
= 0,50
(4)
Butir Nomor 4:
=
0,71
IBD
= 0,178
Dengan memergunakan kriteria
kelayakan butir soal seperti di atas, yaitu ITK 0,20 - 0,80 dan IDB 0,20 ke atas, dari keempat butir soal
uraian di atas hanya nomor empat yang kurang layak karena IDB yang terlalu
kecil.
Daftar Pustaka
Nurgiantoro,
Burhan. 2010. Penilaian Pembelajaran
Bahasa. Yogjakarta: BPFE-Yogyakarta
Safari, Achmad. 2005. Panduan Analisis Soal. Jakarta: Gramedia
No comments:
Post a Comment