Sunday, June 12, 2016

TINGKAT KESULITAN





TINGKAT KESULITAN
(Item Difficulty)

1.        Definisi Tingkat Kesulitan (Item Difficulty)
Oller dalam Nurgiantoro (2010:194), mendefinisikan tingkat kesulitan sebagai sebuah pernyataan tentang seberapa mudah akau sulit butir soal bagi perserta didik yang dikenai pengukuran. Indeks Tingkat Kesuitan (ITK) adalah indeks yang menunjukkan seberapa mudah atau sulit suatu butir sola bagi peserta tes yang diuji. Tentang istilah kesulitan tersebut Oller dalam Nurgiantoro (2010:194), lebih suka mempergunakan istilah Item facility karena hal yang sebenarnya dimaksud adalah seberapa besar suatu butir soal memberi fasilitas atau kemudahan bagi peserta didik.

2.        Indeks Kesulitan
Menurut Nurgiantoro (2010:195) tingkat kesulitan suatu butir soal dinyatakan dengan sebuah indeks yang berkisar antara 0,00 sampai dengan 1,00. Indeks 0,00 berarti butir soal yang bersangkutan sangat sulit karena tidak seorang peserta didik pun menjawabnya dengan benar. Sebaliknya, indeks 1,00 berarti butir soal yang bersangkutan sangat mudah karena semua peserta didik dapat menjawab dengan betul. Selanjutnya Oller dalam Nurgiantoro (2010:195) mengemukakan bahwa semua butir soal dinyatakan layak jika indeks tingkat kesulitannya berkisar antara 0,15 sampai dengan 0,85. Indeks yang diluar itu berarti butir soal terlalu mudah atau sulit, maka soal itu perlu direvisi atau diganti. Namun, rentangan interval tersebut masih terlalu luas, lagi pula indeks 0,15 dan 0,85 juga masih terlihat ekstrim sulit dan mudah. Maka, ITK yang dapat ditoleransi adalah yang berkisar antara 0,20 sampai 0,80 (Nurgiantoro:2009).

Rentang Indeks Kesulitan
Kategori
0,00 - 0,19
Tidak Baik (Terlalu Sulit)
0,20 - 0,80
Baik
0,81 – 1,00
Tidak Baik (Terlalu Mudah)
Tingkat kesukaran untuk soal objektif dirumuskan oleh (Nitko, 1996 dalam Safari 2005: 24) adalah dengan menghitung hasil bagi antara jumlah peserta ujian menjawab benar pada soal tertentu dengan jumlah seluruh peserta tes.

Keterangan :
TK       : taraf kesukaran soal
B         : jumlah siswa yang menjawab benar
Js         : jumlah seluruh siswa (Arikunto.2002 a)

Hasil perhitungan dengan menggunakan rumus di atas menggambarkan tingkat kesukaran (TK) soal itu. Sebagai pedoman umum, klasifikasi TK dapat dicontohkan seperti berikut ini:
0,00 – 0,30
soal tergolong sukar

0,31 – 0,70
soal tergolong sedang

0,71 – 1,00
soal tergolong mudah


Tingkat kesukaran di atas bersifat linier dengan Daya Serap, artinya jika soal pada kemampuan yang diuji tergolong sukar atau tingkat kesukaran semakin sukar atau mendekati 0,00 maka semakin kecil daya serap atau 0,00% peluang peserta ujian menjawab benar, sebaliknya jika tingkat kesukaran semakin mudah atau mendekati 1,00 maka semakin besar daya serap atau 0,00% peluang peserta ujian menjawab benar.

3.        Rumus Tingkat Menghitung Tingkat Kesukaran
Tingkat kesukaran sebenarnya lebih mudah dianalisis lewat komputer, tetapi dapat juga dianalisis secara manual. ITK tidak lain adalah penghitungan yang didasarkan pada proporsi jawaban benar, baik untuk kelompok tinggi maupun rendah. Dengan rumus sebagai berikut.


 
Keterangan:
ITK     : indeks tingkat kesulitan yang dicari
FKT     : jumlah jawaban benar kelompok tinggi
FKR    : jumlah jawaban benar kelompok rendah
N         : jumlah peserta tes kedua kelompok

FKT, dapat diperoleh dengan rumus sebagai berikut.


FKR, dapat diperoleh dengan rumus sebagai berikut.

Sebelum menggunakan rumus ITK di atas tersebut, terlebih dahulu diurutkan dari siswa yang mempunyai nilai yang lebih tinggi sampai nilai yang terendah. Akan tetapi, jika hanya mau menghitung ITK saja, artinya tidak dengan IDB (Indeks Daya Beda), sebenarnya tidak perlu membagi peserta didik kedalam dua kelompok tersebut namun cukup dengan menjumlahkan jawaban benar kemudian dibagi jumlah peserta tes.
Contoh:
Jika peserta uji ada 40 orang dan yang mengerjakan dengan betul butir soal nomor 1 ada 30 orang, maka ITK butir soal nomor 1 dapat dihitung menggunakan rumus berikut.
Keterangan :
TK       : taraf kesukaran soal
B          : jumlah siswa yang menjawab benar
Js          : jumlah seluruh siswa (Arikunto.2002)

DAYA BEDA

1.      Definisi Daya Beda
Daya beda butir soal (item discrimination) merupakan suatu pernyataan tentang seberapa besar daya sebuah butir soal dapat membedakan kemampuan antara peserta kelompok tinggi dan kelompok rendah. Indeks daya beda (IDB) adalah indeks yang menunjukkan seberapa besar daya sebuah butir soal kemampuan antara peserta kelompok tinggi dan kelompok  rendah.
Secara teoretis peserta uji kelompok tinggi haruslah menjawab dengan benar butir-butir soal yang dikerjakan secara lebih banyak daripada jawaban benar kelompok rendah. Jika terjadi jumlah jawaban benar peserta kelompok rendah lebih banyak daripada kelompok tinggi, hal itu berarti menyalahi logika dan tidak memiliki konsistensi internal sehingga butir soal yang bersangkutan dinyatakan tidak baik. Sebuah butir soal yang baik adalah yang memunyai daya untuk membedakan kemampuan antara peserta uji kedua kelompok tersebut. Besarnya daya untuk membedakan kemampuan itulah yang kemudian dinyatakan dengan indeks sehingga secara lengkap disebut sebagai indeks daya beda (IDB) butir soal.
Untuk membedakan peserta uji ke dalam kelompok tinggi dan rendah, pengurutan dari skor tertinggi ke skor-skor di bawahnya dan analisis jawaban benar dan salah sebagaimana ditunjukkan pada Tabel 5.1 di atas memang harus dilakukan. Namun, jika jumlah peserta uji relatif kecil, ia dapat dilakukan dengan membagi menjadi dua kelompok saja, yaitu masing-masing sebesar 50%. Penggunaan label persiapan analisis itu justru untuk memermudah penghitungan IDB. Jika hanya bermaksud menghitung ITK saja, kita bisa saja tidak membedakan peserta uji tidak ke dalam dua kelompok.

2.      Indeks Daya Beda
Secara teoretis besamya IDB dapat berkisar antara -1,00 - +1,00, namun indeks yang mendekati bilangan 0 (nol) atau apalagi negatif dinyatakan tidak layak. Sebagian ahli menyatakan bahwa sebuah butir soal dapat dinyatakan layak (oke) jika paling tidak memiliki IDB sebesar 0,25, bahkan sebagian yang lain menyatakan sebesar 0,30.
Pada kenyataannya memperoleh IDB yang memenuhi persyaratan tersebut tidak mudah, apalagi jika kemampuan peserta uji hampir seimbang. Artinya, kemampuan antara peserta kelompok tinggi dan rendah tidak terlalu besar, dan indikator untuk itu dapat dilihat dari besamya simpangan baku (s) skor tes yang bersangkutan. Oleh karena itu, untuk keperluan pembelajaran di kelas sendiri, kiranya dapat diambil jalan yang lebih moderat, yaitu dengan menerima IDB sebesar 0,20 sebagai indeks yang sudah dapat dinyatakan layak (oke). Di pihak lain, untuk keperluan penelitian yang lebih besar yang melibatkan peserta uji yang banyak, kita dapat menentukan persyaratan bahwa IDB yang layak adalah minimum 0,25.
Besar kecilnya IDB sebuah butir soal menunjukkan tinggi rendahnya daya sebuah butir soal untuk dapat membedakan kemampuan peserta uji kelompok tinggi dan kelompok rendah. Semakin tinggi indeks yang dimiliki oleh sebuah butir soal, akan semakin baik butir soal yang bersangkutan karena memunyai daya untuk membedakan kemampuan peserta kedua kelompok itu. Demikian juga sebaliknya. Bahkan, jika IDB menjadi negatif yang berarti peserta kelompok rendah menjawab dengan benar lebih banyak daripada kelompok tinggi, butir soal yang bersangkutan dinyatakan tidak layak dan harus dibuang karena dinyatakan gugur.

3.      Rumus Daya Beda
Untuk menghitung besamya IDB butir soal, secara sederhana dapat dilakukan dengan cara berikut: jumlah jawaban benar kelompok tinggi dikurangi jumlah jawaban benar kelompok rendah dan kemudian dibagi separuh dari jumlah keduanya. Atau, jika dituliskan dengan rumus:


 


Keterangan:
IDB   : Indeks daya beda yang dicari
FKT   : Jumlah jawaban benar kelompok tinggi
FKR : Jumlah jawaban benar kelompok rendah
N       : Jumlah peserta kelompok tinggi atau rendah (27,5%)

Data dalam tabel 4.1 di atas yang sudah dihitung ITK-nya, kini kita hitung IDB sebagai berikut.
Butir nomor 1  

Butir nomor 2 



 
Butir nomor 3

 
Butir nomor 4








 
Butir nomor 7

Butir nomor 40


Dari kelima butir soal yang dihitimg IDB-nya di atas terlihat hanya butir tiga butir yang memenuhi persyaratan minimal 0,20, yaitu butir nomor 1 (0,50), nomor 3 (0,33), dan nomor 4 (0,33), sedang yang lain tidak memenuhi persyaratan sehingga dapat dinyatakan gugur atau tidak layak.
Namun, haruslah dipahami bahwa sebuah butir soal dinyatakan layak (oke) jika baik ITK maupun IDB memenuhi persyaratan yang telah ditentukan. Jadi, sebuah butir yang dari segi ITK memenuhi kelayakan, misalnya 0,58, sedang dari segi IDB tidak memenuhi kriteria, misalnya <0,20, butir soal tersebut tetap dinyatakan tidak layak (tidak oke). Demikian juga sebaliknya. Jadi, untuk butir soal nomor 1 dalam contoh penghitungan di atas yang telah diketahui adalah sebagai berikut.
ITK=0,58 (oke)
IDB=0,50 (oke)
Butir soal tersebut dinyatakan layak (oke). Artinya, butir soal tersebut dapat dipertahankan untuk keperluan pengambilan data dalam penelitian yang dilakukan. Hal itu berlaku jika kita memergunakan pendekatan acuan norma atau kelompok.
Namun, jika dalam sebuah penilaian dipergunakan acuan kriteria, sebenamya kita cukup memergunakan ITK saja. Hal itu disebabkan seorang peserta didik untuk dinyatakan lulus atau tidak bergantung pada tingkat capaiannya sendiri, yaitu memenuhi syarat minimal kriteria yang ditentukan atau tidak. Jika memenuhi, ia dinyatakan lulus, dan jika tidak memenuhi tidak lulus. Kedudukan seorang siswa tidak tergantung pada posisisnya dalam kelompok seperti halnya pada pendekatan norma. Kurikulum yang kini berlaku di Indonesia adalah KTSP yang mempergunakan pendekatan criteria. Jadi, sebenarnya kita sucah cuku menghitung ITK saja.
Jika menghitung ITK dan IDB hasil pengukuran untuk suatu keperluan, jalannya penghitungan sebagaimana ditunjukkan di atas tidak perlu ditampilkan dalam laporan. Hasil penghitungan itu biasanya ditampilkan dalam sebuah tabel rangkuman yang dapat merangkum sebuah rangkaian penghitungan. Tabel yang dimaksud dicontohkan pada tabel berikut. Dengan demikian, hanya dalam satu lembar kertas kita dapat melihat kondisi tiap butir soal yang dianalisis.
Tabel
Hasil Penghitungan Indeks Tingkat Kesulitan dan Indeks Daya Beda
No. Butir soal
FKT
FKR
ITK
IDB
Keterangan
1.
5
2
0,58
0,5
Layak
2.
5
4
0,75
0,17*)
Gugur
3.
5
3
0,67
0,33
Layak
.
.
.
.
.
40.
5
4
0,67
0,17*)
Gugur
*) Indeks yang tidak memenuhi persyaratan
Sebenarnya jika hanya diambil ITK saja, kesemua butir soal di tabel di atas memenuhi persyaratan butir soal yang baik. Namun, jika dilihat bersama dengan IDB ada dua butir yang tidak layak, dan itu disebabkan oleh IDB yang kurang memenuhi syarat. Secara umum dapat dikatakan bahwa persyaratan untuk IDB lebih sulit. hal itu tampaknya disebabkan kenyataan bahwa kelas pada umumnya homogeny sehingga beda skor antara kelompok tinggi kelompok rendah kecil.


ANALISIS BUTIR PENGECOH

Analisis butir dalam model pengukuran klasik juga sampai pada analisis distraktor, yaitu analisis jawaban peserta uji terhadap opsi yang salah. Model itu beranggapan bahwa semua opsi harus efektif. Artinya, walau opsi itu salah, opsi-opsi tersebut tetap saja harus ada sejumlah peserta uji yang memilihnya. Opsi-salah yang baik adalah yang mampu berperan sebagaimana fungsinya, yaitu sebagai perusak, penjebak, atau distraktor terhadap sebagian peserta uji. Namun, tentunya peserta dari kelompok rendah yang lebih banyak "terjebak" daripada kelompok tinggi. Untuk mengetahui bagaimana efektivitas distraktor tiap butir soal, harus dilakukan analisis distraktor. Namun, dalam penulisan ini hal itu sengaja tidak dilakukan, dan di bawah akan langsung ditunjukkan lewat analisis program komputer.

1.      Kriteria Butir Pengecor
Ada beberapa kriteria untuk menetapkan efektivitas distraktor, yaitu (1) semua distraktor (opsi-salah) harus ada yang memilih, (2) jumlah pemilih opsisalah dari peserta kelompok tinggi harus lebih sedikit daripada kelompok rendah, dan (3) jika pemilih opsi-salah hanya satu, ia harus dari kelompok rendah. Kriteria (2) dan (3) sering dipandang memberatkan, yang pada intinya tidak berbeda dengan logika tuntutan IDB di atas, maka yang digunakan secara efektif hanyalah kriteria (1). Opsi-opsi-salah yang tidak efektif karena tidak ada peserta uji yang memilih, sebagai konsekuensinya, haruslah dibuang dan atau direvisi.
Agar semua opsi dalam tiap butir soal efektif, penyusunan opsi-opsi salah harus dilakukan sedemikian rupa sehingga tidak terlalu mencolok terlihat sebagai opsi yang salah. Opsi-salah yang baik adalah yang "sempa tetapi tidak sama" dengan opsi-benar sehingga memunyai peluang untuk dipilih oleh peserta yang tidak hati-hati.

2.      Penghitungan Indeks Tingkat Kesulitan dan Daya Beda Soal Uraian
Penghitungan ITK dan IDB dapat juga dilakukan untuk bentuk soal uraian, namun rumus yang dipergunakan berbeda dengan tes objektif di atas. Walau demikian, prosedur penghitungannya tidak banyak berbeda. Rumus yang dipakai untuk menghitung ITK dan IDB yang dimaksud adalah sebagai berikut.






Keterangan:
St               : Jumlah skor benar kelompok tinggi
Sr               : Jumlah skor benar kelompok rendah
Skor maks       : Skor maksimal suatu butir
Skor min        : Skor minimal suatu butir

Langkah yang perlu dilakukan sebelum menghitung ITK dan IDB hamper sama dengan langkah-langkah soal objektif di atas, yaitu dimulai dengan mengelompokkan jawaban peserta didik ke dalam kelompo tinggi dan rendah kemudian menganalisis jawaban tersebut.
Pada soal uraian, jawaban biasanya dibuat berskala, missal 1-4, 1-5, atau 1-6 tergantuk kompleksitas masing-masing soal. Dibawah ini dicontohkan analisis jawaban per soal per peserta didik dengan skala skor semua soal minimal 1 dan maksimal 5.
Analisis Jawaban Soal Uraian Kelompok Tinggi aan Kelompok Rendah sebagai Persiapan Perhitungan Indeks Tingkat Kesulitan dan Indeks Daya Beda

No. Urut
Nomor Butir Soal

No. Urut
Nomor Butir Soal
1
2
3
4
1
2
3
4
1.
4
4
5
5
1.
3
2
2
4
2.
4
4
3
5
2.
3
1
2
4
3.
3
3
5
4
3.
2
2
1
4
4.
5
3
3
4
4.
1
3
2
3
5.
3
4
4
3
5.
2
1
2
3
6.
3
2
3
4
6.
2
1
2
3
Jumlah
22
20
23
25
Jumlah
13
10
11
21

Berdasarkan data-data tabel di atas kemudian dapat dihitung ITK dan IDB untuk keempat butir soal uraian yang ada.
(1) Butir Nomor 1:
                                                = 0,48
IBD  
          = 0,38

(2) Butir Nomor 2:
                                                = 0,38
IBD  
          = 0,42

(3) Butir Nomor 3:
                                                = 0,46
IBD  
          = 0,50
(4) Butir Nomor 4:
                                                = 0,71
IBD  
          = 0,178

Dengan memergunakan kriteria kelayakan butir soal seperti di atas, yaitu ITK 0,20 - 0,80  dan IDB 0,20 ke atas, dari keempat butir soal uraian di atas hanya nomor empat yang kurang layak karena IDB yang terlalu kecil.







Daftar Pustaka

Nurgiantoro, Burhan. 2010. Penilaian Pembelajaran Bahasa. Yogjakarta: BPFE-Yogyakarta
Safari, Achmad. 2005. Panduan Analisis Soal. Jakarta: Gramedia

TINGKAT KESULITAN
(Item Difficulty)

1.        Definisi Tingkat Kesulitan (Item Difficulty)
Oller dalam Nurgiantoro (2010:194), mendefinisikan tingkat kesulitan sebagai sebuah pernyataan tentang seberapa mudah akau sulit butir soal bagi perserta didik yang dikenai pengukuran. Indeks Tingkat Kesuitan (ITK) adalah indeks yang menunjukkan seberapa mudah atau sulit suatu butir sola bagi peserta tes yang diuji. Tentang istilah kesulitan tersebut Oller dalam Nurgiantoro (2010:194), lebih suka mempergunakan istilah Item facility karena hal yang sebenarnya dimaksud adalah seberapa besar suatu butir soal memberi fasilitas atau kemudahan bagi peserta didik.

2.        Indeks Kesulitan
Menurut Nurgiantoro (2010:195) tingkat kesulitan suatu butir soal dinyatakan dengan sebuah indeks yang berkisar antara 0,00 sampai dengan 1,00. Indeks 0,00 berarti butir soal yang bersangkutan sangat sulit karena tidak seorang peserta didik pun menjawabnya dengan benar. Sebaliknya, indeks 1,00 berarti butir soal yang bersangkutan sangat mudah karena semua peserta didik dapat menjawab dengan betul. Selanjutnya Oller dalam Nurgiantoro (2010:195) mengemukakan bahwa semua butir soal dinyatakan layak jika indeks tingkat kesulitannya berkisar antara 0,15 sampai dengan 0,85. Indeks yang diluar itu berarti butir soal terlalu mudah atau sulit, maka soal itu perlu direvisi atau diganti. Namun, rentangan interval tersebut masih terlalu luas, lagi pula indeks 0,15 dan 0,85 juga masih terlihat ekstrim sulit dan mudah. Maka, ITK yang dapat ditoleransi adalah yang berkisar antara 0,20 sampai 0,80 (Nurgiantoro:2009).

Rentang Indeks Kesulitan
Kategori
0,00 - 0,19
Tidak Baik (Terlalu Sulit)
0,20 - 0,80
Baik
0,81 – 1,00
Tidak Baik (Terlalu Mudah)
Tingkat kesukaran untuk soal objektif dirumuskan oleh (Nitko, 1996 dalam Safari 2005: 24) adalah dengan menghitung hasil bagi antara jumlah peserta ujian menjawab benar pada soal tertentu dengan jumlah seluruh peserta tes.

Keterangan :
TK       : taraf kesukaran soal
B         : jumlah siswa yang menjawab benar
Js         : jumlah seluruh siswa (Arikunto.2002 a)

Hasil perhitungan dengan menggunakan rumus di atas menggambarkan tingkat kesukaran (TK) soal itu. Sebagai pedoman umum, klasifikasi TK dapat dicontohkan seperti berikut ini:
0,00 – 0,30
soal tergolong sukar

0,31 – 0,70
soal tergolong sedang

0,71 – 1,00
soal tergolong mudah


Tingkat kesukaran di atas bersifat linier dengan Daya Serap, artinya jika soal pada kemampuan yang diuji tergolong sukar atau tingkat kesukaran semakin sukar atau mendekati 0,00 maka semakin kecil daya serap atau 0,00% peluang peserta ujian menjawab benar, sebaliknya jika tingkat kesukaran semakin mudah atau mendekati 1,00 maka semakin besar daya serap atau 0,00% peluang peserta ujian menjawab benar.

3.        Rumus Tingkat Menghitung Tingkat Kesukaran
Tingkat kesukaran sebenarnya lebih mudah dianalisis lewat komputer, tetapi dapat juga dianalisis secara manual. ITK tidak lain adalah penghitungan yang didasarkan pada proporsi jawaban benar, baik untuk kelompok tinggi maupun rendah. Dengan rumus sebagai berikut.


 
Keterangan:
ITK     : indeks tingkat kesulitan yang dicari
FKT     : jumlah jawaban benar kelompok tinggi
FKR    : jumlah jawaban benar kelompok rendah
N         : jumlah peserta tes kedua kelompok

FKT, dapat diperoleh dengan rumus sebagai berikut.


FKR, dapat diperoleh dengan rumus sebagai berikut.

Sebelum menggunakan rumus ITK di atas tersebut, terlebih dahulu diurutkan dari siswa yang mempunyai nilai yang lebih tinggi sampai nilai yang terendah. Akan tetapi, jika hanya mau menghitung ITK saja, artinya tidak dengan IDB (Indeks Daya Beda), sebenarnya tidak perlu membagi peserta didik kedalam dua kelompok tersebut namun cukup dengan menjumlahkan jawaban benar kemudian dibagi jumlah peserta tes.
Contoh:
Jika peserta uji ada 40 orang dan yang mengerjakan dengan betul butir soal nomor 1 ada 30 orang, maka ITK butir soal nomor 1 dapat dihitung menggunakan rumus berikut.
Keterangan :
TK       : taraf kesukaran soal
B          : jumlah siswa yang menjawab benar
Js          : jumlah seluruh siswa (Arikunto.2002)

DAYA BEDA

1.      Definisi Daya Beda
Daya beda butir soal (item discrimination) merupakan suatu pernyataan tentang seberapa besar daya sebuah butir soal dapat membedakan kemampuan antara peserta kelompok tinggi dan kelompok rendah. Indeks daya beda (IDB) adalah indeks yang menunjukkan seberapa besar daya sebuah butir soal kemampuan antara peserta kelompok tinggi dan kelompok  rendah.
Secara teoretis peserta uji kelompok tinggi haruslah menjawab dengan benar butir-butir soal yang dikerjakan secara lebih banyak daripada jawaban benar kelompok rendah. Jika terjadi jumlah jawaban benar peserta kelompok rendah lebih banyak daripada kelompok tinggi, hal itu berarti menyalahi logika dan tidak memiliki konsistensi internal sehingga butir soal yang bersangkutan dinyatakan tidak baik. Sebuah butir soal yang baik adalah yang memunyai daya untuk membedakan kemampuan antara peserta uji kedua kelompok tersebut. Besarnya daya untuk membedakan kemampuan itulah yang kemudian dinyatakan dengan indeks sehingga secara lengkap disebut sebagai indeks daya beda (IDB) butir soal.
Untuk membedakan peserta uji ke dalam kelompok tinggi dan rendah, pengurutan dari skor tertinggi ke skor-skor di bawahnya dan analisis jawaban benar dan salah sebagaimana ditunjukkan pada Tabel 5.1 di atas memang harus dilakukan. Namun, jika jumlah peserta uji relatif kecil, ia dapat dilakukan dengan membagi menjadi dua kelompok saja, yaitu masing-masing sebesar 50%. Penggunaan label persiapan analisis itu justru untuk memermudah penghitungan IDB. Jika hanya bermaksud menghitung ITK saja, kita bisa saja tidak membedakan peserta uji tidak ke dalam dua kelompok.

2.      Indeks Daya Beda
Secara teoretis besamya IDB dapat berkisar antara -1,00 - +1,00, namun indeks yang mendekati bilangan 0 (nol) atau apalagi negatif dinyatakan tidak layak. Sebagian ahli menyatakan bahwa sebuah butir soal dapat dinyatakan layak (oke) jika paling tidak memiliki IDB sebesar 0,25, bahkan sebagian yang lain menyatakan sebesar 0,30.
Pada kenyataannya memperoleh IDB yang memenuhi persyaratan tersebut tidak mudah, apalagi jika kemampuan peserta uji hampir seimbang. Artinya, kemampuan antara peserta kelompok tinggi dan rendah tidak terlalu besar, dan indikator untuk itu dapat dilihat dari besamya simpangan baku (s) skor tes yang bersangkutan. Oleh karena itu, untuk keperluan pembelajaran di kelas sendiri, kiranya dapat diambil jalan yang lebih moderat, yaitu dengan menerima IDB sebesar 0,20 sebagai indeks yang sudah dapat dinyatakan layak (oke). Di pihak lain, untuk keperluan penelitian yang lebih besar yang melibatkan peserta uji yang banyak, kita dapat menentukan persyaratan bahwa IDB yang layak adalah minimum 0,25.
Besar kecilnya IDB sebuah butir soal menunjukkan tinggi rendahnya daya sebuah butir soal untuk dapat membedakan kemampuan peserta uji kelompok tinggi dan kelompok rendah. Semakin tinggi indeks yang dimiliki oleh sebuah butir soal, akan semakin baik butir soal yang bersangkutan karena memunyai daya untuk membedakan kemampuan peserta kedua kelompok itu. Demikian juga sebaliknya. Bahkan, jika IDB menjadi negatif yang berarti peserta kelompok rendah menjawab dengan benar lebih banyak daripada kelompok tinggi, butir soal yang bersangkutan dinyatakan tidak layak dan harus dibuang karena dinyatakan gugur.

3.      Rumus Daya Beda
Untuk menghitung besamya IDB butir soal, secara sederhana dapat dilakukan dengan cara berikut: jumlah jawaban benar kelompok tinggi dikurangi jumlah jawaban benar kelompok rendah dan kemudian dibagi separuh dari jumlah keduanya. Atau, jika dituliskan dengan rumus:


 


Keterangan:
IDB   : Indeks daya beda yang dicari
FKT   : Jumlah jawaban benar kelompok tinggi
FKR : Jumlah jawaban benar kelompok rendah
N       : Jumlah peserta kelompok tinggi atau rendah (27,5%)

Data dalam tabel 4.1 di atas yang sudah dihitung ITK-nya, kini kita hitung IDB sebagai berikut.
Butir nomor 1  

Butir nomor 2 



 
Butir nomor 3

 
Butir nomor 4








 
Butir nomor 7

Butir nomor 40


Dari kelima butir soal yang dihitimg IDB-nya di atas terlihat hanya butir tiga butir yang memenuhi persyaratan minimal 0,20, yaitu butir nomor 1 (0,50), nomor 3 (0,33), dan nomor 4 (0,33), sedang yang lain tidak memenuhi persyaratan sehingga dapat dinyatakan gugur atau tidak layak.
Namun, haruslah dipahami bahwa sebuah butir soal dinyatakan layak (oke) jika baik ITK maupun IDB memenuhi persyaratan yang telah ditentukan. Jadi, sebuah butir yang dari segi ITK memenuhi kelayakan, misalnya 0,58, sedang dari segi IDB tidak memenuhi kriteria, misalnya <0,20, butir soal tersebut tetap dinyatakan tidak layak (tidak oke). Demikian juga sebaliknya. Jadi, untuk butir soal nomor 1 dalam contoh penghitungan di atas yang telah diketahui adalah sebagai berikut.
ITK=0,58 (oke)
IDB=0,50 (oke)
Butir soal tersebut dinyatakan layak (oke). Artinya, butir soal tersebut dapat dipertahankan untuk keperluan pengambilan data dalam penelitian yang dilakukan. Hal itu berlaku jika kita memergunakan pendekatan acuan norma atau kelompok.
Namun, jika dalam sebuah penilaian dipergunakan acuan kriteria, sebenamya kita cukup memergunakan ITK saja. Hal itu disebabkan seorang peserta didik untuk dinyatakan lulus atau tidak bergantung pada tingkat capaiannya sendiri, yaitu memenuhi syarat minimal kriteria yang ditentukan atau tidak. Jika memenuhi, ia dinyatakan lulus, dan jika tidak memenuhi tidak lulus. Kedudukan seorang siswa tidak tergantung pada posisisnya dalam kelompok seperti halnya pada pendekatan norma. Kurikulum yang kini berlaku di Indonesia adalah KTSP yang mempergunakan pendekatan criteria. Jadi, sebenarnya kita sucah cuku menghitung ITK saja.
Jika menghitung ITK dan IDB hasil pengukuran untuk suatu keperluan, jalannya penghitungan sebagaimana ditunjukkan di atas tidak perlu ditampilkan dalam laporan. Hasil penghitungan itu biasanya ditampilkan dalam sebuah tabel rangkuman yang dapat merangkum sebuah rangkaian penghitungan. Tabel yang dimaksud dicontohkan pada tabel berikut. Dengan demikian, hanya dalam satu lembar kertas kita dapat melihat kondisi tiap butir soal yang dianalisis.
Tabel
Hasil Penghitungan Indeks Tingkat Kesulitan dan Indeks Daya Beda
No. Butir soal
FKT
FKR
ITK
IDB
Keterangan
1.
5
2
0,58
0,5
Layak
2.
5
4
0,75
0,17*)
Gugur
3.
5
3
0,67
0,33
Layak
.
.
.
.
.
40.
5
4
0,67
0,17*)
Gugur
*) Indeks yang tidak memenuhi persyaratan
Sebenarnya jika hanya diambil ITK saja, kesemua butir soal di tabel di atas memenuhi persyaratan butir soal yang baik. Namun, jika dilihat bersama dengan IDB ada dua butir yang tidak layak, dan itu disebabkan oleh IDB yang kurang memenuhi syarat. Secara umum dapat dikatakan bahwa persyaratan untuk IDB lebih sulit. hal itu tampaknya disebabkan kenyataan bahwa kelas pada umumnya homogeny sehingga beda skor antara kelompok tinggi kelompok rendah kecil.


ANALISIS BUTIR PENGECOH

Analisis butir dalam model pengukuran klasik juga sampai pada analisis distraktor, yaitu analisis jawaban peserta uji terhadap opsi yang salah. Model itu beranggapan bahwa semua opsi harus efektif. Artinya, walau opsi itu salah, opsi-opsi tersebut tetap saja harus ada sejumlah peserta uji yang memilihnya. Opsi-salah yang baik adalah yang mampu berperan sebagaimana fungsinya, yaitu sebagai perusak, penjebak, atau distraktor terhadap sebagian peserta uji. Namun, tentunya peserta dari kelompok rendah yang lebih banyak "terjebak" daripada kelompok tinggi. Untuk mengetahui bagaimana efektivitas distraktor tiap butir soal, harus dilakukan analisis distraktor. Namun, dalam penulisan ini hal itu sengaja tidak dilakukan, dan di bawah akan langsung ditunjukkan lewat analisis program komputer.

1.      Kriteria Butir Pengecor
Ada beberapa kriteria untuk menetapkan efektivitas distraktor, yaitu (1) semua distraktor (opsi-salah) harus ada yang memilih, (2) jumlah pemilih opsisalah dari peserta kelompok tinggi harus lebih sedikit daripada kelompok rendah, dan (3) jika pemilih opsi-salah hanya satu, ia harus dari kelompok rendah. Kriteria (2) dan (3) sering dipandang memberatkan, yang pada intinya tidak berbeda dengan logika tuntutan IDB di atas, maka yang digunakan secara efektif hanyalah kriteria (1). Opsi-opsi-salah yang tidak efektif karena tidak ada peserta uji yang memilih, sebagai konsekuensinya, haruslah dibuang dan atau direvisi.
Agar semua opsi dalam tiap butir soal efektif, penyusunan opsi-opsi salah harus dilakukan sedemikian rupa sehingga tidak terlalu mencolok terlihat sebagai opsi yang salah. Opsi-salah yang baik adalah yang "sempa tetapi tidak sama" dengan opsi-benar sehingga memunyai peluang untuk dipilih oleh peserta yang tidak hati-hati.

2.      Penghitungan Indeks Tingkat Kesulitan dan Daya Beda Soal Uraian
Penghitungan ITK dan IDB dapat juga dilakukan untuk bentuk soal uraian, namun rumus yang dipergunakan berbeda dengan tes objektif di atas. Walau demikian, prosedur penghitungannya tidak banyak berbeda. Rumus yang dipakai untuk menghitung ITK dan IDB yang dimaksud adalah sebagai berikut.






Keterangan:
St               : Jumlah skor benar kelompok tinggi
Sr               : Jumlah skor benar kelompok rendah
Skor maks       : Skor maksimal suatu butir
Skor min        : Skor minimal suatu butir

Langkah yang perlu dilakukan sebelum menghitung ITK dan IDB hamper sama dengan langkah-langkah soal objektif di atas, yaitu dimulai dengan mengelompokkan jawaban peserta didik ke dalam kelompo tinggi dan rendah kemudian menganalisis jawaban tersebut.
Pada soal uraian, jawaban biasanya dibuat berskala, missal 1-4, 1-5, atau 1-6 tergantuk kompleksitas masing-masing soal. Dibawah ini dicontohkan analisis jawaban per soal per peserta didik dengan skala skor semua soal minimal 1 dan maksimal 5.
Analisis Jawaban Soal Uraian Kelompok Tinggi aan Kelompok Rendah sebagai Persiapan Perhitungan Indeks Tingkat Kesulitan dan Indeks Daya Beda

No. Urut
Nomor Butir Soal

No. Urut
Nomor Butir Soal
1
2
3
4
1
2
3
4
1.
4
4
5
5
1.
3
2
2
4
2.
4
4
3
5
2.
3
1
2
4
3.
3
3
5
4
3.
2
2
1
4
4.
5
3
3
4
4.
1
3
2
3
5.
3
4
4
3
5.
2
1
2
3
6.
3
2
3
4
6.
2
1
2
3
Jumlah
22
20
23
25
Jumlah
13
10
11
21

Berdasarkan data-data tabel di atas kemudian dapat dihitung ITK dan IDB untuk keempat butir soal uraian yang ada.
(1) Butir Nomor 1:
                                                = 0,48
IBD  
          = 0,38

(2) Butir Nomor 2:
                                                = 0,38
IBD  
          = 0,42

(3) Butir Nomor 3:
                                                = 0,46
IBD  
          = 0,50
(4) Butir Nomor 4:
                                                = 0,71
IBD  
          = 0,178

Dengan memergunakan kriteria kelayakan butir soal seperti di atas, yaitu ITK 0,20 - 0,80  dan IDB 0,20 ke atas, dari keempat butir soal uraian di atas hanya nomor empat yang kurang layak karena IDB yang terlalu kecil.







Daftar Pustaka

Nurgiantoro, Burhan. 2010. Penilaian Pembelajaran Bahasa. Yogjakarta: BPFE-Yogyakarta
Safari, Achmad. 2005. Panduan Analisis Soal. Jakarta: Gramedia

No comments:

Post a Comment