Analisis butir adalah proses menguji respon-respon
siswa untuk masing-masing butir tes dalam upaya menjustifikasi kualitas item.
Kualitas item, khususnya direpresentasi
oleh tingkat kesukaran, daya pembeda, validitas dan reliabilitas, dan khusus
untuk tes pilihan ganda tidak kalah pentingnya adalah keefektifan pengecoh dan
omit. Tujuan analisis butir soal yaitu untuk mengadakan identifikasi soal-soal
yang baik, kurang baik, dan soal yang buruk.
Secara umum, tes diartikan sebagai alat yang
dipergunakan untuk mengukur pengetahuan atau penguasaan obyek terhadap
seperangkat konten dan materi tertentu. Tes berfungsi sebagai alat pengukuru
keberhasilan belajar siswa.
Menurut Arikunto
(2009) tes yang baik harus mempunyai syarat-syarat sebagai berikut:1) Harus
efisien (Parsimony); 2) Harus baku (Standardize); 3) Mempunyai norma; 4)
Objektif; 5) Valid (Sahih); 6) Reliabel (Andal). Oleh
sebab itu untuk memperoleh tes yang baik, tes tersebut harus di ujicobakan
terlebih dahulu dan hasilnya dianalisis sehingga memenuhi syarat-syarat
tersebut di atas.
Penyusunan dan pengembangan tes dimaksudkan untuk
memperoleh tes yang valid sehingga hasil ukurnya dapat mencerminkan secara
tepat hasil belajar atau prestasi belajar yang dicapai oleh masing-masing
individu peserta tes. Untuk itu, langkah-langkah yang ditempuh dalam
mengembangkan tes antara lain:
1. Menentukan tujuan tes. Tujuan dalam
mengadakan tes ini harus jelas sesuai dengan keperluan.
2. Melakukan analisis kurikulum, dilakukan dengan cara melihat dan menelaah kembali
kurikulum yang ada berkaitan dengan tujuan tes yang telah ditetapkan. Langkah
ini dimaksudkan agar dalam proses pengembangan instrumen tes selalu mengacu
pada kurikulum (SK dan KD) yang sedang digunakan, dan sesuai dengan indikator
pencapaian suatu KD.
3. Analisis sumber belajar (buku pelajaran
dan sumber materi lainnya). Tes yang diukur hendaknya mencakup materi pelajaran
yang telah ditetapkan. Hal ini dimaksudkan agar memperkecil kekeliruan dalam
memilih bahan untuk tes
4. Menyusun kisi-kisi instrumen. Kisi-kisi atau
yang biasa disebut dengan tabel spesifikasi merupakan format yang memuat informasi mengenai ruang
lingkup dan isi/kompetensi yang akan dinilai/diujikan.
Kisi-kisi disusun
berdasarkan tujuan penilaian dan digunakan sebagai pedoman untuk mengembangkan
soal. Kisi-kisi harus mengacu pada SK dan KD,
dan komponen-komponennya
harus rinci, jelas, dan bermakna.
5. Menulis TIK (Tujuan Instruksional
Khusus) / Indikator. Penulisan
TIK/indikator harus sesuai dengan ketentuan-ketentuan yang telah ditetapkan
dalam kisi-kisi. Indikator biasanya kita buat sendiri,
mengacu pada SK dan KD.
6. Menulis soal. Setelah kisi-kisi dalam
bentuk tabel telah tersedia, maka kita harus membuat butir-butir soal sesuai
yang tercantum dalam kisi-kisi. Soal-soal
yang ditulis tidak boleh menyimpang dari indikator yang telah dirumuskan sesuai
dengan kisi-kisi. Tahapannya mencakup: review soal (menelaah soal), seleksi soal, selanjutnya merakit soal menjadi tes
7. Melakukan
telaah instrumen secara teoritis. Telaah instrumen tes secara teoritis atau kualitatif
dilakukan untuk melihat kebenaran instrumen dari segi materi, konstruksi, dan bahasa.
8. Reproduksi tes terbatas. Tes yang sudah
dibuat (sudah jadi) diperbanyak dalam jumlah yang cukup menurut jumlah sampel
yang akan diuji coba.
9. Melakukan
uji coba dan analisis hasil uji coba tes.
Sebelum tes digunakan perlu
dilakukan terlebih dahulu uji coba tes. Langkah ini diperlukan untuk memperoleh
data empiris terhadap kualitas tes yang telah disusun.
Berdasarkan hasil uji coba, dilakukan analisis terutama analisis butir soal
yang meliputi reliabilitas, validitas butir, tingkat kesukaran, pola jawaban,
efektifitas pengecoh, daya pembeda, dan lain-lain.
10.Merevisi
soal. Berdasarkan hasil analisis butir soal hasil ujicoba
kemudian dilakukan perbaikan. Berbagai bagian tes yang masih kurang memenuhi standar
kualitas yang diharapkan perlu diperbaiki sehingga diperoleh perangkat tes yang
lebih baik. Setelah tersusun butir soal yang bagus, kemudian butir
soal tersebut disusun kembali untuk menjadi perangkat instrumen tes, sehingga
instrumen tes siap digunakan.
1.
Menghitung
Indeks Kesukaran
Dalam menghitung indeks kesukaran tiap butir soal
digunakan rumus:
1) 0,00-0,30 tergolong sukar.
2) 0,31-0,70 tergolong sedang
3) 0,71-1,00 tergolong mudah. (Arikunto, 2009)
Dari hasil perhitungan indeks kesukaran
maka kemungkinan tidak semua soal dapat terambil. Soal yang mempunyai indeks
kesukaran sedang yang dapat diambil.
2.
Menghitung
Daya Pembeda
Untuk menghitung daya pembeda digunakan rumus:
Di mana A = jumlah
kelompok atas yang menjawab benar,
B = jumlah kelompok bawah yang
menjawab benar,
N =jumlah peserta tes
Klasifikasi daya pembeda:
0,00
- 0,20 : jelek (poor)
0,20
– 0,40 : cukup (satisfactory)
0,40
– 0,70 : baik (good)
0,70
– 1,00 : baik sekali (excellent),
diterima
negatif : tidak baik, sebaiknya dibuang (Arikunto, 2009)
Setelah diadakan perhitungan daya
beda maka dari sejumlah soal yang disusun kemungkinan tidak semuanya dapat
terambil. Soal yang dapat terambil adalah soal yang mempunyai daya beda cukup,
baik dan baik sekali.
3.
Keberfungsian
Pengecoh (Distraktor)
Distraktor adalah suatu pola yang
menggambarkan bagaimana peserta tes menentukan pilihan jawabannya terhadap
kemungkinan-kemungkinan jawaban yang telah dipasangkan pada setiap butir item.
Pengecoh (distractor), bertujuan
untuk mengecoh mereka yang kurang mampu (tidak tahu) untuk dibedakan dengan
yang mampu (lebih tahu).
Pada tes pilihan ganda, tiap butir
soal menggunakan beberapa pengecoh (distraktor
/ penyesat / option). Tiap pengecoh
hendaknya bermanfaat atau berfungsi, yakni ada sejumlah siswa yang memilihnya.
Pengecoh yang tidak dipilih sama sekali oleh siswa berarti tidak berfungsi
mengecohkan siswa, sebaliknya pengecoh yang dipilih oleh hampir semua siswa
berarti terlalu mirip dengan jawaban yang benar.
Suatu kemungkinan dapat terjadi, yaitu bahwa dari
keseluruhan alternatif yang dipasang pada butir item tertentu, sama sekali tidak dipilih oleh testee. Dengan kata lain, testee
menyatakan “blangko”. Pernyataan blangko ini sering
dikenal dengan istilah omiet dan biasa diberi lambang dengan huruf O.
Distraktor
dinyatakan telah dapat menjalankan fungsinya dengan baik apabila distraktor
tersebut sekurang-kurangnya sudah dipilih oleh 5% dari seluruh peserta tes.
Sebagai tindak
lanjut atas hasil penganalisaan terhadap fungsi distraktor tersebut maka
distraktor yang sudah dapat menjalankan fungsinya dengan baik dapat dipakai
lagi pada tes-tes yang akan datang, sedangkan distraktor yang belum dapat
berfungsi dengan baik sebaiknya diperbaiki atau diganti dengan distraktor yang
lain.
4.
Validitas
Item
Suatu skala atau instrumen pengukur
dapat dikatakan mempunyai validitas yang tinggi apabila instrumen tersebut
menjalankan fungsi ukurnya, atau memberikan hasil ukur yang sesuai dengan
maksud dilakukannya pengukuran tersebut. Sedangkan tes yang memiliki validitas
rendah akan menghasilkan data yang tidak relevan dengan tujuan pengukuran.
Untuk mencari validitas menggunakan rumus:
Mp =
rerata skor dari subjek yang menjawab benar bagi item yang dicari validitasnya
Mt =
rerata skor total
Sd =
standar deviasi dari skor total
p =
proporsi siswa yang menjawab benar (indeks kesukaran)
q =
proporsi yang menjawab salah (q = 1-p)
Interpretasi validitas:
0,800
– 1,00 : sangat tinggi
0,600
– 0,800 : tinggi
0,400
– 0,600 : cukup
0,200
– 0,400 : rendah
0,00
– 0,200 : sangat rendah
Kriteria
validitas:
>0,29
maka VALID, <0,29 maka INVALID (Sumarna. 2004)
5.
Reliabilitas
Tujuan utama menghitung
reliabilitas skor tes adalah untuk mengetahui tingkat ketepatan (precision) dan
keajegan (consistency) skor tes.
Untuk mencari nilai
reliabilitas, digunakan rumus:
x =
skor butir soal ganjil
y =
skor butir soal genap
n =
jumlah peserta tes
Setelah itu nilai dari rxy dimasukkan ke dalam rumus:
r11=2 (rxy) dibagi 1+ rxy
Kriteria reliabilitas:
1,00 : tinggi
> 0,700: cukup
< 0,700:
rendah (Sumarna. 2004)
Untuk contoh software Analisis Butir Soal, silahkan download di sini
Daftar Pustaka
Arikunto, S.
2009. Dasar-Dasar Evaluasi Pendidikan
(Edisi Revisi). Jakarta: Bumi Aksara
Nurkancana, W.
1986. Evaluasi Pendidikan. Surabaya:
Usaha Nasional.
Surapranata, Sumarna. 2004. Analisis, Validitas, Reliabilitas dan
Interpretasi Hasil Tes. Jakarta: Remaja Rosdakarya.
Djaali dan Pudji Muljono. 2007. Pengukuran dalam Bidang Pendidikan.
Jakarta: Grasindo.
http://lussysf.multiply.com/journal/item/114
http://simpelpas.wordpress.com/2011/04/12/analisis-soal/
Sumber:
http://iznaparadise.blogspot.com