Senin, 25 Maret 2013

ANALISIS BUTIR SOAL


            Analisis butir adalah proses menguji respon-respon siswa untuk masing-masing butir tes dalam upaya menjustifikasi kualitas item. Kualitas item, khususnya direpresentasi oleh tingkat kesukaran, daya pembeda, validitas dan reliabilitas, dan khusus untuk tes pilihan ganda tidak kalah pentingnya adalah keefektifan pengecoh dan omit. Tujuan analisis butir soal yaitu untuk mengadakan identifikasi soal-soal yang baik, kurang baik, dan soal yang buruk.
        Secara umum, tes diartikan sebagai alat yang dipergunakan untuk mengukur pengetahuan atau penguasaan obyek terhadap seperangkat konten dan materi tertentu. Tes berfungsi sebagai alat pengukuru keberhasilan belajar siswa.
Menurut Arikunto (2009) tes yang baik harus mempunyai syarat-syarat sebagai berikut:1) Harus efisien (Parsimony); 2) Harus baku (Standardize); 3) Mempunyai norma; 4) Objektif; 5) Valid (Sahih); 6) Reliabel (Andal). Oleh sebab itu untuk memperoleh tes yang baik, tes tersebut harus di ujicobakan terlebih dahulu dan hasilnya dianalisis sehingga memenuhi syarat-syarat tersebut di atas.
Penyusunan dan pengembangan tes dimaksudkan untuk memperoleh tes yang valid sehingga hasil ukurnya dapat mencerminkan secara tepat hasil belajar atau prestasi belajar yang dicapai oleh masing-masing individu peserta tes. Untuk itu, langkah-langkah yang ditempuh dalam mengembangkan tes antara lain:
1.   Menentukan tujuan tes. Tujuan dalam mengadakan tes ini harus jelas sesuai dengan keperluan.
2.   Melakukan analisis kurikulum, dilakukan dengan cara melihat dan menelaah kembali kurikulum yang ada berkaitan dengan tujuan tes yang telah ditetapkan. Langkah ini dimaksudkan agar dalam proses pengembangan instrumen tes selalu mengacu pada kurikulum (SK dan KD) yang sedang digunakan, dan sesuai dengan indikator pencapaian suatu KD.
3.   Analisis sumber belajar (buku pelajaran dan sumber materi lainnya). Tes yang diukur hendaknya mencakup materi pelajaran yang telah ditetapkan. Hal ini dimaksudkan agar memperkecil kekeliruan dalam memilih bahan untuk tes
4. Menyusun kisi-kisi instrumen. Kisi-kisi atau yang biasa disebut dengan tabel spesifikasi merupakan format yang memuat informasi mengenai ruang lingkup dan isi/kompetensi yang akan dinilai/diujikan. Kisi-kisi disusun berdasarkan tujuan penilaian dan digunakan sebagai pedoman untuk mengembangkan soal. Kisi-kisi harus mengacu pada SK dan KD, dan komponen-komponennya harus rinci, jelas, dan bermakna.
5.  Menulis TIK (Tujuan Instruksional Khusus) / Indikator. Penulisan TIK/indikator harus sesuai dengan ketentuan-ketentuan yang telah ditetapkan dalam kisi-kisi. Indikator biasanya kita buat sendiri, mengacu pada SK dan KD.
6.  Menulis soal. Setelah kisi-kisi dalam bentuk tabel telah tersedia, maka kita harus membuat butir-butir soal sesuai yang tercantum dalam kisi-kisi. Soal-soal yang ditulis tidak boleh menyimpang dari indikator yang telah dirumuskan sesuai dengan kisi-kisi. Tahapannya mencakup: review soal (menelaah soal), seleksi soal, selanjutnya merakit soal menjadi tes
7.   Melakukan telaah instrumen secara teoritis. Telaah instrumen tes secara teoritis atau kualitatif dilakukan untuk melihat kebenaran instrumen dari segi materi, konstruksi, dan bahasa.
8.  Reproduksi tes terbatas. Tes yang sudah dibuat (sudah jadi) diperbanyak dalam jumlah yang cukup menurut jumlah sampel yang akan diuji coba.
9.  Melakukan uji coba dan analisis hasil uji coba tes. Sebelum tes digunakan perlu dilakukan terlebih dahulu uji coba tes. Langkah ini diperlukan untuk memperoleh data empiris terhadap kualitas tes yang telah disusun. Berdasarkan hasil uji coba, dilakukan analisis terutama analisis butir soal yang meliputi reliabilitas, validitas butir, tingkat kesukaran, pola jawaban, efektifitas pengecoh, daya pembeda, dan lain-lain.
10.Merevisi soal. Berdasarkan hasil analisis butir soal hasil ujicoba kemudian dilakukan perbaikan. Berbagai bagian tes yang masih kurang memenuhi standar kualitas yang diharapkan perlu diperbaiki sehingga diperoleh perangkat tes yang lebih baik. Setelah tersusun butir soal yang bagus, kemudian butir soal tersebut disusun kembali untuk menjadi perangkat instrumen tes, sehingga instrumen tes siap digunakan.

1.      Menghitung Indeks Kesukaran
  Dalam menghitung indeks kesukaran tiap butir soal digunakan rumus:

1)      0,00-0,30 tergolong sukar.
2)      0,31-0,70 tergolong sedang
3)      0,71-1,00 tergolong mudah.  (Arikunto, 2009)
Dari hasil perhitungan indeks kesukaran maka kemungkinan tidak semua soal dapat terambil. Soal yang mempunyai indeks kesukaran sedang yang dapat diambil.
2.      Menghitung Daya Pembeda
  Untuk menghitung daya pembeda digunakan rumus:
  Di mana    A = jumlah kelompok atas yang menjawab benar,
                  B = jumlah kelompok bawah yang menjawab benar,
                  N =jumlah peserta tes
  Klasifikasi daya pembeda:
0,00 - 0,20 : jelek (poor)
0,20 – 0,40 : cukup (satisfactory)
0,40 – 0,70 : baik (good)
0,70 – 1,00 : baik sekali (excellent), diterima
negatif       : tidak baik, sebaiknya dibuang  (Arikunto, 2009)
  Setelah diadakan perhitungan daya beda maka dari sejumlah soal yang disusun kemungkinan tidak semuanya dapat terambil. Soal yang dapat terambil adalah soal yang mempunyai daya beda cukup, baik dan baik sekali.
3.      Keberfungsian Pengecoh (Distraktor)
Distraktor adalah suatu pola yang menggambarkan bagaimana peserta tes menentukan pilihan jawabannya terhadap kemungkinan-kemungkinan jawaban yang telah dipasangkan pada setiap butir item. Pengecoh (distractor), bertujuan untuk mengecoh mereka yang kurang mampu (tidak tahu) untuk dibedakan dengan yang mampu (lebih tahu).
Pada tes pilihan ganda, tiap butir soal menggunakan beberapa pengecoh (distraktor / penyesat / option). Tiap pengecoh hendaknya bermanfaat atau berfungsi, yakni ada sejumlah siswa yang memilihnya. Pengecoh yang tidak dipilih sama sekali oleh siswa berarti tidak berfungsi mengecohkan siswa, sebaliknya pengecoh yang dipilih oleh hampir semua siswa berarti terlalu mirip dengan jawaban yang benar.
Suatu kemungkinan dapat terjadi, yaitu bahwa dari keseluruhan alternatif yang dipasang pada butir item tertentu, sama sekali tidak dipilih oleh testee. Dengan kata lain, testee menyatakan “blangko”. Pernyataan blangko ini sering dikenal dengan istilah omiet dan biasa diberi lambang dengan huruf O.
Distraktor dinyatakan telah dapat menjalankan fungsinya dengan baik apabila distraktor tersebut sekurang-kurangnya sudah dipilih oleh 5% dari seluruh peserta tes.
Sebagai tindak lanjut atas hasil penganalisaan terhadap fungsi distraktor tersebut maka distraktor yang sudah dapat menjalankan fungsinya dengan baik dapat dipakai lagi pada tes-tes yang akan datang, sedangkan distraktor yang belum dapat berfungsi dengan baik sebaiknya diperbaiki atau diganti dengan distraktor yang lain.
4.      Validitas Item
Suatu skala atau instrumen pengukur dapat dikatakan mempunyai validitas yang tinggi apabila instrumen tersebut menjalankan fungsi ukurnya, atau memberikan hasil ukur yang sesuai dengan maksud dilakukannya pengukuran tersebut. Sedangkan tes yang memiliki validitas rendah akan menghasilkan data yang tidak relevan dengan tujuan pengukuran. Untuk mencari validitas menggunakan rumus:
Mp        = rerata skor dari subjek yang menjawab benar bagi item yang dicari validitasnya
Mt           = rerata skor total
Sd        = standar deviasi dari skor total
p          = proporsi siswa yang menjawab benar (indeks kesukaran)
q          = proporsi yang menjawab salah (q = 1-p)
             
            Interpretasi validitas:
0,800 – 1,00    : sangat tinggi
0,600 – 0,800  : tinggi
0,400 – 0,600  : cukup
0,200 – 0,400  : rendah
0,00 – 0,200    : sangat rendah
Kriteria validitas:
>0,29 maka VALID, <0,29 maka INVALID (Sumarna. 2004)
5.      Reliabilitas
Tujuan utama menghitung reliabilitas skor tes adalah untuk mengetahui tingkat ketepatan (precision) dan keajegan (consistency) skor tes.
Untuk mencari nilai reliabilitas, digunakan rumus: 
x          = skor butir soal ganjil
y          = skor butir soal genap
n          = jumlah peserta tes
Setelah itu nilai dari rxy dimasukkan ke dalam rumus: 
r11=2 (rxy) dibagi 1+ rxy
Kriteria reliabilitas:
1,00     : tinggi
> 0,700: cukup
< 0,700: rendah (Sumarna. 2004)

Untuk contoh software Analisis Butir Soal, silahkan download di sini

Daftar Pustaka

Arikunto, S. 2009. Dasar-Dasar Evaluasi Pendidikan (Edisi Revisi). Jakarta: Bumi Aksara
Nurkancana, W. 1986. Evaluasi Pendidikan. Surabaya: Usaha Nasional.
Surapranata, Sumarna. 2004. Analisis, Validitas, Reliabilitas dan Interpretasi Hasil Tes. Jakarta: Remaja Rosdakarya.
Djaali dan Pudji Muljono. 2007. Pengukuran dalam Bidang Pendidikan. Jakarta: Grasindo.
http://lussysf.multiply.com/journal/item/114
http://simpelpas.wordpress.com/2011/04/12/analisis-soal/
Sumber:
http://iznaparadise.blogspot.com

Tidak ada komentar:

Posting Komentar

MEKANISME SISTEM KOMPUTER

A.    Komponen Sistem Komputer Layaknya internet, komputer adalah benda wajib yang harus dimiliki di era digital seperti sekarang. Banyak ...