Materi Analisis Butir Soal


A.    Hakikat Analisis Butir Soal

Kegiatan menganalisis butir soal merupakan suatu kegiatan yang harus dilakukan guru untuk meningkatkan mutu soal yang telah ditulis. Kegiatan ini merupakan proses pengumpulan, peringkasan, dan penggunaan informasi dari jawaban siswa untuk membuat keputusan tentang setiap penilaian (Nitko 1996 dalam Elis dkk, 22014).

Tugas melakukan evaluasi terhadap alat pengukuran yang telah digunakan untuk mengukur keberhasilan belajar peserta didik pada umumnya dilupakan oleh evaluator. Menurut Nana Sudjana (2006: 135), “Analisis butir soal atau analisis item adalah pengkajian pertanyaan-pertanyaan tes agar diperoleh perangkat pertanyaan yang memiliki kualitas yang memadai”. Menurut Daryanto (2007: 177), “Analisis soal adalah suatu prosedur sistematis, yang akan memberikan informasi-informasi yang sangat khusus terhadap butir tes yang kita susun”. Analisis kualitas tes merupakan suatu tahapan yang harus ditempuh untuk mengetahui derajat kualitas suatu tes. Dalam penilaian hasil belajar diharapkan tes dapat menggambarkan hasil yang objektif dan akurat (dalam Widayati, 2012).

B.     Tujuan Analisis Kualitas Butir Soal

Tujuan penelaahan kualitas butir soal, menurut Aiken, (1994: 63 dalam Elis dkk, 2014), memiliki tiga tujuan antara lain:

  1. Untuk mengkaji dan menelaah setiap butir soal agar diperoleh soal yang bermutu sebelum soal digunakan.
  2. Untuk membantu meningkatkan tes melalui revisi atau membuang soal yang tidak efektif,
  3. Untuk mengetahui informasi diagnostik pada siswa apakah mereka sudah/belum memahami materi yang telah diajarkan

Dari hal diatas Anastasi dan Urbina, (1997 dalam Elis dkk, 2014) menegaskan bahwa tujuan utama dari analisis butir soal dalam sebuah tes yang dibuat guru adalah untuk mengidentifikasi kekurangan-kekurangan dalam tes atau dalam pembelajaran.

C.    Manfaat Soal yang Telah Ditelaah

  1. Dapat membantu para pengguna tes dalam evaluasi atas tes yang digunakan,
  2. Sangat relevan bagi penyusunan tes informal dan lokal seperti tes yang disiapkan guru untuk siswa di kelas,
  3. Mendukung penulisan butir soal yang efektif,
  4. Secara materi dapat memperbaiki tes di kelas,
  5. Meningkatkan validitas soal dan reliabilitas. (Anastasi dan Urbina, 1997:172 dalam Elis dkk, 2014).

Di samping itu, manfaat lainnya menurut Nitko, (1996: 308-309 dalam Elis dkk, 2014), adalah:

  1. Untuk menentukan apakah suatu fungsi butir soal sesuai dengan yang diharapkan,
  2. Untuk memberi masukan kepada siswa tentang kemampuan dan sebagai dasar untuk bahan diskusi di kelas,
  3. Untuk memberi masukan kepada guru tentang kesulitan siswa,
  4. Untuk memberi masukan pada aspek tertentu untuk pengembangan kurikulum,
  5. Untuk erevisi materi yang dinilai atau diukur,
  6. Untuk meningkatkan keterampilan penulisan soal.

D.    Proses dan Prosedur Analisis Kualitas Soal    

Dalam melaksanakan analisis butir soal, para penulis soal dapat menganalisis secara kualitatif, dalam kaitan dengan isi dan bentuknya, dan kuantitatif dalam kaitan dengan ciri-ciri statistiknya (Anastasi dan Urbina, 1997: 172 dalam Elis dkk, 2014). Dengan demikian, ada dua cara yang dapat digunakan dalam penelaahan butir soal yaitu penelaahan soal secara kualitatif dan kuantitatif. Dikarenakan kedua teknik ini masing-masing memiliki keunggulan dan kelemahan. Oleh karena itu teknik terbaik adalah menggunakan keduanya (penggabungan).

  1. Analisis Butir Soal Secara Kualitatif

Pada prinsipnya analisis butir soal secara kualitatif dilaksanakan berdasarkan kaidah penulisan soal (tes tertulis, perbuatan, dan sikap). Penelaahan ini biasanya dilakukan sebelum soal digunakan/diujikan. Aspek yang diperhatikan di dalam penelaahan secara kualitatif ini adalah setiap soal ditelaah dari segi materi, konstruksi, bahasa/budaya, dan kunci jawaban/pedoman penskorannya. Dalam melakukan penelaahan setiap butir soal, penelaah perlu mempersiapkan bahan-bahan penunjang seperti: Kisi-kisi tes, Kurikulum yang digunakan, Buku sumber, dan Kamus bahasa indonesia.

Ada beberapa teknik yang dapat digunakan untuk menganalisis butir soal secara kualitatif, diantaranya adalah teknik moderator dan teknik panel yaitu sebagai berikut :

a.       Teknik Moderator : teknik berdiskusi yang di dalamnya terdapat satu orang sebagai penengah. Berdasarkan teknik ini, setiap butir soal didiskusikan secara bersama-sama dengan beberapa ahli seperti guru yang mengajarkan materi, ahli materi, penyusun/pengembang kurikulum, ahli penilaian, ahli bahasa, berlatar belakang psikologi. Teknik ini sangat baik karena setiap butir soal dilihat secara bersama-sama berdasarkan kaidah penulisannya yaitu diantaranya aspek-aspeknya: para penelaah dipersilakan mengomentari/ memperbaiki berdasarkan ilmu yang di miliki nya, setiap komentar/masukan dari peserta diskusi dicatat oleh notulis, setiap butir soal dapat dituntaskan secara bersama-sama, perbaikannya seperti apa. Namun, kelemahan teknik ini adalah memerlukan waktu lama untuk rnendiskusikan setiap satu butir soal (Elis dkk, 2014).

b.      Teknik Panel : merupakan suatu teknik menelaah butir soal yang setiap butir soalnya ditelaah berdasarkan kaidah penulisan butir soal, yaitu ditelaah dari segi materi, konstruksi, bahasa/budaya, kebenaran kunci jawaban/pedoman penskorannya yang dilakukan oleh beberapa penelaah. Caranya adalah beberapa penelaah diberikan: butirbutir soal yang akan ditelaah, format penelaahan, dan pedoman penilaian/ penelaahannya. Pada tahap awal para penelaah diberikan pengarahan, kemudian tahap berikutnya para penelaah berkerja sendirisendiri di tempat yang tidak sama. Para penelaah dipersilakan memperbaiki langsung pada teks soal dan memberikan komentarnya serta memberikan nilai pada setiap butir soalnya yang kriterianya misal: sudah baik, perlu diperbaiki, atau harus diganti. Secara ideal penelaah butir soal di samping memiliki latar belakang materi yang diujikan, beberapa penelaah yang diminta untuk menelaah butir soal memiliki keterampilan, seperti guru yang mengajarkan materi itu, ahli materi, ahli pengembang kurikulum, ahli penilaian,, ahli bahasa, ahli kebijakan pendidikan, atau lainnya (Lilik Tahmidaten, 2016).

Aspek yang dinilai dalam analisis butir soal secara kualitatif ini antara lain:

Aspek

Butir Soal Uraian

Butir Soal Pilihan Ganda

Materi

·         Soal sesuai dengan indikator (menuntut tes tertulis untuk bentuk Uraian)

·         Batasan pertanyaan dan jawaban yang diharapkan sudah sesuai

·         Materi yang ditanyakan sesuai dengan kompetensi (urgensi, relevasi, kontinyuitas, keterpakaian seharihari tinggi)

·         Isi materi yang ditanyakan sesuai dengan jenjang jenis sekolah atau tingkat kelas

 

·         Soal sesuai dengan indikator (menuntut tes tertulis untuk bentuk pilihan ganda

·         Materi yang ditanyakan sesuai dengan kompetensi (urgensi, relevasi, kontinyuitas, keterpakaian seharihari tinggi)

·         Pilihan jawaban homogen dan logis

·         Hanya ada satu kunci jawaban

 

Konstruksi

·         Menggunakan kata tanya atau perintah yang menuntut jawaban uraian

·         Ada petunjuk yang jelas tentang cara mengerjakan soal

·         Ada pedoman penskorannya

·         Tabel, gambar, grafik, peta, atau yang sejenisnya disajikan dengan jelas dan terbaca

·         Pokok soal dirumus-kan dengan singkat, jelas, dan tegas

·         Rumusan pokok soal dan pilihan jawaban merupakan pernya-taan yang diperlukan saja

·         Pokok soal tidak memberi petunjuk kunci jawaban

·         Pokok soal bebas dan pernyataan yang bersifat negatif ganda

·         Pilihan jawaban homogen dan logis ditinjau dari segi materi

·         Gambar, grafik, tabel, diagram, atau sejenisnya jelas dan berfungsi

·         Panjang pilihan jawaban relatif sama

·         Pilihan jawaban tidak menggunakan pernyataan "semua jawaban di atas salah/benar" dan sejenisnya

·         Pilihan jawaban yang berbentuk angka/waktu disusun berdasarkan urutan besar kecilnya angka atau kronologisnya

·         Butir soal tidak bergantung pada jawaban soal sebelumnya

Bahasa

·         Rumusan kalimat soal komunikatif

·         Butir soal menggu-nakan bahasa Indo-nesia yang baku

·         Tidak menggunakan kata/ungkapan yang

·         menimbulkan penafsiran ganda atau salah pengertian

·         Tidak menggunakan bahasa yang berlaku setempat/tabu

·         Rumusan soal tidak mengandung/ ungkapan yang menyinggung peserta didik

·         Menggunakan bahasa yang sesuai dengan kaidah bahasa Indonesia

·         Menggunakan bahasa yang komunikatif

·         Tidak menggunakan bahasa yang berlaku setempat/tabu

·         Pilihan jawaban tidak mengulang

·         Kata/kelompok kata yang sama, kecuali merupakan satu kesatuan pengertian

 

  1. Analisis Butir Soal Secara Kuantitatif

Penelaahan soal secara kuantitatif maksudnya adalah penelaahan butir soal didasarkan pada data empirik dari butir soal yang bersangkutan. Data empirik ini diperoleh dari soal yang telah diujikan. Ada dua pendekatan dalam analisis secara kuantitatif, yaitu pendekatan secara klasik dan modern.

  1. Klasik : Analisis butir soal secara klasik adalah proses penelaahan butir soal melalui informasi dari jawaban peserta didik guna meningkatkan mutu butir soal yang bersangkutan dengan menggunakan teori tes klasik. Kelebihan analisis butir soal secara klasik adalah murah, dapat dilaksanakan sehari-hari dengan cepat menggunakan komputer, murah, sederhana, familier dan dapat menggunakan data dari beberapa peserta didik atau sampel kecil (Millman dan Greene, 1993: 358 dalam Elis dkk, 2014). Pada analisis butir soal secara klasikal, seperti yang dijelaskan oleh Depdikbud (1997) tingkat kesukaran dapat diperoleh dengan beberapa cara antara lain : a). skala kesukaran linier; b). skala bivariat; c). indeks davis; d). proporsi menjawab benar. Secara klasik, aspek yang perlu diperhatikan dalam analisis butir soal adalah setiap butir soal ditelaah dari segi yaitu sebagai berikut :

1.      Tingkat Kesukaran Soal : Peluang untuk menjawab benar suatu soal pada tingkatkemampuan tertentu yang biasanya dinyatakan dalam bentuk indeks. Indeks tingkat kesukaran ini pada umumnya dinyatakan dalam bentuk proporsi yang besarnya berkisar 0,00 1,00 (Aiken (1994: 66). Semakin besar indeks tingkat kesukaran yang diperoleh dari hasil hitungan, berarti semakin mudah soal itu. Suatu soal memiliki TK= 0,00 artinya bahwa tidak ada peserta didik yang menjawab benar dan bila memiliki TK= 1,00 artinya bahwa peserta didik menjawab benar. Perhitungan indeks tingkat kesukaran ini dilakukan untuk setiap nomor soal. Pada prinsipnya, skor rata-rata yang diperoleh peserta didik pada butir soal yang bersangkutan dinamakan tingkat kesukaran butir soal itu. Fungsi tingkat kesukaran butir soal biasanya dikaitkan dengan tujuan tes. Misalnya untuk keperluan ujian semester digunakan butir soal yang memiliki tingkat kesukaran sedang, untuk keperluan seleksi digunakan butir soal yang memiliki tingkat kesukaran tinggi/sukar, dan untuk keperluan diagnostik biasanya digunakan butir soal yang memiliki tingkat kesukaran rendah/mudah. Untuk soal obyektif atau pilihan ganda rumusnya adalah seperti berikut ini (Nitko, 1996: 310 dalam Lilik, 2016) :

 

Untuk mengetahui tingkat kesukaran soal bentuk uraian digunakan rumus berikut ini :

 

 

Hasil perhitungan dengan menggunakan rumus di atas menggambarkan tingkat kesukaran soal itu. Klasifikasi tingkat kesukaran soal dapat dikategorikan seperti berikut ini. (Lilik Tahmidaten, 2016)

§  0,00 0,30 soal tergolong sukar

§  0,31 0,70 soal tergolong sedang

§  0,71 1,00 soal tergolong mudah

2.      Validitas : Validitas mencerminkan sejauh mana ketepatan dan kecermatan suatu instrumen tes berfungsi sebagai alat ukur hasil belajar. Suatu tes dapat dikatakan memiliki validitas apabila tes tersebut dapat mengukur objek yang seharusnya diukur dan sesuai dengan kriteria tertentu. Suatu skala atau instrumen pengukur dapat dikatakan mempunyai validitas yang tinggi apabila instrumen tersebut menjalankan fungsi ukurnya, atau memberikan hasil ukur yang sesuai dengan maksud dilakukannya pengukuran tersebut. Tes yang memiliki validitas rendah akan menghasilkan data yang tidak relevan dengan tujuan pengukuran.

a.      Validitas Tes : Menurut Anas Sudijono (2011: 163), penganalisisan terhadap tes hasil belajar sebagai suatu totalitas dapat dilakukan dengan dua cara yaitu penganalisisan dengan jalan berpikir secara rasional (logical analysis) dan penganalisisan yang dilakukan dengan mendasarkan diri pada kenyataan empiris (empirical analysis).

b.      Validitas Item : Menurut Anas Sudijono (2011: 163), validitas item dari suatu tes adalah ketepatan mengukur yang dimiliki oleh sebutir item (yang merupakan bagian tak terpisahkan dari tes sebagai suatu totalitas), dalam mengukur apa yang seharusnya diukur lewat butir item tersebut. Hubungan antara butir item dengan tes hasil belajar sebagai suatu totalitas adalah bahwa semakin banyak butir-butir item yang dapat dijawab oleh peserta didik, maka skor total hasil tes tersebut akan semakin tinggi. Untuk sampai pada kesimpulan bahwa item-item yang ingin diketahui validitasnya, dapat digunakan teknik korelasi sebagai teknik analisisnya. Sebutir item dapat dinyatakan valid apabila skor item yang bersangkutan terbukti memiliki kesejajaran dengan skor total.

c.       Reliabilitas : tingkat atau derajat konsistensi dari suatu instrumen. Reliabilitas tes berkenaan dengan pertanyaan apakah suatu tes teliti dan dapat dipercaya sesuai dengan kriteria yang telah ditetapkan. Suatu tes dikatakan reliabel jika selalu memberikan hasil yang sama bila diteskan pada kelompok yang sama pada waktu atau kesempatan yang berbeda (Zainal Arifin, 2011: 258). Menurut Nana Sudjana (2006: 16), “Reliabilitas alat penilaian adalah ketetapan atau keajegan alat tersebut dalam menilai apa yang dinilainya”. Artinya, kapan pun alat penilaian tersebut digunakan akan memberikan hasil yang relatif sama. Hal senada juga diungkapkan Chabib Thoha (2003: 118), “reliabilitas sering diartikan dengan keterandalan”. Artinya, suatu tes memiliki keterandalan jika tes tersebut dipakai mengukur berulang-ulang hasilnya sama. Dengan demikian reliabilitas dapat pula diartikan dengan keajegan atau stabilitas. Reliabilitas merupakan salah satu persyaratan bagi sebuah tes. Reliabilitas sebuah soal perlu karena sebagai penyokong terbentuknya validitas butir soal sehingga sebuah soal yang valid biasanya reliabel.

d.      Daya Pembeda : Menurut Anas Sudijono (2011: 385 dalam Widiyanti, 2012), daya pembeda item adalah kemampuan suatu butir item tes hasil belajar untuk dapat membedakan antara testee yang berkemampuan tinggi dengan testee yang berkemampuan rendah. Mengetahui daya pembeda item sangat penting, sebab salah satu dasar pegangan untuk menyusun butir tes hasil belajar adalah adanya anggapan bahwa kemampuan antara testee yang satu dengan testee yang lain berbeda-beda. Selain itu, butir tes hasil belajar harus mampu memberikan hasil tes yang mencerminkan adanya perbedaan kemampuan yang terdapat di kalangan testee tersebut. Daya pembeda item dapat diketahui dengan melihat besar kecilnya angka indeks diskriminasi item. Angka indeks diskriminasi item adalah sebuah angka atau bilangan yang menunjukkan besar kecilnya daya pembeda (discrimination power) yang dimiliki oleh sebutir item. Sama halnya dengan menganalisis tingkat kesukaran, dalam menganalisis daya pembeda soal bentuk objektif dan bentuk uraian dilakukan dengan cara yang berbeda.

e.       Fungsi Pengecoh/ Distraktor : jawaban. Di antara pilihan jawaban yang ada, hanya satu yang benar. Selain jawaban yang benar tersebut, adalah jawaban yang salah. Jawaban yang salah itulah yang dikenal dengan distractor (pengecoh). Butir soal yang baik, pengecohnya akan dipilih secara merata oleh peserta didik yang menjawab salah. Sebaliknya, butir soal yang kurang baik, pengecohnya akan dipilih secara tidak merata oleh peserta didik. Tujuan utama dari pemasangan distractor pada setiap butir item adalah agar dari sekian banyak peserta tes yang mengikuti tes hasil belajar ada yang tertarik untuk memilihnya. Distractor akan mengecoh peserta didik yang kurang mampu untuk dapat dibedakan dengan yang mampu. Distractor yang baik adalah yang dapat dihindari oleh peserta didik yang pandai dan akan dipilih oleh peserta didik yang kurang pandai. Dengan demikian distractor baru dapat dikatakan telah berfungsi dengan baik apabila distraktor tersebut telah memiliki daya rangsang atau daya tarik yang baik. (Widayati, 2012)

Menurut Anas Sudijono (2011: 411 dalam Widayati, 2012), mengungkapkan bahwa distractor telah dapat menjalankan fungsinya dengan baik apabila distractor tersebut telah dipilih sekurang-kurangnya 5% dari seluruh peserta tes. Distrsctor yang telah menjalankan fungsinya dengan baik dapat digunakan kembali pada tes yang akan datang. Dengan demikian, efektivitas distractor adalah seberapa baik pilihan yang salah tersebut dapat mengecoh peserta tes yang memang tidak mengetahui kunci jawaban yang tersedia. Semakin banyak peserta tes yang memilih distractor tersebut, maka distractor itu dapat menjalankan fungsinya dengan baik. Jika peserta tes mengabaikan semua option (tidak memilih) disebut omit. Dilihat dari segi omit, sebuah item dikatakan baik jika omitnya tidak lebih dari 10 % pengikut tes.

 

  1. Modern : Analisis butir soal secara modern yaitu penelaahan butir soal dengan menggunakan Item Response Theory (IRT) atau teori jawaban butir soal. Teori ini merupakan suatu teori yang menggunakan fungsi matematika untuk menghubungkan antara peluang menjawab benar suatu scal dengan kemampuan siswa. Nama lain IRT adalah latent trait theory (LTT), atau characteristics curve theory (ICC). Asal mula IRT adalah kombinasi suatu versi hukum phi-gamma dengan suatu analisis faktor butir soal (item factor analisis) kemudian bernama Teori Trait Latent (Latent Trait Theory), kemudian sekarang secara umum dikenal menjadi teori jawaban butir soal (Item Response Theory) (McDonald, 1999: 8 dalam Elis dkk, 2014).

Daftar Rujukan Rangkuman

Sudjana, D. N. (2013). Penilaian Hasil Proses Belajar Mengajar. Bandung: PT Remaja Rosdakarya.

Dr. Elis Ratna Wulan, S. M. (2014). Evaluasi Pembelajaran. Bandung: Pustaka Setia Bandung.

Lilik Tahmidaten, S. M. (2016). MODUL PENGEMBANGAN KEPROFESIAN BERKELANJUTAN MATA PELAJARAN SOSIOLOGI. Jakarta: Pusat Pengembangan dan Pemberdayaan Pendidik dan Tenaga Kependidikan Pendidikan Kewarganegaraan dan Ilmu pengetahuan Sosial.

Widayati, A. N. (2012). Analisis Butir Soal Tes Kendali Mutu Kelas Xii Sma Mata Pelajaran Ekonomi Akuntansi Di Kota Yogyakarta. Jurnal Pendidikan Akuntansi Indonesia, X, 5-9.


Nasiha Dwi Aulina Firandasari

51706130015/PBSI-FKIP/UNIM

 

 

 

Komentar