Pada umumnya untuk mengukur sejauh mana kemampuan dan pemahaman peserta didik, pendidik akan memberikan sebuah tes yang kemudian dari hasil tersebut akan memberikan sebuah gambaran yang memberikan informasi tentang sejauh mana keberhasilan pencapaian tujuan sebuah pembelajaran. Tes yang baik adalah tes yang dapat dipertanggung jawabkan kesahihan, kelayakan, ketafsiran, keterpercayaan, kebergunaan maupun efektivitas butir soal yang meliputi tingkat kesulitan dan daya pembeda yang baik, karena tidak semua butir soal dapat dianggap layak untuk diberikan kepada peserta didik.
Rumusan masalah dalam penelitian ini adalah bagaimanakah tingkat kesulitan, daya beda dan distraktor alternatif jawaban dari soal UAS bahasa Jerman kelas X semester genap SMAN 13 Surabaya TP 2017/2018. Pada penelitian ini merupakan jenis penelitian kuantitatif dengan cara menganalisis tingkat kesulitan, daya pembeda maupun distraktor pada setiap butir soal dengan menggunakan rumus IF (indeks facility) dan ID (indeks discrimination).
Dari hasil penelitian ini diketahui bahwa dari 40 butir soal multiple choice yang telah dianalisis hanya terdapat 19 butir soal tidak memenuhi indeks tingkat kesulitan, sedangkan dalam indeks daya beda sebanyak 32 butir tidak memenuhinya. Hasil akhir dari perhitungan indeks tingkat kesulitan dan indeks daya beda hanya terdapat 8 butir soal yang dapat dinyatakan layak, dan sisa 32 butir soal lainnya dinyatakan tidak layak. Hasil analisis indeks tingkat kesulitannya terdapat 27 butir soal yang tergolong mudah, 12 butir soal tergolong sedang, dan 1 butir soal tergolong sulit. Namun dari 27 butir soal yang tergolong mudah ini, sebanyak 18 butir soal dinyatakan tidak layak karena masuk dalam kategori butir soal yang terlalu mudah sehingga menyebabkan butir soal ini tidak dapat berfungsi sebagai pembeda kelompok tinggi maupun rendah. Dan pada 1 butir soal yang tergolong sulit tersebut juga dinyatakan tidak layak dikarenakan masuk dalam kategori dalam butir soal yang terlalu sulit. Sedangkan masih terdapat 3 butir soal lagi yang dinyatakan tidak layak dikarenakan hasil indeks daya bedanya minus atau kelompok rendah menjawab lebih banyak benar daripada kelompok tinggi. Butir-butir soal tersebut dapat dipertimbangkan kembali untuk diganti sedangkan sisanya masih bisa di revisi. Kemudian pada sebaran frekuensi alternatif jawaban pengecoh atau distraktor yang disediakan dalam 40 butir soal ini, dari total 160 alternatif jawaban pengecoh hanya 65 alternatif jawaban pengecoh yang berfungsi dengan baik sedangkan 95 lainnya tidak.
Kata kunci : Analisis butir soal, tingkat kesulitan, daya beda dan distraktor.
AbstractANALYSIS OF THE DEADLINE FOR FINAL EXAM SEMESTER (UAS) GERMAN CLASS X SMAN 13 SURABAYA EVEN SEMESTERName: Desy TristianaNIM: 15020094021Majors: German language and literature educationFaculty: Faculty of Languages and ArtsInstitution Name: Surabaya State UniversityLecturer: Drs. Ari Pujosusanto, M. Pd.Year: 2019In general to gauge the extent of the learners ' ability and understanding, the educator will provide a test which then results in a picture that provides information about the extent to which the success of achieving the objectives A lesson. A good test is a test that can be accountable for the validity, feasibility, interpretation, reliability, usability and effectiveness of a question that includes a good level of difficulty and differentiation power, because not all items can be considered Worthy to be given to learners.The problem formulation in this research is how the level of difficulty, different power and alternative distractor answers of the problem UAS German language class X semester even SMAN 13 Surabaya TP 2017/2018. In this research is a type of quantitative research by analyzing the level of difficulty, differentiation and distractors on each item by using the Formula IF (Index facility) and ID (index discrimination).From the results of this research is known that from 40 items of multiple awards that have been analyzed there are only 19 items that do not meet the index of difficulty level, while in the index of different power as many as 32 grains do not fulfill. The final result of the index calculation of the difficulty and the difference in power Index there are only 8 questions that can be declared worthy, and the remaining 32 rounds of other problems are declared unworthy. The results of index analysis of the difficulty there are 27 questions that are relatively easy, 12 items are relatively medium, and 1 problem is classified as difficult. However, of the 27 items that are relatively easy, as many as 18 items are not feasible because it belongs to the category of items that are too easy to cause this problem can not serve as a differentiator of high or low group. And in 1 item the difficult question is also declared unworthy because it belongs to the category in the problem that is too difficult. While there are still 3 other problems that are declared not feasible because the results of the index of the difference in power minus or low group answer more true than the high group. The details of the question can be reconsidered to be replaced while the rest can still be revised. Then on the spread of alternative frequency of mountebank answer or Distractor provided in the 40 item of this question, of a total of 160 alternative reply Mountebank only 65 alternative mountebank that works well whereas the other 95 not. Keywords: analysis of grain problems, difficulty levels, different power and distractors.