Klasifikasi Tingkat Kesiapan Kerja Mahasiswa Universitas Negeri Surabaya Menggunakan Algoritma C5.0
Classification of Job Readiness Level of Students at Universitas Negeri Surabaya Using the C5.0 Algorithm
Skripsi ini membahas tentang klasifikasi tingkat kesiapan kerja mahasiswa Universitas Negeri Surabaya menggunakan algoritma C5.0. Penelitian ini bertujuan untuk membangun model klasifikasi yang mampu menentukan kesiapan kerja mahasiswa tingkat akhir di Universitas Negeri Surabaya serta mengidentifikasi atribut-atribut yang berperan penting dalam mempengaruhi kesiapan kerja mahasiswa.
Penelitian dilakukan dengan melakukan survei terhadap 114 responden, yang terdiri dari mahasiswa semester 6 dan semester 8 di Universitas Negeri Surabaya. Dalam survei ini, responden menjawab pertanyaan yang menggambarkan keadaan diri mereka saat ini terkait dengan 16 atribut aspek kesiapan kerja, seperti fleksibel, perencanaan, prioritas, komorganisir, tangkas, openmind, adaptasitek, manfaattek, pelatihan, multitask, demonstrasi, kebersiapan, inovatif, dan analisis, komefektif, dan studi. Masing-masing artibut tersebut mewakili setiap pernyataan yang dimuat di dalam survei.
Data yang diperoleh dari survei kemudian diproses menggunakan metode SMOTE (Synthetic Minority Over-sampling Technique). Selanjutnya, seleksi fitur dilakukan menggunakan teknik information gain untuk mengurangi jumlah fitur yang digunakan dalam penelitian. Dataset yang telah dikurangi fiturnya kemudian diolah menggunakan algoritma C5.0, sebuah algoritma decision tree yang digunakan untuk mengklasifikasikan tingkat kesiapan kerja mahasiswa ke dalam dua kategori: 'siap' dan 'tidak siap' kerja. Evaluasi dilakukan menggunakan confusion matrix, dengan menghitung nilai akurasi, presisi, dan recall.
Hasil penelitian menunjukkan skema pembagian data 70:30, didapatkan akurasi sebesar 86%, presisi 83,87%, dan recall 92,85%. Sementara itu, skema 80:20 menghasilkan akurasi 93,93%, presisi 100%, dan recall 88,88%. Terakhir, skema 90:10 menunjukkan akurasi 88,23%, presisi 87,50%, dan recall 87,50%. Oleh karena itu, skema 80:20 memiliki akurasi dan presisi tertinggi, sedangkan recall terbaik dimiliki oleh skema 70:30. Model klasifikasi yang penulis bangun dapat membantu mahasiswa tingkat akhir Universitas Negeri Surabaya untuk mengidentifikasi aspek-aspek yang mempengaruhi tingkat kesiapan kerja mereka dan melakukan evaluasi untuk mempersiapkan setiap individu dalam memasuki dunia kerja.
This thesis discusses the classification of job readiness levels of students at Universitas Negeri Surabaya using the C5.0 algorithm. The research aims to develop a classification model that can determine the job readiness of final-year students at Universitas Negeri Surabaya and identify key attributes that influence their job readiness.
The study was conducted through a survey of 114 respondents, consisting of 6th and 8th-semester students at Universitas Negeri Surabaya. In this survey, respondents answered questions reflecting their current state related to 16 job readiness attributes, such as flexibility, planning, prioritization, organization, agility, open-mindedness, technological adaptation, technology utilization, training, multitasking, demonstration skills, readiness, innovation, analysis, effective communication, and study habits. Each attribute corresponded to specific statements included in the survey.
The data obtained from the survey was processed using the SMOTE (Synthetic Minority Over-sampling Technique) method. Feature selection was then performed using the information gain technique to reduce the number of features used in the study. The reduced dataset was subsequently processed using the C5.0 algorithm, a decision tree algorithm used to classify the job readiness levels of students into two categories: 'ready' and 'not ready' for work. The evaluation was conducted using a confusion matrix, calculating accuracy, precision, and recall values.
The results showed that with a 70:30 data split scheme, the model achieved an accuracy of 86%, precision of 83.87%, and recall of 92.85%. Meanwhile, the 80:20 scheme resulted in an accuracy of 93.93%, precision of 100%, and recall of 88.88%. Lastly, the 90:10 scheme demonstrated an accuracy of 88.23%, precision of 87.50%, and recall of 87.50%. Therefore, the 80:20 scheme had the highest accuracy and precision, while the 70:30 scheme had the best recall. The classification model developed in this study can help final-year students at Universitas Negeri Surabaya identify the aspects influencing their job readiness and evaluate their preparedness for entering the workforce.