PEMILIHAN MODEL TERBAIK UNTUK MEMPREDIKSI LAMA KENAIKAN JABATAN DAN PANGKAT PRANATA KOMPUTER (STUDI KASUS : KEMENTERIAN X)
BEST MODEL SELECTION FOR PREDICTING THE DURATION OF PROMOTION AND RANK OF COMPUTER ADMINISTRATION EMPLOYEES (CASE STUDY : MINISTRY X)
Kementerian X memiliki data mengenai riwayat kenaikan jabatan dan pangkat pegawainya, khususnya pada pegawai Pranata Komputer. Kementerian X merasa kesulitan untuk mendata pegawainya yang sudah saatnya untuk naik jabatan dan pangkat. Kementerian X membutuhkan sebuah model algoritma untuk memprediksi lama kenaikan jabatan dan pangkat dari pranata komputer di instansinya. Hasil prediksi yang diinginkan berupa label / kelas yakni label A, B dan C dengan durasi lama waktu yang berbeda. Label A untuk pegawai yang diprediksi dapat naik jabatan dan pangkat antara 0 – 2 tahun, Label B untuk pegawai yang diprediksi dapat naik jabatan dan pangkat antara 3 – 5 tahun dan Label C untuk pegawai yang diprediksi dapat naik jabatan dan pangkat > 5 tahun.
Dalam penelitian ini, peneliti membuat sebuah model klasifikasi dengan cara membandingkan beberapa model algoritma klasifikasi yang tersedia dalam library kemudian dipilih model terbaik untuk proses prediksi. Peneliti menggunakan metode CRISP-DM (Cross Industry Standard Process for Data Mining), library PyCaret dan tools JupyterLab serta SPSS (Statistical Program for Social Science). Dataset yang digunakan untuk proses prediksi terdiri dari 15 variabel independen dan 1 variabel dependen (target) yang bersifat multiclass.
Hasil penelitian ini menunjukkan bahwa dari 9 model algoritma klasifikasi yang dikomparasikan pada dataset jabatan dan pangkat, model Linier Discriminant Analysis (LDA) adalah model terbaik untuk proses prediksi. Pada dataset kenaikan jabatan model LDA terbaik diperoleh saat fold ke 4, menghasilkan f1 score training sebesar 0,9345 dan f1 score testing sebesar 0,9765. Sedangkan pada dataset kenaikan pangkat, model LDA terbaik diperoleh saat fold ke 8, menghasilkan f1 score training sebesar 0,9522 dan f1 score testing sebesar 0,9608
Kata Kunci : Perbandingan, Klasifikasi, Prediksi, PyCaret, JupyterLab, F1 Score
Ministry X has data regarding the history of promotions and ranks of its employees, particularly in the Computer Administration department. The ministry is facing difficulties in tracking employees who are due for promotion and rank advancement. Therefore, Ministry X requires a model algorithm to predict the duration of promotions and rank advancements for its Computer Administration employees. The desired prediction results are in the form of labels/classes, Label A, B, and C, with different time durations. Label A represents employees predicted to be promoted and receive rank advancement within 0-2 years, Label B for employees predicted to be promoted and receive rank advancement within 3-5 years, and Label C for employees predicted to be promoted and receive rank advancement > 5 years.
In this research, the researcher develops a classification model by comparing several classification algorithm models available in the library and then selecting the best model for the prediction process. The researcher used the CRISP-DM (Cross Industry Standard Process for Data Mining) method, PyCaret library, and tools such as JupyterLab and SPSS (Statistical Program for Social Science). The dataset used for the prediction process consists of 15 independent variables and 1 dependent variable (target) which is multiclass.
The results of this research indicate that out of the 9 compared classification algorithm models on the promotion and rank dataset, the Linear Discriminant Analysis (LDA) model is the best model for the prediction process. For the promotion dataset, the best LDA model is obtained at the 4th fold, resulting in an f1 score training of 0.9345 and an f1 score testing of 0.9765. Meanwhile, for the rank advancement dataset, the best LDA model is obtained at the 8th fold, resulting in an f1 score training of 0.9522 and a f1 score testing of 0.9608.
Keywords: Comparison, Classification, Prediction, PyCaret, JupyterLab, F1 Score