KLASIFIKASI KASUS DBD MENGGUNAKAN CBR BERBASIS K-MEANS, STUDI KASUS : KABUPATEN BANGKA, PROVINSI KEPULAUAN BANGKA BELITUNG
CLASSIFICATION OF DBD CASES USING K-MEANS-BASED CBR, CASE STUDY: BANGKA DISTRICT, BANGKA BELITUNG ISLAND PROVINCE
Di Kabupaten Bangka, kasus DBD telah meningkat dalam beberapa tahun terakhir. Pada tahun 2020 terdapat 119 kasus, kemudian meningkat menjadi 149 kasus pada tahun 2021, dan melonjak menjadi 290 kasus pada tahun 2022. Adapun metode klasifikasi kasus DBD di Kabupaten Bangka masih dilakukan secara manual dengan memeriksa data historis dari kasus DBD. Oleh karena itu, penelitian ini menggunakan pendekatan CBR berbasis K-Means untuk mengklasifikasikan kasus DBD di Kabupaten Bangka. Dalam penelitian ini, dilakukan pengclusteran tingkat sanitasi menggunakan metode K-Means, untuk menentukan jumlah cluster yang optimal menggunakan metode elbow diperoleh jumlah cluster yang optimal sebanyak 3 (tiga) cluster dengan nilai inertianya sebesar 1.715965. Adapun hasil pengclustern tingkat sanitasi diperoleh untuk C1 (tingkat sanitasi kategori rendah) terdapat 207 anggota cluster, C2 (tingkat sanitasi kategori sedang) sebanyak 108 anggota cluster dan C3 (tingkat sanitasi kategori tinggi) sebanyak 165 anggota cluster. Untuk evaluasi pengclusteran menggunakan pendekatan DBI, menunjukkan bahwa penggunaan 3 cluster memberikan hasil yang lebih baik dalam tingkat pemisahan clusternya, dengan nilai DBI terendah sebesar 0.608.
Untuk mengklasifikasikan kasus DBD, menggunakan pendekatan CBR dengan metode pencarian similarity-nya menggunakan KNN, diperoleh akurasi untuk kesesuaian antara hasil klasifikasi dengan data aktual sebesar 92.7%. Sedangkan hasil evaluasi kinerja model, diperoleh bahwa model yang diusulkan memiliki nilai akurasi, presisi, recall dan F1-Score lebih baik dibandingkan dengan model lainnya seperti SVM, ANN dan K-Means, adapun nilai akurasi, presisi, recall, dan F1-Score diperoleh sebesar 0.951, 0.954, 0.951 dan 0.943. Berdasarkan hal tersebut, menunjukkan bahwa model yang diusulkan memiliki kinerja yang lebih baik dalam mengklasifikasikan kasus DBD, dan dapat diandalkan untuk membantu dalam pengambilan keputusan. Implikasi dari penelitian ini, dapat memberikan kontribusi pada pengembangan sistem klasifikasi kasus DBD di Kabupaten Bangka terkait dengan mengidentifikasi dan merespon potensi peningkatan kasus DBD dengan lebih cepat dan efektif. Di samping itu juga, dapat mendorong partisipasi aktif masyarakat dalam program-program pencegahan penyakit DBD dan peningkatan kesehatan masyarakat.
Kata kunci : Sanitasi, DBD, Klasifikasi, K-Means, Case Base Reasoning
In Bangka District, DHF cases have increased in recent years. In 2020, there were 119 cases, which increased to 149 cases in 2021 and jumped to 290 cases in 2022. The classification method for DHF cases in Bangka Regency is still done manually by examining historical data on DHF cases. Therefore, this study uses a K-means-based CBR approach to classify DHF cases in the Bangka Regency. In this study, the clustering of sanitation levels was carried out using the K-means method. To determine the optimal number of clusters using the elbow method, the optimal number of clusters was obtained with as many as three clusters and an inertia value of 1.715965. The clustering results for C1 (low category sanitation level) show that there are 207 cluster members, C2 (medium category sanitation level) has as many as 108 cluster members, and C3 (high category sanitation level) has as many as 165 cluster members. The evaluation of clustering using the DBI approach shows that using three clusters gives better results in cluster separation, with the lowest DBI value of 0.608. To classify dengue cases using the CBR approach with the similarity search method using KNN, the accuracy obtained for the conformity between the classification results and the actual data is 92.7%. While the results of model performance evaluation show that the proposed model has better accuracy, precision, recall, and F1-Score values compared to other models such as SVM, ANN, and K-Means, the accuracy, precision, recall, and F1-Score values are obtained as 0.951, 0.954, 0.951, and 0.943. Based on this, it shows that the proposed model has better performance in classifying DHF cases and can be relied upon to assist in decision-making. This research implies that it can contribute to the development of a classification system for DHF cases in Bangka Regency related to identifying and responding to potential increases in DHF cases more quickly and effectively. Furthermore, it can encourage active community participation in DHF prevention programs and public health improvements.
Keywords: Sanitation, DHF, Classification, K-Means, Case Base Reasoning