KLASIFIKASI PENYAKIT DIABETES MELITUS MENGGUNAKAN METODE SUPPORT VECTOR MACHINE (SVM)
CLASSIFICATION OF DIABETES MELLITUS DISEASE USING THE SUPPORT VECTOR MACHINE (SVM) METHOD
Deteksi dini terhadap risiko diabetes penting untuk meningkatkan pencegahan dan penanganan kondisi medis tersebut. Penelitian ini bertujuan untuk membangun model prediktif yang mampu mengidentifikasi risiko diabetes pada pasien berdasarkan data medis. Dataset yang digunakan adalah Pima Indians Diabetes, yang berisi informasi medis dan indikator penting seperti Kehamilan, Glukosa, Tekanan darah, Ketebalan kulit, Insulin, BMI, DiabetesPedigreeFunction, Umur. Metode yang digunakan dalam penelitian ini melibatkan preprocessing data untuk membersihkan dan menstandarisasi data, serta membagi data menjadi dua kelompok, yaitu data training (80%) dan data testing (20%).
Analisis data eksploratif (Exploratory Data Analysis) dilakukan untuk memahami karakteristik distribusi data dan korelasi antar variabel. Setelah preprocessing dan analisis data, model prediksi dibangun menggunakan algoritma Support Vector Machine (SVM), yang dipilih karena kemampuannya dalam mengklasifikasikan data biner secara efektif. Evaluasi model dilakukan menggunakan metrik akurasi, presisi, recall, dan confusion matrix untuk mengukur kemampuan model dalam mendeteksi kasus diabetes dengan benar. Hasil penelitian ini menunjukkan bahwa model prediksi yang dihasilkan mampu mengidentifikasi pasien berisiko dengan tingkat ketepatan yang baik, sehingga memiliki potensi aplikasi dalam mendukung deteksi dini diabetes. Penelitian ini memberikan kontribusi dalam pemanfaatan data medis untuk prediksi penyakit kronis, khususnya diabetes, yang diharapkan dapat membantu pengambilan keputusan dalam praktik kesehatan.
Kata Kunci: Diabetes, Prediksi, Pima Indians Diabetes, Support Vector Machine (SVM), Evaluasi Model.
Early detection of diabetes risk is important to improve prevention and management of this medical condition. This study aims to build a predictive model that is able to identify diabetes risk in patients based on medical data. The dataset used is Pima Indians Diabetes, which contains medical information and important indicators such as Pregnancy, Glucose, Blood pressure, Skin thickness, Insulin, BMI, DiabetesPedigreeFunction, Age. The method used in this study involves data preprocessing to clean and standardize the data, and dividing the data into two groups, namely training data (80%) and testing data (20%).
Exploratory data analysis was conducted to understand the characteristics of data distribution and correlation between variables. After preprocessing and data analysis, a prediction model was built using the Support Vector Machine (SVM) algorithm, which was chosen for its ability to effectively classify binary data. Model evaluation was conducted using accuracy, precision, recall, and confusion matrix metrics to measure the model's ability to correctly detect diabetes cases.
The results of this study indicate that the resulting prediction model is able to identify at-risk patients with a good level of accuracy, so it has potential applications in supporting early detection of diabetes. This study contributes to the use of medical data for the prediction of chronic diseases, especially diabetes, which is expected to help decision making in health practices.
Keywords: Diabetes, Prediction, Pima Indians Diabetes, Support Vector Machine (SVM), Model Evaluation.