Klasifikasi Penyakit Stroke Menggunakan Support Vector Machine (SVM) dan Particle Swarm Optimization (PSO)
Classification of Stroke Disease Using Support Vector Machine (SVM) and Particle Swarm Optimization (PSO)
Stroke adalah penyakit yang tidak menular tetapi menjadi salah satu penyakit yang paling sering menyebabkan kematian dan kecacatan di dunia termasuk negara kita Indonesia. Ada beberapa faktor yang dapat menyebabkan penyakit stroke yaitu faktor risiko stroke yang dapat diubah dan tidak dapat diubah. Faktor risiko stroke yang tidak dapat diubah yakni jenis kelamin, usia, genetik dan ras. Untuk faktor risiko stroke yang dapat diubah yakni obesitas, merokok, hipertensi (tekanan darah), diabetes militus, dan gaya hidup tidak sehat.
Menurut Kementrian Kesehatan RI penderita penyakit stroke mengalami peningkatan yang signifikan sebesar 10.9% pada tahun 2018 dibandingkan dengan tahun 2013 jumlah penderita penyakit stroke sebanyak 7.0% (Kementrian Kesehatan RI, dalam Abdul 2022).
Tujuan dari penelitian ini yaitu dapat mengetahui hasil preprocessing dataset, dapat mengetahui hasil klasifikasi penyakit stroke menggunakan metode Support Vector Machine, dan dapat mengetahui hasil perbedaan akurasi dari klasifikasi penyakit stroke menggunakan metode Support Vector Machine dan Support Vector Machine berbasis Particle Swarm Optimization.
Sebelum melakukan klasifikasi dataset stroke dilakukan preprocessing terlebih dahulu seperti mengatasi data tidak seimbang menggunakan teknik SMOTE sehingga data siap dimasukkan kedalam model klasifikasi. Dataset stroke yang digunakan memiliki 9 fitur atau atribut dan bejumlah 5.510 data sebelum di upsampling dan menjadi 9.772 data setelah di upsampling.
Hasil penelitian ini memperoleh sebuah model untuk sistem sederhana prediksi untuk klasifikasi penyakit stroke, serta mendapatkan hasil nilai akurasi yaitu 88% dengan metode SVM dengan teknik SMOTE dan 95% untuk pengujian menggunakan metode PSO-SVM dengan teknik SMOTE..
Kata kunci: Stroke, klasifikasi, Support Vector Machine, Particle Swarm Optimization, Smote
Stroke is a non-communicable disease but also one of the diseases that most often causes death and disability in the world, including Indonesia. There are several factors that can cause stroke, namely modifiable and non-modifiable stroke risk factors. Non-modifiable stroke risk factors are gender, age, genetics and race. The modifiable risk factors for stroke are obesity, smoking, hypertension (blood pressure), diabetes mellitus, and an unhealthy lifestyle.
According to the Ministry of Health of the Republic of Indonesia, the number of stroke patients experienced a significant increase of 10.9% in 2018 compared to 2013, with a total of 7.0% stroke patients (Ministry of Health of the Republic of Indonesia, as cited in Abdul 2022
The purpose of this research is to know the results of preprocessing datasets, to know the results of stroke classification using the Support Vector Machine method, and to know the results of differences in the accuracy of stroke classification using the Support Vector Machine and Support Vector Machine based on Particle Swarm Optimization.
Before classifying the stroke dataset, preprocessing is carried out so that it is ready to be included in the classification model. The stroke dataset used has 9 (nine) features or attributes and amounted of 5,510 data before upsampling and becomes 9,772 data after upsampling.
The results of this study obtained a model for a simple predictive system for classification of stroke, and obtained an accuracy value of 88% with the SVM method and 95% for testing using the PSO-SVM method.
Keywords: Strokes, Classification, Support Vector Machine, Particle Swarm Optimization, Smote