Klasifikasi Penyakit Stroke dengan Metode Support Vector Machine (SVM)
Penyakit stroke merupakan penyakit ke tiga di dunia yang menyebabkan kecacatan akibat gangguan fungsi syaraf. Gangguan fungsi syaraf yang terjadi seperti gangguan penglihatan, bicara pelo, gangguan mobilitas, serta kelumpuhan pada wajah maupun ekstremitas. Tujuan dari penelitian ini yang pertama yaitu mengetahui nilai akurasi, presisi, dan recall menggunakan metode Support Vector Machine (SVM). Kedua menerapkan linear kernel, polynomial function, hyperbolic tangent (sigmoid), dan Gaussian radial basis function (RBF) dalam melakukan klasifikasi dengan metode Support Vector Machine (SVM). Pada penelitian ini menggunakan jenis dataset publik yang diambil dari www.kaggle.com.
Dataset yang digunakan yaitu Stroke Prediction Dataset kemudian diunduh dalam bentuk csv yang disimpan dengan nama dataset. Pada data stroke terdiri dari 5110 data dengan 12 atribut. Bahasa yang digunakan yaitu python. Dalam proses evaluasi kinerja menggunakan metode Support Vector Machine dengan 14 perbandingan rasio. Evaluasi yang digunakan dalam penelitian ini yaitu menentukan nilai akurasi, presisi dan recall. Pada penelitian ini nilai akurasi tertinggi dihasilkan oleh kernel polinomial dengan nilai akurasi 78.86%, nilai presisi 73.98% dan nilai recall 56.75%.
Kata Kunci: Stroke, Kernel Support Vector Machine, Klasifikasi
Stroke is the third disease in the world that causes disability due to impaired nerve function. Impaired nerve function that occurs such as visual impairment, pelo speech, mobility disorders, and paralysis of the face and extremities. The purpose of this first study is to determine the value of accuracy, precision, and recall using the Support Vector Machine (SVM) method. The second applies linear kernel, polynomial function, hyperbolic tangent (sigmoid), and Gaussian radial basis function (RBF) in classifying with the Support Vector Machine (SVM) method. This study used a type of public dataset taken from www.kaggle.com.
The dataset used is the Stroke Prediction Dataset and then downloaded in csv form which is stored with the name of the dataset. The stroke data consists of 5110 data with 12 attributes. The language used is python. In the performance evaluation process using the Support Vector Machine method with nine ratio comparisons. The evaluation used in this study is to determine the value of accuracy, precision and recall. In this study, the highest accuracy value was produced by the polynomial kernel with an accuracy value of 78.86%, a precision value of 73.98% and a recall value of 56.75%.
Keywords: Stroke, Kernel Support Vector Machine, Classification