Penerapan Algoritma Naive Bayes (NB) untuk Klasifikasi Penyakit Jantung
Application of Naive Bayes (NB) Algorithm For Classification of Heart Disease
Saat ini secara global penyakit tidak menular (PTM) menjadi penyebab utama kematian, salah satunya penyakit jantung. Penyakit jantung merupakan suatu penyakit degeneratif yang berkaitan dengan gaya hidup, dan sosial ekonomi masyarakat yang menjadi penyebab kematian nomor satu di dunia. Dengan kemajuan teknologi yang sangat pesat, mendorong berbagai penelitian untuk mempermudah mendiagnosa penyakit jantung menggunakan machine learning. Model klasifikasi yang digunakan yaitu Naïve Bayes (NB). Naïve Bayes (NB) menggunakan probabilitas disetiap data. Dataset yang digunakan adalah Heart Disease Clasification Dataset yan diambil dari kaggle berjumlah 1320 data. Penelitian ini dilakukan bertujuan untuk mendapatkan akurasi terbaik untuk klasifikasi penyakit jantung. Untuk mengetahui akurai terbaik, penelitian ini menggunakan dua pengujian, yaitu dengan split data dan cross validaton. Untuk penggunaan split data diperoleh accuracy 69.96%, precision 100%, recall 45.94%, dan f1-score 62.92%. Sedangkan penggunaan cross validation diperoleh nilai accuracy 77.25%, precision 82.70%, recall 81.40% dan f1-score 76.89%.
Kata Kunci – Klasifikas, Naïve Bayes (NB), Split Data, Cross Validation.
Currently, globally, non-communicable diseases (NCDs) are the leading cause of death, including heart disease. Heart disease is a degenerative condition associated with lifestyle, and the socio-economic factors of the community, making it the number one cause of death worldwide. With the rapid advancement of technology, various research efforts are being made to facilitate the diagnosis of heart disease using machine learning. The classification model used is Naïve Bayes (NB). Naïve Bayes (NB) utilizes probabilities for each piece of data. The dataset used is the Heart Disease Classification Dataset, consisting of 1320 data points, obtained from Kaggle. This research aims to achieve the best accuracy for heart disease classification.To determine the best accuracy, two tests are conducted in this research: data split and cross-validation. For the use of data split, an accuracy of 69.96%, precision of 100%, recall of 45.94%, and an f1-score of 62.92% are obtained. Meanwhile, with cross-validation, the values obtained are an accuracy of 77.25%, precision of 82.70%, recall of 81.40%, and an f1-score of 76.89%.
Keywords – Clarification, Naïve Bayes (NB), Split Data, Cross Validation.