OPTIMASI METODE RANDOM FOREST DENGAN SMOTE (SYNTHETIC MINORITY OVERSAMPLING TECHNIQUE) PADA PENGEMBANGAN SISTEM INFORMASI PREDIKSI DIABETES BERBASIS WEBSITE
OPTIMIZATION OF THE RANDOM FOREST METHOD WITH SMOTE (SYNTHETIC MINORITY OVERSAMPLING TECHNIQUE) IN THE DEVELOPMENT OF A WEBSITE-BASED DIABETES PREDICTION INFORMATION SYSTEM
Indonesia, dengan jumlah penduduk tertinggi ke-empat di dunia saat ini sedang menghadapi tantangan Kesehatan yang signifikan dengan angka kematian yang tinggi, terutama disebabkan oleh penyakit kronis. Penyebab utama kematian di Indonesia adalah stroke, penyakit jantung iskemik, dan diabetes. Diabetes merupakan salah satu penyakit kronis yang menyerang performa tubuh dalam memproses karbohidrat, lemak, dan protein dalam tubuh. Penyakit ini dapat menyerang pada segala rentang usia mulai dari anak-anak hingga lansia. Gaya hidup tidak sehat telah menjadi tren masa kini kalangan pemuda, konsumsi makanan cepat saji, minimal beralkohol, hingga kurangnya minat Masyarakat untuk berolahraga menjadi salah satu penyebab banyaknya penderita diabetes. Tidak hanya itu saat ini sedang marak dieluhkan terjadinya proses maladministrasi yang dilakukan oleh oknum pemerintahan dengan pihak layanan Kesehatan sehingga membuat Masyarakat enggan untuk melakukan cek Kesehatan secara rutin. Oleh karena itu untuk mengatasi kondisi diatas dikembangkan sebuah inovasi berupa sistem informasi prediksi diabetes dengan menggunakan salah satu algoritma machine learning yaitu random forest sebagai metode analisis data dan dioptimalkan dengan algoritma smote untuk mengurangi kemungkinan adanya imbalance class. Sistem informasi ini menggabungkan pengembangan sistem pakar untuk mendiagnosa diabetes berdasarkan gejala yang dilaporkan oleh pengguna melalui form yang diisi pengguna pada website. Pengembangan sistem informasi prediksi diabetes diharapkan dapat membantu pengguna untuk melakukan prediksi diabetes untuk mencegah keterlambatan dalam mendiagnosa penyakit tersebut.
Indonesia, with the fourth highest population in the world, is currently facing significant health challenges with a high mortality rate, mainly caused by chronic diseases. The main causes of death in Indonesia are stroke, ischemic heart disease and diabetes. Diabetes is a chronic disease that attacks the body's performance in processing carbohydrates, fats and proteins in the body. This disease can attack all ages, from children to the elderly. Unhealthy lifestyles have become a current trend among young people, consumption of fast food, minimal alcohol, and people's lack of interest in exercising is one of the causes of the large number of diabetes sufferers. Not only that, there are currently widespread complaints about maladministration processes carried out by government officials and health services, making people reluctant to carry out regular health checks. Therefore, to overcome the above conditions, an innovation was developed in the form of a diabetes prediction information system using a machine learning algorithm, namely random forest, as a data analysis method and optimized with the smote algorithm to reduce the possibility of class imbalance. This information system combines the development of an expert system to diagnose diabetes based on symptoms reported by users through a form that users fill out on the website. The development of a diabetes prediction information system is expected to help users predict diabetes to prevent delays in diagnosing the disease.