Klasifikasi Deteksi Link Phising Dana Kaget Menggunakan Metode Suport Vector Machine Berbasis Website
Link Detection Classification Phishing Dana Kaget Using Support Methods Vector Machine Based Website
Penelitian ini bertujuan untuk mengembangkan model klasifikasi deteksi Link phishing DANA Kaget menggunakan metode Support Vector Machine (SVM) berbasis WEBSITE. Tujuan utama dari model ini adalah memberikan perlindungan kepada pengguna layanan "DANA Kaget" dengan memberi peringatan ketika mereka mengunjungi tautan yang mencurigakan atau situs Website yang berpotensi phishing. Data Link diperoleh melalui observasi manual pada media sosial seperti Facebook, Telegram, dan WhatsApp, dengan total 865 Link phishing dan non-phishing yang dikumpulkan.
Support Vector Machine (SVM) adalah metode pembelajaran mesin yang digunakan untuk klasifikasi dan regresi. SVM bekerja dengan cara menemukan hyperplane optimal yang memisahkan data menjadi dua kelas yang berbeda. Algoritma ini mencoba memaksimalkan margin, yaitu jarak terdekat antara titik data dari masing-masing kelas dengan hyperplane tersebut. Dalam ruang berdimensi tinggi, SVM menggunakan kernel trik untuk membuat pemisahan data lebih efisien dan efektif, meskipun data tidak dapat dipisahkan secara linear. SVM terkenal karena kemampuannya dalam menangani data berukuran besar dan kompleks, serta memberikan performa yang tinggi dalam berbagai aplikasi.
Metode SVM yang diterapkan pada model ini Berdasarkan hasil cross-validation dengan fold 3, 5, dan 10, dapat disimpulkan bahwa model memiliki kinerja yang stabil dengan peningkatan akurasi pada data train dan test seiring dengan peningkatan jumlah fold. Pada fold 3, model mencapai akurasi train sebesar 88% dan test sebesar 84%, menunjukkan kemampuan model dalam mempelajari pola pada data training. Dengan penambahan fold menjadi 5, akurasi train dan test meningkat menjadi 89% dan 85% secara berturut-turut, menandakan peningkatan kemampuan generalisasi model. Pada fold 10, akurasi train meningkat menjadi 90% dan akurasi test mencapai 88%, menunjukkan bahwa model ini memiliki kemampuan yang baik dalam menggeneralisasi pada data baru.
Kata Kunci : SVM, Cross Validation, Dana, PhishingÂ
This study aims to develop a classification model for detecting phishing links on "DANA Kaget" using the Support Vector Machine (SVM) method based on a website. The primary goal of this model is to provide protection to "DANA Kaget" users by warning them when they visit suspicious links or potentially phishing websites. The link data was obtained through manual observation on social media platforms such as Facebook, Telegram, and WhatsApp, with a total of 865 phishing and non-phishing links collected.
Support Vector Machine (SVM) is a machine learning method used for classification and regression. SVM works by finding the optimal hyperplane that separates data into two distinct classes. The algorithm attempts to maximize the margin, which is the closest distance between data points of each class and the hyperplane. In high-dimensional space, SVM uses the kernel trick to make data separation more efficient and effective, even when data cannot be linearly separated. SVM is wellknown for its ability to handle large and complex datasets, providing high performance in various applications.
The SVM method applied in this model shows stable performance based on cross-validation results with 3, 5, and 10 folds. It can be concluded that the model's accuracy improves on both training and test data with an increasing number of folds. At 3 folds, the model achieves a training accuracy of 88% and a test accuracy of 84%, demonstrating its ability to learn patterns in the training data. With the increase to 5 folds, the training and test accuracy improve to 89% and 85%, respectively, indicating an enhancement in the model's generalization ability. At 10 folds, the training accuracy rises to 90%, and the test accuracy reaches 88%, showing that the model has a good capacity to generalize to new data.
Keywords: SVM, Cross Validation, DANA, PhishingÂ