Di Tahun 2022, tercatat penggunaan internet masyarakat Indonesia sebesar 73.7% dari total populasi untuk aktivitas sehari-hari. Internet telah membawa kemudahan bagi masyarakat dalam media sosial dan komunikasi. Ekspektasi yang tercipta ketika semakin berkembangnya internet dan aplikasi perpesanan adalah tidak lagi dibutuhkannya penggunaan nomor telepon dan SMS. Fakta mengenai hal ini justru berbalik dimana penggunaan internet dan aplikasi perpesanan saat ini tidak menghilangkan penggunaan SMS di Indonesia. Fenomena spam dalam SMS dapat terjadi karena beberapa faktor. Salah satu faktor tersebut adalah kurangnya wawasan masyarakat dalam membedakan pesan yang berupa sebuah spam atau tidak. Klasifikasi teks menggunakan metode Long-Short Term Memory (LSTM) dilakukan untuk mengklasifikasi data SMS ke dalam tiga kategori, yaitu “promo”, “penipuan” dan “normal”. Untuk melakukan klasifikasi teks perlu melibatkan beberapa proses, yaitu: Data Collection, Data Preprocessing, Word Representation, Classification, dan Evaluation/Testing. Data terdiri dari 1143 SMS yang telah diberi label serta menggunakan framework tensorflow dan keras dalam penelitian ini. Dengan menggunakan algoritma LSTM, model penelitian yang dibentuk mencapai akurasi sebesar 94%. Metode LSTM menghasilkan hasil yang lebih baik dari kedua metode pembandingnya. Model dengan metode LSTM menghasilkan nilai accuracy 27% lebih baik dibandingkan dengan metode Naive Bayes dan 24% lebih baik dari metode KNN.
In 2022, it was recorded that the internet use of the Indonesian people amounted to 73.7% of the total population for daily activities. The internet has brought convenience to people in social media and communication. The expectation created when the internet and messaging applications are growing is that there is no longer a need for the use of phone numbers and SMS. The fact about this is actually reversed where the use of the internet and messaging applications currently does not eliminate the use of SMS in Indonesia. The phenomenon of spam in SMS can occur due to several factors. One of these factors is the lack of public insight in distinguishing messages that are in the form of spam or not. Text classification using the Long-Short Term Memory (LSTM) method is carried out to classify SMS data into three categories, namely “promo”, “penipuan” and “normal”. To perform text classification, it is necessary to involve several processes, namely: Data Collection, Data Preprocessing, Word Representation, Classification, and Evaluation / Testing. The data consisted of 1143 sms that had been labeled and used tensorflow and hard frameworks in this study. Using the LSTM algorithm, the formed research model achieved an accuracy of 94%. The LSTM method produces better results than its two comparison methods. The model with the LSTM method produces an accuracy value 27% better than the Naive Bayes method and 24% better than the KNN method.