PERBANDINGAN ALGORITMA LSTM DAN BILSTM UNTUK ANALISIS SENTIMEN MULTI-CLASS MEDIA SOSIAL TWITTER
COMPARISON OF LSTM AND BILSTM ALGORITHM FOR MULTI-CLASS SENTIMENT ANALYSIS OF TWITTER SOSIAL MEDIA
Perkembangan teknologi khususnya internet dan media sosial banyak digunakan oleh masyarakat. Salah satunya media sosial twitter sangat popular di Indonesia. Pengguna twitter dapat berinteraksi dan berbagi pendapat maupun opini melalui tweet. tweet ini berisi informasi berupa teks yang mengandung emosi pengguna. Analisis sentimen merupakan proses untuk menentukan emosi dari opini seseorang berupa teks. Penelitian ini, melakukan analisis multiclass menggunakan model long Short-Term Memory (LSTM) dan Bidirectional Long Short-Term Memory (BiLSTM). Model ini dipilih karena memiliki kemampuan dalam memahami data teks dan menangkap konteks temporal dalam kalimat. Penelitian dilakukan pada data sentimen yang sudah memiliki label yang diklasifikasikan dalam 5 kelas yaitu anger, fear happy, sadness, dan love. LSTM dan BILSTM dilatih menggunakan representasi vector kata dan parameter yang dioptimalkan untuk meningkatkan akurasi. Selain itu, untuk mengetahui akurasi yang paling tinggi juga menggunakan perbandingan hyperparameter batch size, learning rate dan epoch. Membandingan dengan menggunakan penyeimbang smote dan menggunakan embedding glove. Hasil evaluasi menunjukkan bahwa model BiLSTM memiliki akurasi 60% lebih baik dibandingkan LSTM memiliki akurasi 58% dengan menggunakan hyperparameter terbaik.
Kata kunci: Analisis sentiment, Twitter, LSTM, BiLSTM
Technological developments, especially the internet and social media, are widely used by society. One of them is the social media Twitter which is very popular in Indonesia. Twitter users can interact and share thoughts and opinions via tweets. This tweet contains information in the form of text that contains the user's emotions. Sentiment analysis is a process for determining emotions from someone's opinion in the form of text. This research carried out multiclass analysis using long short-term memory (LSTM) and bidirectional long short-term memory (BiLSTM) models. This model was chosen because it has the ability to understand text data and capture the temporal context in sentences. The research was carried out on sentiment data which already had labels classified into 5 classes, namely anger, fear, happiness, sadness and love. LSTM and BILSTM are trained using word vector representations and optimized parameters to improve accuracy. Apart from that, to find out the highest accuracy, we also use a comparison of the hyperparameters batch size, learning rate and epoch. Comparing using a smote balancer and using an embedding glove. The evaluation results show that the BiLSTM model has 60% better accuracy than LSTM which has 58% accuracy using the best hyperparameters.
Keywords: Sentiment analysis, Twitter, LSTM, BiLSTM