Penerapan Metode TF-IDF dan Deep Neural Network untuk Analisa Sentimen pada Data Ulasan Hotel
Application of TF-IDF Method and Deep Neural Network for Sentiment Analysis on Hotel Review Data
Data ulasan pelanggan memainkan peran yang penting dalam dunia bisnis karena dapat digunakan oleh para pelaku usaha untuk lebih memahami pelanggan serta mengetahui kelebihan dan kekurangan dari produk yang ditawarkannya. Namun, data ulasan tersebut hadir dalam jumlah yang besar di internet dan terus bertambah setiap harinya sehingga proses analisis menjadi lebih susah jika dilakukan secara manual. Analisa sentimen merupakan teknik untuk mengklasifikasikan data-data teks kedalam berbagai kelas sentimen. Penelitian ini bertujuan untuk membuat sistem analisa sentimen untuk data perhotelan menggunakan metode TF-IDF dan deep neural network. Metode TF-IDF digunakan untuk mengubah data teks menjadi vektor numerik, sedangkan deep neural network digunakan untuk mengklasifikasikan data vektor tersebut kedalam tiga kelas sentimen, yaitu positif, negatif dan netral. Penelitian ini juga bertujuan untuk mengeksplorasi kombinasi parameter yang memberikan hasil terbaik atau biasa juga disebut dengan hyperparameter tuning. Beberapa parameter yang diuji adalah kombinasi n-gram, nilai learning rate, dan jumlah hidden layers. Dari hasil penelitian yang dilakukan, metode TF-IDF dan deep neural network terbukti mampu untuk menyelesaikan permasalahan analisa sentimen untuk data perhotelan. Selain itu, kombinasi parameter yang memberikan hasil terbaik yaitu n-gram dengan jumlah 3, nilai learning rate 0,001, dan hidden layers dengan jumlah 3.
Customer review data plays an important role in the business world since it can be used by business owners to better understand their customers and find out the advantages and disadvantages of the products they offer. However, these data reviews are present in large numbers on the internet and are increasing every day so the analysis process becomes more difficult if done manually. Sentiment analysis is a technique for classifying text data into various sentiment classes. This study aims to create a sentiment analysis system for hospitality data using the TF-IDF and deep neural network. The TF-IDF is used to convert text data into numeric vectors, while the deep neural network is used to classify the vector data into three sentiment classes, namely positive, negative and neutral. This study also aims to explore the combination of parameters that give the best results or also known as hyperparameter tuning. Some of the parameters tested are the combination of n-grams, the value of the learning rate, and the number of hidden layers. From the results of the research conducted, the TF-IDF and deep neural network are proven to be able to solve the problem of sentiment analysis for hotel data. In addition, the combination of parameters that gives the best results is n-grams with a number of 3, a learning rate value of 0.001, and hidden layers with a number of 3.