NBC Berbasis Ekstraksi Fitur untuk Analisis Sentimen Masyarakat terhadap Fluktuasi Harga Saham
Feature Extraction-Based NBC for Analysis of Public Sentiment on Stock Price Fluctuations
Saat ini, banyak orang memulai investasi karena ingin mencapai kebebasan finansial. Investasi juga penting untuk melindungi aset dari penurunan nilai akibat inflasi. Investasi saham termasuk salah satu jenis investasi yang popular di Indonesia. Karena harganya yang terjangkau, investasi saham juga sangat mudah dilakukan dan sifatnya fleksibel. Berkaitan dengan investasi saham, banyak orang mencari informasi melalui media sosial, yang salah satunya adalah instagram. Banyak akun instagram yang membuat konten tentang edukasi saham yang sangat bermanfaat. Akun tersebut biasanya melakukan update tentang fluktuasi Indeks Harga Saham Gabungan (IHSG). Keadaan inilah yang menjadi penguat bahwa perlu dilakukannya penelitian ini. Penelitian ini fokus pada analisis sentimen masyarakat terhadap fluktuasi IHSG berdasarkan komentar instagram. Komentar pada media sosial ini perlu diklasifikasi karena beberapa unggahan yang sedang trend memantik ratusan komentar. Teknik klasifikasi yang diterapkan adalah teknik Naïve Bayes Classifier (NBC) dengan ekstraksi fitur N-Gram. Pengujian dilakukan menggunakan 2 cara yaitu pengujian menggunakan k-fold cross validation dan parameter dengan unigram, bigram dan trigram. Hasil ujicoba memperlihatkan cross-validation menghasilkan akurasi tertinggi sebesar 97%. Hasil ini dicapai pada penerapan bigram dengan k=8 dan trigram dengan k= 2, k=4, k=5. Untuk pengujian parameter, level akurasi tertinggi sekitar 97% dicapai pada penerapan trigram dengan α = 0,2 dan α = 0,3.
Nowadays, many people start investing because they want to achieve financial freedom. Investment is also important to protect assets from devaluation due to inflation. One type of investment that is quite popular in Indonesia is a stock investment. Apart from being quite affordable, investing in stocks is also very easy to do and flexible. Regarding stock investment, many people seek information through, one of which is instagram. Many instagram accounts create content about stock education that is very useful. The account usually updates about the ups and downs of the Jakarta Composite Index (JCI). This condition underlies this research needs to be done. This study focuses on analyzing public sentiment on JCI fluctuations based on instagram comments. Comments on social media need to be classified because some of the trending uploads have sparked hundreds of comments. The classification method applied is the Naïve Bayes Classifier (NBC) method with N-Gram feature extraction. Testing is carried out using two methods, namely testing using k-fold cross-validation and parameters with unigram, bigram, and trigram. The experiment results inidicate that cross-validation produces the highest accuracy of 97%. This result is achieved by the application of bigram with k=8 and trigram with k= 2, k=4, k=5. For parameter testing, the highest level of accuracy about 97% is reached on the application of trigrams with = 0.2 and = 0.3..