Classification of Twitter User Opinions to Online Schools with the Naïve Bayes Method and Support Vector Machine
Covid-19 atau Coronavirus Disease menjangkit negara Indonesia. Hal ini menyebabkan segala aktifitas terganggu terutama dalam dunia pendidikan. Sistem pembelajaran yang semula dilakukan tatap muka menjadi secara daring atau online. Sistem pembelajaran ini mendapatkan banyak tanggapan masyarakat. Fasilitas dan cara belajar mengajar menjadi perdebatan oleh masyarakat. Hal ini menjadi landasan penting untuk melakukan penelitian ini. Fokus pada penelitian ini yaitu melakukan analisa sentimen tentang sekolah daring dengan metode SVM dan NBC. Terkait dengan data yang dalam penelitian, data tersebut dibagi kedalam 3 bagian sentimen yaitu positif, netral, negatif. Data dalam penelitian diambil dari twitter dengan mencari tweet yang terdapat kata sekolah daring. Data yang didapat yaitu sebesar 414 tweet dengan terbagi dengan 3 sentimen yaitu positif sebesar 27.7%, negatif sebesar 36.9%, dan netral sebesar 35.2%. Data tersebut akan dilakukan pengujian menggunakan 2 langkah yaitu menggunakan split data dan cross-validation. Hasil uji menggunakan split data pada metode NBC mendapatkan nilai accuracy tertinggi yaitu pada ratio 4:6 dengan nilai sebesar 68%, untuk nilai precision 74%, recall 65%, dan f1-score 68%. Sedangkan pada metode SVM dengan kernel=linear mendapatkan nilai accuracy tertinggi yaitu pada ratio 1:9 dengan nilai sebesar 71,4%. untuk nilai precision 73%, recall 70%, dan f1-score 71%. Untuk hasil uji dengan menggunakan cross-validation pada metode NBC mendapatkan nilai accuracy tertinggi yaitu pada k=10 dengan nilai sebesar 69,25%, untuk nilai precision 86%, recall 79%, dan f1-score 81%. Sedangkan pada metode SVM dengan kernel=linear mendapatkan nilai accuracy tertinggi yaitu pada k=10 dengan nilai sebesar 68,87% untuk nilai precision 74%, recall 68%, dan f1-score 69%.
Covid-19 or Coronavirus Disease has hit Indonesia. This causes all activities to be disrupted, including in the world of education. The learning system that was originally carried out face-to-face has become online or online. This learning system gets a lot of public response. Facilities and methods of teaching and learning have become a matter of debate in the community. This is the basis for conducting this research. This study focuses on analyzing sentiment about online schools using the SVM and NBC methods. Regarding data collection, this study came from 414 tweets divided into 3 sentiments, respectively, namely positive, negative, neutral as much as 27.7%, 36.9%, 35.2%. The evaluation technique uses 2 techniques, namely split data and cross-validation. The results of the test using split data on the NBC method get the highest accuracy value, namely at a ratio of 4:6 with a value of 68%, for a precision value of 74%, recall 65%, and an f1-score of 68%. Meanwhile, the application of the SVM method with kernel=linear got the highest performance at a ratio of 1:9, which is an accuracy level of 71.4%. 73% precision, 70% recall, and 71% f1-score. For test results using cross-validation on the NBC method, the highest performance was achieved at k=10 with an accuracy level of 69.25%, precision 86%, recall 79%, and f1-score 81%. Meanwhile, in the SVM method with a linear kernel, the highest performance was obtained at k=10 with an accuracy value of 68.87%, 74% precision, 68% recall, and 69% f1-score.