Topic Analysis Of Online Loans On Twitter Social Media Using Latent Dirichlet Allocation (LDA)
Industri keuangan Indonesia mengalami transformasi besar selama era digitalisasi dan kemajuan teknologi informasi. Pertumbuhan bisnis start-up fintech di Indonesia, khususnya melalui penggunaan aplikasi pinjaman online, membawa fenomena pinjaman online. Pinjaman online telah menimbulkan berbagai kontroversi dan isu yang menjadi sorotan dikalangan masyarakat. Diperlukan suatu metode yang cepat dan efisien untuk mengolah dan memahami informasi yang terdapat dari jutaan tweet agar lebih terstruktur dan sistematis yaitu dengan metode pemodelan topik. Pada penelitian sebelumnya telah mengusulkan algoritma Latent Direchlet Allocation (LDA) untuk untuk mengetahui gambaran umum mengenai opini publik terhadap omnibus law. LDA dapat digunakan untuk memodelkan topik-topik laten yang ada di dalam kumpulan dokumen. Pada penelitian ini, digunakan metodologi Knowledge Discovery in Databases (KDD) untuk mengidentifikasi dan mengelompokan isu-isu dari tweet mengenai pinjaman online. Penelitian ini bertujuan untuk membantu dalam mengidentifikasi dan mengelompokan isu-isu dari tweet mengenai pinjaman online dengan metode Latent Dirichlet Allocation (LDA). Sebanyak 3435 tweet mengenai pinjaman online dilakukan pemodelan topik dengan melakukan percobaan untuk mendapatkan topic modelling terbaik. Didapatkan pemodelan LDA terbaik pada skenario satu dengan paramater untuk iterasi bernilai 10, nilai alpha sebesar 0,1 dan beta sebesar 0,1. Dalam pemodelan skenario dua ini didapat nilai coherence score tertinggi sebesar 0,391. Nilai ini lebih unggul dari seknario lainnya dengan nilai tertinggi dan didapat jumlah topik yaitu 9 topik. Hasil validasi pemodelan topik pinjaman online dengan menggunakan uji koherensi topik yang terdiri dari Word Intruction Task dengan nilai presentase sebesar 95% dan Topic Instruction Task dengan nilai 94%.
Kata Kunci: Pemodelan Topik, Pinjaman Online, Latent Dirichlet Allocation, Coherence Score
Indonesia's financial industry underwent a major transformation during the era of digitalization and advances in information technology. The growth of fintech start-up businesses in Indonesia, particularly through the use of online lending applications, brought about the phenomenon of online lending. Online lending has caused various controversies and issues that are in the spotlight among the public. A fast and efficient method is needed to process and understand the information contained in millions of tweets to make it more structured and systematic, namely the topic modeling method. Previous research has proposed the Latent Dirichlet Allocation (LDA) algorithm to find out an overview of public opinion on the omnibus law. LDA can be used to model latent topics in a collection of documents. In this research, Knowledge Discovery in Databases (KDD) methodology is used to identify and categorize issues from tweets about online loans. This study aims to assist in identifying and clustering issues from tweets about online loans using the Latent Dirichlet Allocation (LDA) method. A total of 3435 tweets about online loans were topic modeling by experimenting to get the best topic modeling. The best LDA modeling was obtained in scenario two with parameters for iterations worth 10, alpha value of 0.1 and beta of 0.1. In modeling scenario two, the highest coherence score value of 0.391 was obtained. This value is superior to other scenarios with the highest value and the number of topics obtained is 9 topics. The results of online loan topic modeling validation using the topic coherence test consisting of Word Instruction Task with a percentage value of 95% and Topic Instruction Task with a value of 94%.
Keywords: Topic Modeling, Online Loan, Latent Dirichlet Allocation, Coherence Score.