Teks Ringkas Otomatis pada Portal Berita CNN Indonesia Menggunakan Algoritma Textrank
Automated Text Summarization on CNN Indonesia News Portal Using the Textrank Algorithm
Peringkasan teks otomatis dapat membantu pembaca artiket website dalam memahami dengan singkat inti dari sebuah artikel. Konsep dari peringkasan teks otomatis yaitu dapat mencari bagian penting informasi yang berasal dari teks artikel asli, dengan program tersebut hasil dari rangkuman dapat di jadikan lebih ringkas, padat, dan jelas sesuai dengan topik utama dari artikel yang akan di ringkas.
Program ini akan menggunakan bahasa pemograman Python dengan menggunakana Platfrom Jupyter untuk menjalankan Algoritme Textrank. Untuk bahasa yang digunakan dalam program ini yaitu bahasa indonesia dengan melakukan proses cleaning terlebih dahulu seperti menghilangkan tanda baca pada teks agar program dapat berjalan dengan baik. Untuk penggunaan program ini penulis telah membuat format file .txt dari sumber artikel berita CNN Indonesia dan menjalankan program dengan menggunakan jupyter pada browser untuk melihat hasil perangkuman teks artikel tersebut.
Penelitian ini bertujuan untuk (1) Mengetahui pengimplementasian Algoritma textrank melalui platform Jupyter Notebook, (2) Mengetahui presentase perbandingan yang dapat diperoleh dari teks artikel asli dan hasil peringkasan dengan Algoritma tekxtrank, dan (3) Mengetahui Alogaritma textrank dapat efektif dalam meringkas text berita dalam bahasa Indonesia. Berdasarkan hasil pengujian dihasilkan bahwa rata-rata presentase ringkasan sebesar 6,9% lebih ringkas daripada artikel asli, dengan catatan penulis membatasi jumlah kalimat sebesar 3 kalimat dan hasil analisis Algoritma textrank efektif dalam meringkas text berita dalam bahasa Indonesia.
Kata Kunci : Text, TextRank, Alogaritme, Jupyter Notebook, Phyton,
Automatic text summarization can help website article readers briefly understand the essence of an article. The concept of automatic text summarization is that it can search for important parts of information originating from the original article text, with this program the results of the summary can be made more concise, concise and clear according to the main topic of the article to be summarized.
This program will use the Python programming language using the Jupyter platform to run the Textrank algorithm. The language used in this program is Indonesian, by carrying out a cleaning process first, such as removing punctuation marks in the text so that the program can run well. To use this program, the author has created a .txt file format from the CNN Indonesia news article source and ran the program using Jupyter in a browser to see the results of the summary of the article text.
This research aims to (1) find out the implementation of the textrank algorithm through the Jupyter Notebook platform, (2) find out the comparison percentage that can be obtained from the original article text and the summarization results with the tekxtrank algorithm, and (3) find out that the textrank algorithm can be effective in summarizing news text in Indonesian. Based on the test results, it was found that the average summary percentage was 6.9% more concise than the original article, provided that the author limited the number of sentences to 3 sentences and the results of the textrank algorithm analysis were effective in summarizing news text in Indonesian.