PENGELOMPOKKAN PROVINSI DI INDONESIA BERDASARKAN DATA COVID-19 MENGGUNAKAN TIME SERIES BASED CLUSTERING
CLUSTERING PROVINCES IN INDONESIA BASED ON COVID-19 CASE USING TIME SERIES BASED CLUSTERING
Covid-19 telah memasuki Negara Indonesia sejak bulan Maret 2020 dan terus menyebar diberbagai daerah di Indonesia. Tingginya kasus positif dan kematian Covid-19 di Indonesia harus menjadi perhatian dari semua pihak, khususnya pemerintah untuk membuat kebijakan yang tepat di masing-masing daerah. Sehingga diperlukan adanya informasi daerah-daerah beresiko Covid-19 yang dapat menjadi acuan pemerintah untuk mengurangi angka kasus Covid-19 di berbagai daerah di Indonesia. Dalam artikel ini akan dibahas pengelompokkan provinsi-provinsi di Indonesia berdasarkan penambahan kasus positif dan kematian Covid-19 menggunakan Time Series Based Clustering Analysis. Metode Clustering yang digunakan adalah Complete Linkage dengan 3 ukuran jarak yaitu Dynamic Time Warping (DTW), Autocorrelation Function (ACF) Distance, dan Manhattan Distance. Dari 3 ukuran jarak tersebut, dilakukan cluster validation menggunakan koefisien silhouette didapatkan hasil bahwa metode DTW menghasilkan cluster yang optimal dengan jumlah cluster 3 pada kasus positif Covid-19 sebesar 0.79 dan pada kasus kematian Covid-19 sebesar 0.8. Sehingga dapat disimpulkan bahwa cluster yang terbentuk dalam kategori strong cluster. Hasil dari pengelompokkan 34 provinsi yaitu cluster pertama dengan karakteristik penambahan jumlah kasus positif tinggi yaitu DKI Jakarta, dan pada kasus kematian yaitu Jawa Timur. Cluster kedua dengan penambahan jumlah kasus positif sedang terdiri dari Jawa Barat, Jawa Timur, Jawa Tengah, sedangkan pada kasus kematian yaitu DKI Jakarta, Jawa Tengah. Dan provinsi lainnya masuk dalam cluster ketiga yang merupakan provinsi dengan penambahan jumlah kasus yang rendah.
Kata kunci : Covid-19, Complete Linkage, Dynamic Time Warping, Autocorrelation Function Distance, Manhattan Distance
Covid-19 has entered the country of Indonesia since March 2020 and continues to spread in various regions in Indonesia. The high number of positive cases and deaths of Covid-19 in Indonesia must be the concern of all parties, especially the government, to make the right policies in each region. So it is necessary to have information on areas at risk of Covid-19 which can be a reference for the government to reduce the number of Covid-19 cases in various regions in Indonesia. In this article, we will discuss the grouping of provinces in Indonesia based on the addition of positive cases and deaths of Covid-19 using the Clustering Time Series Analysis. The clustering method used is Complete Linkage with 3 distance measures, namely Dynamic Time Warping (DTW), Autocorrelation Function (ACF) Distance, and Manhattan Distance. From the 3 distance measures, cluster validation was carried out using the silhouette coefficient. The results showed that the DTW method produced an optimal cluster with 3 clusters in positive cases of Covid-19 of 0.79 and cases of Covid-19 deaths of 0.8. So it can be concluded that the clusters formed are in the strong cluster category. The results of clustering 34 provinces are the first cluster with the characteristics of the addition of a high number of positive cases, namely DKI Jakarta, and in the case of death, namely East Java. The second cluster with an increase in the number of moderate positive cases consisted of West Java, East Java, Central Java, while the death cases were DKI Jakarta, Central Java. And other provinces are included in the third cluster, which is a province with a low increase in the number of cases.
Keywords: Covid-19, Complete Linkage, Dynamic Time Warping, Autocorrelation Function Distance, Manhattan Distance