Optimization of the Number of Single Tuition Clusters on Student Socio-Economic Data
Uang Kuliah Tunggal (UKT) adalah sistem pembayaran untuk biaya kuliah Perguruan Tinggi Negeri. Setiap perguruan negeri mempunyai ketentuan UKT yang berbeda-beda. Untuk menentukan tarif UKT mahasiswa dibutuhkan sebuah teknik pengelompokan data. Teknik ini bertujuan agar memudahkan pihak PTN dalam menentukan tarif UKT masing-masing mahasiswa. Teknik tersebut dinamakan dengan clustering. Clustering merupakan pengelompokan data berdasarkan kemiripan. Jika hasil clustering memiliki derajat kemiripan yang tinggi di kelompok klaster yang sama, tetapi derajat kemiripan yang lebih rendah di kelompok klaster yang berbeda maka dapat dikatakan clustering tersebut baik atau optimal. Dengan adanya Clustering maka akan memudahkan untuk mengetahui bagaimana data harus dikelompokkan dengan begitu akan memperoleh gambaran dari kondisi sosial ekonomi mahasiswa yang cukup relatif. Algoritma clustering yang digunakan pada penelitian ini adalah K-Means Clustering, K-Medians Clustering, K-Modes Clustering dan Fuzzy C-Means Clustering. Dengan adanya algoritma-algoritma clustering yang berbeda-beda maka didapatkan jumlah cluster yang optimal adalah 6 cluster. Untuk membuktikannya maka dibutuhkan uji validitas clustering. Pengujian tersebut menggunakan Silhoutte Coefficient. Nilai Silhoutte Coefficient jika mendekati 1, maka jumlah clusternya dapat dikatakan representatif. Dalam pengujian Silhoutte Coefficient mendapatkan jumlah klaster optimalnya adalah 6 cluster dengan nilai sebesar 0.20212705. Sedangkan algoritma yang optimal adalah algoritma K-Means Clustering dengan nilai sebesar 0.1274176.
Single Tuition Fee (UKT) is a payment system for tuition fees for State Universities (PTN). Each PTN has different UKT requirements. To determine student UKT rates, a data grouping technique is needed. This technique aims to make it easier for PTN to determine the UKT rate for each student. This technique is called clustering. Clustering is a grouping of data based on similarities. If the clustering results have a high degree of similarity in the same cluster group, but a lower degree of similarity in different cluster groups, it can be said that the clustering is good or optimal. With the existence of clustering, it will be easier to find out how the data should be grouped so that it will get a fairly relative picture of the socio-economic conditions of students. The clustering algorithms used in this study are K-Means Clustering, K-Medians Clustering, K-Modes Clustering and Fuzzy C-Means Clustering. With the different clustering algorithms, the optimal number of clusters is 6 clusters. To prove this, a clustering validity test is needed. This test uses the Silhoutte Coefficient. If the Silhoutte Coefficient value is close to 1, then the number of clusters can be said to be representative. In testing the Silhoutte Coefficient, the optimal number of clusters is 6 clusters with a value of 0.20212705. While the optimal algorithm is the K-Means Clustering algorithm with a value of 0.1274176.