KLASIFIKASI MUSIK MENGGUNAKAN KOMBINASI K-MEANS DAN XGBOOST BERDASARKAN SUASANA HATI
MUSIC CLASSIFICATION USING A COMBINATION OF K-MEANS AND XGBOOST BASED ON MOOD
Musik memiliki peranan krusial dalam kehidupan manusia dari dahulu hingga sekarang, tanpa memandang usia, lokasi, atau budaya. Spotify adalah platform streaming musik populer dengan 515 juta pengguna global, umumnya mengelompokkan musik berdasarkan judul, penyanyi, album, dan genre, yang seringkali kurang fleksibel untuk kebutuhan pendengar. Penelitian ini mengusulkan pendekatan untuk memodelkan playlist yang dipersonalisasi berdasarkan suasana hati pengguna secara otomatis. Metode ini memanfaatkan algoritma K-Means untuk klasterisasi musik, yang membantu mengelompokkan musik berdasarkan suasana hati. K-Means adalah pembelajaran tanpa pengawasan yang memungkinkan untuk meminimalkan perbedaan antar data dalam suatu klaster. Namun, K-Means memiliki kekurangan, seperti sensitif terhadap inisialisasi centroid awal, perlu diketahui jumlah klaster yang diinginkan, sensitif terhadap outlier yang dapat mempengaruhi pembentukan klaster, hanya berlaku untuk numerik, dan tidak dapat memberikan informasi secara langsung tentang fitur audio atau atribut yang terpenting dalam pembentukan klaster tersebut. iii XGBoost digunakan untuk mengatasi masalah ini. Pengklasifikasian menggunakan XGBoost juga digunakan untuk memprediksi apakah hasil dari model menggunakan fitur audio atau atribut yang dipilih dapat menghasilkan klasifikasi yang sesuai atau tidak. Temuan dari penelitian ini menunjukkan bahwa nilai silhouette coefficient yang diperoleh dari klasterisasi dengan K Means adalah 0.2333, menunjukkan klaster yang kurang terstruktur. Penggunaan XGBoost untuk menentukan fitur penting meningkatkan kualitas klaster dengan hasil terbaik menggunakan tiga fitur, yaitu “Valence”, “Tempo”, dan “Energy”, menghasilkan nilai silhouette coefficient sebesar 0.5575. Playlist terpersonalisasi dan otomatis dikategorikan dalam empat kategori suasana hati, yaitu “Relax”, “Sad”, “Happy”, dan “Angry”.
Music has played a crucial role in human life from the past to the present, regardless of age, location, or culture. Spotify, a popular music streaming platform with 515 million global users, generally categorizes music by title, singer, album, and genre, which often lacks flexibility for listener needs. This research proposes an approach to automatically model personalized playlists based on the user's mood. This method utilizes the K-Means algorithm for music clustering, which helps group music based on mood. K-Means is unsupervised learning that allows to minimize the differences between data in a cluster. However, K-Means has drawbacks, such as being sensitive to initial centroid initialization, needing to know the desired number of clusters, being sensitive to outliers that may affect cluster formation, being numerical only, and not being able to provide direct information regarding the most important audio features or attributes in cluster formation. XGBoost is used to address these issues. Clustering using XGBoost is also used to predict whether the results of the model using the selected audio features or attributes can produce an appropriate classification or not. The findings of this study show that the v silhouette coefficient value obtained from clustering with K-Means is 0.2333, indicating a less structured cluster. The use of XGBoost to determine important features improves cluster quality with the best results using three features, namely “Valence”, “Tempo”, and “Energy”, resulting in a silhouette coefficient value of 0.5575. The playlists are personalized and automatically categorized into four mood categories, namely “Relax”, “Sad”, “Happy”, and “Angry”.