Pemilihan Arsitektur Convolutional Neural Network (CNN) untuk Deteksi Tempat Wisata di Surabaya
Selection of Convolutional Neural Network (CNN) Architecture for Tourist Attraction Detection in Surabaya
Penelitian ini bertujuan untuk mengembangkan aplikasi web berbasis Convolutional Neural Network (CNN) yang dapat mengklasifikasikan gambar tempat wisata di Surabaya. Penelitian ini menganalisis kinerja enam arsitektur CNN tunggal (SENet, ResNeXt, Inception v4, ResNet, Inception v3, dan Inception v2) serta menguji kombinasi dari dua arsitektur terbaik. Metode penelitian yang digunakan adalah CRISP-DM (Cross-Industry Standard Process for Data Mining). Tahapannya mencakup pemahaman bisnis, pengumpulan dan pembersihan data dari berbagai sumber (Google, Google Maps, dan foto langsung) untuk menghasilkan 21.500 gambar yang seimbang di 43 kelas. Model dilatih menggunakan data ini dan dievaluasi dengan metrik akurasi, presisi, recall, dan F1-score. Hasilnya menunjukkan bahwa arsitektur tunggal terbaik adalah ResNet dengan akurasi 83.49%. Namun, kombinasi arsitektur ResNet + SENet dengan optimizer RMSProp dan learning rate 0.0001, serta batch size 32, memberikan performa paling optimal, mencapai akurasi 89.02%. Model terbaik ini kemudian diimplementasikan ke dalam aplikasi web menggunakan framework Flask, dan pengujian black box testing menunjukkan bahwa seluruh fungsionalitas berjalan dengan baik dan sesuai dengan kebutuhan pengguna. Aplikasi ini diharapkan dapat membantu wisatawan mengidentifikasi tempat wisata dan mendukung promosi pariwisata Surabaya.
Kata Kunci: Convolutional Neural Network, Deteksi, Tempat Wisata, Surabaya, Flask
This research aims to develop a web application based on Convolutional Neural Network (CNN) that can classify tourist attraction images in Surabaya. The study analyzes the performance of six single CNN architectures (SENet, ResNeXt, Inception v4, ResNet, Inception v3, and Inception v2) and tests a combination of the two best-performing architectures. The research methodology used is CRISP-DM (Cross-Industry Standard Process for Data Mining). The stages include business understanding, data collection and cleaning from various sources (Google, Google Maps, and direct photos) to produce 21,500 balanced images across 43 classes. The model was trained using this data and evaluated with accuracy, precision, recall, and F1-score metrics. The results show that the best single architecture is ResNet with an accuracy of 83.49%. However, the combination of ResNet + SENet architecture with the RMSProp optimizer and a learning rate of 0.0001, along with a batch size of 32, provides the most optimal performance, reaching an accuracy of 89.02%. This best model was then implemented into a web application using the Flask framework, and black box testing confirmed that all functionalities worked well and met user needs. This application is expected to help tourists identify tourist attractions and support the promotion of Surabaya's tourism.
Keywords: Convolutional Neural Network, Detection, Tourist Attraction, Surabaya, Flask