Penerapan Ensemble Learning Untuk Klasifikasi Preferensi Film Pada Dataset Movielens Dengan Penanganan Kelas Tidak Seimbang

Authors

  • Rodhiyah Desviana Universitas Lancang Kuning
  • Susandri Susandri Universitas Lancang Kuning
  • Syafrial Syafrial Universitas Lancang Kuning

DOI:

https://doi.org/10.31849/pz3r6608

Keywords:

Ensemble Learning, Klasifikasi Preferensi Film, Dataset MovieLens, SMOTE, Kelas Tidak Seimbang

Abstract

Sistem rekomendasi film semakin dibutuhkan seiring bertambahnya jumlah konten digital dan meningkatnya kebutuhan pengguna akan rekomendasi yang sesuai dengan preferensi mereka. Penelitian ini berfokus pada klasifikasi preferensi pengguna terhadap film menggunakan data MovieLens, dengan pendekatan ensemble learning untuk meningkatkan performa prediksi. Salah satu tantangan utama dalam klasifikasi ini adalah ketidakseimbangan kelas antara data pengguna yang menyukai dan tidak menyukai film, yang dapat memengaruhi akurasi dan kestabilan model. Untuk mengatasi hal tersebut, digunakan teknik SMOTE (Synthetic Minority Over-sampling Technique) guna menyeimbangkan distribusi kelas secara efektif, serta dilakukan tuning hiperparameter menggunakan GridSearchCV untuk mendapatkan konfigurasi terbaik pada model. Model ensemble yang diuji meliputi Random Forest, XGBoost, dan Voting Classifier sebagai kombinasi dari kedua model tersebut. Hasil eksperimen menunjukkan bahwa Voting Classifier memberikan kinerja terbaik secara rata-rata, dengan skor ROC AUC sebesar 0.6466 dan F1 Score sebesar 0.5934. Performa terbaik secara individual juga dicapai oleh Voting Classifier pada test size 0.1 dan random state 2024, dengan ROC AUC sebesar 0.6540 dan F1 Score sebesar 0.5966. Temuan ini menunjukkan bahwa kombinasi SMOTE dan model ensemble yang dioptimalkan dapat secara signifikan meningkatkan akurasi klasifikasi preferensi pengguna, serta memberikan kontribusi praktis yang berarti bagi pengembangan sistem rekomendasi film yang lebih akurat dan responsif terhadap kebutuhan pengguna.

References

[1] S. Utami, K. M. Lhaksmana, and Y. Sibaroni, “Deep Learning and Imbalance Handling on Movie Review Sentiment Analysis,” SinkrOn, vol. 7, no. 3, pp. 1894–1907, Jul. 2023, doi: 10.33395/sinkron.v8i3.12770.

[2] A. A. Khan, O. Chaudhari, and R. Chandra, “A review of ensemble learning and data augmentation models for class imbalanced problems: Combination, implementation and evaluation,” Jun. 15, 2024, Elsevier Ltd. doi: 10.1016/j.eswa.2023.122778.

[3] P. A. R. Mukhlashin, A. Fitrianto, A. M. Soleh, and W. Z. A. Wan Muhamad, “Ensemble learning with imbalanced data handling in the early detection of capital markets,” Journal

of Accounting and Investment, vol. 24, no. 2, pp. 600–617, May 2023, doi: 10.18196/jai.v24i2.17970.

[4] Y. Irawan, R. Wahyuni, and R. Ordila, “Comparative Analysis of Machine Learning Algorithms with SMOTE and Boosting Techniques in Accuracy Improvement,” The Indonesian Journal of Computer Science, vol. 13, no. 5, 2024, doi: 10.33022/ijcs.v13i5.4386.

[5] F. O. Aghware et al., “Effects of Data Balancing in Diabetes Mellitus Detection: A Comparative XGBoost and Random Forest Learning Approach,” NIPES Journal of Science and Technology Research, vol. 7, no. 1, pp. 1–11, Mar. 2025, doi: 10.37933/nipes/7.1.2025.1.

[6] T. Permatasari Djaka and A. S. Winarsih, “Analisis Kinerja Ensemble Learning dan Algoritma Tunggal dalam Klasifikasi Sindrom Ovarium Polikistik Menggunakan Random Forest, Logistic Regression, dan XGBoost,” Infotekmesin, vol. 16, no. 01, 2025, doi: 10.35970/infotekmesin.v16i1.2504.

[7] D. F. Wicaksono, R. S. Basuki, and D. Setiawan, “Peningkatan Performa Model Machine Learning XGBoost Classifier melalui Teknik Oversampling dalam Prediksi Penyakit AIDS,” JURNAL MEDIA INFORMATIKA BUDIDARMA, vol. 8, no. 2, p. 736, Apr. 2024, doi: 10.30865/mib.v8i2.7501.

[8] S. Sarmini, S. Sunardi, and A. Fadlil, “Performa Random Forest dan XGBoost pada Deteksi Penipuan E-Commerce Menggunakan Augmentasi Data CGAN,” Building of Informatics, Technology and Science (BITS), vol. 6, no. 3, pp. 1919–1931, Dec. 2024, doi: 10.47065/bits.v6i3.6430.

[9] M. A. Talukder, M. Khalid, and M. A. Uddin, “An integrated multistage ensemble machine learning model for fraudulent transaction detection,” J Big Data, vol. 11, no. 1, Dec. 2024, doi: 10.1186/s40537-024-00996-5.

[10] M. Imani, A. Beikmohammadi, and H. R. Arabnia, “Comprehensive Analysis of Random Forest and XGBoost Performance with SMOTE, ADASYN, and GNUS Under Varying Imbalance Levels,” Technologies (Basel), vol. 13, no. 3, Mar. 2025, doi: 10.3390/technologies13030088.

[11] P. Zhang, Y. Jia, and Y. Shang, “Research and application of XGBoost in imbalanced data,” Int J Distrib Sens Netw, vol. 18, no. 6, Jun. 2022, doi: 10.1177/15501329221106935.

[12] I. Gusti Ayu Nandia Lestari, N. Made Rai Masita Dewi, K. Gita Meiliana, and I. Komang Agus Ady Aryanto, “Effectiveness of AdaBoost and XGBoost Algorithms in Sentiment Analysis of Movie Reviews,” 2025. [Online]. Available: http://jurnal.polibatam.ac.id/index.php/JAIC

[13] W. Fang, Y. Sha, M. Qi, and V. S. Sheng, “Movie Recommendation Algorithm Based on Ensemble Learning,” Intelligent Automation and Soft Computing, vol. 34, no. 1, pp. 609–622, 2022, doi: 10.32604/iasc.2022.027067.

[14] GroupLens, “https://grouplens.org/datasets/movielens/ml_belief_2024/.”

Downloads

Published

2025-12-01

How to Cite

Penerapan Ensemble Learning Untuk Klasifikasi Preferensi Film Pada Dataset Movielens Dengan Penanganan Kelas Tidak Seimbang. (2025). SEMASTER: Seminar Nasional Teknologi Informasi & Ilmu Komputer, 4(1), 127-142. https://doi.org/10.31849/pz3r6608