PENINGKATAN KINERJA SUPPORT VECTOR MACHINE MENGGUNAKAN MODEL BAHASA BERT UNTUK KLASIFIKASI SENTIMEN DENGAN DATASET TERBATAS
DOI:
https://doi.org/10.31849/zn.v7i2.26847Keywords:
Klasifikasi Sentimen, SVM, BERT, X, Kaesang PangarepAbstract
Media sosial kini menjadi ruang penting bagi masyarakat untuk mengekspresikan opini secara terbuka terhadap berbagai isu terkini, salah satunya melalui platform X yang populer di kalangan pengguna internet. Platform ini sering digunakan sebagai sumber data klasifikasi sentimen guna mengungkap persepsi masyarakat terhadap peristiwa-peristiwa yang terjadi, khususnya di bidang politik dan pemerintahan. Namun, keterbatasan dataset menjadi tantangan utama dalam proses klasifikasi karena kondisi tersebut dapat mempengaruhi akurasi dan validitas sentimen yang dihasilkan. Untuk mengatasi permasalahan tersebut, penelitian ini mengusulkan kombinasi algoritma Support Vector Machine (SVM) dengan fitur Bidirectional Encoder Representations from Transformers (BERT) yang terbukti efektif dalam menangkap konteks bahasa secara mendalam. Pendekatan ini bertujuan untuk meningkatkan performa klasifikasi sentimen terkait pengangkatan Kaesang Pangarep sebagai Ketua Umum Partai Solidaritas Indonesia (PSI) pada media sosial X. Metode penelitian meliputi tahap preprocessing text, ekstraksi fitur menggunakan BERT, serta penerapan SVM dalam proses klasifikasi sentimen. Hasil eksperimen menunjukkan bahwa model kombinasi tersebut berhasil meningkatkan F1-Score secara signifikan sebesar 3% pada data uji. Hal ini menandakan model bahasa BERT dapat meningkatkan performa SVM dalam klasifikasi sentimen
References
I. N. N. Fauziah, S. A. Saputri, and Y. T. Herlambang, ‘Teknologi Informasi: Dampak Media Sosial pada Perubahan Sosial Masyarakat’, Indo-MathEdu Intellectuals Journal, vol. 5, no. 1, pp. 757–766, Jan. 2024, doi: 10.54373/imeij.v5i1.645.
M. Mesran and D. P. Indini, ‘Analisis Dalam Pendukung Keputusan Seleksi Content Creator Mahasiswa Terbaik Menerapkan Metode EDAS dan ROC’, Journal of Computer System and Informatics (JoSYC), vol. 4, no. 4, pp. 912–921, Aug. 2023, doi: 10.47065/josyc.v4i4.4093.
O. Fontanelli, D. Hernández, and R. Mansilla, ‘Modeling the popularity of twitter hashtags with master equations’, Soc Netw Anal Min, vol. 12, no. 1, Dec. 2022, doi: 10.1007/s13278-022-00861-4.
Y. El Saputra, S. Agustian, and S. Ramadhani, ‘KLIK: Kajian Ilmiah Informatika dan Komputer Klasifikasi Sentimen SVM Dengan Dataset yang Kecil Pada Kasus Kaesang Sebagai Ketua Umum PSI’, Media Online), vol. 4, no. 6, pp. 2902–2908, 2024, doi: 10.30865/klik.v4i6.1944.
T. Y. Pahtoni and H. Jati, ‘Analisis sentimen data Twitter terkait ChatGPT menggunakan Orange Data Mining’, Jurnal Teknologi Informasi dan Ilmu Komputer, vol. 11, no. 2, pp. 329–336, Apr. 2024, doi: 10.25126/jtiik.20241127276.
K. H. Siregar and R. Rahmawati, ‘Kaesang’s Coat-Tail Effect: Influence and Implications for PSI’s Political Branding in the 2024 Election’, Jurnal Ilmu Sosial Indonesia (JISI), vol. 5, no. 2, pp. 153–167, Dec. 2024, doi: 10.15408/jisi.v5i2.43589.
M. Arsyad, ‘Analisis sentimen linguistik komputasional: memahami emosi dalam teks’, 2023, [Online]. Available: https://www.researchgate.net/publication/376722063
S. Agustian and A. Nazir, ‘Klasifikasi Sentimen Terhadap Pengangkatan Kaesang Sebagai Ketua Umum Partai PSI Menggunakan Metode Support Vector Machine’, Technology and Science (BITS), vol. 6, no. 1, 2024, doi: 10.47065/bits.v6i1.5340.
I.-A. Albu and S. Spînu, ‘Emotion detection from tweets using a BERT and SVM ensemble model’, U.P.B. Sci. Bull., Series C, vol. 84, no. 1, 2022, [Online]. Available: https://pypi.org/project/demoji
B. Prasetyo, Ahmad Yusuf Al-Majid, and Suharjito, ‘A Comparative Analysis of MultinomialNB, SVM, and BERT on Garuda Indonesia Twitter Sentiment’, PIKSEL : Penelitian Ilmu Komputer Sistem Embedded and Logic, vol. 12, no. 2, pp. 445–454, Sep. 2024, doi: 10.33558/piksel.v12i2.9966.
S. Forhad and A. H. Siddique, ‘Analyzing TF-IDF and BERT Approach for Bangla Text Classification Using Transformer-Based Embedding for Newspaper Sentiment Classification’. [Online]. Available: https://www.researchgate.net/publication/384888117
S. Agustian et al., ‘New Directions in Text Classification Research: Maximizing The Performance of Sentiment Classification from Limited Data Arah Baru Penelitian Klasifikasi Teks: Memaksimalkan Kinerja Klasifikasi Sentimen dari Data Terbatas’, 2024. Accessed: Feb. 10, 2025. [Online]. Available: https://arxiv.org/abs/2407.05627
A. Gunawan, E. Altiarika, S. Pratama, and Y. B. Pratama, ‘Pengembangan Aplikasi Asisten Virtual Menggunakan Machine Learning Berbasis Mobile Untuk Meningkatkan Pelayanan Kampus di Muhammadiyah Bangka Belitung’, 2024. [Online]. Available: https://jits.unmuhbabel.ac.id/
A. Addiga and S. Bagui, ‘Sentiment Analysis on Twitter Data Using Term Frequency-Inverse Document Frequency’, Journal of Computer and Communications, vol. 10, no. 08, pp. 117–128, 2022, doi: 10.4236/jcc.2022.108008.
A. Amelia and R. Yusuf, ‘Analisis sentimen masyarakat Indonesia pada platform X terhadap isu fufufafa menggunakan Bidirectional Encoder Representations from Transformers’, Jurnal Informatika Teknologi dan Sains , vol. 7, no. 1, pp. 72–80, 2025.
K. Setyo Nugroho, A. Yullian Sukmadewa, H. D. Wuswilahaken, F. Abdurrachman Bachtiar, and N. Yudistira, ‘BERT Fine-Tuning for Sentiment Analysis on Indonesian Mobile Apps Reviews’, 2021. Accessed: Feb. 17, 2025. [Online]. Available: https://arxiv.org/pdf/2107.06802
G. Sanhaji, A. Febrianti, and F. Teknik, ‘Aplikasi DIATECT Untuk Prediksi Penyakit Diabetes Menggunakan SVM Berbasis Web’, Jurnal Tekno Kompak, vol. 18, no. 1, pp. 150–163, 2024.
H. Hendra, ‘Prediksi Daya Listrik Pada Pembangkit Listrik Siklus Gabungan Berdasarkan Kondisi Lingkungan Menggunakan Metode Machine Learning’, Elektron : Jurnal Ilmiah, pp. 72–82, Dec. 2023, doi: 10.30630/eji.0.0.415.
Y. Prasetyo et al., ‘Analisis perbandingan optimizer SGD dan ADAM pada model CNN untuk klasifikasi jamur edible dan poisonous’, 2025.
P. Yohana, S. Agustian, and S. Kurnia Gusti, ‘Klasifikasi Sentimen Masyarakat terhadap Kebijakan Vaksin Covid-19 pada Twitter dengan Imbalance Classes Menggunakan Naive Bayes’, 2022. [Online]. Available: https://lp2m.unmul.ac.id/webadmin/public/upload/files/9584b64517cfe308eb6b115847cbe8e7.pdf
B. Cahya, ‘Implementasi WORD2VEC Sebagai Fitur Pada Algoritma SVM Dalam Klasifikasi Sentimen ( Studi Kasus Tweet Kaesang Sebagai KETUM PSI)’, Universitas Islam Negeri Sultan Syarif Kasim Riau, 2024.
J. Pranata, S. Agustian, and E. Haerani, ‘Penggunaan Model Bahasa indoBERT pada Metode Random Forest Untuk Klasifikasi Sentimen Dengan Dataset Terbatas’, Technology and Science (BITS), vol. 6, no. 3, pp. 1668–1676, 2024, doi: 10.47065/bits.v6i3.6335.
R. Illahi, S. Agustian, F. Yanto, P. H. Studi Teknik Informatika Fakultas Sains dan Teknologi Universitas Islam Negeri Sultan Syarif Kasim Riau Jl Soebrantas, S. Baru, and K. Pekanbaru, ‘Klasifikasi sentimen menggunakan bidirectional LSTM dan IndoBERT dengan dataset terbatas.’, 2025.
Downloads
Published
Issue
Section
License
Copyright (c) 2025 ZONAsi: Jurnal Sistem Informasi

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
CC BY-SA 4.0
Attribution-ShareAlike 4.0
You are free to:
- Share — copy and redistribute the material in any medium or format for any purpose, even commercially.
- Adapt — remix, transform, and build upon the material for any purpose, even commercially.
- The licensor cannot revoke these freedoms as long as you follow the license terms.
Under the following terms:
- Attribution — You must give appropriate credit , provide a link to the license, and indicate if changes were made . You may do so in any reasonable manner, but not in any way that suggests the licensor endorses you or your use.
- ShareAlike — If you remix, transform, or build upon the material, you must distribute your contributions under the same license as the original.
- No additional restrictions — You may not apply legal terms or technological measures that legally restrict others from doing anything the license permits.
Notices:
You do not have to comply with the license for elements of the material in the public domain or where your use is permitted by an applicable exception or limitation .
No warranties are given. The license may not give you all of the permissions necessary for your intended use. For example, other rights such as publicity, privacy, or moral rights may limit how you use the material.
