KLASIFIKASI SENTIMEN MENGGUNAKAN BIDIRECTIONAL LSTM DAN INDOBERT DENGAN DATASET TERBATAS

Authors

  • Ridho Illahi Universitas Islam Negeri Sultan Syarif Kasim - Riau
  • Surya Agustian Universitas Islam Negeri Sultan Syarif Kasim - Riau
  • Jasril Jasril Universitas Islam Negeri Sultan Syarif Kasim - Riau
  • Febi Yanto Universitas Islam Negeri Sultan Syarif Kasim - Riau

DOI:

https://doi.org/10.31849/zn.v7i1.25091

Keywords:

Analisis Sentimen, Kaesang Pangarep, Bidirectional LSTM, IndoBERT, Media Sosial

Abstract

Untuk mendapatkan informasi melalui media sosial mengenai popularitas termasuk juga sentimen masyarakat terhadap para tokoh politik, masalah waktu menjadi krusial. Oleh karena itu, menganalisis hal tersebut menggunakan komputer menjadi pilihan. Namun menyediakan data yang berlabel cukup untuk pembelajaran mesin dalam kasus analisis sentimen dan tingkat kepopuleran  dari media sosial, akan menyebabkan waktu yang dibutuhkan menjadi lebih lama. Penelitian ini mengembangkan model Bi-LSTM (Bidirectional Long Short-Term Memory) yang dipadukan dengan IndoBERT sebagai fitur representasi teks, untuk menganalisis sentimen dengan data training yang terbatas. Isu utama mengenai pengangkatan Kaesang sebagai ketua umum Partai Solidaritas Indonesia (PSI), hanya menyediakan 300 – 600 tweet  berlabel positif, negatif dan netral untuk training. Data tweet setelah melalui tahap preprocessing  dan vektorisasi BERT, dilatih pada metode klasifikasi Bi-LSTM. Langkah-langkah optimasi dilakukan sampai kepada hyperparameter tuning untuk menemukan model terbaik. Meski jumlah data  train terbatas, model  yang diusulkan berhasil mencapai F1-score sebesar 71% pada data validasi, dan 59% pada pengujian data test. Hasil penelitian mendemonstrasikan keefektifan metode Bi-LSTM dan fitur IndoBERT dalam mengukur opini masyarakat di media sosial. Framework metode klasifikasi yang diusulkan sangat potensial sebagai alat untuk menganalisis respons masyarakat terhadap isu politik terkini.

References

[1] D. S. Puspitarini and R. Nuraeni, “Pemanfaatan Media Sosial Sebagai Media Promosi,” J. Common, vol. 3, no. 1, pp. 71–80, 2019, doi: 10.34010/common.v3i1.1950.
[2] R. Rinaldo, A. P. Sari, and E. Fardiana, “Digital Opinion #Puanadalahharapan Di Media Sosial Twitter Menggunakan Social Network Analysis,” J. Ilm. Multidisiplin, vol. 2, no. 01, pp. 19–29, 2023, doi: 10.56127/jukim.v2i01.407.
[3] M. Ravil, S. Agustian, M. Fikry, and F. Insani, “Peningkatan Performa Klasifikasi Sentimen Tweet Kaesang Menggunakan Naïve Bayes dengan PSO pada Dataset Kecil,” KLIK Kaji. Ilm. …, vol. 4, no. 6, pp. 2909–2917, 2024, doi: 10.30865/klik.v4i6.1939.
[4] Safrizal, S. Agustian, A. Nazir, and Yusra, “Klasifikasi Sentimen Terhadap Pengangkatan Kaesang Sebagai Ketua Umum Partai PSI Menggunakan Metode Support Vector Machine,” Technol. Sci., vol. 6, no. 1, pp. 216–225, 2024, doi: 10.47065/bits.v6i1.5340.
[5] Muhammad Abdillah, M. Fikry, Yusra, A. Nazir, and F. Insani, “Analisa sentimen terhadap kenaikan bbm di twitter (x) menggunakan naive bayes classifier,” J. CoSciTech (Computer Sci. Inf. Technol., vol. 5, no. 1, pp. 65–74, 2024, doi: 10.37859/coscitech.v5i1.6954.
[6] J. Devlin, M.-W. Chang, K. Lee, K. T. Google, and A. I. Language, “BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding,” Naacl-Hlt 2019, no. Mlm, pp. 4171–4186, 2018, [Online]. Available: https://aclanthology.org/N19-1423.pdf.
[7] M. F. Ramadhan, B. Siswoyo, and S. I. Cirebon, “Mengenal Model BERT dan Implementasinya untuk Analisis Sentimen Ulasan Game,” pp. 395–398.
[8] B. Wilie et al., “IndoNLU: Benchmark and Resources for Evaluating Indonesian Natural Language Understanding,” 2020, [Online]. Available: http://arxiv.org/abs/2009.05387.
[9] N. Afrianto, D. H. Fudholi, and S. Rani, “Prediksi Harga Saham Menggunakan BiLSTM dengan Faktor Sentimen Publik,” J. RESTI (Rekayasa Sist. dan Teknol. Informasi), vol. 6, no. 1, pp. 41–46, 2022, doi: 10.29207/resti.v6i1.3676.
[10] A. Aziz Sharfuddin, M. Nafis Tihami, and M. Saiful Islam, “A Deep Recurrent Neural Network with BiLSTM model for Sentiment Classification,” 2018 Int. Conf. Bangla Speech Lang. Process. ICBSLP 2018, pp. 1–4, 2018, doi: 10.1109/ICBSLP.2018.8554396.
[11] H. K. Obayes, F. S. Al-Turaihi, and K. H. Alhussayni, “Sentiment classification of user’s reviews on drugs based on global vectors for word representation and bidirectional long short-term memory recurrent neural network,” Indones. J. Electr. Eng. Comput. Sci., vol. 23, no. 1, pp. 345–353, 2021, doi: 10.11591/ijeecs.v23.i1.pp345-353.
[12] L. Geni, E. Yulianti, and D. I. Sensuse, “Sentiment Analysis of Tweets Before the 2024 Elections in Indonesia Using IndoBERT Language Models,” J. Ilm. Tek. Elektro Komput. dan Inform., vol. 9, no. 3, pp. 746–757, 2023, doi: 10.26555/jiteki.v9i3.26490.
[13] D. R. Alghifari, M. Edi, and L. Firmansyah, “Implementasi Bidirectional LSTM untuk Analisis Sentimen Terhadap Layanan Grab Indonesia,” J. Manaj. Inform., vol. 12, no. 2, pp. 89–99, 2022, doi: 10.34010/jamika.v12i2.7764.
[14] G. Airlangga, “Advancing fake news detection: a comparative study of RNN, LSTM, and Bidirectional LSTM Architectures,” vol. 16, no. 1, pp. 13–23, 2024.
[15] S. Agustian et al., “New Directions in Text Classification Research: Maximizing The Performance of Sentiment Classification from Limited Data Arah Baru Penelitian Klasifikasi Teks: Memaksimalkan Kinerja Klasifikasi Sentimen dari Data Terbatas,” Malcom, pp. 1–10, 2024, [Online]. Available: https://github.com/s4gustian/Small_DataSet_Sentiment_Classification.
[16] M. Ihsan, Benny Sukma Negara, and Surya Agustian, “LSTM (Long Short Term Memory) for Sentiment COVID-19 Vaccine Classification on Twitter,” Digit. Zo. J. Teknol. Inf. dan Komun., vol. 13, no. 1, pp. 79–89, 2022, doi: 10.31849/digitalzone.v13i1.9950.
[17] I. M. S. Putra, Putu Jhonarendra, and Ni Kadek Dwi Rusjayanthi, “Deteksi Kesamaan Teks Jawaban pada Sistem Test Essay Online dengan Pendekatan Neural Network,” J. RESTI (Rekayasa Sist. dan Teknol. Informasi), vol. 5, no. 6, pp. 1070–1082, 2021, doi: 10.29207/resti.v5i6.3544.
[18] D. Ramadhansyah, A. Asrofiq, and Y. Yunefri, “Analisis Sentimen Ulasan penumpang maskapai penerbangan di Indonesia… ZONAsi,” J. Sist. Inf., vol. 6, no. 2, pp. 287–297, 2024.
[19] J. Pranata, S. Agustian, and E. Haerani, “Penggunaan Model Bahasa indoBERT pada Metode Random Forest Untuk Klasifikasi Sentimen Dengan Dataset Terbatas,” vol. 6, no. 3, pp. 1668–1676, 2024, doi: 10.47065/bits.v6i3.6335.

Downloads

Published

2025-01-03

How to Cite

[1]
“KLASIFIKASI SENTIMEN MENGGUNAKAN BIDIRECTIONAL LSTM DAN INDOBERT DENGAN DATASET TERBATAS”, zn, vol. 7, no. 1, pp. 74–84, Jan. 2025, doi: 10.31849/zn.v7i1.25091.

Most read articles by the same author(s)