MODEL RETRIEVAL BERBASIS NATURAL LANGUAGE PROCESSING UNTUK REKOMENDASI OTOMATIS ICD-10 DAN ICD-9 PADA SISTEM KLAIM RUMAH SAKIT

Authors

  • D Mastiin T Saputra Universitas Islam Nusantara
  • Galih Galih Universitas Islam Nusantara

DOI:

https://doi.org/10.31849/grjvmm06

Keywords:

Natural Language Processing, Otomatisasi, ICD 10, ICD 9, INA-CBG, Sentence Embeddings, Cosine Similarty, Rekam Medis, Validasi Temporal, Multi Label Data

Abstract

Sejak penerapan Jaminan Kesehatan Nasional, pengkodean diagnosis dan prosedur menjadi komponen penting dalam penentuan tarif INA-CBG pada proses klaim rumah sakit. Namun praktik pengkodean manual sering menimbulkan jeda waktu, ketidakkonsistenan antarpetugas, serta potensi keterlambatan pengajuan klaim ke BPJS Kesehatan. Penelitian ini bertujuan mengembangkan model ringan berbasis Natural Language Processing (NLP) untuk menghasilkan rekomendasi otomatis kode ICD-10 dan ICD-9 dari teks diagnosis dokter dengan kebutuhan komputasi minimal. Metode yang digunakan meliputi normalisasi teks medis, pembentukan sentence embeddings menggunakan model Sentence Transformer, serta perhitungan kemiripan berbasis cosine similarity dalam skema retrieval multi-label. Dataset berasal dari hasil kodifikasi Rumah Sakit Khusus Ibu dan Anak Harapan Bunda Bandung periode Oktober 2024 hingga November 2025, dengan evaluasi dilakukan menggunakan pendekatan temporal hold-out pada data Desember 2025 dan Januari 2026. Hasil evaluasi menunjukkan performa stabil dengan nilai Hit-3 sebesar 80,7% pada Desember 2025 dan 77,5% pada Januari 2026. Nilai Recall-3 sebesar 70% pada Desember 2025 dan 68% pada Januari 2026, sementara Mean Reciprocal Rank (MRR) berada di atas 0,4, menunjukkan bahwa kode relevan umumnya muncul pada peringkat awal rekomendasi, analisis per unit layanan menunjukkan bahwa performa model lebih optimal pada kasus rawat inap dibandingkan rawat jalan, mengindikasikan bahwa karakteristik teks diagnosis dan kompleksitas kasus pada rawat inap lebih sesuai dengan pendekatan semantic retrieval yang digunakan. Temuan ini mengindikasikan bahwa pendekatan retrieval berbasis NLP mampu memberikan rekomendasi kode ICD secara cepat dan konsisten, serta berpotensi mendukung percepatan proses pengkodean dan meminimalkan risiko keterlambatan klaim layanan Kesehatan

References

1. Agus Teguh Riadi, F. I. (2025). Cross-Temporal Generalization of IndoBERT for Indonesian Hoax News Classification. Jurnal Teknik Informatika (JUTIF) Vol. 6, No. 5, October 2025, 5291-5304.

2. Belni Puspilasari, S. J. (2022). Analisis Perbedaan Kode Diagnosis ICD-10 Antara Rumah Sakit Dengan Verifikator Bpjs Kesehatan. Jurnal Keperawatan Priority, Vol 5, No 2, Juli 2022, 25-36.

3. Chraibi, A., Delerue, David, Taillard, Julien, Draa, Ismat Chaib, Beuscart, Régis, & Hansske, Arnaud. (2021, 7). A deep learning framework for automated ICD-10 coding. Public Health and Informatics: Proceedings of MIE 2021, 347-351. doi:10.3233/SHTI210178

4. Kemenkes. (2021). Pedoman Indonesia Case Base Groups (INA-CBG). Peraturan Menteri Kesehatan Republik Indonesia Nomor 26 Tahun 2021, 1-65.

5. Laksono, A. S. (2025). Studi Eksplorasi Metode Pengenalan Emosi Untuk Deteksi Multi-Emosi Dalam Entri Jurnal. Skripsi Program Studi Informatika Fakultas Teknologi Industri Universitas Islam Indonesia.

6. Maisharoh, D. S. (2025). Pembangunan Ulang Aplikasi Kecerdasan Buatan (Ai) Untuk Diagnosis, Kodifikasi, Dan Tindakan Kasus Kebidanan Di Rumah Sakit. Journal of Information Technology and Computer Science (INTECOMS )Volume 8 Nomor 6, 1767 - 1774.

7. Masud, J. H. (2023, 7 1). Applying Deep Learning Model to Predict Diagnosis Code of Medical Records. (S. Antani, Ed.) Diagnostics, 13. doi:10.3390/diagnostics13132297

8. Muhammad Abdul Hafizh Fathuddin, E. P. (2025). Penerapan Sentence-Bert dan Cosine Similarity untuk Pencarian Semantik Dokumen Skripsi dalam Format PDF. Ranah Research Vol. 8, No. 1 (2025) , 322 -337.

9. Muhammad Andika Fadilla, M. F. (2024). Pengembangan Sistem Klasifikasi Diagnosa Medis Menggunakan Progressive Web Application Terintegrasi Machine Learning. Jurnal Syntax Admiration 5356 Vol. 5, No. 12, 5488 - 5503.

10. Mulyana, S. (2021). Input Text Processing Using NLP In Case Based Reasoning To Help Diagnose Types Of Schizophrenic Disorder And Their Management. Disertation Doctoral Faculty of Mathematics and Natural Sciences Universitas Gadjah Mada.

11. Parjono, & Sri Kusumadewi. (2023, 9 16). Pemodelan Text Mining dalam Pengkodean Penyakit Pasien Berdasar Kode ICD 10. Jurnal Nasional Teknologi dan Sistem Informasi, 9, 200-207. doi:10.25077/teknosi.v9i2.2023.200-207

12. Priwibowo, A. (2025). Pembuatan Model Klasifikasi Teks Dengan BERT dan GRU untuk Pengkodean ICD-10 Diagnosis Utama Penyakit pada Proses Klaim BPJS di RSUP Persahabatan. Tesis Magister Komputer Konsentrasi Sains Data Fakultas Teknologi Industri Universitas Islam Indonesia.

13. Xin Zhang, Y. Z. (2024). mGTE:Generalized Long-Context Text Representation and Reranking Models for Multilingual Text Retrieval. arXiv:2407.19669v1 29 Jul 2024, 1-20.

Downloads

Published

2026-05-30

How to Cite

[1]
“MODEL RETRIEVAL BERBASIS NATURAL LANGUAGE PROCESSING UNTUK REKOMENDASI OTOMATIS ICD-10 DAN ICD-9 PADA SISTEM KLAIM RUMAH SAKIT”, zn, vol. 8, no. 2, pp. 747–758, May 2026, doi: 10.31849/grjvmm06.