Perbandingan Boolean Model Dan Vector Space Model Dalam Pencarian Dokumen Teks

  • Susanti Susanti STMIK Amik Riau
  • Muhammad Azmi Stmik Amik Riau
  • Edwar Ali Stmik Amik Riau
  • Rahmaddeni Rahmaddeni Stmik Amik Riau
  • Yansyah Saputra Wijaya Stmik Amik Riau
Keywords: Comparison, Boolean Model, Vector Space Model, Search, Text Documents

Abstract

Perkembangan teknologi informasi di era globalisasi saat ini, membuat semua aspek kehidupan kita berubah dan tidak dapat dihindarkan dari pengaruh kemajuan zaman. Untuk mendapatkan data dan informasi yang kita inginkan bukanlah perkara mudah, mengingat sedemikian banyaknya informasi yang tersedia untuk berbagai keperluan dengan berbagai gaya penyajian. Pencarian data di komputer, baik itu secara online ataupun offline berkembang banyak metode yang semakin menyempurnakan hasil pencarian. Hal ini juga meningkatkan kepuasan pengguna dalam mencari informasi. Metode yang umum digunakan dalam melakukan pencarian adalah Boolean Model. Metode lainnya adalah Vector Space Model (VSM). VSM yaitu model yang digunakan untuk mengukur kueri antara suatu dokumen dengan suatu kata kunci. Oleh karena itu, penulis bertujuan untuk membandingkan kedua metode tersebut dari kecepatan (waktu) pencarian dan jumlah temuan. Kecepatan tersebut dihitung berdasarkan lama waktu pencarian untuk kedua metode tersebut. Hasil yang didapati adalah perbandingan waktu pencarian antara boolean model dan vector space model didapati bahwa boolean model lebih cepat dengan selisih 30 sampai 50 detik. Perbandingan untuk hasil temuan didapati bahwa vector space model mempunyai hasil temuan yang sama dengan boolean model yang menggunakan operator or, sedangkan dengan operator and dan gabungan and serta or didapati bahwa jumlah hasil temuan tidak sama dengan vector space model.

 

Kata kunci: Perbandingan, Boolean Model, Vector Space Model, Pencarian, Dokumen Teks

 

Abstract

The development of information technology in the current era of globalization, makes all aspects of our lives change and cannot be avoided from the influence of the times. To get the data and information that we want is not an easy matter, considering that so much information is available for various purposes with various styles of presentation. Searching data on a computer, be it online or offline, there are many methods that improve the search results. It also increases user satisfaction in finding information. The most commonly method of searching is the Boolean Model. Another method is the Vector Space Model (VSM). VSM is a model used to measure queries between a document and a keyword. Therefore, the authors aim to compare the two methods from the speed (time) of the search and the number of findings. The speed is calculated based on the search time for both methods. The result is that the comparison between boolean model and vector space model shows that the boolean model is faster by a difference of 30 - 50 seconds. The comparison for the foundings document text shows that vector space model has the same findings as the boolean model using the or operator, whereas with the and operator and the combination of operator and or it is found that the number of findings is not the same as vector space model.

 

Keywords: Comparison, Boolean Model, Vector Space Model, Search, Text Documents

 

 

Downloads

Download data is not yet available.

References

S. Sugiono, H. Herwin, H. Hamdani, and E. Erlin, “Aplikasi Pendeteksi Tingkat Kesamaan Dokumen Teks: Algoritma Rabin Karp Vs. Winnowing,” Digit. Zo. J. Teknol. Inf. dan Komun., vol. 9, no. 1, pp. 82–93, 2018, doi: 10.31849/digitalzone.v9i1.1242.

L. W. Pandjaitan, Dasar-dasar Komputasi Cerdas. Yogyakarta: Andi, 2007.

S. A. Zodgekar, Neural Network and Expert System: Concept and Application. Punjagutta: Icfai Books, 2008.

S. . Jain and A. . Gunawardena, Linier Algebra an Interactive Approach. California (USA): Cole-Thomson Learning, 2004.

L. Seimour and L. M. Lars, Schaum’s Outlines Teori dan Soal Aljabar Linier Edisi Ketiga. Jakarta: Erlangga, 2006.

D. Susandi and U. Sholahudin, “Pemanfaatan Vector Space Model pada Penerapan Algoritma Nazief Adriani , KNN dan Fungsi Similarity Cosine untuk Pembobotan IDF dan WIDF pada Prototipe Sistem Klasifikasi Teks Bahasa Indonesia,” J. ProTekInfo, vol. 3, no. 1, pp. 22–29, 2016.

A. Fauzi and G. Ginabila, “Information Retrieval System Pada File Pencarian Dokumen Tesis Berbasis Text Menggunakan Metode Vector Space Model,” J. Pilar Nusa Mandiri, vol. 15, no. 1, pp. 41–46, 2019, doi: 10.33480/pilar.v15i1.61.

B. Sugara, Dody, and Donny, “Sistem Temu Kembali Informasi Pada Gejala Autisme Dengan Metode Vector Space Model,” vol. 1, no. 1, pp. 19–25, 2017.

V. Basmalah Wicaksono, R. Saptono, and S. Widya Sihwi, “Analisis Perbandingan Metode Vector Space Model dan Weighted Tree Similarity dengan Cosine Similarity pada kasus Pencarian Informasi Pedoman Pengobatan Dasar di Puskesmas,” J. Teknol. Inf. ITSmart, vol. 4, no. 2, p. 73, 2016, doi: 10.20961/its.v4i2.1768.

A. - AMIK BSI Pontianak and A. H. - AMIK BSI Pontianak, “Implementasi Vector Space Model Pada Sistem Pencarian Mesin Karaoke,” Evolusi J. Sains dan Manaj., vol. 6, no. 1, pp. 1–6, 2018, doi: 10.31294/evolusi.v6i1.3535.

A. Aziz, R. Saptono, and K. P. Suryajaya, “Implementasi Vector Space Model dalam Pembangkitan Frequently Asked Questions Otomatis dan Solusi yang Relevan untuk Keluhan Pelanggan,” Sci. J. Informatics, vol. 2, no. 2, p. 111, 2016, doi: 10.15294/sji.v2i2.5076.

D. Grossman and F. Ophir, Information Retrieval: Algorithms and Heuristics Second Editon. Chicago-USA: Springer, 2004.

F. Lv, H. Zhang, J. G. Lou, S. Wang, D. Zhang, and J. Zhao, “CodeHow: Effective code search based on api understanding and extended boolean model,” Proc. - 2015 30th IEEE/ACM Int. Conf. Autom. Softw. Eng. ASE 2015, pp. 260–270, 2016, doi: 10.1109/ASE.2015.42.

T. Georgieva-Trifonova, “Text classification based on enriched vector space model,” ACM Int. Conf. Proceeding Ser., vol. Part F1320, pp. 103–110, 2017, doi: 10.1145/3134302.3134343.

B. Yulianto, W. Budiharto, and I. H. Kartowisastro, “The Performance of Boolean Retrieval and Vector Space Model in Textual Information Retrieval,” CommIT (Communication Inf. Technol. J., vol. 11, no. 1, p. 33, 2017, doi: 10.21512/commit.v11i1.2108.

F. Liantoni and A. Yusincha, “Pemodelan UML Pada Sistem Pengajuan Dana Anggaran Untuk Peningkatan Produktivitas Perusahaaan,” Digit. Zo. J. Teknol. Inf. dan Komun., vol. 9, no. 2, pp. 94–105, 2018, doi: 10.31849/digitalzone.v9i2.1763.

Published
2020-11-07
How to Cite
Susanti, S., Azmi , M., Ali, E., Rahmaddeni , R., & Saputra Wijaya , Y. (2020). Perbandingan Boolean Model Dan Vector Space Model Dalam Pencarian Dokumen Teks. Digital Zone: Jurnal Teknologi Informasi Dan Komunikasi, 11(2), 268-277. https://doi.org/10.31849/digitalzone.v11i2.4168
Abstract viewed = 1738 times
PDF downloaded = 780 times