Bulletin Ilmiah: Klasifikasi Teks dengan Metode Naive Bayes dan Laplace

Authors

  • Muhammad Fajrin Universitas Pamulang

Abstract

Metode klasifikasi teks menjadi semakin penting dalam era informasi digital. Dalam studi ini, kami menginvestigasi penerapan metode Naive Bayes dan Laplace Smoothing untuk mengklasifikasikan dokumen teks ke dalam kategori tertentu. Naive Bayes adalah pendekatan probabilitas yang berguna dalam klasifikasi dokumen, sementara Laplace Smoothing digunakan untuk mengatasi masalah kata-kata yang tidak ada dalam data pelatihan. Kami mempresentasikan beberapa studi kasus yang menggambarkan implementasi dan evaluasi metode ini.


Pendahuluan:
Klasifikasi teks adalah tugas penting dalam pemrosesan bahasa alami dan analisis teks. Tujuan utama adalah untuk mengelompokkan dokumen atau teks ke dalam kategori yang sesuai, seperti spam atau bukan spam, positif atau negatif, dan sebagainya. Metode Naive Bayes adalah salah satu metode yang umum digunakan dalam klasifikasi teks, yang memanfaatkan teori probabilitas.
Metode:
Dalam studi kasus ini, kami menggunakan metode Naive Bayes untuk mengklasifikasikan ulasan produk sebagai positif atau negatif. Kemudian, kami menerapkan Laplace Smoothing untuk mengatasi kata-kata yang tidak ada dalam data pelatihan. Ini membantu meningkatkan akurasi model klasifikasi.
Implementasi:
Pengumpulan Data: Kami mengumpulkan kumpulan ulasan pelanggan tentang produk dari berbagai sumber.
Pra-pemrosesan Data: Data ulasan dibereskan, seperti penghilangan tanda baca, pengubahan teks menjadi huruf kecil, dan tokenisasi.
Klasifikasi: Kami melatih model Naive Bayes dengan data pelatihan dan kemudian mengklasifikasikan ulasan pelanggan sebagai positif atau negatif.
Laplace Smoothing: Kami menerapkan Laplace Smoothing untuk mengatasi masalah kata-kata yang tidak ada dalam data pelatihan.
Hasil dan Evaluasi:
Kami melakukan evaluasi kinerja model menggunakan metrik seperti akurasi, presisi, recall, dan F1-Score. Hasil menunjukkan bahwa penerapan Laplace Smoothing meningkatkan kemampuan model dalam mengklasifikasikan ulasan, terutama untuk kata-kata yang jarang muncul dalam data pelatihan.


Kesimpulan:
Studi kasus ini menggambarkan penerapan metode Naive Bayes dan Laplace Smoothing dalam klasifikasi teks. Hasilnya menunjukkan bahwa metode ini efektif dalam mengklasifikasikan ulasan pelanggan sebagai positif atau negatif. Penerapan Laplace Smoothing membantu mengatasi masalah kata-kata yang tidak ada dalam data pelatihan. Penggunaan metode ini dapat memiliki aplikasi yang luas dalam analisis sentimen, deteksi spam, dan banyak domain lainnya.

References

Datasans. Naive Bayes: Pengklasifikasian Pesan Spam Konsep 5 Menit. https://datasans.medium.com/naive-bayes-pengklasifikasian-pesan-spam-konsep-5-menit-cb4f5afac069

Diyah Utami, Putri Aisyiyah Rakhma Devi. Klasifikasi Kelayakan Penerima Bantuan Program Keluarga Harapan (PKH) Menggunakan Metode Weighted Naïve Bayes dengan Laplace Smoothing. https://core.ac.uk/download/pdf/544186584.pdf

Analisis Penyaringan Email Spam Menggunakan Metode Naive Bayes. https://core.ac.uk/download/pdf/235044654.pdf

Muhammad Fachriza. Efektifitas Algoritma Naïve Bayes dalam Mendeteksi Pesan Spam dalam Short Message Service Smartphone. http://etheses.uin-malang.ac.id/37455/2/15650050.pdf

Agoes Inarto. Modul Statistika II. https://www.academia.edu/35761265/Modul_statistika_ii

Dian Indriani. Analisis Sentimen pada Tweet dengan Tagar #KPUJanganCurang Menggunakan Metode Naïve Bayes. https://repository.uir.ac.id/3733/1/Dian%20Indriani.pdf

Published

2023-10-25

How to Cite

Muhammad Fajrin. (2023). Bulletin Ilmiah: Klasifikasi Teks dengan Metode Naive Bayes dan Laplace. BIKARMA : Buletin Ilmiah Karya Mahasiswa, 1(1). Retrieved from https://ojs.jurnalmahasiswa.com/ojs/index.php/bikarma/article/view/89