Text Classification With Naïve Bayes

Authors

  • Epri Wahyudi Informatika

Keywords:

Naïve Bayes Classifer, klasifikasi, pemrograman java, confusion matrix.

Abstract

Pengaruh gaya hidup masyarakat era modern dalam mengakses informasi lebih banyak dilakukan membaca secara online daripada membaca di media cetak. Akibatnya, setiap hari jumlah dokumen teks khususnya dokumen berita online di internet semakin meningkat dan sulit dalam memperoleh informasi berita yang diinginkan dengan cepat. sehingga diperlukan sebuah teknik pengelompokkan dokumen yang dapat mengelompokkan dokumen berita ke dalam kategori yang telah ditentukan. Teknik ini adalah klasifikasi dokumen. Salah satu metode klasifikasi yang baik dan populer adalah naïve bayes atau lebih dikenal naïve bayes classifer (NBC). Metode probabilistik  naïve bayes classifer memiliki kelebihan keserhanaan dalam komputasinya. Penelitian ini mengkaji kinerja NBC untuk kategorisasi teks dokumen berita berbahasa Indonesia. Penelitian ini menggunakan data sebanyak  270 set data. Hasil penelitian yang dihitung menggunakan tabel matriks confusion (confusion matrix) menunjukkan tingkat akurasi maksimal dicapai 97%. Menggunakan pemrograman Java, program klasifikasi dengan Naïve Bayes Classifer berhasil membuktikan bahwa algoritma ini mampu mengelompokkan dokumen ke dalam kategori yang telah ditentukan.

References

Agustina, I., & Isnaini, F. (2020). Sistem Perhitungan dan Pelaporan Pajak Penghasilan Pasal 21 pada Universitas XYZ. Jurnal Ilmiah Infrastruktur Teknologi Informasi (JIITI), 1(2), 24–29.

Ahluwalia, L. (2020). EMPOWERMENT LEADERSHIP AND PERFORMANCE: ANTECEDENTS. Angewandte Chemie International Edition, 6(11), 951–952., 7(1), 283. http://www.nostarch.com/javascriptforkids%0Ahttp://www.investopedia.com/terms/i/in_specie.asp%0Ahttp://dspace.ucuenca.edu.ec/bitstream/123456789/35612/1/Trabajo de Titulacion.pdf%0Ahttps://educacion.gob.ec/wp-content/uploads/downloads/2019/01/GUIA-METODOL

Aldino, A. A., Darwis, D., Prastowo, A. T., & Sujana, C. (2021). Implementation of K-Means Algorithm for Clustering Corn Planting Feasibility Area in South Lampung Regency. Journal of Physics: Conference Series, 1751(1). https://doi.org/10.1088/1742-6596/1751/1/012038

Alim, S., Lestari, P. P., & Rusliyawati, R. (2020). Sistem Pakar Diagnosa Penyakit Tanaman Kakao Menggunakan Metode Certainty Factor Pada Kelompok Tani Pt Olam Indonesia (Cocoa) Cabang Lampung. Jurnal Data Mining Dan Sistem Informasi, 1(1), 26–31.

Alita, D. (2021). Multiclass SVM Algorithm for Sarcasm Text in Twitter. JATISI (Jurnal Teknik Informatika Dan Sistem Informasi), 8(1), 118–128. https://doi.org/10.35957/jatisi.v8i1.646

Alita, D., Sari, I., Isnain, A. R., & Styawati, S. (2021). Penerapan Naïve Bayes Classifier Untuk Pendukung Keputusan Penerima Beasiswa. Jurnal Data Mining Dan Sistem Informasi, 2(1), 17–23.

Anestiviya, V., Ferico, A., & Pasaribu, O. (2021). Analisis Pola Menggunakan Metode C4.5 Untuk Peminatan Jurusan Siswa Berdasarkan Kurikulum (Studi Kasus : Sman 1 Natar). Jurnal Teknologi Dan Sistem Informasi (JTSI), 2(1), 80–85. http://jim.teknokrat.ac.id/index.php/JTSI

Ardian, A., & Fernando, Y. (2020). Sistem Imformasi Manajemen Lelang Kendaraan Berbasis Mobile (Studi Kasus Mandiri Tunas Finance). Jurnal Teknologi Dan Sistem Informasi, 1(2), 10–16.

Ariyanti, D., & Iswardani, K. (2020). Teks Mining untuk Klasifikasi Keluhan Masyarakat Pada Pemkot Probolinggo Menggunakan Algoritma Naïve Bayes. Jurnal IKRA-ITH Informatika, 4(3), 125–132.

Bhara, A. M., & Syahida, A. R. (2019). Pengaruh Iklan “Shopee Blackpink Sebagai Brand Ambassador” Terhadap Minat Belanja Online Mahasiswa. Jurnal Ilmu Sosial Dan Ilmu Politik, 8(4), 288–296. https://publikasi.unitri.ac.id/index.php/fisip/article/view/1962

Damayanti, D., Sulistiani, H., & Umpu, E. (2021). Analisis dan Perancangan Sistem Informasi Akuntansi Pengelolaan Tabungan Siswa pada SD Ar-Raudah Bandarlampung. Jurnal Teknologi Dan Informasi, 11(1), 40–50.

Febriza, M. A., & Adrian, Q. J. (2021). PENERAPAN AR DALAM MEDIA PEMBELAJARAN KLASIFIKASI BAKTERI. Jurnal BIOEDUIN: Program Studi Pendidikan Biologi, 11(1), 10–18.

Febriza, M. A., Adrian, Q. J., & Sucipto, A. (2021). Penerapan AR dalam Media Pembelajaran Klasifikasi Bakteri. Jurnal Program Studi Pendidikan Biologi, 11(1), 11.

Fikri, M. I., Sabrila, T. S., & Azhar, Y. (2020). Perbandingan Metode Naïve Bayes dan Support Vector Machine pada Analisis Sentimen Twitter. Smatika Jurnal, 10(02), 71–76. https://doi.org/10.32664/smatika.v10i02.455

Gandhi, B. S., Megawaty, D. A., & Alita, D. (2021). Aplikasi Monitoring Dan Penentuan Peringkat Kelas Menggunakan Naïve Bayes Classifier. Jurnal Informatika Dan Rekayasa Perangkat Lunak, 2(1), 54–63.

Giovani, A. P., Ardiansyah, A., Haryanti, T., Kurniawati, L., & Gata, W. (2020). Analisis Sentimen Aplikasi Ruang Guru Di Twitter Menggunakan Algoritma Klasifikasi. Jurnal Teknoinfo, 14(2), 115. https://doi.org/10.33365/jti.v14i2.679

Gunawan D. (2020). Komparasi Algoritma Support Vector Machine Dan Naïve Bayes Dengan Algoritma Genetika Pada Analisis Sentimen Calon Gubernur Jabar 2018-2023. V(1), 135–138. https://doi.org/10.31294/jtk.v4i2

Gunawan, I., & Fernando, Y. (2021). SISTEM PAKAR DIAGNOSA PENYAKIT KULIT PADA KUCING MENGGUNAKAN METODE NAIVE BAYES BERBASIS WEB. Jurnal Informatika Dan Rekayasa Perangkat Lunak, 2(2).

Hendrastuty, N., Rahman Isnain, A., & Yanti Rahmadhani, A. (2021). Analisis Sentimen Masyarakat Terhadap Program Kartu Prakerja Pada Twitter Dengan Metode Support Vector Machine. 6(3), 150–155. http://situs.com

Isnain, A. R., Sakti, A. I., Alita, D., & Marga, N. S. (2021). SENTIMEN ANALISIS PUBLIK TERHADAP KEBIJAKAN LOCKDOWN PEMERINTAH JAKARTA MENGGUNAKAN ALGORITMA SVM. Jurnal Data Mining Dan Sistem Informasi, 2(1), 31–37.

Mittal, A., & Patidar, S. (2019). Sentiment analysis on twitter data: A survey. ACM International Conference Proceeding Series, 91–95. https://doi.org/10.1145/3348445.3348466

Nabila, Z., Isnain, A. R., & Permata, P. (2021). Mining Data Analysis for Clustering of Covid-19 Case in Lampung Province Using K-Means Algorithm. The 1st International Conference on Advanced Information Technology and Communication (IC-AITC).

Nabila, Z., Isnain, A. R., Permata, P., & Abidin, Z. (2021). ANALISIS DATA MINING UNTUK CLUSTERING KASUS COVID-19 DI PROVINSI LAMPUNG DENGAN ALGORITMA K-MEANS. Jurnal Teknologi Dan Sistem Informasi, 2(2), 100–108.

Nabila, Z., Rahman Isnain, A., & Abidin, Z. (2021). Analisis Data Mining Untuk Clustering Kasus Covid-19 Di Provinsi Lampung Dengan Algoritma K-Means. Jurnal Teknologi Dan Sistem Informasi (JTSI), 2(2), 100. http://jim.teknokrat.ac.id/index.php/JTSI

Neneng, N., Puspaningrum, A. S., & Aldino, A. A. (2021). Perbandingan Hasil Klasifikasi Jenis Daging Menggunakan Ekstraksi Ciri Tekstur Gray Level Co-occurrence Matrices (GLCM) Dan Local Binary Pattern (LBP). SMATIKA JURNAL, 11(01), 48–52.

Neneng, N., Putri, N. U., & Susanto, E. R. (2021). Klasifikasi Jenis Kayu Menggunakan Support Vector Machine Berdasarkan Ciri Tekstur Local Binary Pattern. CYBERNETICS, 4(02), 93–100.

Nurdin, A., Aji, B. A. S., Bustamin, A., & Abidin, Z. (2020). PERBANDINGAN KINERJA WORD EMBEDDING WORD2VEC, GLOVE, DAN FASTTEXT PADA KLASIFIKASI TEKS. Jurnal Tekno Kompak, 14(2), 74–79.

Nurkholis, A., & Susanto, T. (2020). Rancangan Media Pembelajaran Hewan Purbakala Menggunakan Augmented Reality. Jurnal RESTI (Rekayasa Sistem Dan Teknologi Informasi), 4(5), 978–987.

Primadewi, A. (2021). Model Machine Learning untuk Klasifikasi Mutu Telur Ayam Ras Berdasarkan Kebersihan Kerabang. 8(6), 386–391. https://doi.org/10.30865/jurikom.v8i6.3574

Putri, S. eka Y. (2020). Penerapan Model Naive Bayes Untuk Memprediksi Potensi Pendaftaran Siswa Di Smk Taman Siswa Teluk Betung Berbasis Web. Jurnal Informatika Dan Rekayasa Perangkat Lunak, 1(1), 93–99. https://doi.org/10.33365/jatika.v1i1.228

Rahmanto, Y. (2021). RANCANG BANGUN SISTEM INFORMASI MANAJEMEN KOPERASI MENGGUNAKAN METODE WEB ENGINEERING (Studi Kasus: Primkop Kartika Gatam). Jurnal Data Mining Dan Sistem Informasi, 2(1), 24–30.

Rahmawati, D., & Nani, D. A. (2021). PENGARUH PROFITABILITAS, UKURAN PERUSAHAAN, DAN TINGKAT HUTANG TERHADAP TAX AVOIDANCE. Jurnal Akuntansi Dan Keuangan, 26(1), 1–11. https://doi.org/10.23960/jak.v26i1.246

Ramadhanu, P. B., & Priandika, A. T. (2021a). Rancang Bangun Web Service Api Aplikasi Sentralisasi Produk Umkm Pada Uptd Plut Kumkm Provinsi Lampung. Jurnal Teknologi Dan Sistem Informasi (JTSI), 2(1), 59–64. http://jim.teknokrat.ac.id/index.php/JTSI

Ramadhanu, P. B., & Priandika, A. T. (2021b). RANCANG BANGUN WEB SERVICE API APLIKASI SENTRALISASI PRODUK UMKM PADA UPTD PLUT KUMKM PROVINSI LAMPUNG. Jurnal Teknologi Dan Sistem Informasi, 2(1), 59–64.

Ramadona, S., Diono, M., Susantok, M., & Ahdan, S. (2021). Indoor location tracking pegawai berbasis Android menggunakan algoritma k-nearest neighbor. JITEL (Jurnal Ilmiah Telekomunikasi, Elektronika, Dan Listrik Tenaga), 1(1), 51–58. https://doi.org/10.35313/jitel.v1.i1.2021.51-58

Rani, L. N. (2016). Klasifikasi Nasabah Menggunakan Algoritma C4.5 Sebagai Dasar Pemberian Kredit. INOVTEK Polbeng - Seri Informatika, 1(2), 126. https://doi.org/10.35314/isi.v1i2.131

Rauf, A., & Prastowo, A. T. (2021). Rancang Bangun Aplikasi Berbasis Web Sistem Informasi Repository Laporan Pkl Siswa (Studi Kasus Smk N 1 Terbanggi Besar). Jurnal Teknologi Dan Sistem Informasi (JTSI), 2(3), 26. http://jim.teknokrat.ac.id/index.php/JTSI

Reza, F., & Putra, A. D. (2021). Sistem Informasi E-Smile (Elektronic Service Mobile)(Studi Kasus: Dinas Kependudukan dan Pencatatan Sipil Kabupaten Tulang Bawang). Jurnal Teknologi Dan Sistem Informasi, 2(3), 56–65. http://jim.teknokrat.ac.id/index.php/sisteminformasi/article/view/909

Rusliyawati, R., Putri, T. M., & Darwis, D. (2021). Penerapan Metode Garis Lurus Dalam Sistem Informasi Akuntansi Perhitungan Penyusutan Aktiva Tetap Pada Po Puspa Jaya. Jurnal Ilmiah Sistem Informasi Akuntansi, 1(1), 1–13. http://jim.teknokrat.ac.id/index.php/jimasia/article/view/864

Sarasvananda, I. B. G., Anwar, C., Pasha, D., & Styawati, S. (2021). ANALISIS SURVEI KEPUASAN MASYARAKAT MENGGUNKAN PENDEKATAN E-CRM (Studi Kasus: BP3TKI Lampung). Jurnal Data Mining Dan Sistem Informasi, 2(1), 1–9.

Sari, I. P., Kartina, A. H., Pratiwi, A. M., Oktariana, F., Nasrulloh, M. F., & Zain, S. A. (2020). Implementasi Metode Pendekatan Design Thinking dalam Pembuatan Aplikasi Happy Class Di Kampus UPI Cibiru. Edsence: Jurnal Pendidikan Multimedia, 2(1), 45–55. https://doi.org/10.17509/edsence.v2i1.25131

Setiawan, R., Parlika, R., & Mumpuni, R. (2020). Rancang Bangun Bot Auto Trade Cryptocurrency Berbasis Web. Jurnal Informatika Dan Sistem Informasi (JIFoSI), 1(2), 294–301.

Styawati, Andi Nurkholis, Zaenal Abidin, & Heni Sulistiani. (2021). Optimasi Parameter Support Vector Machine Berbasis Algoritma Firefly Pada Data Opini Film. Jurnal RESTI (Rekayasa Sistem Dan Teknologi Informasi), 5(5), 904–910. https://doi.org/10.29207/resti.v5i5.3380

Styawati, S., Yulita, W., & Sarasvananda, S. (2020). SURVEY UKURAN KESAMAAN SEMANTIC ANTAR KATA. Jurnal Data Mining Dan Sistem Informasi, 1(1), 32–37.

Suaidah, S. (2021). Analisis Penerimaan Aplikasi Web Engineering Pelayanan Pengaduan Masyarakat Menggunakan Technology Acceptance Model. JATISI (Jurnal Teknik Informatika Dan Sistem Informasi), 8(1), 299–311. https://doi.org/10.35957/jatisi.v8i1.600

Sulistiani, H., Muludi, K., & Syarif, A. (2019). Implementation of Dynamic Mutual Information and Support Vector Machine for Customer Loyalty Classification. Journal of Physics: Conference Series, 1338(1). https://doi.org/10.1088/1742-6596/1338/1/012050

Suryani, A. D., & Ardian, Q. J. (2020). Rancang Bangun Identifikasi Kebutuhan Kalori Dengan Aplikasi Go Healthy Life. Jurnal Teknologi Dan Sistem Informasi, 1(1), 47–56.

Wibisono, A. D., Rizkiono, S. D., & Wantoro, A. (2020). Filtering Spam Email Menggunakan Metode Naive Bayes. Telefortech: Journal Of Telematics And Information Technology, 1(1), 9–17.

Windane, W. W., & Lathifah, L. (2021). E-Commerce Toko Fisago.Co Berbasis Android. Jurnal Informatika Dan Rekayasa Perangkat Lunak, 2(3), 285–303. https://doi.org/10.33365/jatika.v2i3.1139

Yuliana, Y., Paradise, P., & Kusrini, K. (2021). Sistem Pakar Diagnosa Penyakit Ispa Menggunakan Metode Naive Bayes Classifier Berbasis Web. CSRID (Computer Science Research and Its Development Journal), 10(3), 127. https://doi.org/10.22303/csrid.10.3.2018.127-138

Downloads

Published

2022-04-16