Implementasi Metode Naïve Bayes dengan Random Oversampling pada Klasifikasi Keluarga Berisiko Stunting
DOI:
https://doi.org/10.59632/leibniz.v5i02.610Keywords:
Stunting, Naïve Bayes, Random Oversampling, KlasifikasiAbstract
Stunting masih menjadi salah satu masalah kesehatan serius yang memiliki dampak jangka panjang terhadap tumbuh kembang dan kognitif anak. Keluarga memiliki peran penting dalam mencegah terjadinya stunting, sehingga identifikasi dini keluarga yang berisiko melahirkan anak stunting menjadi langkah awal dalam upaya pencegahan. Penelitian ini bertujuan untuk mengklasifikasikan keluarga berisiko stunting menggunakan metode Naïve Bayes serta mengevaluasi pengaruh teknik Random Oversampling (ROS) terhadap performa model pada data tidak seimbang. Data pada penelitian ini terdiri dari 7 variabel independen dan 1 variabel dependen yang bersumber dari Perwakilan Badan Kependudukan dan Keluarga Berencana Nasional (BKKBN) Sumatera Barat. Hasil evaluasi menunjukkan bahwa model Naïve Bayes memiliki akurasi sebesar 92,46% dan sensitivitas 100% serta spesifisitas 69,14% yang menunjukkan kelemahan dalam mengidentifikasi keluarga berisiko. Metode ROS-Naïve Bayes menunjukkan peningkatan performa model dimana diperoleh akurasi sebesar 99,87%, sensitivitas 99,83%, dan spesifisitas 100%. Hal ini menunjukkan bahwa implementasi Naïve Bayes dengan ROS efektif dalam mengatasi ketidakseimbangan data dan meningkatkan performa model. Faktor utama yang memengaruhi risiko stunting meliputi keikutsertaan KB modern, sanitasi, usia ibu dan jumlah anak.
Downloads
References
Afrianti, E., Fthoni, & Heroza, R. I. (2020). Text classification with Naïve Bayes Classifier (NBC) for grouping report description and recovery time duration of PT.PLN (persero) WS2JB palembang area. E-Journal, 12(1), 1955–1961.
Apriluana, G., & Fikawati, S. (2018). Analisis faktor-faktor risiko terhadap kejadian stunting pada balita. Jurnal Departemen Gizi Fakultas Kesehatan Masarakat, 28(4), 247–256. https://doi.org/10.22435/mpk.v28i4.472.
Badan Kependudukan dan Keluarga Berencana Nasional (BKKBN). (n.d.). Satuan tugas percepatan penurunan stunting. Diakses 22 Mei 2025, dari https://satgasstunting.info/web/index.php
Burnaev, E., Erofeev, P., & Papanov, A. (2015). Influence of resampling on accuracy of imbalanced classification. Eighth International Conference on Machine Vision (ICMV 2015), 9875(987521), 1–5. https://doi.org/10.1117/12.2228523.
Demir, S., & Şahin, E. K. (2022). Evaluation of oversampling methods (OVER, SMOTE, and ROSE) in classifying soil liquefaction dataset based on SVM, RF, and Naïve Bayes. European Journal of Science and Technology, 34, 142–147. https://doi.org/10.31590/ejosat.1077867.
Fernández, A., García, S., Galar, M., Prati, R. C., Krawczyk, B., & Herrera, F. (2018). Learning from imbalanced data sets. Switzerland: Springer Nature.
Fitriani, R. D., Yasin, H., & Tarno, T. (2021). Penanganan klasifikasi kelas data tidak seimbang dengan Random Oversampling Pada Naive Bayes (Studi Kasus: Status Peserta KB IUD di Kabupaten Kendal). Jurnal Gaussian, 10(1), 11–20. https://doi.org/10.14710/j.gauss.v10i1.30243.
Gorunescu, F. (2011). Data mining concepts, models and technique. In Springer (Vol. 12). Berlin, Germany: Springer-Verlag.
Han, J., Kamber, M., & Pei, J. (2012). Data mining: concepts and techniques (Third). USA: Elsevier Inc.
He, H., & Garcia, E. A. (2009). Learning from imbalanced data. IEEE Transactions on Knowledge and Data Engineering, 21(9), 1263–1284. https://doi.org/10.1109/TKDE.2008.239.
Id, I. D. (2021). Machine Learning: teori, sudi kasus dan implementasi menggunakan python (1st ed.). Riau: UR PRESS.
Lemaking, V. B., Manimalai, M., & Djogo, H. M. A. (2022). Hubungan pekerjaan ayah, pendidikan ibu, pola asuh, dan jumlah anggota keluarga dengan kejadian stunting pada balita di Kecamatan Kupang Tengah, Kabupaten Kupang. Ilmu Gizi Indonesia, 5(2), 123–132. https://doi.org/10.35842/ilgi.v5i2.254.
Nisa, W. K., & Azinar, M. (2024). Karakteristik keluarga berisiko stunting pada anak usia 7-24 bulan di wilayah kerja Puskesmas Bandarharjo dengan pendekatan case control. Kritis, 33(1), 17–36. https://doi.org/10.24246/kritis.v33i1p17-36.
Pang, Y., Chen, Z., Peng, L., Ma, K., Zhao, C., & Ji, K. (2019). A signature-based assistant random oversampling method for malware detection. Proceedings 2019 18th IEEE International Conference on Trust, Security and Privacy in Computing and Communications/13th IEEE International Conference on Big Data Science and Engineering, TrustCom/BigDataSE 2019, 256–263. https://doi.org/10.1109/TrustCom/BigDataSE.2019.00042
Peling, I. B. A., Arnawan, I. N., Arthawan, I. P. A., & Janardana, I. G. N. (2017). Implementation of data mining to predict period of students study using naive bayes algorithm. International Journal of Engineering and Emerging Technology, 2(1), 53–57. https://doi.org/10.18201/ijisae.2019252786.
Sir, Y. A., & Soepranoto, A. H. H. (2022). Pendekatan resampling data untuk menangani masalah ketidakseimbangan kelas. Jurnal Komputer Dan Informatika, 10(1), 31–38. https://doi.org/10.35508/jicon.v10i1.6554.
Suarnianti. (2020). Faktor risiko stunting : Literatur Review. Jurnal Ilmiah Kesehatan, 15(2), 144–147.
Susanti, R. (2023). Analisis faktor maternal terhadap keluarga berisiko stunting sebagai upaya peningkatan analisis data di BKKBN Kalimantan Timur. Jurnal Nasional Pengabdian Masyarakat, 4(1), 7–17. https://doi.org/10.47747/jnpm.v4i1.1089.
Tan, P.-N., Steinbach, M., & Kumar, V. (2014). Introduction to data mining. USA: Pearson.
Yunita, A., Asra, R. H., Nopitasari, W., Putri, R. H., & Fevria, R. (2022). Hubungan sosial ekonomi dengan kejadian stunting pada balita. Semnas Bio 2022, 812–819. https://doi.org/10.24036/prosemnasbio/vol2/519.
Downloads
Published
Issue
Section
License
Copyright (c) 2025 Yeni Suliswati, Tessy Octavia Mukhti, Syafriandi, Admi Salma

This work is licensed under a Creative Commons Attribution 4.0 International License.













