PENERAPAN NAIVE BAYES, REGRESI LOGISTIK, RANDOM FOREST, SVM, DAN KNN UNTUK PREDIKSI DIABETES
Keywords:
Kata Kunci: Prediksi Diabetes, Regresi Logistik, Random Forest, Support Vector Machine, K-Nearest Neighbor dan Naïve Bayes.Abstract
Abstrak
Diabetes merupakan penyakit kronis yang prevalensinya terus meningkat. Oleh karena itu, prediksi dan deteksi
dini diabetes sangat penting untuk pencegahan dan pengendalian penyakit ini. Penelitian ini bertujuan untuk
membandingkan akurasi beberapa algoritma machine learning populer untuk memprediksi diabetes berdasarkan
fitur-fitur diagnosis pasien. Data 768 pasien yang terdiri dari 9 fitur diagnosis diabetes digunakan dalam penelitian.
Data dibagi menjadi data latih dan data uji dengan perbandingan 80:20. Beberapa algoritma machine learning yang
diaplikasikan meliputi Regresi Logistik (LR), Random Forest (RF), Support Vector Machine (SVM), dan KNearest Neighbor (KNN). Akurasi model dievaluasi menggunakan matriks konfusi serta metrik presisi, recall, dan
f1-score. Hasil penelitian menunjukkan bahwa Random Forest memberikan akurasi paling tinggi yaitu 81% diikuti
SVM (80%), KNN (80%), naive bayes (76%) dan LR (78%). Namun, untuk kelas minoritas (pasien diabetes) LR
dan RF menghasilkan recall lebih tinggi daripada SVM dan KNN. Dengan demikian kombinasi beberapa model
dapat meningkatkan performa klasifikasi diabetes secara keseluruhan.
Downloads
Published
Issue
Section
License
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.