Metode Decision Tree Classifier dan XGBoost Classifier Dalam Memprediksi Penyakit Jantung
Abstract
Penyakit jantung menjadi penyebab utama kematian di seluruh dunia, didorong oleh gaya hidup tidak sehat serta faktor fisiologis seperti hipertensi dan kolesterol tinggi. Deteksi dini menjadi tantangan utama, karena sering kali pasien baru menyadari keberadaan penyakit ini pada tahap lanjut. Oleh karena itu, penelitian ini bertujuan untuk mengembangkan sistem prediksi berbasis machine learning guna membantu dalam mendiagnosis penyakit jantung secara lebih akurat dan cepat. Dua algoritma, Decision Tree Classifier dan XGBoost Classifier, diterapkan dan dibandingkan efektivitasnya dalam memprediksi risiko penyakit jantung. Dataset UCI Machine Learning Repository, yang berisi 920 data observasi dengan 14 fitur, digunakan sebagai sumber data. Melalui serangkaian langkah mulai dari preprocessing, encoding, hingga teknik oversampling, dataset dipersiapkan untuk dianalisis. Data kemudian dibagi menjadi data latih dan data uji, sebelum dievaluasi dengan metrik akurasi, precision, recall, dan F1-score. Hasil penelitian menunjukkan bahwa algoritma XGBoost mencapai akurasi 93%, lebih unggul dibandingkan Decision Tree yang memperoleh akurasi 90%. Dengan demikian, XGBoost direkomendasikan sebagai alternatif yang lebih efektif untuk mendukung proses diagnosis dini yang lebih tepat dan efisien. Diharapkan bahwa hasil penelitian ini dapat berkontribusi dalam pengembangan metode deteksi dini yang lebih efektif dalam layanan kesehatan untuk mengurangi angka kematian akibat penyakit jantung.
References
[2] A. Sepharni, I. E. Hendrawan, and C. Rozikin, “Klasifikasi Penyakit Jantung dengan Menggunakan Algoritma C4.5,” STRING (Satuan Tulisan Ris. dan Inov. Teknol., vol. 7, no. 2, p. 117, 2022, doi: 10.30998/string.v7i2.12012.
[3] D. M. Al Hafiz, K. Amaly, J. Jonathan, M. T. Rachmatullah, and Rosidi, “Sistem Prediksi Penyakit Jantung Menggunakan Metode Naive Bayes,” J. Rekayasa Elektro Sriwij., vol. 2, no. 2, pp. 151–157, 2021, doi: 10.36706/jres.v2i2.29.
[4] A. Lailiyah, V. R. S. Nastiti, E. D. Wahyuni, and C. S. K. Aditya, “Klasifikasi Tingkat Kemampuan Adaptasi Siswa dalam Pembelajaran Online Menggunakan Decision Tree,” Techno.Com, vol. 23, no. 1, pp. 11–19, 2024, doi: 10.62411/tc.v23i1.9739.
[5] K. Mahasiswa, B. Putus, and S. Menggunakan, “Arus Jurnal Sains dan Teknologi ( AJST ) Klasifikasi Mahasiswa Berpotensi Putus Studi Menggunakan Algoritma Decision Tree pada Fakultas Teknik Unismuh Makassar,” vol. 2, no. 2, 2024.
[6] K. Y. Nazara, “Perancangan Smart Predictive Maintenance untuk Mesin Produksi,” Semin. Nas. Off. Stat., vol. 2022, no. 1, pp. 691–702, 2022, doi: 10.34123/semnasoffstat.v2022i1.1575.
[7] B. A. C. Permana and I. K. Dewi, “Komparasi Metode Klasifikasi Data Mining Decision Tree dan Naïve Bayes Untuk Prediksi Penyakit Diabetes,” Infotek J. Inform. dan Teknol., vol. 4, no. 1, pp. 63–69, 2021, doi: 10.29408/jit.v4i1.2994.
[8] M. I. Aziz, A. Z. Fanani, and A. Affandy, “Analisis Metode Ensemble Pada Klasifikasi Penyakit Jantung Berbasis Decision Tree,” J. Media Inform. Budidarma, vol. 7, no. 1, p. 1, 2023, doi: 10.30865/mib.v7i1.5169.
[9] M. K. Nasution, R. R. Saedudin, and V. P. Widartha, “Perbandingan Akurasi Algoritma Naïve Bayes Dan Algoritma Xgboost Pada Klasifikasi Penyakit Diabetes,” e-Proceeding Eng., vol. 8, no. 5, pp. 9765–9772, 2021.
[10] “Heart Disease,” UCI Machine Learning Repository. Accessed: Jan. 28, 2024. [Online]. Available: http://archive.ics.uci.edu/ml/datasets/Heart+Disease