PENERAPAN ALGORITMA C4.5 UNTUK KLASIFIKASI PENYAKIT DIABETES MELLITUS

Achmad Ridwan

Abstract


Abstrak—Diabetes Mellitus merupakan penyakit turunan  disebabkan oleh kadar gula tinggi dalam darah. Gula darah disimpan dan digunakan untuk energi yang dipindahkan ke sel manusia yang berasal dari darah oleh hormon insulin . ketika pasien mengalami Diabetes, insulin pada manusia tidak biasa dihasilkan secara seimbang  dan  tubuh tidak dapat menggunakan insulin tersebut secara tepat  untuk  kebutuhan badan. Diabetes Mellitus sebagai penyakit yang merupakan  termasuk deretan penyakit penyebab kematian terbesar didunia. Diabetes Mellitus dapat diklasifikasikan berdasarkan kemungkinan mengalami diabetes  dari atribut gejala yang muncul diawal fasenya. Penyakit ini bisa dideteksi kemunculannya  karena banyak atribut  gejala yang terdeteksi di awal fasenya. Dataset ketika analisis penelitian ini dilakukan merupakan data dari dataset UCI Machine Learning yaitu Early Stage Diabetes Risk pada tahun 2020 dan terdiri dari 17 attribut. Analisis penelitian ini antara lain Data Preprocessing, Modeling , dan Evaluasi. Model  klasifikasi penelitian memakai Algoritma C4.5. Hasil Klasifikasi pada riset ini didapatkan  akurasi sebesar 94.23% dan nilai AUCnya yaitu 0,952


Full Text:

PDF

References


N. D. S. Report, “National Diabetes Statistics Report, 2020,” Natl. Diabetes Stat. Rep., 2020.

N. D. S. Report, “National Diabetes Statistics Report 2020 Estimates of Diabetes and Its Burden in the United States,” Natl. Diabetes Stat. Rep., 2020.

F. Gorunescu, Data Mining, vol. 12. Berlin, Heidelberg: Springer Berlin Heidelberg, 2011.

J. Han, M. Kamber, and J. Pei, Data Mining: Concepts and Techniques. 2012.

X. Wu and V. Kumar, The Top Ten Algorithms in Data Mining. Taylor & Francis Group, 2009.

M. Galar, A. Fernandez, E. Barrenechea, H. Bustince, and F. Herrera, “A review on ensembles for the class imbalance problem: Bagging-, boosting-, and hybrid-based approaches,” IEEE Transactions on Systems, Man and Cybernetics Part C: Applications and Reviews. 2012, doi: 10.1109/TSMCC.2011.2161285.

L. Marlina, M. lim, and A. P. Utama Siahaan, “Data Mining Classification Comparison (Naïve Bayes and C4.5 Algorithms),” Int. J. Eng. Trend Techno., 2016, doi: 10.14445/22315381/ijett-v38p268.

“Decision Support System for Medical Diagnosis Using Data Mining,” Int. J. Comput. Sci. Issues, 2011.

B. HSSINA, A. MERBOUHA, H. EZZIKOURI, and ERRITALI, “A comparative study of decision tree ID3 and C4.5,” Int. J. Advan. Comp. Sci. Appli., 2014, doi: 10.14569/specialissue.2014.040203.

C. J. Mantas and J. Abellán, “Credal-C4.5: Decision tree based on imprecise probabilities to classify noisy data,” Expert Syst. Appl., 2014, doi: 10.1016/j.eswa.2014.01.017.

S. Angra and S. Ahuja, “Implementation of data mining algorithms on student’s data using rapid miner,” 2017, doi: 10.1109/ICBDACI.2017.8070869.

K. M. Ting, “Confusion Matrix,” in Encyclopedia of Machine Learning and Data Mining, 2017.

A. Ridwan, P. N. Andono, and C. Supriyanto, “Optimasi Klasifikasi Status Gizi Balita Berdasarkan Indeks Antropometri Menggunakan Algoritma Naive,” Teknol. Inf., 2018.


Refbacks

  • There are currently no refbacks.