OPTIMASI PARAMETER ALGORITMA DECISION TREE C4.5 PADA KLASIFIKASI BLOGGER PROFESSIONAL
Abstract
Blogger merupakan salah satu pekerjaan yang paling dicari. Bisnis yang dapat menghasilkan banyak uang jika ditekuni secara mendalam. Di era teknologi komputer yang terus berkembang dengan pesat, kita dapat menghemat waktu untuk mengklasifikasikan bloger profesional atau bukan menggunakan metode data mining. Untuk memprediksi bloger profesional menggunakan data mining, diperlukan elemen pendukung untuk menentukan dan data yang valid. Penelitian ini menggunakan teknik klasifikasi data mining untuk menentukan bloger profesional. Algoritma yang digunakan adalah decision tree C4.5. Penelitian ini Menggunakan 4-Fold Cross Validation dan Optimasi paramter apply prepurning, apply purning, dan minimal leaf size pada algoritma C4.5. Hasil akurasi Pengujian sebesar 88,00 % dengan Precision sebesar 87,30% %, dan Recall sebesar 75,00%.
Full Text:
PDFReferences
Altman, N. and Krzywinski, M. (2017) ‘Points of Significance: Ensemble methods: Bagging and random forests’, Nature Methods. doi: 10.1038/nmeth.4438.
Basuki, A. and Suwarno (2018) ‘Online dissolved gas analysis of power transformers based on decision tree model’, in 4th IEEE Conference on Power Engineering and Renewable Energy, ICPERE 2018 - Proceedings. doi: 10.1109/ICPERE.2018.8739761.
Boukenze, B. et al. (2012) ‘Top 10 algorithms in data mining’, Knowledge and Information Systems. doi: 10.1017/S0269888910000032.
Fatmawati, F. (2016) ‘PERBANDINGAN ALGORITMA KLASIFIKASI DATA MINING MODEL C4.5 DAN NAIVE BAYES UNTUK PREDIKSI PENYAKIT DIABETES’, None.
Gorunescu, F. (2011) Data Mining, Soft Computing. Berlin, Heidelberg: Springer Berlin Heidelberg. doi: 10.1007/978-3-642-19721-5.
Hoo, Z. H., Candlish, J. and Teare, D. (2017) ‘What is an ROC curve?’, Emergency Medicine Journal. doi: 10.1136/emermed-2017-206735.
Larose, D. T. (2006) Data Mining Methods and Models, Data Mining Methods and Models. doi: 10.1002/0471756482.
Luque, A. et al. (2019) ‘The impact of class imbalance in classification performance metrics based on the binary confusion matrix’, Pattern Recognition. doi: 10.1016/j.patcog.2019.02.023.
Marlina, L., lim, M. and Utama Siahaan, A. P. (2016) ‘Data Mining Classification Comparison (Naïve Bayes and C4.5 Algorithms)’, International Journal of Engineering Trends and Technology. doi: 10.14445/22315381/ijett-v38p268.
Naik, A. and Samant, L. (2016) ‘Correlation Review of Classification Algorithm Using Data Mining Tool: WEKA, Rapidminer, Tanagra, Orange and Knime’, Procedia Computer Science, 85, pp. 662–668. doi: 10.1016/j.procs.2016.05.251.
Ridwan, A., Andono, P. N. and Supriyanto, C. (2018) ‘Optimasi Klasifikasi Status Gizi Balita Berdasarkan Indeks Antropometri Menggunakan Algoritma Naive’, Teknologi Informasi.
Wu, X. et al. (2008) ‘Top 10 algorithms in data mining’, Knowledge and Information Systems. doi: 10.1007/s10115-007-0114-2.
Wu, X. and Kumar, V. (2009) The Top Ten Algorithms in Data Mining. Taylor & Francis Group.
Refbacks
- There are currently no refbacks.
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.