Algoritma Genetika Optimalisasi Fitur Seleksi Pada Kismis Di Turki Menggunakan Model Random Forest
Abstract
Ada banyak jenis kismis, termasuk varietas emas dan cokelat tua. Kedua kismis itu tidak sama, meski kesan pertama mereka mirip. Saat ini, lebih dari 1 juta ton kismis diproduksi di seluruh dunia. Di sebagian besar dunia, kismis dikonsumsi oleh orang-orang dari semua budaya dan kelas sosial. Produksi kismis dunia relatif tinggi, khususnya di Indonesia. Tujuan dari penelitian ini yaitu untuk mengklasifikasi dataset raisin menggunakan data mining, sehingga memunculkan nilai akurasi yang paling tinggi dari lima algoritma dan dua tipe optimasi yang akan dikomparasi nantinya. Pada penelitian ini, peneliti menggunakan metode klasifikasi dengan algoritma RF dan optimasi fitur seleksi GA yang dilakukan pemisahan data training dan data testing sebelumnya menggunakan cross validation dan split validation rasio 0,5 – 0,9. Nilai akurasi dan AUC yang dihasilkan oleh metode RF adalah 85.56% untuk akurasi dan 0.922 untuk AUC. untuk mengevaluasi operator validasi split dengan rasio split mulai dari 0,5 hingga 0,9 menggunakan metode RF. Berdasarkan pengujian yang dijalankan, rata-rata akurasi dan nilai AUC masing-masing adalah 84.52% dan 0.916. Optimalisasi fitur seleksi dengan metode GA memanfaatkan validasi data dengan 10-Fold-Validation dilakukan untuk meningkatkan performa nilai akurasi algoritma RF. Hal ini menghasilkan nilai sebesar 87.56% untuk akurasi dan 0.928 untuk AUC.
Keywords
References
Almomani, O. (2020). A feature selection model for network intrusion detection system based on pso, gwo, ffa and ga algorithms. Symmetry, 12(6), 1–20. https://doi.org/10.3390/sym12061046
Dharma, F., Noviana, A., Tahir, M., Hendrastuty, N., & Author, C. (2020). Prediction of Indonesian Inflation Rate Using Regression Model Based on Genetic Algorithms. Jurnal Online Informatika, 5(1), 45–52. https://doi.org/10.15575/join
Faid, M., Jasri, M., & Rahmawati, T. (2019). Perbandingan Kinerja Tool Data Mining Weka dan Rapidminer Dalam Algoritma Klasifikasi. Teknika, 8(1), 11–16. https://doi.org/10.34148/teknika.v8i1.95
Forrest, S. (1996). Genetic Algorithms. In ACM Computing Surveys (Vol. 28, Issue 1).
Karimi. (2011). Modelling of raisin berries by some physical and statistical characteristics. ResearchGate, 141–147.
Kemal Üniversitesi Ziraat Fakültesi Dergisi, M., Semerci̇, A., Kiziltuğ, T., Duran ÇELİK, A., & Ali KİRACI, M. (n.d.). Türkiye Bağcılığının Genel Durumu.
Kumar, V. (2014). Feature Selection: A literature Review. The Smart Computing Review, 4(3). https://doi.org/10.6029/smartcr.2014.03.007
Masesh, B. (2019). Machine Learning Algorithms-A Review. https://doi.org/10.21275/ART20203995
McCall, J. (2005). Genetic algorithms for modelling and optimisation. Journal of Computational and Applied Mathematics, 184(1), 205–222. https://doi.org/10.1016/j.cam.2004.07.034
Meira, W. (2020). Data Mining and Machine Learning: Fundamental Concepts and Algorithms. Researchgate.
Osman, A. S. (2019). Data Mining Techniques: Review. https://www.educba.com/7-data-
Qiu, M., Ming, Z., Li, J., Gai, K., & Zong, Z. (2015). Phase-change memory optimization for green cloud with genetic algorithm. IEEE Transactions on Computers, 64(12), 3528–3540.
Ramadhani, Y., Mubarok, A., Hidayatullah, S., & Wiguna, W. (2020). Attribute Optimization: Genetic Algorithms and Neural Network for Voice Analysis Classification of Parkinson’s Disease. 3074–3079. https://doi.org/10.5220/0009947030743079
Ramdhani, Y., Apra, D. F., & Alamsyah, D. P. (2023). Feature selection optimization based on genetic algorithm for support vector classification varieties of raisin. Indonesian Journal of Electrical Engineering and Computer Science, 30(1), 192. https://doi.org/10.11591/ijeecs.v30.i1.pp192-199
Rosyada, F. A. N. H. K. M. (2019). BOKIS_(BAHAN_OLAHAN_KISMIS)-1[1]. OSFPREPRINTS.
Somantri, O., & Khambali, M. (2017). Feature Selection Klasifikasi Kategori Cerita Pendek Menggunakan Naïve Bayes dan Algoritme Genetika. In JNTETI (Vol. 6, Issue 3). http://cerpenmu.com/.
Speiser, J. L. (2019). A comparison of random forest variable selection methods for classification prediction modeling. ELSEVIER, 134, 93–101.
DOI: 10.24269/jkt.v7i1.1894
Refbacks
- There are currently no refbacks.