Algoritma Genetika Optimalisasi Fitur Seleksi Pada Kismis Di Turki Menggunakan Model Random Forest

Trisna Trisna, Hafidh Ashil, Serly Agustin, Yudi Ramadhani

Abstract


Ada banyak jenis kismis, termasuk varietas emas dan cokelat tua. Kedua kismis itu tidak sama, meski kesan pertama mereka mirip. Saat ini, lebih dari 1 juta ton kismis diproduksi di seluruh dunia. Di sebagian besar dunia, kismis dikonsumsi oleh orang-orang dari semua budaya dan kelas sosial. Produksi kismis dunia relatif tinggi, khususnya di Indonesia. Tujuan dari penelitian ini yaitu untuk mengklasifikasi dataset raisin menggunakan data mining, sehingga memunculkan nilai akurasi yang paling tinggi dari lima algoritma dan dua tipe optimasi yang akan dikomparasi nantinya. Pada penelitian ini, peneliti menggunakan metode klasifikasi dengan algoritma RF dan optimasi fitur seleksi GA yang dilakukan pemisahan data training dan data testing sebelumnya menggunakan cross validation dan split validation rasio 0,5 – 0,9. Nilai akurasi dan AUC yang dihasilkan oleh metode RF adalah 85.56% untuk akurasi dan 0.922 untuk AUC. untuk mengevaluasi operator validasi split dengan rasio split mulai dari 0,5 hingga 0,9 menggunakan metode RF. Berdasarkan pengujian yang dijalankan, rata-rata akurasi dan nilai AUC masing-masing adalah 84.52% dan 0.916. Optimalisasi fitur seleksi dengan metode GA memanfaatkan validasi data dengan 10-Fold-Validation dilakukan untuk meningkatkan performa nilai akurasi algoritma RF. Hal ini menghasilkan nilai sebesar 87.56% untuk akurasi dan 0.928 untuk AUC.


Keywords


Data Mining; Algoritma Genetika; Kismis; Random Forest

References


Almomani, O. (2020). A feature selection model for network intrusion detection system based on pso, gwo, ffa and ga algorithms. Symmetry, 12(6), 1–20. https://doi.org/10.3390/sym12061046

Dharma, F., Noviana, A., Tahir, M., Hendrastuty, N., & Author, C. (2020). Prediction of Indonesian Inflation Rate Using Regression Model Based on Genetic Algorithms. Jurnal Online Informatika, 5(1), 45–52. https://doi.org/10.15575/join

Faid, M., Jasri, M., & Rahmawati, T. (2019). Perbandingan Kinerja Tool Data Mining Weka dan Rapidminer Dalam Algoritma Klasifikasi. Teknika, 8(1), 11–16. https://doi.org/10.34148/teknika.v8i1.95

Forrest, S. (1996). Genetic Algorithms. In ACM Computing Surveys (Vol. 28, Issue 1).

Karimi. (2011). Modelling of raisin berries by some physical and statistical characteristics. ResearchGate, 141–147.

Kemal Üniversitesi Ziraat Fakültesi Dergisi, M., Semerci̇, A., Kiziltuğ, T., Duran ÇELİK, A., & Ali KİRACI, M. (n.d.). Türkiye Bağcılığının Genel Durumu.

Kumar, V. (2014). Feature Selection: A literature Review. The Smart Computing Review, 4(3). https://doi.org/10.6029/smartcr.2014.03.007

Masesh, B. (2019). Machine Learning Algorithms-A Review. https://doi.org/10.21275/ART20203995

McCall, J. (2005). Genetic algorithms for modelling and optimisation. Journal of Computational and Applied Mathematics, 184(1), 205–222. https://doi.org/10.1016/j.cam.2004.07.034

Meira, W. (2020). Data Mining and Machine Learning: Fundamental Concepts and Algorithms. Researchgate.

Osman, A. S. (2019). Data Mining Techniques: Review. https://www.educba.com/7-data-

Qiu, M., Ming, Z., Li, J., Gai, K., & Zong, Z. (2015). Phase-change memory optimization for green cloud with genetic algorithm. IEEE Transactions on Computers, 64(12), 3528–3540.

Ramadhani, Y., Mubarok, A., Hidayatullah, S., & Wiguna, W. (2020). Attribute Optimization: Genetic Algorithms and Neural Network for Voice Analysis Classification of Parkinson’s Disease. 3074–3079. https://doi.org/10.5220/0009947030743079

Ramdhani, Y., Apra, D. F., & Alamsyah, D. P. (2023). Feature selection optimization based on genetic algorithm for support vector classification varieties of raisin. Indonesian Journal of Electrical Engineering and Computer Science, 30(1), 192. https://doi.org/10.11591/ijeecs.v30.i1.pp192-199

Rosyada, F. A. N. H. K. M. (2019). BOKIS_(BAHAN_OLAHAN_KISMIS)-1[1]. OSFPREPRINTS.

Somantri, O., & Khambali, M. (2017). Feature Selection Klasifikasi Kategori Cerita Pendek Menggunakan Naïve Bayes dan Algoritme Genetika. In JNTETI (Vol. 6, Issue 3). http://cerpenmu.com/.

Speiser, J. L. (2019). A comparison of random forest variable selection methods for classification prediction modeling. ELSEVIER, 134, 93–101.


Full Text: PDF

DOI: 10.24269/jkt.v7i1.1894

Refbacks

  • There are currently no refbacks.