Komparasi Metode Mean dan KNN Imputation dalam Mengatasi Missing Value pada Dataset Kecil

Missing value pada dataset yang kecil akan mengakibatkan berkurangnya data yang dapat digunakan untuk pembelajaran sehingga prediksi hasil klasifikasi dari data tersebut akan berkurang. Metode Imputasi sebagai solusi metode yang paling umum digunakan untuk menangani masalah dataset yang tidak lengka...

Full description

Saved in:
Bibliographic Details
Published inJIP (Jurnal Informatika Polinema) Vol. 10; no. 2; pp. 257 - 264
Main Authors Yulian Pamuji, Fandi, Ahmad Rofiqul Muslikh, Rizza Muhammad Arief, Delviana Muti
Format Journal Article
LanguageEnglish
Published 29.02.2024
Online AccessGet full text

Cover

Loading…
More Information
Summary:Missing value pada dataset yang kecil akan mengakibatkan berkurangnya data yang dapat digunakan untuk pembelajaran sehingga prediksi hasil klasifikasi dari data tersebut akan berkurang. Metode Imputasi sebagai solusi metode yang paling umum digunakan untuk menangani masalah dataset yang tidak lengkap. Metode Imputasi proses di mana beberapa teknik statistik digunakan untuk mengganti data yang hilang dengan nilai pengganti. Tujuan penelitian ini dengan kinerja klasifikasi yang dapat dipertahankan dengan metode imputasi missing value, karena metode ini dapat menghindari berkurangnya jumlah dataset yang digunakan dalam proses klasifikasi pada dataset dan meningkatkan kinerja klasifikasi pada dataset yang tidak ideal terutama untuk jumlah dataset yang kecil. Berdasarkan hasil eksperimen yang telah dilakukan dari penelitian ini yaitu bahwa pengujian metode imputasi Mean dan KNN Imputation dengan metode klasifikasi mampu menangani data kosong dengan jumlah missing value sedikit maupun banyak dengan menghasilkan nilai accuracy mencapai kinerja prediksi yang lebih besar dibandingkan dengan menggunakan missing value nilai 0. Kemudian untuk dataset Hepatitis nilai Accuracy tinggi menggunakan metode imputasi KNN Imputasi dengan nilai 0,79 menggunakan metode Logistic Regression dan dataset Ginjal Kronis nilai Accuracy tinggi menggunakan metode imputasi Mean dengan nilai 0,97 dengan menggunakan metode Naïve Bayes. Hal tersebut menunjukkan bahwa proses metode imputasi terhadap nilai kosong disetiap column dataset kecil pada tahap data preprocessing memberikan pengaruh terhadap nilai Accuracy metode Mean dan KNN Imputation pada metode klasifikasi.
ISSN:2614-6371
2407-070X
DOI:10.33795/jip.v10i2.5031