Teks
Penanganan Data Imbalance Menggunakan Metode Synthetic Minority Oversampling Technique (SMOTE) Untuk Meningkatkan Kinerja Algoritma K-Nearest Neighbor
Klasifikasi merupakan salah satu peran utama dalam data mining yang termasuk ke
dalam pembelajaran supervised learning. Berbagai algoritma klasifikasi terus
berkembang, namun masalah dalam klasifikasi, seperti data imbalance masih
sering terjadi. Data imbalance dapat menyebabkan model klasifikasi bias terhadap
kelas mayoritas, sehingga kinerja model dalam mendeteksi kelas minoritas menjadi
kurang optimal. Penelitian ini bertujuan untuk mengatasi masalah data imbalance
pada klasifikasi penderita penyakit stroke dengan menerapkan metode Synthetic
Minority Oversampling Technique (SMOTE) dan algoritma K-Nearest Neighbor
(K-NN).
Penelitian ini menggunakan dataset yang tersedia secara terbuka di Kaggle, yang
terdiri dari 5110 data dengan 12 variabel, di mana variabel 'stroke' memiliki 2 kelas:
1 (stroke) dengan 249 data dan 0 (tidak stroke) dengan 4861 data. Penelitian ini
membandingkan performa model K-NN tanpa SMOTE dan dengan SMOTE pada
berbagai nilai k (k=3, k=5, dan k=7). Evaluasi dilakukan menggunakan metrik
akurasi, presisi, dan recall.
Hasil penelitian menunjukkan bahwa penerapan metode SMOTE pada dataset yang
tidak seimbang secara signifikan meningkatkan performa klasifikasi pada kelas
minoritas. Pada model K-NN tanpa SMOTE, nilai akurasi terbaik adalah 95,48%
dengan k=7, namun presisi dan recall pada kelas minoritas masih rendah dengan
hanya memperoleh hasil 47,87% untuk presisi dan 49,86% untuk recall. Setelah
diterapkan metode SMOTE, model K-NN dengan k=3 memberikan hasil yang lebih
seimbang dengan akurasi 90,91%, presisi 91,93%, dan recall 90,91%. Berdasarkan
hasil evaluasi, dapat disimpulkan bahwa metode SMOTE efektif dalam menangani
data imbalance dan meningkatkan performa model K-NN dalam
mengklasifikasikan penderita penyakit stroke.
| S00031.24 | RF TI.S00031.24 Fao p | My Library (Referensi) | Tersedia |
Tidak tersedia versi lain