Teks
Optimasi Algoritma K-Nearest Neighbors Berdasarkan Perbandingan Analisis Outlier (Distance, Density, LOF Based)
Pertumbuhan data yang terjadi saat ini berpengaruh terhadap analisis data di
berbagai bidang seperti astronomi, bisnis, kedokteran, pendidikan dan finalsial.
Data yang terkumpul dan tersimpan mengandung nilai ekstrim atau nilai
pengamatan yang berbeda dari kebanyakan nilai pengamatan yang lain atau disebut
juga dengan data outlier. Data outlier memiliki dampak yang buruk terhadap hasil
dari analisis. Deteksi outlier dapat dilakukan sebagai data preprocessing
menggunakan teknik analisis outlier.
K-Nearest Neighbors (KNN) merupakan salah satu algoritma data mining
yang sangat sensitif terhadap outlier dikarenakan cara kerjanya bergantung pada
nilai k, sehingga perlu penanganan tepat untuk KNN saat bekerja pada dataset
beroutlier. Penelitian ini bertujuan untuk mengoptimasikan algoritma KNN
berdasarkan perbandingan analisis outlier (distance, density, LOF based).
Hasil penelitian menunjukan bahwa KNN-density unggul sebanyak tiga kali
pada dataset Breast Cancer Wisconsin dengan nilai rata-rata akurasi sebesar
99,34% k=3 dan k=5, dataset Glass rata-rata akurasi sebesar 85,25% pada k=7 dan
dataset Lymphography dengan rata-rata akurasi sebesar 85,45% pada k=5.
Berdasarkan uji Friedman yang dilakukan H0 ditolak dan Haditerima.. Artinya
terdapat perbedaan yang signifikan antara KNN-density, KNN-distance dan KNN-
LOF.
| S00004.23 | RF SI.S00004.23 Nur o | My Library (Skripsi SI) | Tersedia |
Tidak tersedia versi lain