Optimasi klasifikasi imbalanced data penyakit kelainan genetik multifaktorial dengan algoritma ensemble

This item is published by Universitas Islam Negeri Sunan Ampel Surabaya

Mas'udi, Ahmad Bagus (2024) Optimasi klasifikasi imbalanced data penyakit kelainan genetik multifaktorial dengan algoritma ensemble. Undergraduate thesis, UIN Sunan Ampel Surabaya.

[img] Text
Ahmad Bagus Mas'udi_09020620018 OK.pdf

Download (1MB)
[img] Text
Ahmad Bagus Mas'udi_09020620018 Full.pdf
Restricted to Repository staff only until 10 February 2027.

Download (2MB)

Abstract

Ketidakseimbangan data adalah masalah yang sering terjadi dalam klasifikasi. Ketidakseimbangan data terjadi ketika jumlah sampel pada salah satu kelas, jumlahnya jauh lebih sedikit atau jauh lebih besar dibanding kelas lain. Hal ini dapat menyebabkan model klasifikasi menjadi tidak akurat dan cenderung memprediksi kelas mayoritas. Untuk mengatasi masalah ketidakseimbangan data, metode resampling dapat digunakan. Sehingga penelitian ini bertujuan mengatasi permasalahan ketidakseimbangan data dalam klasifikasi data kelainan genetik multifaktorial. Penelitian ini menguji penerapan beberapa metode resampling, antara lain Random Undersampling, NearMiss, SMOTE, ADASYN, dan SMOTE-ENN, untuk meningkatkan kinerja model pada dataset yang tidak seimbang. Selain itu, diterapkan Principal Component Analysis (PCA) untuk seleksi fitur. Penerapan metode resampling tersebut diuji menggunakan algoritma klasifikasi Random Forest dan XGBoost. Dari hasil ujicoba, hasil terbaik pengujian didapatkan dalam penerapan SMOTE-ENN pada algoritma Random Forest dengan hasil accuracy sebesar 98%, spesificity sebesar 98.9%, sensitivity sebesar 94.9%, dan AUC sebesar 96.9%.

Statistic

Downloads from over the past year. Other digital versions may also be available to download e.g. from the publisher's website.

Item Type: Thesis (Undergraduate)
Creators:
CreatorsEmailNIM
Mas'udi, Ahmad Bagusahmadbagusmasudi@gmail.com09020620018
Contributors:
ContributionNameEmailNIDN
Thesis advisorRolliawati, Dwidwi_roll@uinsby.ac.id2027097901
Thesis advisorKhalid, Khalidkhalid@uinsby.ac.id--
Subjects: Teknologi
Teknologi > Teknologi Informasi
Keywords: Imbalanced Data; SMOTE-ENN; Multifactorial Genetic Disorders; Klasifikasi
Divisions: Fakultas Sains dan Teknologi > Studi Sistem Informasi
Depositing User: Ahmad Bagus Mas'udi
Date Deposited: 09 Feb 2024 23:28
Last Modified: 09 Feb 2024 23:28
URI: http://digilib.uinsa.ac.id/id/eprint/68411

Actions (login required)

View Item View Item