IMPLEMENTASI CATBOOST DENGAN MENGGUNAKAN HYPER-PARAMETER TUNING BAYESIAN SEARCH UNTUK MEMPREDIKSI PENYAKIT DIABETES

Authors

  • Arif Darmawan
  • Muliadi Muliadi
  • Dwi Kartini
  • Triando Hamonangan Saragih
  • Radityo Adi Nugraha

DOI:

https://doi.org/10.23960/komputasi.v11i2.13746

Keywords:

AUC, Bayesian Search, Classification, CatBoost, Hyperparameter Tuning, Precision.

Abstract

Diabetes merupakan masalah kesehatan masyarakat dunia dengan prevalensi yang selalu meningkat setiap tahun. Penyakit Diabetes ini perlu didiagnosis sejak dini menggunakan algoritma klasifikasi. Dataset yang digunakan yaitu PIMA Indians Diabetes Database dari Kaggle dengan 768 data dan 8 fitur. Metode pengklasifikasi yang digunakan yaitu Catboost. Klasifikasi Catboost dapat bekerja baik dalam menangani ketidak seimbangan data, namun kinerja algoritma ini masih bisa ditingkatkan lagi. Untuk mengatasi permasalahan tersebut peneliti menggunakan solusi Hyper-parameter tuning. Catboost memiliki beberapa Hyper-parameter yang dapat dikonfigurasi untuk meningkatkan kinerja dari model. Masalah mengidentifikasi nilai yang baik untuk Hyper-parameter disebut Hyper-parameter tuning. Metode Hyper-parameter tuning yang digunakan yaitu Bayesian Search yang kemudian divalidasi menggunakan 10-Fold Cross Validation sebanyak 10 iterasi. Hyper-parameter Catboost yang dikonfigurasi antara lain depth, learning_rate dan Iterations. Pengujian pada Catboost tanpa Hyper-parameter tuning memperoleh nilai presisi sebesar 0,625% dan nilai AUC sebesar 0,868%. Untuk pengujian Catboost dengan Hyper-parameter tuning memperoleh presisi sebesar 0,634 % dan AUC sebesar 0,901%. Menambahkan Hyper-parameter tuning Bayesian Search pada metode klasifikasi Catboost dapat meningkatkan hasil nilai akurasi dan nilai AUC.

Downloads

Download data is not yet available.

Downloads

Published

2023-10-30

Issue

Section

Articles