Mengembangkan Model Logistic Regression untuk Memprediksi Jenis Bunga

Mengembangkan Model Logistic Regression untuk Memprediksi Jenis Bunga

Pada bagian sebelumnya, kita telah belajar cara mengidentifikasi dataset dan merekomendasikan transformasi data dan teknik modeling yang sesuai. Kita juga telah membandingkan beberapa algoritma pada dataset tersebut dan menganalisis hasilnya.

Dalam bagian ini, kita akan fokus pada pengembangan model Logistic Regression untuk memprediksi jenis bunga berdasarkan karakteristiknya. Kita akan menggunakan Weka machine learning workbench untuk mengembangkan model dan menampilkan hasilnya.

Mengembangkan Model

  1. Buka Weka Explorer dan muat dataset iris.arff.
  2. Klik pada tab Classify.
  3. Pilih algoritma Logistic Regression (functions.Logistic).
  4. Ubah opsi "Test" dari "Cross Validation" menjadi "Use training set".
  5. Klik tombol "Start" untuk mengembangkan model.

Menganalisis Hasil

  1. Buka Weka Experiment Environment.
  2. Pilih analisis paired-corrected t-test (Tester: weka.experiment.PairedCorrectedTTester).
  3. Isikan nilai-niai sebagai berikut:
  • G: 4,5,6
  • D: 1
  • R: 2
  • S: 0.05
  • V: -result-matrix "weka.experiment.ResultMatrixPlainText"
  1. Klik tombol "Perform test" untuk menjalankan analisis.

Mengembangkan Model Akhir

  1. Tutup Weka Experiment Environment.
  2. Buka Weka Explorer dan muat dataset iris.arff.
  3. Klik pada tab Classify.
  4. Pilih algoritma Logistic Regression (functions.Logistic).
  5. Ubah opsi "Test" dari "Cross Validation" menjadi "Use training set".
  6. Klik tombol "Start" untuk mengembangkan model akhir.
  7. Simpan model ke file dengan nama "iris-logistic".

Model ini dapat digunakan pada waktu yang akan datang untuk membuat prediksi pada data baru.

Menampilkan Hasil

Dalam bagian terakhir, kita akan menampilkan hasilnya dan membahas variabilitasnya. Kita tahu bahwa 95% dari akurasi model akan jatuh dalam dua standar deviasi dari rata-rata akurasi model. Atau, dalam kata lain, kita dapat menjelaskan bahwa performa model pada data yang belum pernah diuji sebelumnya akan 96,33% plus atau minus 2 * 3,38 or 6,76, atau antara 87,57% dan 100% akurat.

Ringkasan
Dalam postingan ini, Anda telah menyelesaikan proyek machine learning end-to-end menggunakan Weka machine learning workbench. Kita telah belajar:

Bagaimana menganalisis dataset dan merekomendasikan transformasi data dan modeling techniques yang sesuai.
Bagaimana membandingkan suite algoritma pada masalah dan menganalisis hasilnya.
Bagaimana mengembangkan model akhir untuk membuat prediksi pada data baru dan menampilkan estimasi akurasi model pada data yang belum pernah diuji sebelumnya.

Apakah Anda memiliki pertanyaan tentang menjalankan proyek machine learning di Weka atau tentang postingan ini? Beritahu kami dalam komentar dan saya akan berusaha menjawabnya.