Pada awalnya, mempelajari tentang data Anda sangat penting ketika mulai bekerja pada masalah machine learning baru. Ada beberapa hal yang dapat membantu Anda cepat mempelajari lebih lanjut tentang dataset, seperti statistik deskriptif dan visualisasi data.
Dalam postingan ini, Anda akan belajar bagaimana mengembangkan pengetahuan tentang data dengan menggunakan Weka, sebuah workbench machine learning. Setelah membaca postingan ini, Anda akan memahami:
- Distribusi atribut dengan meninjau statistik deskriptif.
- Distribusi atribut dengan meninjau plot univariate.
- Hubungan antara atribut dengan meninjau plot multivariate.
Memahami Data dengan Statistik Deskriptif
Weka explorer akan secara otomatis menghitung statistik deskriptif untuk atribut numerik.
Buka GUI Weka.
Klik "Explorer" untuk membuka Weka Explorer.
Muat dataset Pima Indians dari data/diabetes.arff.
Meninjau Distribusi Atribut
Weka memudahkan Anda untuk meninjau distribusi masing-masing atribut dengan menggunakan plot univariate. Hal ini dapat membantu Anda dalam mendapatkan pengetahuan tentang dataset dan juga memberikan ide tentang operasi pengolah data yang lebih lanjut.
Meninjau Hubungan Atribut
Weka juga memungkinkan Anda untuk meninjau hubungan antara atribut dengan menggunakan plot multivariate, seperti scatter plot. Hal ini dapat membantu Anda dalam mendapatkan pengetahuan tentang pola data dan memberikan ide tentang teknik machine learning yang lebih lanjut.
Ringkasan
Dalam postingan ini, Anda telah belajar bagaimana mengembangkan pengetahuan tentang data dengan menggunakan Weka. Khususnya, Anda telah memahami:
- Weka secara otomatis menghitung statistik deskriptif untuk atribut numerik.
- Weka memudahkan Anda untuk meninjau distribusi masing-masing atribut dengan menggunakan plot univariate.
- Weka memungkinkan Anda untuk meninjau hubungan antara atribut dengan menggunakan plot multivariate.
Jika Anda memiliki pertanyaan tentang statistik deskriptif dan visualisasi data dalam Weka atau postingan ini, silakan tanyakan di komentar di bawah. Aku akan berusaha menjawabnya.