Cara Membuat Scatter Plot pada Weka dan R

Cara Membuat Scatter Plot pada Weka dan R

Eksplorasi Data dengan Menggunakan Weka dan R

Praktikum 3 Data Mining – 23 Februari 2016

Eksplorasi Data dengan Menggunakan Weka

Eksplorasi data merupakan langkah untuk memahami data sebelum dilakukan praproses. Dalam eksplorasi data, hal yang harus diperhatikan adalah tipe data.

Tipe data terdiri dari nominal, ordinal, interval, dan rasio. Pada Weka, hanya dapat mengenali tipe data nominal dan numerik. Gunakan data weather.arff yang telah tersedia di Weka.

Gambar 3: Statistika ringkasan dari atribut outlook
Gambar 4: Statistika ringkasan dari atribut temperature
Gambar 5: Histogram atribut temperature terhadap kelas play
Gambar 6: Histogram atribut windy terhadap kelas play
Gambar 7: Scatter plot humidity terhadap temperature

Eksplorasi Data dengan Menggunakan R

Eksplorasi pada R tidak jauh berbeda dengan Weka, hanya saja di R memiliki tipe data dan visualisasi data yang lebih lengkap dibandingkan Weka.

Untuk eksplorasi data dengan menggunakan R, kita import data insurance.csv [Tersedia di http://bit.ly/insurance_csv] dan simpan pada variabel data.

Untuk melihat tipe data tiap atribut, ketikkan perintah:
str(data)

Jika dibandingkan dengan Weka, R memiliki tipe data yang lebih lengkap seperti int, Factor, num. Untuk melihat statistika ringkasan (misal pada atribut age dan sex), ketikkan perintah:
summary(data)

Membuat Scatter Plot dengan Menggunakan R

Untuk membuat scatter plot, ketikkan perintah:

plot(age ~ sex, data = insurance)

Analisis dengan Menggunakan Scatter Plot

Terdapat tiga jenis analisa yang dapat dilakukan dengan menggunakan scatter plot:

  1. Scatter plot dapat menunjukkan hubungan (korelasi) antara dua variabel/atribut dan juga dapat digunakan untuk mendeteksi hubungan non linier antar dua variabel/atribut.
  2. Ketika label dari kelas tersedia, scatter plot dapat digunakan untuk menyelidiki derajat kedua atribut dalam memisahkan kelas.
  3. Menganalisa pencilan/outlier.

Perbedaan Secara General Terkait Eksplorasi Data dengan Menggunakan Weka dan R

R Weka
Statistika Ringkasan Min, Max, Q1, Median, Q3, Mean
Visualisasi Data Histogram, Scatter plot, pie chart, line chart, box plot