Analisis Data dengan Menggunakan Scatter Plot Matrix

Analisis Data dengan Menggunakan Scatter Plot Matrix

Dalam analisis data, memiliki kemampuan untuk melihat hubungan antara variasi lebih dari satu dapat membantu dalam memahami pola yang terjadi pada data. Salah satu cara untuk melakukannya adalah dengan menggunakan scatter plot matrix.

Scatter plot matrix adalah gabungan dari beberapa grafik scatter plot dua-dimensi yang menampilkan hubungan antara variasi yang berbeda. Dalam contoh di atas, kita memiliki beberapa variabel seperti weight, turning circle, displacement, dan horsepower. Dengan menggunakan scatter plot matrix, kita dapat melihat hubungan antara variasi-variasi ini secara simultan.

Dalam Figur 14, kita lihat bahwa semua gabungan dua-dimensi dari variasi memiliki hubungan yang meningkat. Hal ini berarti bahwa beberapa variasi memiliki hubungan yang kuat dan seharusnya dipertimbangkan dalam analisis lebih lanjut.

Selain itu, scatter plot matrix juga dapat membantu kita dalam mengidentifikasi outliers. Dalam Figur 14, kita lihat bahwa terdapat beberapa titik yang tidak berada di dalam boxplot yang menunjukkan ada beberapa variasi yang tidak berada pada pola yang lain.

Dengan menggunakan JMP, kita dapat menambahkan informasi lebih lanjut ke scatter plot matrix, seperti histogram untuk masing-masing variasi yang berada di diagonal. Kita juga dapat menggantikan grafik scatter plot yang berada di atas segmen dengan korelasi antara pasangan variasi.

Dalam Figur 15, kita lihat bahwa scatter plot matrix telah ditambahkan dengan histogram dan korelasi antara variasi. Grafik ini membantu kita dalam memahami hubungan antara variasi-variasi yang berbeda.

Tipe Data dan Grafik

Data terbagi menjadi beberapa tipe, yaitu continuous data, categorical data, dan nominal data. Continuous data adalah data yang diukur pada skala yang banyak kemungkinan nilai, contohnya age, blood pressure, weight, temperature, dan speed. Kita dapat menggunakan grafik scatter plot untuk menganalisis data ini.

Sementara itu, categorical data dan nominal data adalah data yang diukur pada skala yang memiliki nilai tertentu, contohnya opinion pada skala "Strongly Disagree" hingga "Strongly Agree". Data jenis ini lebih cocok digunakan dengan grafik bar chart.

Dalam beberapa kasus, kita dapat menggunakan categorical atau nominal data untuk mengustomisasi grafik scatter plot. Kita dapat mengassign warna dan marker yang berbeda untuk level-level dari variasi-variasi tersebut.