Scatter plot matrix adalah sebuah matriks scatterplot yang memungkinkan Anda untuk memahami hubungan pasangan antara variabel-variabel dalam dataset. Ada dua cara umum untuk membuat scatter plot matrix di R:
Metode 1: Menggunakan Base R
Dalam contoh di atas, kita dapat menggunakan fungsi plot()
dari base R untuk membuat scatter plot matrix:
plot(df, pch=20)
Parameter pch
menentukan bentuk titik dalam scatter plot (dalam kasus ini, kita menggunakan bola solid dengan nilai 20). Parameter lainnya, seperti cex
dan col
, dapat digunakan untuk mengontrol ukuran titik dan warna titik.
Metode 2: Menggunakan ggplot2 dan GGally
Dalam contoh di atas, kita juga dapat menggunakan fungsi ggpairs()
dari paket ggplot2
dan GGally
untuk membuat scatter plot matrix:
library(ggplot2)
library(GGally)
ggpairs(df)
Fungsi ggpairs()
tidak hanya menampilkan scatter plot matriks, tapi juga menampilkan koefisien korelasi antara pasangan variabel dan density plot untuk setiap variabel individu. Contoh di atas memperlihatkan bahwa:
- Koefisien korelasi antara assists dan points adalah 0,571.
- Koefisien korelasi antara rebounds dan points adalah -0,598.
- Koefisien korelasi antara rebounds dan assists adalah -0,740. Bintang kecil (*) di samping -0,740 juga menunjukkan bahwa korelasi antara rebounds dan assists signifikan secara statistik.
Referensi
- NIST Handbook (di atas)
- Statology: How to Create a Scatterplot Matrix in R (2 Examples)