Scatterplot dan Scatterplot Matrix di R

Scatterplot dan Scatterplot Matrix di R

Dalam statistik dan visualisasi data, scatterplot (plot titik-titik) adalah salah satu tool yang paling populer. Dengan menggunakan fungsi scatterplot di R, kita dapat membuat plot scatterplot untuk memvisualkan hubungan antara dua variabel.

Contoh penggunaan fungsi scatterplot adalah sebagai berikut:

library(FactoMineR)
data(mtcars)

scatterplot(y ~ x | group)

Kita juga dapat menonaktifkan legenda dengan mengatur argumen legend menjadi FALSE. Selain itu, kita dapat menonaktifkan grid plot atau bahkan menambahkan elipsa dengan argumen grid dan ellipse, masing-masing.

scatterplot(x, y,
 boxplots = "", # Disable boxplots
 grid = FALSE, # Disable plot grid
 ellipse = TRUE) # Draw ellipses

Terdapat banyak argumen lain yang dapat diatur untuk mengcustomisasi plot scatterplot. Oleh karena itu, silakan lihat dokumentasi ?scatterplot untuk informasi lebih lanjut.

Scatterplot Matrix di R

Ketika kita bekerja dengan berbagai variabel, seringkali kita ingin membuat plot multiple scatter plots dalam sebuah matrix. Dengan menggunakan fungsi pairs di R, kita dapat membuat plot scatterplot matrix yang akan memvisualkan korasi antara variabel-variabel.

library(FactoMineR)
data(mtcars)

pairs(~disp + wt + mpg + hp, data = mtcars)

Kita juga dapat menambahkan warna untuk group-group yang berbeda dengan mengatur argumen col. Contohnya:

pairs(~disp + wt + mpg + hp, col = factor(mtcars$am), pch = 19, data = mtcars)

Sebagai alternatif, kita dapat menggunakan fungsi scatterplotMatrix dari paket car, yang akan menambahkan perkiraan density kernel dalam diagonal.

library(car)

install.packages("car")

scatterplotMatrix(~ disp + wt + mpg + hp, data = mtcars)

Kita juga dapat mengcustomisasi warna plot dengan argumen-argumen berikut:

scatterplotMatrix(~ disp + wt + mpg + hp, data = mtcars,
 diagonal = FALSE, # Remove kernel density estimates
 regLine = list(col = "green", # Linear regression line color
 lwd = 3), # Linear regression line width
 smooth = list(col.smooth = "red", # Non-parametric mean color
 col.spread = "blue")) # Non-parametric variance color

Scatterplot di ggplot2

Membuat scatter graph dengan menggunakan library ggplot2 dapat dilakukan dengan fungsi geom_point. Kita juga dapat membagi group-group dengan warna dengan menggunaan aes dan argument colour.

library(ggplot2)

my_df <- data.frame(x = x, y = y, group = group)

ggplot(my_df, aes(x = x, y = y)) +
 geom_point(aes(colour = group)) + # Points and color by group
 scale_color_discrete("Groups") + # Change legend title
 xlab("Variable X") + # X-axis label
 ylab("Variable Y") + # Y-axis label
 theme(axis.line = element_line(colour = "black", # Changes the default theme
 size = 0.24))

Scatterplot 3D di R

Dengan menggunakan library scatterplot3d dan rgl, kita dapat membuat scatter plot 3D di R. Fungsi scatterplot3d memungkinkan kita untuk membuat plot 3D statis dari tiga variabel.

library(scatterplot3d)

set.seed(2)
x <- rnorm(1000)
y <- rnorm(1000)
z <- rnorm(1000)

scatterplot3d(x, y, z, pch = 19, color = "blue")

Sebagai alternatif, kita dapat menggunakan fungsi plot3d dari paket rgl, yang memungkinkan visualisasi interaktif. Kita dapat menggeser, zoom in dan out plot untuk mencari pola dalam data 3D.

library(rgl)

plot3d(x, y, z,
 type = "s", # Type of the plot
 col = "blue") # Color of the plot

Semoga artikel ini dapat membantu Anda memahami bagaimana scatterplot dan scatterplot matrix di R.