Dalam statistik dan visualisasi data, scatterplot (plot titik-titik) adalah salah satu tool yang paling populer. Dengan menggunakan fungsi scatterplot
di R, kita dapat membuat plot scatterplot untuk memvisualkan hubungan antara dua variabel.
Contoh penggunaan fungsi scatterplot
adalah sebagai berikut:
library(FactoMineR)
data(mtcars)
scatterplot(y ~ x | group)
Kita juga dapat menonaktifkan legenda dengan mengatur argumen legend
menjadi FALSE
. Selain itu, kita dapat menonaktifkan grid plot atau bahkan menambahkan elipsa dengan argumen grid
dan ellipse
, masing-masing.
scatterplot(x, y,
boxplots = "", # Disable boxplots
grid = FALSE, # Disable plot grid
ellipse = TRUE) # Draw ellipses
Terdapat banyak argumen lain yang dapat diatur untuk mengcustomisasi plot scatterplot. Oleh karena itu, silakan lihat dokumentasi ?scatterplot
untuk informasi lebih lanjut.
Scatterplot Matrix di R
Ketika kita bekerja dengan berbagai variabel, seringkali kita ingin membuat plot multiple scatter plots dalam sebuah matrix. Dengan menggunakan fungsi pairs
di R, kita dapat membuat plot scatterplot matrix yang akan memvisualkan korasi antara variabel-variabel.
library(FactoMineR)
data(mtcars)
pairs(~disp + wt + mpg + hp, data = mtcars)
Kita juga dapat menambahkan warna untuk group-group yang berbeda dengan mengatur argumen col
. Contohnya:
pairs(~disp + wt + mpg + hp, col = factor(mtcars$am), pch = 19, data = mtcars)
Sebagai alternatif, kita dapat menggunakan fungsi scatterplotMatrix
dari paket car
, yang akan menambahkan perkiraan density kernel dalam diagonal.
library(car)
install.packages("car")
scatterplotMatrix(~ disp + wt + mpg + hp, data = mtcars)
Kita juga dapat mengcustomisasi warna plot dengan argumen-argumen berikut:
scatterplotMatrix(~ disp + wt + mpg + hp, data = mtcars,
diagonal = FALSE, # Remove kernel density estimates
regLine = list(col = "green", # Linear regression line color
lwd = 3), # Linear regression line width
smooth = list(col.smooth = "red", # Non-parametric mean color
col.spread = "blue")) # Non-parametric variance color
Scatterplot di ggplot2
Membuat scatter graph dengan menggunakan library ggplot2
dapat dilakukan dengan fungsi geom_point
. Kita juga dapat membagi group-group dengan warna dengan menggunaan aes
dan argument colour
.
library(ggplot2)
my_df <- data.frame(x = x, y = y, group = group)
ggplot(my_df, aes(x = x, y = y)) +
geom_point(aes(colour = group)) + # Points and color by group
scale_color_discrete("Groups") + # Change legend title
xlab("Variable X") + # X-axis label
ylab("Variable Y") + # Y-axis label
theme(axis.line = element_line(colour = "black", # Changes the default theme
size = 0.24))
Scatterplot 3D di R
Dengan menggunakan library scatterplot3d
dan rgl
, kita dapat membuat scatter plot 3D di R. Fungsi scatterplot3d
memungkinkan kita untuk membuat plot 3D statis dari tiga variabel.
library(scatterplot3d)
set.seed(2)
x <- rnorm(1000)
y <- rnorm(1000)
z <- rnorm(1000)
scatterplot3d(x, y, z, pch = 19, color = "blue")
Sebagai alternatif, kita dapat menggunakan fungsi plot3d
dari paket rgl
, yang memungkinkan visualisasi interaktif. Kita dapat menggeser, zoom in dan out plot untuk mencari pola dalam data 3D.
library(rgl)
plot3d(x, y, z,
type = "s", # Type of the plot
col = "blue") # Color of the plot
Semoga artikel ini dapat membantu Anda memahami bagaimana scatterplot dan scatterplot matrix di R.