Bagaimana Membuat dan Menginterpretasi Plot Pairs di R

Bagaimana Membuat dan Menginterpretasi Plot Pairs di R

Membuat plot pairs dalam R sangatlah mudah. Anda dapat menggunakan fungsi pairs() untuk membuat plot ini. Dalam artikel ini, kita akan membahas beberapa contoh cara menggunakan fungsi pairs() dan juga cara menginterpretasikan plot pairs.

Contoh 1: Membuat Plot Pairs untuk Semua Variabel

Dalam contoh ini, kita akan membuat plot pairs untuk semua variabel dalam data frame dengan menggunakan kode berikut:

# Membuat data frame
set.seed(0)
var1 <- rnorm(1000)
var2 <- var1 + rnorm(1000, 0, 2)
var3 <- var2 - rnorm(1000, 0, 5)
df <- data.frame(var1, var2, var3)

# Membuat plot pairs
pairs(df)

Plot pairs yang dihasilkan akan memiliki struktur sebagai berikut:

  • Nama variabel ditampilkan pada kotak-kotak diagonal.
  • Kotak-kotak lainnya menampilkan scatterplot antara setiap kombinasi pasangan variabel.

Dalam contoh ini, kita dapat melihat bahwa var1 dan var2 memiliki korelasi positif yang kuat, sedangkan var3 memiliki korelasi negatif yang kuat dengan kedua variabel lainnya.

Contoh 2: Membuat Plot Pairs dengan menggunakan ggplot2 dan GGally

Dalam contoh ini, kita akan membuat plot pairs dengan menggunakan library ggplot2 dan GGally. Kita dapat menggunakan fungsi ggpairs() untuk membuat plot ini.

# Membuat data frame
set.seed(0)
x <- rnorm(500)
y <- x + rnorm(500, 0, 10)
z <- x - rnorm(500, 0, 7)
sample_data <- data.frame(x, y, z)

# Membuat plot pairs dengan menggunakan ggplot2 dan GGally
library(ggplot2)
library(GGally)
ggpairs(sample_data)

Plot pairs yang dihasilkan akan memiliki struktur sebagai berikut:

  • Nama variabel ditampilkan pada tepi luar matriks.
  • Kotak-kotak diagonal menampilkan density plot untuk setiap variabel.
  • Kotak-kotak lainnya menampilkan scatterplot antara setiap kombinasi pasangan variabel.
  • Kotak-kotak atas kanan menampilkan korelasi Pearson antara setiap kombinasi pasangan variabel.

Dalam contoh ini, kita dapat melihat bahwa x dan y memiliki korelasi positif yang kuat, sedangkan z memiliki korelasi negatif yang kuat dengan kedua variabel lainnya. Korelasi Pearson juga menunjukkan korelasi antara setiap kombinasi pasangan variabel.

Dalam kesimpulan, plot pairs adalah salah satu cara untuk memvisualisasikan data dan mengidentifikasi korelasi antara setiap kombinasi pasangan variabel. Dengan menggunakan fungsi pairs() atau ggpairs(), Anda dapat membuat plot ini dengan cepat dan mudah.