Dalam analisis statistik, plot kuantil-kuantil (quantile-quantile plot) atau disingkat sebagai QQ plot digunakan untuk membandingkan distribusi variabel yang ditelaah dengan distribusi hipotesis. Dalam artikel ini, kita akan membahas bagaimana menggunakan fungsi ggqqplot
dari paket ggpubr
di R untuk membuat plot kuantil-kuantil.
Mengapa Menggunakan QQ Plot?
QQ plot digunakan untuk membandingkan distribusi dua variabel. Dalam kasus, kita ingin mengetahui apakah distribusi variabel yang ditelaah seimbang dengan distribusi hipotesis. Misalnya, dalam analisis regresi linear, kita ingin memastikan bahwa distribusi error term seimbang dengan distribusi normal.
Struktur Fungsi ggqqplot
Fungsi ggqqplot
memiliki beberapa argumen yang dapat diatur untuk menyesuaikan plot:
data
: data frame yang berisi variabel yang akan ditelaah.x
: variabel yang akan ditelaah.combine
: boolean value yang digunakan jika y adalah vektor yang mengandung variabel-variabel lain. Jika TRUE, maka plot dari variabel-variabel lain akan dibuat dalam plot yang sama.merge
: boolean atau nilai karakter yang digunakan jika y adalah vektor yang mengandung variabel-variabel lain. Jika TRUE, maka variabel-variabel lain akan digabungkan dalam plot yang sama.color
,size
, danshape
: warna, ukuran, dan bentuk titik pada plot.add
: nilai karakter yang dapat diatur untuk menambahkan garis atau plot lain. Defaultnya adalah "none" atau "qqline".conf.int
: boolean value yang digunakan jika ingin menambahkan interval kepercayaan.title
,xlab
, danylab
: judul, label x, dan label y pada plot.
Contoh Penggunaan
Berikut adalah contoh penggunaan fungsi ggqqplot
:
# Buat data dengan dua variabel: sex dan weight
set.seed(1234)
wdata = data.frame(
sex = factor(rep(c("F", "M"), each=200)),
weight = c(rnorm(200, 55), rnorm(200, 58))
)
# Membuat plot kuantil-kuantil dasar untuk variabel weight
ggqqplot(wdata, x = "weight")
# Mengubah warna dan bentuk titik berdasarkan group ("sex")
ggqqplot(wdata, x = "weight", color = "sex", palette = c("#00AFBB", "#E7B800"))
Dalam contoh di atas, kita membuat data dengan dua variabel: sex
dan weight
. Kemudian, kita menggunakan fungsi ggqqplot
untuk membuat plot kuantil-kuantil dasar untuk variabel weight
. Selanjutnya, kita mengubah warna dan bentuk titik berdasarkan group ("sex"
).
Kesimpulan
Dalam artikel ini, kita membahas bagaimana menggunakan fungsi ggqqplot
dari paket ggpubr
di R untuk membuat plot kuantil-kuantil. Fungsi ini sangat berguna dalam analisis statistik untuk membandingkan distribusi variabel yang ditelaah dengan distribusi hipotesis. Dengan menggunakan argumen yang tepat, kita dapat menyesuaikan plot sesuai kebutuhan.