Pendahuluan
Normal QQ-plot adalah sebuah plot probabilitas yang berguna untuk mengecek secara visual apakah distribusi sampel atau data mengikuti Distribusi tertentu dalam kasus pada artikel ini dicek apakah distribusi data mengikuti distribusi normal. Jika distribusi data mengikuti distribusi normal, maka sebaran data akan mengikuti garis referensi distribusi normal.
Artikel ini merupakan bagian dari seri artikel terkait Visualisasi data menggunakan paket bawaan R. Artikel lainnya dapat dibaca pada tautan di bawah ini.
Baca Juga: Visualisasi Data – R Base Graphs
Dataset
Dataset yang digunakan pada artikel ini adalah iris dataset. Untuk memuat dan mengecek struktur dataset, jalankan command berikut:
## Memuat dataset
head(iris) # mengecek 6 observasi pertama
str(iris) # mengecek struktur dataset
attach(iris) # menyisipkan dataset pada fungsi selanjutnya
Output:
len | supp | dose |
---|---|---|
4.2 | VC | 0.5 |
11.5 | VC | 0.5 |
7.3 | VC | 0.5 |
5.8 | VC | 0.5 |
6.4 | VC | 0.5 |
10.0 | VC | 0.5 |
Struktur dataset:
'data.frame': 150 obs. of 4 variables:
$ Sepal.Length: num 5.1 4.9 4.7 4.6 5.5 5.8 5.3 5.3 5.2 5.0 ...
$ Sepal.Width : num 3.5 3.5 3.4 3.4 3.4 3.4 3.4 3.4 3.4 3.5 ...
$ Petal.Length: num 1.4 1.4 1.7 1.6 1.4 1.7 1.4 1.5 1.6 1.5 ...
$ Petal.Width : num 0.2 0.2 0.3 0.2 0.2 0.2 0.2 0.2 0.2 0.2 ...
Membuat QQ Plots: qqnorm() dan qqline()
Untuk membuat normal QQ-plot pada paket bawaan R, dapat dilakukan dengan dua langkah. Langkah pertama membuat normal QQ-plot pada data menggunakan fungsi qqnorm()
. Langkah selanjutnya membuat garis referensi distribusi normal menggunakan qqline()
sebagai garis referensi teoritis distribusi normal. Jika data tidak berdistribusi normal, maka distribusi data tidak mengikuti garis referensinya.
Untuk membuat QQ-plot, jalankan command berikut:
## Membuat QQ Plots: qqnorm() dan qqline()
qqnorm(Sepal.Length, pch = 1) # membuat normal QQ plot
qqline(Sepal.Length, col="red", lwd = 2) # menambahkan garis referensi
Output:
Gambar 1. QQ-Plots
Berdasarkan plot tersebut dapat dikatan bahwa distribusi variabel mengikuti distribusi normal. Hal tersebut dapat terlihat dari sebagian besar titik observasi yang mengikuti garis referensinya.
Membuat QQ Plots menggunakan Fungsi: car::qqPlot()
Metode lain yang dapat digunakan untuk membuat QQ-plot adalah menggunakan fungsi qqPlot()
pada paket car
. Plot yang dihasilkan bisa terbilang cukup lengkap karena pada plot akan ditampilkan QQ-plot variabel dan garis referensinya. Selain itu, pada plot akan ditampilkan garis confidence interval dari garis referensinya.
Untuk membuatnya, jalankan command berikut:
## Membuat QQ Plots: car::qqPlot()
library(car)
qqPlot(Sepal.Length)
Output:
Gambar 2. Gambar ulang Gambar 1
Berdasarkan hasil yang diperoleh dapat dipastikan bahwa distribusi yang dihasilkan berdistribusi normal meskipun sebagian kecil titik observasi telah melewati garis referensinya.
Kesimpulan
Dalam artikel ini, kita telah belajar tentang cara membuat QQ-plot pada paket bawaan R menggunakan fungsi qqnorm()
dan qqline()
, serta menggunakan fungsi qqPlot()
dari paket car
. Dengan menggunakan metode-metode tersebut, kita dapat mengecek apakah distribusi data mengikuti distribusi normal atau tidak.