Apabila kita ingin mengetahui tentang sifat distribusi data, maka salah satu cara yang paling efektif adalah dengan menggunakan plot kualitatif. Plot kualitatif yang paling populer digunakan adalah Q-Q plot atau Quantile-Quantile plot.
Q-Q plot berfungsi sebagai alat untuk membandingkan dua distribusi probability. Dalam hal ini, kita ingin mengetahui apakah titik data berada di garis lurus atau tidak. Jika titik data berada di garis lurus, maka kita dapat menginterpretasikan bahwa data tersebut memiliki distribusi yang sama dengan distribusi lainnya.
Namun, apabila titik data tidak berada di garis lurus, maka kita dapat menginferencesomething about our data. Dalam contoh di atas, kita akan melihat beberapa kasus yang menarik.
Pertama-tama, kita akan membuat plot Q-Q antara distribusi chi-square dengan 3 derajat kebebasan dan distribusi normal. Kita menggunakan fungsi qnorm
dan qchisq
untuk mendapatkan quantile dari kedua distribusi.
qqplot(qnorm(ppoints(30)), qchisq(ppoints(30), df=3))
Dalam plot di atas, kita melihat bahwa titik data membentuk kurva yang tidak lurus. Kita dapat menginferences that our sample data are skewed, atau memiliki distribusi yang tidak simetris.
Kedua, kita akan membuat plot Q-Q antara distribusi Cauchy dan distribusi normal. Kita menggunakan fungsi qnorm
dan qcauchy
untuk mendapatkan quantile dari kedua distribusi.
qqplot(qnorm(ppoints(30)), qcauchy(ppoints(30)))
Dalam plot di atas, kita melihat bahwa titik data membentuk garis lurus di tengah, namun memutar di bagian ekstrem. Kita dapat menginferences that our data have more extreme values than would be expected if they truly came from a normal distribution.
Dengan demikian, Q-Q plot menjadi alat yang efektif untuk mengetahui tentang sifat distribusi data dan dapat membantu kita dalam membuat keputusan yang lebih baik.