Dalam statistik, distribusi bell-curve atau distribusi normal adalah salah satu distribusi yang paling penting. Distribusi ini memiliki mean (rata-rata) 0 dan deviasi standar 1. Dalam hal ini, kita akan membahas tentang cara menghitung quantile dari distribusi normal ini dan membuat plotting untuk memahami distribusi data.
Quantile adalah titik di mana sebagian besar data terletak. Misalnya, 0,5 quantile atau 50th percentile adalah 0, yang berarti separuh data terletak di bawah nilai 0. Kita juga dapat menemukan 0,95 quantile atau 95th percentile yang sekitar 1,64, yang berarti 95% data terletak di bawah nilai tersebut.
Dalam R, kita dapat menghitung quantile dari distribusi normal menggunakan fungsi qnorm()
. Contohnya, kita dapat membuat tabel quantile dari 0,01 hingga 0,99 dengan increment 0,01:
qnorm(seq(0.01,0.99,0.01))
Kita juga dapat menghasilkan data acak dari distribusi normal dan kemudian menemukan quantile menggunakan fungsi quantile()
:
quantile(rnorm(200), probs = seq(0.01,0.99,0.01))
Plotting Quantile (QQ plot) adalah salah satu cara untuk memahami distribusi data. Plot ini dibuat dengan mengurutkan data dalam urutan ascending dan kemudian mengplotnya terhadap quantile yang dihitung dari distribusi teoretis. Fungsi qqnorm()
dan qqplot()
dalam R digunakan untuk membuat plotting quantile.
Dalam R, kita dapat membuat plot normal QQ dengan menggunakan fungsi qqnorm()
. Contohnya, kita dapat membuat plot normal QQ dari data Height dalam dataset trees yang berasal dari R. Plot ini menunjukkan bahwa data Height terlihat seperti datang dari distribusi normal.
Plotting quantile untuk distribusi lainnya juga dapat dibuat dengan menggunakan fungsi qqplot()
. Misalnya, kita dapat membuat plot uniform (0,1) untuk memahami apakah data randu terlihat seperti datang dari distribusi uniform. Plot ini menunjukkan bahwa data randu terlihat seperti datang dari distribusi uniform.
Namun, jika data tidak berada pada garis lurus, maka kita dapat menginfer apakah data memiliki distribusi yang berbeda dengan distribusi normal. Contohnya, kita dapat membuat plot chi-square vs normal untuk mengetahui apakah data terlihat seperti datang dari distribusi skewed right.
Dalam akhirnya, analisis distribusi bell-curve dan plotting quantile dapat membantu kita memahami distribusi data dan menginfer apakah data memiliki distribusi yang berbeda dengan distribusi normal.