Penggunaan Quantile dan Plotting untuk Menguji Asumsi Normalitas

Penggunaan Quantile dan Plotting untuk Menguji Asumsi Normalitas

Dalam analisis statistik, asumsi normalitas adalah salah satu asumsi yang paling penting. Dalam beberapa kasus, kita perlu menguji apakah data kita memenuhi asumsi normalitas atau tidak. Salah satu cara untuk melakukan hal ini adalah dengan menggunakan quantile dan plotting.

Quantile

Quantile adalah suatu nilai yang menunjukkan bagian tertentu dari data. Misalnya, jika kita memiliki 100 data, maka quantile 0,05 akan menunjukkan nilai yang terkecil di antara 5% data yang paling kecil. Dalam R, kita dapat menggunakan fungsi quantile() untuk mencari quantile.

Contoh:

quantile(rnorm(200), probs = seq(0.01, 0.99, 0.01))

Dalam contoh di atas, kita akan mencari quantile dari 200 data acak yang dihasilkan oleh fungsi rnorm(). Quantile ini akan menunjukkan bagian tertentu dari data.

Plotting

Plotting adalah salah satu cara untuk menguji asumsi normalitas. Salah satu jenis plotting yang paling populer adalah plot Q-Q (Quantile-Quantile).

Dalam R, kita dapat menggunakan fungsi qqnorm() dan qqplot() untuk membuat plot Q-Q.

Contoh:

qqnorm(trees$Height)

Dalam contoh di atas, kita akan membuat plot Q-Q dari data Height pada dataset trees. Plot ini akan menunjukkan bagian tertentu dari data yang dipermudah secara logaritmik.

Menguji Asumsi Normalitas

Plot Q-Q dapat digunakan untuk menguji asumsi normalitas. Jika data kita memenuhi asumsi normalitas, maka plot Q-Q akan berbentuk lurus. Sebaliknya, jika data kita tidak memenuhi asumsi normalitas, maka plot Q-Q akan berbentuk kurva.

Contoh:

qqplot(randu$x, y = qunif(ppoints(length(randu$x))))

Dalam contoh di atas, kita akan membuat plot Q-Q dari data acak yang dihasilkan oleh fungsi randu. Plot ini menunjukkan bahwa data tersebut memenuhi asumsi normalitas.

Namun, tidak semua data memenuhi asumsi normalitas. Jika data kita tidak memenuhi asumsi normalitas, maka plot Q-Q akan berbentuk kurva. Contoh:

qqplot(qnorm(ppoints(30)), qchisq(ppoints(30), df = 3))

Dalam contoh di atas, kita akan membuat plot Q-Q dari data yang dihasilkan oleh distribusi chi-square dengan 3 derajat kebebasan. Plot ini menunjukkan bahwa data tersebut tidak memenuhi asumsi normalitas.

Jadi, dalam analisis statistik, penggunaan quantile dan plotting dapat membantu kita menguji asumsi normalitas. Dengan demikian, kita dapat lebih yakin dalam membuat keputusan yang sesuai dengan data kita.