Dalam statistik, distribusi normal adalah salah satu bentuk distribusi yang paling penting dan sering digunakan dalam analisis data. Namun, bagaimana kita mengetahui apakah dataset kita berdistribusi normal atau tidak? Salah satu cara untuk mengetahui hal ini adalah dengan menggunakan plot Q-Q (Quantile-Quantile).
Plot Q-Q adalah sebuah plot yang digunakan untuk mengecek apakah dataset kita berasal dari distribusi teoritis. Dalam kebanyakan kasus, plot Q-Q digunakan untuk menentukan apakah dataset kita berdistribusi normal atau tidak.
Dengan menggunakan plot Q-Q, kita dapat melihat apakah titik observasi dalam dataset kita berada di sekitar garis diagonal lurus (straight line) yang melambangkan distribusi normal. Jika titik-titik tersebut terlihat lebih seragam dan berada di sekitar garis diagonal, maka kita dapat asumsikan bahwa dataset kita berdistribusi normal.
Pada bagian ini, kita akan membahas tentang plot Q-Q dan cara menggunakan plot ini untuk mengetahui apakah dataset kita berdistribusi normal atau tidak. Kita juga akan melihat contoh-contoh praktis dari plot Q-Q yang digunakan dalam R (R Programming Language).
Contoh 1: Plot Q-Q untuk Data Normal
Berikut adalah contoh kode R yang menunjukkan cara membuat dataset normal dengan 500 observasi dan membuat plot Q-Q untuk dataset tersebut:
#set.seed(1)
normal_data <- rnorm(500)
qqnorm(normal_data, main='Q-Q Plot of Normally Distributed Data')
Dari plot ini, kita dapat melihat bahwa titik-titik observasi terlihat lebih seragam dan berada di sekitar garis diagonal. Berdasarkan plot ini, kita dapat asumsikan bahwa dataset ini berdistribusi normal.
Contoh 2: Plot Q-Q untuk Data Left-Skewed
Berikut adalah contoh kode R yang menunjukkan cara membuat dataset left-skewed dengan 500 observasi dan membuat plot Q-Q untuk dataset tersebut:
#set.seed(1)
left_skewed <- rbeta(500,7,2)
qqnorm(left_skewed, main='Q-Q Plot of Left-Skewed Distribution')
Dari plot ini, kita dapat melihat bahwa titik-titik observasi memiliki "arch" di atas kiri plot, yang menunjukkan bahwa dataset ini berdistribusi left-skewed.
Contoh 3: Plot Q-Q untuk Data Right-Skewed
Berikut adalah contoh kode R yang menunjukkan cara membuat dataset right-skewed dengan 500 observasi dan membuat plot Q-Q untuk dataset tersebut:
#set.seed(1)
right_skewed <- rbeta(500,2,7)
qqnorm(right_skewed, main='Q-Q Plot of Right-Skewed Distribution')
Dari plot ini, kita dapat melihat bahwa titik-titik observasi memiliki "dip" di bawah kanan plot, yang menunjukkan bahwa dataset ini berdistribusi right-skewed.
Contoh 4: Plot Q-Q untuk Data Non-Normal
Berikut adalah contoh kode R yang menunjukkan cara membuat dataset non-normal dengan 200 observasi dan membuat plot Q-Q untuk dataset tersebut:
#set.seed(1)
exponential_data <- rexp(200, rate=5)
qqnorm(exponential_data, main='Q-Q Plot of Exponential Distribution')
Dari plot ini, kita dapat melihat bahwa titik-titik observasi tidak terlihat seragam dan berada di luar garis diagonal. Berdasarkan plot ini, kita dapat asumsikan bahwa dataset ini tidak berdistribusi normal.
Referensi:
- "QQ-plots: Quantile-Quantile plots – R Base Graphs"
- "The Complete Guide: How to Interpret Q-Q Plots – Statology"
Saya harap artikel ini membantu Anda memahami plot Q-Q dan cara menggunakan plot ini untuk mengetahui apakah dataset Anda berdistribusi normal atau tidak.