Mengoptimalkan Prediksi dan Analisis Regresi dengan Normal Probability Plot

Mengoptimalkan Prediksi dan Analisis Regresi dengan Normal Probability Plot

Dalam analisis regresi, kita seringkali dihadapkan pada masalah normalitas data. Dalam kasus ini, kita memiliki dataset yang berisi data kecepatan dan jarak berhenti. Kita telah melalui proses fitting model regresi linear dan mencoba untuk memprediksi nilai jarak berhenti berdasarkan kecepatan.

Dalam tabel di atas, kita dapat melihat bahwa predicted values dan prediction intervals yang diperoleh dengan cara menghitung square dari hasil regresi (yaitu transformasi balik ke skala data asli). Hal ini menunjukkan bahwa prediksi nilai jarak berhenti lebih dekat dengan pola rata-rata dalam scatterplot kecepatan dan jarak berhenti.

Namun, perlu diingat bahwa assumption normalitas data masih perlu diuji. Salah satu cara untuk melakukan hal itu adalah dengan menggunakan plot probability normal residuals (PPN). Plot ini membantu kita mengetahui apakah error terms yang digunakan dalam model regresi linear mempunyai distribusi normal atau tidak.

Menggunakan Normal Probability Plot

Normal probability plot of residuals adalah scatter plot yang memiliki theoretical percentiles dari distribusi normal pada sumbu x dan sample percentiles dari residuals pada sumbu y. Dalam contoh di atas, kita dapat melihat bahwa relationship antara theoretical percentiles dan sample percentiles lebih dekat dengan garis diagonal.

Garis diagonal ini membantu kita dalam mengevaluasi apakah hubungan antara theoretical percentiles dan sample percentiles linear atau tidak. Karena plot ini menunjukkan hubungan yang relatif linear, maka dapat disimpulkan bahwa error terms memiliki distribusi normal.

Penggunaan Normal Probability Plot dalam Analisis Regresi

Normal probability plot of residuals sering digunakan sebagai salah satu cara untuk memastikan apakah asumsi normalitas data terpenuhi. Dalam analisis regresi linear, asumsi normalitas data sangat penting karena error terms harus memiliki distribusi normal.

Dengan menggunakan normal probability plot, kita dapat mengetahui apakah assumption normalitas data terpenuhi atau tidak. Jika plot ini menunjukkan hubungan yang relatif linear, maka kita dapat yakin bahwa error terms memiliki distribusi normal dan model regresi linear yang digunakan adalah valid.

Contoh Normal Probability Plot

Berikut adalah contoh-contoh dari plot probability normal residuals (PPN) dan apa yang ditunjukkan oleh masing-masing:

  • Dalam contoh di atas, kita dapat melihat bahwa relationship antara theoretical percentiles dan sample percentiles lebih dekat dengan garis diagonal. Hal ini menunjukkan bahwa error terms memiliki distribusi normal.
  • Contoh lainnya menunjukkan bahwa plot PPN dapat membantu kita dalam mengetahui apakah assumption normalitas data terpenuhi atau tidak.

Dalam kesimpulan, normal probability plot of residuals adalah alat yang sangat berguna dalam analisis regresi untuk memastikan apakah asumsi normalitas data terpenuhi. Dengan menggunakan plot ini, kita dapat mengetahui apakah error terms memiliki distribusi normal dan model regresi linear yang digunakan adalah valid.

Leave a comment