Mengatasi Heteroskedastisitas dalam Regresi Linear: Contoh dengan Stata

Mengatasi Heteroskedastisitas dalam Regresi Linear: Contoh dengan Stata

Dalam statistik, heteroskedastisitas adalah fenomena di mana varians residu tidak konstan, yang berarti bahwa asumsi standar dari regresi linear (OLS) tidak terpenuhi. Hal ini dapat menyebabkan estimasi parameter yang salah dan hasil inferensi yang keliru.

Dalam Stata, kita dapat mengatasi heteroskedastisitas dengan menggunakan command hetregress. Command ini memungkinkan kita untuk memodelkan varian sebagai fungsi eksponensial dari kovariat yang diketahui.

Contoh

Kita akan membangun model regresi linear untuk menghubungkan prestasi siswa (GPA) dengan variabel lain seperti:

  • Tingkat hadirannya (attend)
  • Tingkat grade level (grade)
  • Partisipasinya dalam olahraga (sports)
  • Partisipasinya dalam kegiatan ekstra-kurikuler (extra)
  • Pemilihan mata pelajaran lanjutan (ap)
  • Jenis kelamin (boy)
  • Tingkat pendidikan orang tua (pedu)

Kita dapat menghitung model ini dengan menggunakan command regress sebagai berikut:

. regress gpa attend i.(grade sports extra ap boy pedu)

Namun, setelah kita memfiturkan model, kita menemukan indikasi heteroskedastisitas menggunakan command estat hettest. Kita memiliki suspek bahwa varian meningkat seiring dengan tingkat grade level siswa.

Karena itu, kita refit model dengan menggunakan command hetregress sebagai berikut:

. hetregress gpa attend i.(grade sports extra ap boy pedu)

Command hetregress memungkinkan kita untuk memodelkan varian sebagai fungsi eksponensial dari kovariat yang diketahui.

Hasil

Berikut adalah hasil dari model regresi linear dengan heteroskedastisitas:

Coef
gpa:
lnsigma2:

Kita dapat melihat bahwa koefisien varian (lnsigma2) meningkat seiring dengan tingkat grade level siswa. Hal ini menunjukkan bahwa varian meningkat seiring dengan tingkat grade level siswa.

Pada bagian bawah tabel, kita juga dapat melihat hasil likelihood-ratio test yang menunjukkan bahwa model varian kita lebih baik daripada model varian konstan.

Kesimpulan

Dalam contoh ini, kita telah menggunakan command hetregress untuk mengatasi heteroskedastisitas dalam regresi linear dengan Stata. Kita dapat melihat bahwa memodelkan varian sebagai fungsi eksponensial dari kovariat yang diketahui dapat membantu kita dalam meningkatkan akurasi model dan hasil inferensi.