Dalam statistik, heteroskedastisitas adalah fenomena di mana varians residu tidak konstan, yang berarti bahwa asumsi standar dari regresi linear (OLS) tidak terpenuhi. Hal ini dapat menyebabkan estimasi parameter yang salah dan hasil inferensi yang keliru.
Dalam Stata, kita dapat mengatasi heteroskedastisitas dengan menggunakan command hetregress
. Command ini memungkinkan kita untuk memodelkan varian sebagai fungsi eksponensial dari kovariat yang diketahui.
Contoh
Kita akan membangun model regresi linear untuk menghubungkan prestasi siswa (GPA) dengan variabel lain seperti:
- Tingkat hadirannya (attend)
- Tingkat grade level (grade)
- Partisipasinya dalam olahraga (sports)
- Partisipasinya dalam kegiatan ekstra-kurikuler (extra)
- Pemilihan mata pelajaran lanjutan (ap)
- Jenis kelamin (boy)
- Tingkat pendidikan orang tua (pedu)
Kita dapat menghitung model ini dengan menggunakan command regress
sebagai berikut:
. regress gpa attend i.(grade sports extra ap boy pedu)
Namun, setelah kita memfiturkan model, kita menemukan indikasi heteroskedastisitas menggunakan command estat hettest
. Kita memiliki suspek bahwa varian meningkat seiring dengan tingkat grade level siswa.
Karena itu, kita refit model dengan menggunakan command hetregress
sebagai berikut:
. hetregress gpa attend i.(grade sports extra ap boy pedu)
Command hetregress
memungkinkan kita untuk memodelkan varian sebagai fungsi eksponensial dari kovariat yang diketahui.
Hasil
Berikut adalah hasil dari model regresi linear dengan heteroskedastisitas:
Coef | |
---|---|
gpa: | … |
lnsigma2: | … |
Kita dapat melihat bahwa koefisien varian (lnsigma2) meningkat seiring dengan tingkat grade level siswa. Hal ini menunjukkan bahwa varian meningkat seiring dengan tingkat grade level siswa.
Pada bagian bawah tabel, kita juga dapat melihat hasil likelihood-ratio test yang menunjukkan bahwa model varian kita lebih baik daripada model varian konstan.
Kesimpulan
Dalam contoh ini, kita telah menggunakan command hetregress
untuk mengatasi heteroskedastisitas dalam regresi linear dengan Stata. Kita dapat melihat bahwa memodelkan varian sebagai fungsi eksponensial dari kovariat yang diketahui dapat membantu kita dalam meningkatkan akurasi model dan hasil inferensi.