Heteroskedastisitas adalah situasi di mana varians residu tidak sama sepanjang rentang nilai yang diukur. Ketika menjalankan analisis regresi, heteroskedastisitas menyebabkan scatter residu tidak seragam (juga dikenal sebagai error term).
Dalam statistik, heteroskedastisitas dilihat sebagai masalah karena regresi yang melibatkan metode terkecil (OLS) asumsikan bahwa residu-diri ditiriskan dari populasi dengan varians konstan. Jika ada scatter residu tidak seragam, populasi yang digunakan dalam regresi mengandung varians tidak sama, dan akibatnya hasil analisis mungkin menjadi tidak valid.
Analisis Heteroskedastisitas
Untuk mencari heteroskedastisitas, diperlukan untuk terlebih dahulu menjalankan regresi dan menganalisis residu. Salah satu cara paling umum untuk mengetahui adanya heteroskedastisitas adalah dengan membuat plot grafik dari residu.
Secara visual, jika tampak seperti fan atau cone dalam plot residu, maka indikator adanya heteroskedastisitas. Selain itu, regresi dengan heteroskedastisitas menunjukkan pola di mana varians residu meningkat seiring nilai yang diprediksi.
Tipe Heteroskedastisitas
Heteroskedastisitas dapat dikategorikan menjadi dua jenis: pure dan impure. Pure heteroskedastisitas mengacu pada situasi di mana jumlah independent variable yang benar digunakan, tetapi plot residu menunjukkan varians tidak sama.
Impure heteroskedastisitas mengacu pada situasi di mana jumlah independent variable yang salah digunakan (dikenal sebagai model misspecification). Dalam kasus ini, regresi mungkin memiliki jumlah variable terlalu sedikit (underspecified) atau terlalu banyak (overspecified). Sebagaimana itu, hasil regresi akan mengandung varians tidak sama.
Penyebab Heteroskedastisitas
Ada beberapa alasan mengapa heteroskedastisitas mungkin terjadi dalam model regresi, tetapi biasanya melibatkan masalah dengan dataset. Contohnya, model yang melibatkan rentang nilai yang luas lebih cenderung memiliki heteroskedastisitas karena perbedaan antara nilai terkecil dan terbesar.
Dalam analisis regresi, diperlukan untuk memastikan bahwa residu memiliki varians konstan. Jika residu memiliki varians tidak sama, maka indikator adanya heteroskedastisitas.
Contoh Heteroskedastisitas dalam Dunia Nyata
Contoh heteroskedastisitas yang umum adalah hubungan antara pengeluaran makanan dan pendapatan. Bagi mereka dengan pendapatan lebih rendah, pengeluaran makanan seringkali terbatas berdasarkan budget.
Seiring pendapatan meningkat, orang-orang cenderung menghabiskan lebih banyak pada makanan karena memiliki lebih banyak opsi dan batasan anggaran yang kurang. Bagi mereka dengan pendapatan lebih tinggi, mereka dapat mengakses berbagai jenis makanan dengan sangat sedikit batasan anggaran.
Dalam situasi seperti itu, varians pengeluaran makanan orang-orang yang lebih kaya relatif terhadap individu dengan pendapatan lebih rendah. Jika kita menjalankan regresi menggunakan dataset ini, kita akan menemukan adanya heteroskedastisitas.
Sumber Daya Tambahan
Terima kasih telah membaca panduan CFI tentang Heteroskedastisitas. Untuk membantu Anda menjadi analisis kelas dunia dan meningkatkan karier Anda hingga potensi penuh, sumber daya tambahan ini akan sangat bermanfaat:
- Kursus Dasar Statistika Gratis
- Homoskedastisitas
- Formula Varans
- Analisis Regresi
- Variabel Acak
Lihat semua sumber daya ilmu data.