Heteroskedastisitas dalam Analisis Regresi: Apa Itu dan Bagaimana Membuat Scatter Plot

Heteroskedastisitas dalam Analisis Regresi: Apa Itu dan Bagaimana Membuat Scatter Plot

Dalam analisis regresi, heteroskedastisitas adalah kondisi dimana variansi atau keseruan dari residual (bagian yang tidak dijelaskan oleh model) berbeda-beda pada setiap titik data. Kondisi ini dapat menyebabkan model regresi menjadi tidak efektif dan hasil analisis menjadi tidak reliabel. Oleh karena itu, deteksi heteroskedastisitas adalah langkah penting dalam proses analisis.

Dalam artikel ini, kita akan membahas konsep heteroskedastisitas, bagaimana membuat scatter plot untuk menentukan adanya heteroskedastisitas, serta contoh aplikasinya dalam analisis regresi.

Apa Itu Heteroskedastisitas?

Heteroskedastisitas adalah kondisi dimana variansi residual tidak konstan pada setiap titik data. Pada umumnya, model regresi asumsikan bahwa residual memiliki variansi yang konstan dan normal. Namun, dalam kenyataan, variansi residual dapat berbeda-beda tergantung pada nilai independen atau variasi lainnya.

Heteroskedastisitas dapat menyebabkan beberapa masalah, seperti:

  1. Peningkatan bias model regresi
  2. Peningkatan variancia estimasi parameter model
  3. Keputusan yang tidak reliabel

Membuat Scatter Plot untuk Menentukan Adanya Heteroskedastisitas

Scatter plot adalah salah satu cara untuk menentukan adanya heteroskedastisitas. Dalam scatter plot, kita dapat melihat apakah variansi residual berbeda-beda pada setiap titik data.

Berikut adalah langkah-langkah membuat scatter plot untuk menentukan adanya heteroskedastisitas:

  1. Buatlah scatter plot antara independen (x-axis) dan dependen (y-axis).
  2. Lakukan pengujian goodness-of-fit, seperti R-squared atau F-statistic.
  3. Jika hasil pengujian tidak memenuhi asumsi normalitas dan konstan variansi residual, maka kemungkinan besar adanya heteroskedastisitas.

Contoh Aplikasinya dalam Analisis Regresi

Berikut adalah contoh aplikasinya dalam analisis regresi:

Misalkan kita memiliki data sebagai berikut:

Income Price
50,000 100
60,000 120
70,000 140

Dalam kasus ini, kita ingin mengetahui apakah harga rumah (Price) tergantung pada pendapatan (Income). Kita dapat membuat scatter plot antara Income dan Price untuk menentukan adanya heteroskedastisitas.

Dalam scatter plot, jika variansi residual tidak konstan pada setiap titik data, maka kita dapat mengklaim bahwa ada heteroskedastisitas. Dalam hal ini, kita dapat menggunakan teknik transformasi data, seperti log-transformation atau Box-Cox transformation, untuk membuat model regresi lebih sesuai.

Referensi

  • Lecture 8: Heteroskedasticity – Arizona State University (ASU Home > My ASU > Colleges and Schools > Sign In)
  • [PDF] Heteroskedastisitas dan Cara Mengaturnya dalam Regresi Linear (Journal of Statistics Education)

Dengan demikian, kita dapat mengetahui apakah terdapat heteroskedastisitas dalam data regresi dan bagaimana cara membuat scatter plot untuk deteksi heteroskedastisitas. Kita juga dapat melihat contoh aplikasinya dalam analisis regresi.