Hubungan Linear dan Outlier dalam Analisis Data

Hubungan Linear dan Outlier dalam Analisis Data

Dalam analisis data, hubungan linear antara variabel dependen dan independen adalah suatu konsep yang penting. Dalam artikel ini, kita akan membahas tentang hubungan linear, outliers, dan bagaimana kedua hal itu mempengaruhi hasil analisis.

Hubungan Linear Kuat

Dalam diagram scatterplot, jika semua titik data sangat ketat berkelompok, maka tidak ada outlier yang signifikan. Dalam kasus seperti ini, data menunjukkan hubungan linear kuat. Jika data memiliki beberapa atau banyak outlier yang jauh dari trend line, maka data menunjukkan hubungan linear moderat.

Hubungan Linear Sedang

Jika data memiliki beberapa atau banyak outlier, maka hubungan linear menjadi lemah. Sebaliknya, jika tidak ada outlier dan semua titik data sangat ketat berkelompok, maka hubungan linear kuat.

Outliers

Sebuah outlier adalah titik data yang jauh dari trend line. Jika terdapat beberapa atau banyak outlier, maka hubungan linear menjadi lemah. Sebaliknya, jika tidak ada outlier dan semua titik data sangat ketat berkelompok, maka hubungan linear kuat.

Contoh

Mari kita lihat contoh bagaimana hubungan linear dan outliers mempengaruhi hasil analisis. Dalam scatterplot di bawah ini, kita dapat melihat bahwa data memiliki hubungan linear moderat dengan beberapa outlier yang jauh dari trend line.

5090

5092
5094
5096
5105
5111
5123
5135
5147
5161
5179

Leave a comment