Pengenalan Scatterplot

Pengenalan Scatterplot

Scatterplot adalah salah satu cara untuk menampilkan data multivariabel, yakni data yang melibatkan dua atau lebih variabel per individu. Dalam scatterplot, titik-titik mewakili individu, sedangkan koordinat setiap titik adalah nilai dari dua variabel tersebut untuk individu yang bersangkutan.

Deskripsi Scatterplots

Scatterplot memungkinkan kita melihat hubungan antara variabel. Apakah salah satu variabel cenderung lebih besar ketika lainnya juga besar? Apakah hubungan mengikuti garis lurus atau tidak? Adakah skater dalam salah satu variabel sama, terlepas dari nilai variabel lain?

Linearitas dan Nonlinearitas

Dalam contoh di atas, scatterplot menunjukkan hubungan linear antara variabel. Scatterplot relatif berbentuk bola sepak: titik-titik tidak berada tepat pada garis lurus, tetapi tersebar seimbang di sekitar garis tersebut. Namun, scatterplot lainnya dapat menunjukkan nonlinearitas, yakni pola hubungan antara variabel yang tidak linear – sehingga tidak mengikuti garis lurus.

Homoskedastisitas dan Heteroskedastisitas

Ketika skater dalam variabel Y relatif sama di vertikal slice melalui scatterplot, data dan scatterplot tersebut disebut homoskedastik (sama skater). Semua plot sebelumnya telah menunjukkan homoskedastisitas. Namun, scatterplot lainnya dapat menunjukkan heteroskedastisitas, yakni pola hubungan antara variabel yang tidak sama – sehingga skater dalam vertikal slice tergantung pada tempat pengambilan slice.

Outlier

Titik yang tidak sesuai dengan pola data overall atau yang sangat jauh dari bulk data disebut outlier. Contoh scatterplot di atas menunjukkan data dengan outlier besar.

Ringkasan

Data multivariabel adalah observasi dari dua atau lebih variabel per individu. Dua variabel pada saat bersamaan dapat diperlihatkan dalam scatterplot. Titik-titik dalam scatterplot mewakili individu, sedangkan koordinat setiap titik adalah nilai dari dua variabel tersebut untuk individu yang bersangkutan. Kriteria lainnya termasuk asosiasi antara variabel, homoskedastisitas, heteroskedastisitas, outlier, dan linearitas atau nonlinearitas.

Kata-kunci

  • Asosiasi
  • Bin
  • Bivariate
  • Chebychev's inequality
  • Football-shaped
  • Heteroskedastik
  • Homoskedastik
  • Horizontal slice
  • Linear association
  • Mean
  • Multivariabel
  • Nonlinearity
  • Outlier
  • Point of averages
  • Positive association
  • Scatterplot
  • Vertical slice

Leave a comment