Scatterplot adalah salah satu cara untuk menampilkan data multivariabel, yakni data yang melibatkan dua atau lebih variabel per individu. Dalam scatterplot, titik-titik mewakili individu, sedangkan koordinat setiap titik adalah nilai dari dua variabel tersebut untuk individu yang bersangkutan.
Deskripsi Scatterplots
Scatterplot memungkinkan kita melihat hubungan antara variabel. Apakah salah satu variabel cenderung lebih besar ketika lainnya juga besar? Apakah hubungan mengikuti garis lurus atau tidak? Adakah skater dalam salah satu variabel sama, terlepas dari nilai variabel lain?
Linearitas dan Nonlinearitas
Dalam contoh di atas, scatterplot menunjukkan hubungan linear antara variabel. Scatterplot relatif berbentuk bola sepak: titik-titik tidak berada tepat pada garis lurus, tetapi tersebar seimbang di sekitar garis tersebut. Namun, scatterplot lainnya dapat menunjukkan nonlinearitas, yakni pola hubungan antara variabel yang tidak linear – sehingga tidak mengikuti garis lurus.
Homoskedastisitas dan Heteroskedastisitas
Ketika skater dalam variabel Y relatif sama di vertikal slice melalui scatterplot, data dan scatterplot tersebut disebut homoskedastik (sama skater). Semua plot sebelumnya telah menunjukkan homoskedastisitas. Namun, scatterplot lainnya dapat menunjukkan heteroskedastisitas, yakni pola hubungan antara variabel yang tidak sama – sehingga skater dalam vertikal slice tergantung pada tempat pengambilan slice.
Outlier
Titik yang tidak sesuai dengan pola data overall atau yang sangat jauh dari bulk data disebut outlier. Contoh scatterplot di atas menunjukkan data dengan outlier besar.
Ringkasan
Data multivariabel adalah observasi dari dua atau lebih variabel per individu. Dua variabel pada saat bersamaan dapat diperlihatkan dalam scatterplot. Titik-titik dalam scatterplot mewakili individu, sedangkan koordinat setiap titik adalah nilai dari dua variabel tersebut untuk individu yang bersangkutan. Kriteria lainnya termasuk asosiasi antara variabel, homoskedastisitas, heteroskedastisitas, outlier, dan linearitas atau nonlinearitas.
Kata-kunci
- Asosiasi
- Bin
- Bivariate
- Chebychev's inequality
- Football-shaped
- Heteroskedastik
- Homoskedastik
- Horizontal slice
- Linear association
- Mean
- Multivariabel
- Nonlinearity
- Outlier
- Point of averages
- Positive association
- Scatterplot
- Vertical slice