Dalam analisis data, scatterplot adalah salah satu diagram yang paling populer digunakan untuk menampilkan hubungan antara dua variabel. Diagram ini dapat membantu dalam mengidentifikasi pola dan struktur data, serta menemukan keterkaitan antara dua variabel.
Diagram scatterplot terdiri dari beberapa titik data yang ditampilkan dalam ruang grafis dengan sumbu-X dan sumbu-Y. Setiap titik data mewakili nilai dari dua variabel yang dipertimbangkan. Dengan demikian, diagram ini dapat membantu dalam mengidentifikasi hubungan antara dua variabel, seperti keterkaitan positif, negatif, atau tidak adanya keterkaitan.
Konsentrasi atau Penyebaran Data
Data points dalam scatterplot dapat berdekatan (Chart 5.6.4, Part A) atau terpenyebaran luas di area grafis (Chart 5.6.4, Part B). Pada Chart 5.6.4, kita dapat melihat bahwa data points pada bagian A terkoncentrasikan lebih ke kiri, sedangkan bagian B terpenyebaran luas.
Tabel Data untuk Chart 5.6.4
Variable X1 (Part A) | Variable Y1 (Part A) | Variable X2 (Part B) | Variable Y2 (Part B) |
---|---|---|---|
44 | 51 | 4 | 37 |
42 | 51 | 25 | 32 |
48 | 51 | 64 | 60 |
… | … | … | … |
Keberadaan Outlier
Selain menampilkan hubungan antara dua variabel, scatterplot juga dapat menunjukkan apakah ada outlier dalam data. Outliers adalah titik data yang jauh dari titik lainnya dalam dataset, seperti dua titik merah pada Chart 5.6.5.
Tabel Data untuk Chart 5.6.5
Variable X | Variable Y | Symbol |
---|---|---|
0 | -1 | Black circle |
7 | 1 | Black circle |
13 | 32 | Black circle |
… | … | … |
Pada tabel di atas, kita dapat melihat bahwa dua titik merah (Red triangle) terlihat sebagai outlier karena jauh dari titik lainnya. Dengan demikian, scatterplot dapat membantu dalam mengidentifikasi outlier dan memberikan informasi yang lebih akurat tentang dataset.
Dalam analisis data, scatterplot adalah salah satu diagram yang paling berguna untuk menampilkan hubungan antara dua variabel dan menemukan keterkaitan. Dengan menggunakan diagram ini, kita dapat mengidentifikasi pola dan struktur data, serta menemukan outlier dalam dataset.
Tanggal perbarui: 2021-09-02