Scatterplot adalah salah satu jenis visualisasi data yang paling umum digunakan untuk menggambarkan hubungan antara dua variabel. Dalam artikel ini, kita akan membahas tentang bagaimana scatterplot dapat digunakan untuk menggambarkan data dan mengetahui apakah terdapat outliers dalam data.
Konsentrasi atau Persebaran Data Points
Data points dalam scatterplot dapat berada sangat dekat satu sama lain (Chart 5.6.4, Part A) atau tersebar luas di area grafik (Chart 5.6.4, Part B). Dalam Chart 5.6.4, terlihat bahwa beberapa data points berada pada titik pusat, sedangkan yang lainnya tersebar lebih jauh.
Tabel Data untuk Chart 5.6.4
Berikut adalah tabel data untuk Chart 5.6.4:
Variable X1 (Part A) | Variable Y1 (Part A) | Variable X2 (Part B) | Variable Y2 (Part B) |
---|---|---|---|
44 | 51 | 4 | 37 |
42 | 51 | 25 | 32 |
48 | 51 | 64 | 60 |
49 | 46 | 15 | 18 |
38 | 46 | 51 | 18 |
41 | 52 | 60 | 54 |
55 | 51 | 20 | 70 |
50 | 58 | 35 | 24 |
54 | 41 | 15 | 55 |
59 | 48 | 47 | 62 |
42 | 49 | 62 | 13 |
55 | 49 | 35 | 6 |
52 | 46 | 60 | 81 |
46 | 57 | 65 | 16 |
55 | 52 | 70 | 65 |
Keberadaan Outliers
Selain digunakan untuk menggambarkan hubungan antara variabel, scatterplot juga dapat menunjukkan apakah terdapat outliers dalam data. Outliers adalah titik-titik data yang sangat jauh dari titik-titik lainnya dalam dataset, seperti dua titik merah pada Chart 5.6.5.
Tabel Data untuk Chart 5.6.5
Berikut adalah tabel data untuk Chart 5.6.5:
Variable X | Variable Y | Symbol |
---|---|---|
0 | -1 | Black circle |
7 | 1 | Black circle |
13 | 32 | Black circle |
15 | 83 | Red triangle (potential outlier) |
20 | 28 | Black circle |
27 | 5 | Black circle |
28 | 95 | Red triangle (potential outlier) |
33 | 30 | Black circle |
40 | 46 | Black circle |
47 | 29 | Black circle |
53 | 41 | Black circle |
60 | 46 | Black circle |
67 | 29 | Black circle |
73 | 54 | Black circle |
80 | 52 | Black circle |
87 | 63 | Black circle |
93 | 59 | Black circle |
100 | 82 | Black circle |
Dalam chart ini, terlihat bahwa dua titik berwarna merah (outliers) sangat jauh dari titik-titik lainnya dalam dataset.
Konklusi
Scatterplot adalah salah satu jenis visualisasi data yang paling umum digunakan untuk menggambarkan hubungan antara dua variabel. Selain itu, scatterplot juga dapat menunjukkan apakah terdapat outliers dalam data. Oleh karena itu, scatterplot dapat membantu kita memahami lebih lanjut tentang data dan membuat keputusan yang lebih baik.
Tanggal Perubahan: 2021-09-02