Penggunaan Scatter Plot dan Variabel Ketiga

Penggunaan Scatter Plot dan Variabel Ketiga

Dalam analisis data, scatter plot adalah salah satu cara yang paling populer untuk menunjukkan hubungan antara dua variabel. Namun, kadang-kadang kita perlu menambahkan variabel ketiga ke dalam diagram tersebut agar dapat membantu memahami lebih lanjut tentang hubungan antara dua variabel.

Highlighting dengan Annotation dan Warna

Jika kita ingin menggunakan scatter plot untuk menunjukkan insight, maka kita dapat menggunakkan annotation dan warna untuk memperhatikan titik-titik yang spesifik. Dengan demangan, kita dapat membuat point-point yang kurang penting menjadi tidak terlihat, sehingga point-point lainnya akan lebih mudah dipahami.

Scatter Map

Jika dua variabel dalam scatter plot adalah koordinat geografis – latitude dan longitude – maka kita dapat menumpangkan titik-titik pada peta untuk mendapatkan scatter map (dikenal juga sebagai dot map). Hal ini dapat menjadi sangat bermanfaat jika konteks geografis penting untuk menarik insight, serta dapat dikombinasikan dengan encoding lain seperti ukuran point dan warna.

Contoh yang terkenal dari scatter map adalah peta letak penyakit cholera pada tahun 1854 oleh John Snow, yang menunjukkan bahwa kasus-kasus penyakit (garis-garis hitam) berpusat sekitar sebuah sumur air di Jalan Broad Street (titik tengah).

Heatmap

Sebagai catatan, heatmap dapat menjadi alternatif yang baik untuk scatter plot ketika ada banyak titik data yang perlu dipplot dan kepadatan titik-titik tersebut menyebabkan masalah overplotting. Namun, heatmap juga dapat digunakan dalam cara yang serupa untuk menunjukkan hubungan antara variabel ketika salah satu atau kedua variabel bukan continuous dan numeric. Jika kita mencoba mendepikt discrete values dengan scatter plot, maka semua titik-titik level akan berada pada garis lurus.

Connected Scatter Plot

Jika variabel ketiga yang kita ingin tambahkan ke dalam scatter plot menunjukkan timestamp, maka salah satu jenis chart yang kita dapat pilih adalah connected scatter plot. Sebaliknya daripada memodifikasi bentuk titik-titik untuk menunjukkan tanggal, kita menggunakan garis-garis untuk menghubungkan observasi-observasi secara berurutan. Hal ini dapat membantu memahami bagaimana hubungan antara dua variabel tidak hanya terlihat, tetapi juga bagaimana hubungan tersebut berubah seiring waktu.

Alat Visualisasi

Scatter plot adalah chart type dasar yang harus dapat dihasilkan oleh setiap alat visualisasi atau solusi. Komputasi garis trend linear dasar juga adalah opsi yang umum, serta warna titik-titik menurut level-level variabel ketiga kategori. Opsi-opsi lainnya, seperti garis trend non-linear dan encoding nilai variabel ketiga dengan bentuk, tidak begitu sering ditemui. Namun, bahkan tanpa opsi-opsi tersebut, scatter plot dapat menjadi chart type yang berguna untuk digunakan jika kita ingin menemukan hubungan antara variabel-variabel numeric dalam data kita.

Alat Visualisasi Data

Scatter plot adalah salah satu dari berbagai chart type yang dapat digunakan untuk visualisasi data. Belajar lebih lanjut tentang chart type dasar dan bagaimana memilih tipe data visualisasi dengan membaca artikel kami tentang chart types, pemilihan tipe data visualisasi, atau dengan menjelajahi koleksi artikel kita di kategori chart.