Scatter Plot dengan Variabel Ketiga

Scatter Plot dengan Variabel Ketiga

Salah satu modifikasi yang paling umum dari scatter plot dasar adalah penambahan variabel ketiga. Nilai dari variabel ketiga dapat ditekan melalui perubahan cara memplot titik. Untuk variabel ketiga yang menunjukkan nilai kategori (seperti wilayah geografis atau gender), encoding paling umum adalah dengan warna titik. Dengan memberikan tiap titik warna yang unik, Anda dapat dengan mudah menunjukkan anggota masing-masing titik ke dalam grup.

Contohnya, jika kita ingin menampilkan tipe pohon (Fersons dan Miltons), maka kita dapat menggunakan warna untuk menunjukkan perbedaan antara keduanya. Warna yellow dapat digunakan untuk Fersons yang lebih lebar tetapi juga lebih pendek untuk diameter yang sama. Pada dasarnya, warna blue dapat digunakan untuk Miltons.

Selain warna, opsi encoding lainnya adalah bentuk. Namun, perlu diingat bahwa bentuk dapat memiliki ukuran dan luas permukaan yang berbeda, sehingga dapat mempengaruhi bagaimana grup dipersepsikan. Walaupun demikian, dalam kasus-kasus tertentu di mana warna tidak dapat digunakan (seperti cetak), bentuk mungkin menjadi pilihan terbaik untuk membedakan antara grup.

Bentuk-bentuk di atas telah diasumsi agar memiliki luas permukaan yang sama dan berisi warna yang sama.

Variabel Numetik

Untuk variabel ketiga yang memiliki nilai numerik, encoding umum datang dari mengubah ukuran titik. Scatter plot dengan ukuran titik berdasarkan variabel ketiga memanggil dirinya sendiri sebagai chart bubble. Ukuran titik yang lebih besar menunjukkan nilai yang lebih tinggi.

Alternatif lainnya adalah menggunakan warna untuk mendepiktakan nilai numerik. Alas, bukannya menggunakan warna yang unik untuk titik seperti pada kasus kategori, kita ingin menggunakan berbagai warna secara terus menerus sehingga warna yang lebih gelap menunjukkan nilai yang lebih tinggi.

Perlu diingat bahwa legend sangat penting untuk interpretasi variabel ketiga, karena mata kita kurang dapat membedakan ukuran dan warna dengan mudah seperti posisi.

Highlight menggunakan Anotasi dan Warna

Jika Anda ingin menggunakan scatter plot untuk menampilkan insight, maka bagus jika Anda menggunakan anotasi dan warna untuk memfokuskan titik yang berharga. Desaturasi titik yang tidak signifikan membuat titik lainnya menjadi lebih terang, dan memberikan referensi untuk membandingkan titik lainnya dengan titik tersebut.

Scatter Map

Ketika dua variabel dalam scatter plot adalah koordinat geografis – latitude dan longitude – maka kita dapat menempatkan titik-titik pada peta untuk mendapatkan scatter map (dikenal juga sebagai dot map). Hal ini dapat sangat berguna ketika konteks geografisnya bermanfaat untuk menarik kesimpulan tertentu, dan dapat digabung dengan encoding variabel ketiga lainnya seperti ukuran titik dan warna.

Contohnya yang terkenal adalah peta kejadian cholera John Snow tahun 1854, menunjukkan bahwa kejadian-kejadian cholera (baris hitam) berpusat di sekitar sebuah sumur air pada Jalan Broad (titik tengah). Original: Wikimedia Commons

Heatmap

Seperti yang disebutkan di atas, heatmap dapat menjadi alternatif yang baik untuk scatter plot ketika ada banyak titik data yang perlu dipplot dan kepadatannya menyebabkan masalah overplotting. Namun, heatmap juga dapat digunakan dalam cara yang serupa untuk menunjukkan hubungan antara variabel ketika salah satu atau keduanya tidak berupa nilai numerik. Jika kita mencoba menampilkan nilai diskret dengan scatter plot, maka semua titik dari level yang sama akan berada di garis lurus.

Heatmap dapat mengatasi masalah overplotting ini dengan membungkus nilai menjadi kotak-kotak hitungan.

Connected Scatter Plot

Jika variabel ketiga yang kita ingin tambahkan pada scatter plot menunjukkan timestamps, maka chart type yang kita pilih adalah connected scatter plot. Sebaliknya, kita menggunakan garis-garis untuk menghubungkan pengamatan-pengamatan sehingga dapat dengan mudah melihat bagaimana dua variabel utama tidak hanya berhubungan antara satu sama lain, tapi juga bagaimana mereka berubah seiring waktu.

Kesimpulan

Dalam artikel ini, kita telah membahas tentang scatter plot dan cara-cara yang digunakan untuk menambahkan variabel ketiga. Kita telah melihat bagaimana encoding warna dan bentuk dapat digunakan untuk membedakan antara grup, serta bagaimana heatmap dapat digunakan untuk mengatasi masalah overplotting. Kita juga telah membahas tentang cara-cara lainnya yang dapat digunakan untuk memfokuskan titik-titik yang berharga dan menampilkan insight dengan lebih jelas.