Saat menggunakan scatter plot untuk memahami hubungan prediktif atau korelasi antara variabel-variabel, biasanya ditambahkan garis trend yang menunjukkan fitur matematika terbaik ke data. Hal ini dapat memberikan signal tambahan tentang kuatnya hubungan antara dua variabel dan apakah ada titik-titik yang tidak normal yang mempengaruhi penghitungan garis trend.
Variabel Kategori Ketiga
Modifikasi umum dari scatter plot dasar adalah penambahan variabel ketiga. Nilai variabel ketiga dapat di-encode dengan mengubah cara plotting point-point. Untuk variabel kategori (seperti wilayah geografi atau gender), encoding yang paling umum adalah melalui warna point.
Contoh: Coloring points by tree type menunjukkan bahwa Fersons (yellow) biasanya lebih lebar daripada Miltons (blue), namun juga lebih pendek untuk diameter yang sama. Pilihan lain yang kadang-kadang ditemukan untuk encoding variabel ketiga adalah bentuk. Namun, dalam beberapa kasus di mana warna tidak dapat digunakan (seperti cetak), maka bentuk mungkin menjadi pilihan terbaik untuk membedakan antara grup.
Variabel Nominal Ketiga
Untuk variabel ketiga yang memiliki nilai nominal, encoding yang paling umum berasal dari perubahan ukuran point. Scatter plot dengan ukuran point berdasarkan variabel ketiga sebenarnya dikenal sebagai chart jenis "bubble chart". Ukuran point yang lebih besar menunjukkan nilai yang lebih tinggi.
Alternatif lain untuk encoding variabel nominal adalah menggunakan warna. Dalam hal ini, kita ingin menggunakan sequence warna kontinu sehingga warna yang gelap menunjukkan nilai yang lebih tinggi. Perlu diingat bahwa, dalam keduanya ukuran dan warna, legend penting untuk interpretasi variabel ketiga karena mata manusia tidak dapat dengan mudah membedakan ukuran dan warna.
Pemilihan Titik dengan Annotate dan Warna
Jika Anda ingin menggunakan scatter plot untuk menampilkan insights, maka baik-baik saja untuk meng-highlight titik-titik yang menarik melalui penggunaan annotate dan warna. Meredukat titik-titik yang tidak penting membuat titik-titik lainnya lebih tampak, serta memberikan referensi untuk membandingkan titik-titik lain dengan titik-titik yang lain.
Peta Scatter
Saat dua variabel pada scatter plot adalah koordinat geografi – latitude dan longitude – maka kita dapat menambahkan point-point pada peta untuk mendapatkan peta scatter (dikenal juga sebagai dot map). Hal ini dapat sangat membantu jika konteks geografis berguna untuk menggambar insights tertentu, serta dapat di-combination dengan encoding variabel ketiga lainnya seperti ukuran dan warna.
Contoh yang terkenal adalah peta cholera oleh John Snow pada tahun 1854, menunjukkan bahwa kasus-kasus cholera (bar-bar hitam) berpusat di sekitar air pump tertentu di Broad Street (titik tengah).
Heatmap
Seperti yang telah disebutkan di atas, heatmap dapat menjadi alternatif baik untuk scatter plot saat ada banyak titik data yang perlu dipplot dan kepadatan mereka menyebabkan masalah overplotting. Namun, heatmap juga dapat digunakan dalam cara yang sama untuk menunjukkan hubungan antara variabel ketika salah satu atau kedua variabel bukan kontinu dan nomial. Jika kita mencoba mendepiksi nilai discrete dengan scatter plot, maka semua titik dari level yang sama akan berada di garis lurus.
Scatter Plot Terhubung
Jika variabel ketiga yang ingin ditambahkan pada scatter plot menunjukkan timestamp, maka chart jenis yang dapat dipilih adalah scatter plot terhubung. Sebagai gantinya, kita menggunakan segmen garis untuk menghubungkan observasi-observasi dalam urutan waktu. Hal ini dapat membuatnya lebih mudah untuk melihat bagaimana dua variabel utama tidak hanya berhubungan dengan satu sama lain, tapi juga cara hubungan tersebut berubah seiring waktu.
Alat Visualisasi
Scatter plot adalah chart jenis dasar yang seharusnya dapat di-create oleh setiap alat visualisasi atau solusi. Penghitungan garis trend linear dasar juga pilihan yang cukup umum, serta penambahan warna pada point-point berdasarkan level variabel ketiga kategori. Pilihan lain yang kadang-kadang ditemukan untuk encoding variabel ketiga adalah bentuk.
Namun, dalam beberapa kasus, alat visualisasi mungkin tidak dapat memplot scatter plot dengan baik tanpa perluasan data atau penggunaan cara lainnya. Oleh karena itu, penting bagi Anda untuk memilih alat visualisasi yang tepat dan sesuai dengan kebutuhan Anda.