Dalam dunia statistik dan analisis data, scatter plot adalah salah satu tool yang paling populer digunakan untuk menganalisis hubungan antara dua variabel numerik. Diagram ini sangat membantu dalam menggambarkan relasi antara dua variabel, serta memberikan signal tambahan tentang kekuatan hubungan antara keduanya dan apakah ada titik-titik yang tidak sesuai dengan perhitungan garis trend.
Categorical Third Variable
Salah satu modifikasi scatter plot yang paling umum adalah penambahan variabel ketiga yang berisi nilai kategorikal. Dalam hal ini, nilai variabel ketiga dapat di-encode dengan cara mengubah warna titik-titik dalam diagram. Contohnya, jika memiliki nilai kategori "jenis pohon", maka kita dapat memberikan warna yang berbeda untuk setiap jenis pohon.
Numeric Third Variable
Selain itu, scatter plot juga dapat digunakan untuk menampilkan hubungan antara dua variabel numerik dan sebuah variabel numerik lainnya. Salah satu cara yang paling umum adalah dengan mengubah ukuran titik-titik dalam diagram. Dalam hal ini, titik-titik yang lebih besar menunjukkan nilai yang lebih tinggi.
Highlight using annotations and color
Jika Anda ingin menggunakan scatter plot untuk memberikan insigtnya, maka Anda dapat menggunakan annotation dan warna untuk memperjelas beberapa titik yang paling menarik perhatian. Dengan mengurangi warna titik-titik yang tidak penting, maka Anda dapat membuat titik-titik lainnya menjadi lebih jelas dan memberikan referensi untuk membandingkan titik-titik lain dengan titik-titik tersebut.
Scatter Map
Dalam beberapa kasus, scatter plot juga dapat digunakan sebagai scatter map. Dalam hal ini, titik-titik dalam diagram diletakkan pada peta geografi, sehingga kita dapat memperjelas relasi antara dua variabel numerik dan lokasi geografis.
Heatmap
Selain itu, heatmap juga dapat dijadikan sebagai alternatif untuk scatter plot jika memiliki banyak titik data yang perlu dipplot. Dalam hal ini, heatmap dapat membantu mengatasi masalah overplotting dengan cara membagi nilai menjadi kotak-kotak yang berisi hitungan.
Connected Scatter Plot
Jika variabel ketiga Anda menunjukkan timestamps, maka Anda dapat menggunakan connected scatter plot sebagai alternatif. Dalam hal ini, garis-garis yang terhubung akan menampilkan hubungan antara dua variabel numerik dan bagaimana hubungan tersebut berubah seiring waktu.
Visualization Tools
Sebuah scatter plot adalah diagram dasar yang harus dapat dibuat oleh setiap tools visualisasi atau solusi. Perhitungan garis trend line linear juga umum digunakan, serta warna titik-titk menurut tingkat variabel ketiga kategori. Namun, beberapa pilihan lainnya seperti garis trend non-linear dan encoding nilai variabel ketiga dengan bentuk tidak begitu sering ditemui. Walaupun demikian, scatter plot masih dapat dijadikan sebagai diagram yang sangat berharga untuk digunakan dalam menginvestigasi relasi antara dua variabel numerik dalam data Anda.
Artikel ini adalah bagian dari seri tentang chart type yang paling penting dan cara memilih tipe data visualisasi. Untuk mengetahui lebih lanjut, silakan baca artikel-artikel lainnya di kategori "chart" atau "essential chart types".