how exactly scatter diagram made and woks

how exactly scatter diagram made and woks

Ketika menggunakan plot skatter untuk meneliti hubungan prediktif atau korelasi antara variabel, biasanya ditambahkan garis trend yang menunjukkan kemiripan matematis terhadap data. Hal ini dapat memberikan sinyal tambahan tentang sekuatnya hubungan antara dua variabel dan apakah ada titik-titik tidak normal yang mempengaruhi penghitungan garis trend.

Modifikasi plot skatter yang umum adalah penambahan variabel ketiga. Nilai variabel ketiga dapat di-encode dengan cara mengubah cara penampilan titik. Untuk variabel ketiga kategori (seperti wilayah geografis atau gender), encoding yang paling umum adalah warna. Memberikan setiap titik warna unik membuatnya mudah menampilkan anggota masing-masing titik ke dalam kelompok.

Contoh: Pada gambar di atas, warna titik menunjukkan bahwa Fersons (kuning) umumnya lebih lebar daripada Miltons (biru), namun juga lebih pendek untuk diameter yang sama.

Peng-encoding nilai numerik variabel ketiga dapat dilakukan dengan cara mengubah ukuran titik. Plot skatter dengan ukuran titik berbasis variabel ketiga disebut sebagai chart bubble. Ukuran titik lebih besar menunjukkan nilai lebih tinggi. Diskusi lebih lanjut tentang bagaimana chart bubble harus dibuat dapat dibaca dalam artikel sendiri.

Warna juga dapat digunakan untuk mewakili nilai numerik sebagai alternatif lain. Dalam kasus ini, kita menggunakan warna berkelanjutan untuk menunjukkan nilai, sehingga contoh warna gelap menunjukkan nilai lebih tinggi. Perlu diingat bahwa legenda penting untuk interpretasi variabel ketiga, karena mata kita kurang dapat mendeteksi ukuran dan warna dengan mudah seperti posisi.

Highlight menggunakan annotation dan warna dapat digunakan untuk menampilkan penjelasan. Membuat titik tidak penting berwarna rendah membuat titik lainnya terlihat, dan memberikan referensi untuk membandingkan titik lainnya dengan titik yang ditentukan.

Plot skatter juga dapat digunakan untuk presentasi insights dengan menggunakan annotation dan warna. Membuat titik-titik tidak penting berwarna rendah membuat titik lainnya terlihat, dan memberikan referensi untuk membandingkan titik lainnya dengan titik yang ditentukan.

Scatter map dapat digunakan ketika dua variabel plot skatter adalah koordinat geografis – latitude dan longitude. Kita dapat menempelkan titik-titik pada peta untuk mendapatkan scatter map (dikenal sebagai dot map). Hal ini dapat sangat berguna jika konteks geografis penting untuk menarik kesimpulan, dan dapat digabungkan dengan encoding variabel ketiga lain seperti ukuran dan warna.

Contoh yang terkenal adalah peta cholera 1854 John Snow, menunjukkan bahwa kasus cholera (baris hitam) berpusat di sekitar pompa air pada Jalan Broad (titik tengah). Sumber asli: Wikimedia Commons

Heatmap dapat digunakan sebagai alternatif lain untuk plot skatter ketika terdapat banyak titik data yang perlu dipotong, dan kepadatan titiknya menyebabkan masalah overplotting. Namun, heatmap juga dapat digunakan dalam cara yang sama untuk menunjukkan hubungan antara variabel ketika salah satu atau kedua variabel tidak berbasis numerik.

Connected scatter plot dapat digunakan jika variabel ketiga kita ingin menambahkan ke plot skatter menunjukkan timestamps. Kita dapat menggunakan garis-garis untuk menghubungkan observasi-observasi, sehingga membuatnya lebih mudah untuk melihat bagaimana dua variabel utama tidak hanya terkait dengan satu sama lain, namun juga berubah seiring waktu.

Jika sumbu horizontal juga sesuai dengan waktu, maka semua garis akan terus menghubungkan titik dari kiri ke kanan, dan kita memiliki chart garis dasar.