Scatter plot adalah salah satu jenis visualisasi data yang digunakan untuk menunjukkan hubungan antara dua variabel. Dalam scatter plot, setiap pasang nilai dipetakan sebagai titik koordinat yang terurut.
Hubungan antara dua variabel dapat didefinisikan sebagai korelasi. Korelasi positif adalah hubungan antara dua variabel di mana data point meningkat dari kiri ke kanan. Sebaliknya, korelasi negatif adalah hubungan antara dua variabel di mana data point menurun dari kiri ke kanan. Jika tidak ada tendensi yang jelas pada data points, maka tidak ada korelasi.
Berikut ini adalah tiga contoh bagaimana menginterpretasikan scatter plot:
Contoh 1: Korelasi Positif
Scatter plot berikut menunjukkan umur dan tinggi anak-anak di sekolah dasar dan menengah. Deskripsikan hubungan yang diperpresentasikan oleh scatter plot.
Langkah 1: Label horizontal axis grafik adalah "Umur dalam Tahun" dan label vertical axis adalah "Tinggi dalam Kaki". Oleh karena itu, kita tahu bahwa grafik ini menampilkan data umur dan tinggi anak-anak.
Langkah 2: Saat kita melihat scatter plot secara besar, kita lihat bahwa clustering data point cenderung meningkat dari kiri ke kanan. Pertumbuhan tidak terlalu ekstrim, tapi ada kenaikan yang jelas.
Langkah 3: Karena data diperpresentasikan oleh scatter plot meningkat dari kiri ke kanan, kita dapat mengatakan bahwa data adalah positif korrelasi. Oleh karena itu, kita dapat menyimpulkan bahwa terdapat korelasi positif antara umur dan tinggi. Artinya, semakin tua individu, maka tinggi mereka akan lebih besar.
Contoh 2: Korelasi Negatif
Scatter plot berikut menunjukkan jumlah absensi dan IPK siswa di sebuah sekolah. Deskripsikan hubungan yang diperpresentasikan oleh scatter plot.
Langkah 1: Berdasarkan label axis grafik, horizontal axis adalah "Jumlah Absensi" dan vertical axis adalah "IPK Siswa". Oleh karena itu, data ini menampilkan jumlah absensi siswa dan IPK mereka.
Langkah 2: Saat kita melihat dari kiri ke kanan, kita lihat bahwa trend IPK jatuh ketika jumlah absensi meningkat. Artinya, data turun dari kiri ke kanan.
Langkah 3: Dengan menggabungkan informasi di atas, kita dapat mengatakan bahwa terdapat korelasi negatif antara jumlah absensi siswa dan IPK mereka. Artinya, semakin banyak siswa tidak hadir, maka IPK mereka akan lebih rendah.
Contoh 3: Tidak Ada Korelasi
Scatter plot berikut menunjukkan ukuran sepatu dan skor ujian siswa kelas 5. Deskripsikan hubungan yang diperpresentasikan oleh scatter plot.
Langkah 1: Label horizontal axis grafik adalah "Ukuran Sepatu" dan label vertical axis adalah "Skor Ujian". Oleh karena itu, data ini menampilkan ukuran sepatu dan skor ujian siswa.
Langkah 2: Saat kita melihat dari kiri ke kanan, tidak ada tendensi yang jelas pada data points.
Langkah 3: Dengan menggabungkan informasi di atas, kita dapat menyimpulkan bahwa tidak ada korelasi antara ukuran sepatu dan skor ujian.