Seorang analis data atau praktisi ilmu pengetahuan pasti memiliki berbagai jenis plot data untuk memvisualisasikan hubungan antara dua variabel numerik. Salah satu jenis plot tersebut adalah scatter plot, yaitu suatu grafik yang menunjukkan relasi antara dua variabel numerik dengan masing-masing titik data ditampilkan sebagai titik yang koordinat x-nya dan y-nya terkait dengan nilai kedua variabel.
Dalam artikel ini, kita akan membahas beberapa contoh scatter plot yang memiliki parameter korelasi yang perlu dipertanyakan. Misalnya, apakah scatter plot V berbentuk V memiliki korelasi positif, negatif, atau tidak ada korelasi? Jawabannya adalah tidak ada korelasi (linear) jika scatter plot V tersebut sempurna simetris. Jika tidak simetris namun hampir simetris, maka diperkirakan tidak ada korelasi.
Contoh lainnya adalah scatter plot O yang terbentuk seperti huruf O. Apakah scatter plot ini memiliki korelasi positif, negatif, atau tidak ada korelasi? Jawabannya adalah tidak ada korelasi jika scatter plot O tersebut sempurna simetris. Namun, dalam kehidupan sehari-hari hal tersebut jarang terjadi. Jika semua titik data membentuk sebuah O yang hampir simetris, maka diperkirakan tidak ada korelasi.
Selain itu, apakah scatter plot X berbentuk X memiliki korelasi positif, negatif, atau tidak ada korelasi? Jawabannya adalah tidak ada korelasi (linear) yang kuat, namun korelasi yang lemah dan dapat ditunjukkan dengan koefisien korelasi yang mendekati nol.
Ada pula scatter plot vertikal yang sempurna, apakah ini memiliki korelasi positif atau negatif? Jawabannya adalah korelasi yang sempurna (perfect) baik itu positif atau negatif, tergantung arah garis vertikal. Jika semua titik data berada di garis vertikal dari atas ke bawah, maka diperkirakan korelasi yang sempurna dan negatif, yaitu sebagai variabel pertama meningkat, variabel kedua menurun linear. Sebaliknya, jika semua titik data berada di garis vertikal dari bawah ke atas, maka diperkirakan korelasi yang sempurna dan positif, yaitu sebagai variabel pertama meningkat, variabel kedua pula meningkat linear.
Ketika terdapat clustering (gumpalan) data dalam satu sudut scatter plot, apakah ini memiliki korelasi tidak ada? Jawabannya adalah tidak. Scatter plot yang memiliki clustering data dapat menunjukkan korelasi tidak ada, namun juga dapat menunjukkan adanya korelasi yang lemah.
Contoh Kasus
Mary membuat scatter plot dari dua dataset, yaitu jumlah curahan hujan dan jumlah umbrella yang terjual. Variabel apa yang akan diharapkan memiliki korelasi positif? Jawabannya adalah jumlah umbrella yang terjual karena orang biasanya membeli lebih banyak umbrella seiring berkurangnya hujan.
Terkait dengan Penggunaan Scatter Plot
Bagaimana cara membuat scatter plot? Jawabannya adalah dengan menggunakan tabel atau grafik yang menunjukkan titik-titik data. Misalnya, kita memiliki data tinggi dan berat badan siswa Emmy, seperti 140 cm (tinggi) dan 45 kg (berat badan). Maka kita dapat memplot tinggi pada sumbu y dan berat badan pada sumbu x, kemudian mencari titik 45 kg pada sumbu x dan naik hingga menemui garis yang sama dengan 140 cm pada sumbu y. Demikianlah cara membuat scatter plot.
Dalam kesimpulan, scatter plot adalah suatu alat analisis data yang berguna untuk memvisualisasikan hubungan antara dua variabel numerik. Dengan memahami beberapa contoh scatter plot dan cara menggunakan alat tersebut, kita dapat lebih mudah menemukan korelasi antara dua variabel dan membuat keputusan yang lebih baik.