Menggali Scatter Plot dan Korrelasi: Panduan Lengkap

Menggali Scatter Plot dan Korrelasi: Panduan Lengkap

=====================================================

Dalam analisis data, scatter plot (plot data scatter) adalah salah satu jenis visualisasi yang paling populer dan berguna. Scatter plot digunakan untuk menampilkan hubungan antara dua variabel numerik. Dalam artikel ini, kita akan membahas tentang scatter plot, korrelasi, dan bagaimana menginterpretasikan hasilnya.

Apa itu Scatter Plot?

Scatter plot adalah tampilan data yang menampilkan relasi antara dua variabel numerik. Setiap anggota dataset dipresentasikan sebagai titik yang memiliki koordinat x-y yang terkait dengan nilai dua variabel tersebut.

Korrelasi dalam Scatter Plot

Dalam scatter plot, kita dapat melihat hubungan antara dua variabel. Korrelasi dapat diidentifikasi berdasarkan bentuk scatter plot. Berikut beberapa contoh:

  • Bentuk "V" (V-shaped): tidak memiliki korrelasi linear.
  • Bentuk "O" (circular): tidak memiliki korrelasi linear, kecuali jika bentuk tersebut sangat simetri dan sempurna. Dalam keadaan normal, bentuk O tidak memiliki korrelasi linear.
  • Bentuk "X" (asymmetric): memiliki korrelasi yang lemah, sehingga koefisien korrelasi akan mendekati nol.

Korrelasi Perfect

Bentuk scatter plot vertikal sempurna dapat menunjukkan korrelasi perfect. Jika semua titik terletak pada garis lurus vertikal dari atas ke bawah, maka itu menunjukkan korrelasi perfect negatif (sebagai variabel pertama meningkat, variabel kedua turun). Sebaliknya, jika semua titik terletak pada garis lurus vertikal dari bawah ke atas, maka itu menunjukkan korrelasi perfect positif (sebagai variabel pertama meningkat, variabel kedua juga meningkat).

Korrelasi Non-Linear

Korrelasi non-linear terjadi ketika tidak ada tendensi untuk "naik ke jurang atau turun ke jurang". Dalam kasus seperti ini, tidak ada korrelasi linear yang dapat diidentifikasi.

Data Clumping

Jika data terkumpul pada satu sudut, maka tidak ada korrelasi linear yang dapat diidentifikasi. Dalam kasus seperti ini, harus diperkirakan bahwa tidak ada korrelasi linear.

Interpretasi Korrelasi No Association

Korrelasi no association terjadi ketika tidak ada pola atau hubungan jelas antara dua variabel yang dipplotkan. Seringkali, scatter plot dengan no association dapat menampilkan clustering data point, namun ini tidak berarti bahwa tidak ada korrelasi. Dalam beberapa kasus, data points dapat terhampar secara acak tanpa pola atau trend.

Contoh Kasus

Seorang pelaku bisnis, Mary, membuat scatter plot untuk memplotkan jumlah hujan dan penjualan umbrella. Berdasarkan variabel yang dipplotkan, kita dapat mengharapkan korrelasi positif (sebagai jumlah hujan meningkat, penjualan umbrella juga meningkat).

Bagaimana Membuat Scatter Plot?

Untuk membuat scatter plot, Anda perlu memiliki data dan kemudian mempresentasikan data dengan koordinat x-y yang terkait. Contohnya, Anda dapat menggunakan tabel data untuk menampilkan tinggi dan berat badan siswa Emmy, seperti yang dijelaskan dalam contoh di atas.

Dalam artikel ini, kita telah membahas tentang scatter plot, korrelasi, dan bagaimana menginterpretasikan hasilnya. Dengan memahami konsep-konsep tersebut, Anda dapat menggunakan scatter plot untuk menganalisis data dan membuat keputusan yang lebih bijak.