Menghubungkan Variabel dalam Plot Skalar: Review dan Analisis

Menghubungkan Variabel dalam Plot Skalar: Review dan Analisis

Dalam analisis data, plot skalar (scatter plot) adalah salah satu alat yang paling populer untuk menampilkan hubungan antara dua variabel numerik. Setiap titik dataset ditampilkan sebagai titik dengan koordinat x-y yang terkait dengan nilai kedua variabel tersebut.

Namun, bagaimana kita dapat menentukan apakah plot skalar memiliki korelasi positif, negatif, atau tidak? Salah satu cara adalah dengan melihat bentuk plot. Berikut beberapa contoh:

  • Plot V-shaped (sebuah bentuk huruf V) biasanya menunjukkan tidak adanya korelasi linear (no correlation). Jika bentuk tersebut hampir simetris, maka kita dapat mengharapkan tidak adanya korelasi linear.
  • Plot O-shaped (sebuah bentuk huruf O) biasanya menunjukkan tidak adanya korelasi linear. Namun, dalam kehidupan nyata, plot seperti ini jarang terjadi. Jika ada scatterplot yang membentuk "O" yang hampir simetris, maka kita dapat mengharapkan tidak adanya korelasi linear.
  • Plot X-shaped (sebuah bentuk huruf X) biasanya menunjukkan korelasi negatif. Namun, jika plot tersebut tidak memiliki korelasi linear, maka korelasi yang diharapkan adalah sangat lemah.

Selain itu, ada beberapa hal lain yang perlu dipertimbangkan:

  • Plot garis vertikal lurus (straight vertical line) menunjukkan korelasi sempurna positif atau negatif, tergantung arah garis. Jika semua titik jatuh tepat pada garis vertikal dari atas ke bawah, maka menunjukkan korelasi sempurna negatif, sedangkan jika semua titik jatuh tepat pada garis vertikal dari bawah ke atas, maka menunjukkan korelasi sempurna positif.
  • Plot yang tidak linear (non-linear) adalah plot yang tidak memiliki tendensi "naik ke tebing" atau "turun ke tebing".
  • Plot yang mempunyai data clustering di satu sudut (corner) biasanya tidak memiliki korelasi linear.

Dalam beberapa kasus, kita juga perlu mempertimbangkan apakah plot tersebut menunjukkan "tidak adanya hubungan" (no association). Ternyata, "tidak adanya hubungan" ini dapat terlihat tanpa clustering data. Scatterplot dengan tidak adanya hubungan dapat memiliki titik-titik yang tersebar di seluruh plot tanpa pola atau trend.

Sebagai contoh, jika kita membuat scatter plot antara data hujan (precipitation) dan penjualan umbrella, maka kita dapat mengharapkan korelasi positif. Semakin banyak hujan, semakin banyak orang yang membeli umbrella.

Dalam akhirnya, membuat scatter plot adalah tentang mencoba untuk menemukan pola atau hubungan antara dua variabel numerik. Dengan memahami bentuk plot dan analisis yang tepat, kita dapat menentukan apakah plot tersebut memiliki korelasi positif, negatif, atau tidak.