Interpretasi Scatter Plot dan Hubungan Linear

Interpretasi Scatter Plot dan Hubungan Linear

Scatter plot adalah salah satu jenis grafik yang paling umum digunakan dalam analisis data. Grafik ini menampilkan simbol-simbol di titik koordinat X, Y yang sesuai dengan nilai-nilai variabel-variabel terkontinu. Dengan menggunakan scatter plot, Anda dapat mengetahui apakah hubungan atau korelasi antara dua variabel terkontinu, serta arah dan kekuatan hubungan tersebut.

Scatter plot biasanya memuat elemen-elemen berikut:

  • X-axis mewakili nilai-niali variabel kontinu. Dalam hal ini, ini adalah variabel independen jika Anda dapat mengategorikan salah satu variabel sebagai independen.
  • Y-axis mewakili nilai-niali variabel kontinu. Tradisionalnya, ini adalah variabel dependen.
  • Simbol-simbol yang dipplot di titik koordinat (X, Y) data Anda. Opsional, grafik dapat menggunakan simbol warna/bentuk berbeda untuk mewakili kelompok-kelompok yang sama pada chart yang sama.
  • Fitted line yang dapat ditaruhkan atas scatter plot untuk mengetahui seberapa baik model regresi cocok dengan data.

Dalam contoh scatter plot di atas, hubungan antara BMI dan persentase lemak tubuh remaja perempuan tampak memiliki hubungan yang kuat dan positif. Semakin tinggi BMI, semakin tinggi pula persentase lemak tubuh. Hubungan tersebut tampak sedikit melengkung karena flatten out untuk nilai BMI yang lebih tinggi. Untuk memodelkan lengkungan ini, analisanya mencantumkan term kuadrat dalam model.

Interpretasi Scatter Plot dan Evaluasi Hubungan Variable

Scatter plot menampilkan arah, kekuatan, dan linearitas hubungan antara dua variabel terkontinu. Jika hubungan exist, scatter plot menunjukkan arah dan apakah hubungan tersebut linier atau lengkung.

  • Korelasi positif terjadi jika nilai-nilai variabel meningkat seiringnya.
  • Korelasi negatif terjadi jika salah satu variabel meningkat seiringan dengan variabel lainnya mengalami penurunan.
  • Kekuatan hubungan ditentukan oleh tingkat clustering data. Perlu diingat bahwa perubahan skala dapat mempengaruhi kekuatan hubungan yang tampak.

Menemukan Outliers dan Observasi Unusual

Scatter plot juga dapat membantu Anda menemukan outliers dan observasi unusual. Dalam scatter plot, Anda dapat menemukan beberapa jenis outliers:

  • Outliers dengan nilai-nilai ekstrem. Nilai-nilai ini berjarak jauh dari data lainnya.
  • Observasi unusual memiliki nilai-nilai yang tidak terlalu ekstrem, tetapi tidak sesuai dengan hubungan yang ditemui. Dalam scatter plot, Anda dapat melihat titik-titik yang tidak sesuai dengan hubungan yang tampak.

Tren Over Time

Dalam umumnya, analis menggunakan plots waktu (time series plot) untuk menampilkan data over time. Namun, Anda juga dapat menggunakan scatter plot untuk tujuan ini. Scatter plot adalah pilihan sempurna untuk data waktu ketika observasi terjadi pada interval waktu yang tidak teratur. Dalam membuat scatter plot untuk data waktu, pastikan Anda menambahkan garis-garis hubungan antara data!

Menggunakan Scatter Plot dengan Uji Hipotesis Appropriate

Scatter plot dapat digunakan untuk menampilkan hubungan antara variabel-variabel terkontinu. Namun, jika Anda berniat menggunakan sampel untuk menginferences karakteristik dari populasi yang lebih besar, pastikan Anda melakukan uji hipotesis yang diperlukan dan mengetahui signifikansi statistik.

Dalam penulisan ini, kita telah membahas tentang interpretasi scatter plot dan hubungan linear, serta cara-cara menggunakan scatter plot untuk menemukan outliers dan observasi unusual. Selain itu, kita juga membahas tentang pentingnya uji hipotesis untuk mengetahui signifikansi statistik dari hasil analisis.