Bagaimana Menganalisis Scatter Plot

Bagaimana Menganalisis Scatter Plot

Scatterplot adalah salah satu jenis grafik yang digunakan untuk menunjukkan hubungan antara dua variabel kontinu. Grafik ini menampilkan simbol di koordinat X dan Y data point yang dipairkan dengan variabel-variabel tersebut. Scatterplots juga dikenal sebagai scattergrams dan scatter charts.

Polanya titik-titik pada scatterplot memungkinkan Anda untuk menentukan apakah hubungan atau korrelasi antara dua variabel kontinu terjadi. Jika hubungan terjadi, scatterplot menunjukkan arahnya dan apakah hubungan tersebut linear atau tidak.

Grafik garis pasangan adalah jenis scatterplot yang khusus digunakan untuk menampilkan data point bersama dengan garis pasangan untuk model regresi sederhana. Grafik ini memungkinkan Anda untuk mengevaluasi seberapa baik model tersebut sesuai dengan data.

Penggunaan scatterplot untuk mengeksaminasikan fitur-fitur berikut dalam dataset Anda:

  • Menjelajahi hubungan antara dua variabel.
  • Mengecek apakah data memiliki outlier (nilai yang tidak normal).
  • Menentukan trend waktu.

Interpreting Scatterplots

Scatterplot adalah grafik yang menampilkan hubungan antara dua set data. Scatterplot juga dikenal sebagai scattergram atau scatter diagram.

Dalam scatterplot, titik mewakili satu data point. Dengan beberapa data point digrafikkan, Anda dapat melihat distribusi visual data.

Terdependi pada seberapa rapat titik-titik tersebut berkelompok, Anda mungkin dapat menjelajahi trend yang jelas dalam data.

Titik-titik yang lebih dekat membentuk garis lurus ketika digrafikkan, maka korrelasi antara dua variabel atau hubungan yang kuat. Jika titik-titik membuat garis lurus dari awal ke nilai y-tinggi, maka variabel-variabel tersebut memiliki korrelasi positif. Jika titik-titik dimulai dari nilai y-tinggi pada sumbu y dan berlanjut ke nilai y-tinggi yang lebih rendah, maka variabel-variabel tersebut memiliki korrelasi negatif.

Contoh situasi di mana Anda mungkin menemukan korrelasi positif sempurna adalah jika Anda membeli baris cokelat seharga $1. Seiring jumlah baris cokelat meningkat, biaya total juga meningkat.

Trend Over Time

Biasanya, analisis menggunakan plot waktu untuk menampilkan data berdasarkan waktu. Namun, Anda juga dapat menggunakan scatterplot untuk tujuan ini. Scatterplot adalah pilihan sempurna untuk data waktu ketika pengamatan terjadi pada interval-interval yang tidak teratur. Ketika membuat scatterplot untuk data waktu, pastikan Anda untuk menambahkan garis hubungan antara data point!

Hypothesis Tests

Anda dapat menggunakan scatterplot untuk menampilkan hubungan antara variabel kontinu. Namun, jika Anda berencana menggunakan sampel Anda untuk menggeneralisasi karakteristik populasi yang lebih luas, pastikan Anda melakukan uji hipotesis dan menguji signifikansi statistik.

Correlation dan regresi analisis adalah metode primer untuk mengevaluasi hubungan antara data kontinu.

Leave a comment