Menginterpretasikan Scatterplot: Menggunakan, Contoh, dan Membaca

Menginterpretasikan Scatterplot: Menggunakan, Contoh, dan Membaca

Scatterplots atau scattergrams adalah salah satu jenis grafik yang paling umum digunakan untuk menunjukkan hubungan antara dua variabel kontinu. Grafik ini memperlihatkan simbol pada koordinat X-Y dari titik data pair-nya.

Pattern titik-titik pada scatterplot memungkinkan Anda untuk menentukan apakah hubungan atau korrelasi ada antara dua variabel kontinu. Jika hubungan ada, scatterplot menunjukkan arah dan apakah hubungan tersebut linear atau tidak linear.

Grafik berbentuk garis yang disematkan (fitted line plots) adalah jenis scatterplot khusus yang memperlihatkan titik data serta garis yang sesuai untuk model regresi sederhana. Grafik ini memungkinkan Anda untuk mengevaluasi seberapa baik model tersebut memenuhi data.

Gunakan scatterplots untuk mengevaluasi fitur-fitur berikut dari dataset:

  • Menjelajahi hubungan antara dua variabel.
  • Menemukan titik-titik yang tidak sesuai dengan pola.
  • Menemukan tren waktu.

Menginterpretasikan Scatterplot

Scatterplot adalah grafik yang menunjukkan hubungan antara dua set data. Scatterplot juga dapat disebut scattergram atau diagram sketral.

Pada scatterplot, titik mewakili data tunggal. Dengan beberapa data point yang digrafikkan, Anda dapat melihat distribusi visual data.

Terkait seberapa ketat titik-titik cluster, Anda mungkin dapat menemukan trend yang jelas dalam data.

Jika titik-titik mendekati membentuk garis lurus ketika digrafikkan, maka variabel-variabel tersebut memiliki korrelasi positif atau hubungan kuat. Jika titik-titik mulai dari nilai Y tinggi kemudian turun ke nilai Y rendah, maka variabel-variabel tersebut memiliki korrelasi negatif.

Contoh situasi di mana Anda mungkin menemukan korrelasi positif sempurna adalah jika Anda membeli permen seharga $1 setiap. Seiring jumlah permen meningkat, biaya total juga meningkat.

Korrelasi yang kuat (tetapi tidak sempurna) dapat ditemui pada situasi di mana Anda meneliti jam studi siswa vs grade yang diterima. Hal ini tidak akan menjadi korrelasi sempurna karena dua orang mungkin menghabiskan waktu seimbang namun mendapatkan grade yang berbeda. Namun, dalam umumnya, aturan bahwa seiring jumlah waktu studing meningkat maka grade juga meningkat.

Pada beberapa grafik, titik-titik tersebar lebih jauh. Semakin dekat titik-titik cluster untuk membentuk garis, semakin tinggi korrelasi. Pada beberapa grafik lain, data tidak memiliki trend, sehingga tidak ada korrelasi.

Grafik di atas menunjukkan bahwa tidak ada trend dalam data, sehingga tidak ada korrelasi.

Leave a comment