Scatter Plot: Definisi, Grafik, Penggunaan, Contoh dan

Scatter Plot: Definisi, Grafik, Penggunaan, Contoh dan

Scatter plots adalah grafik yang digunakan untuk menunjukkan hubungan antara dua variabel dalam sebuah dataset. Mereka mewakili titik-titik data pada bidang dua-dimensional atau sistem Cartesian. Variabel independen atau atributnya dipaparkan pada sumbu X, sedangkan variabel dependen dipaparkan pada sumbu Y. Grafik-grafik ini sering disebut sebagai scatter graphs atau scatter diagrams.

Bar Graph
Grafik Representasi
Korelasi
Dataset

Scatter plots juga dikenal sebagai chart, scattergram, atau XY graph. Mereka menggambarkan pasang-pasangan data numerik dengan satu variabel pada masing-masing sumbu, menunjukkan hubungan antara dua variabel. Sekarang, pertanyaan muncul untuk siapa pun: kapan menggunakan scatter plot?

Scatter plots digunakan dalam situasi berikut:

  • Ketika kita memiliki data paar numerik
  • Ketika ada nilai-nila dependen yang lebih dari satu untuk nilai independen yang unik
  • Dalam menentukan hubungan antara variabel dalam beberapa skenario, seperti mengidentifikasi penyebab potensial masalah, memeriksa apakah dua produk yang tampak terkait berada di bawah penyebab yang sama, dan lain-lain.

Penggunaan Scatter Plot dan Contoh
Scatter plots segera melaporkan volume besar data. Mereka bermanfaat dalam situasi sebagai berikut:

  • Untuk set besar titik data
  • Setiap set terdiri dari pasang-pasangan nilai
  • Data yang diberikan adalah dalam bentuk numerik

Garis yang digambar pada scatter plot, yang dekat dengan hampir semua titik dalam grafik, disebut "garis fitur terbaik" atau "trend line". Lihat gambar di bawah ini sebagai contoh.

Korelasi Scatter Plot
Kita tahu bahwa korelasi adalah ukuran statistik hubungan antara dua variabel gerakan relatif. Jika variabel-variabel terkait, titik-titik akan jatuh pada garis atau kurva. Semakin baik korelasi, semakin dekat titik-titik akan sentuh garis. Alat pemeriksa ini dianggap sebagai salah satu dari tujuh alat kualitas esensial.

Jenis Korelasi
Scatter plot menjelaskan korelasi antara dua atribut atau variabel. Mereka menunjukkan seberapa dekat dua variabel terkait. Ada tiga situasi seperti ini untuk melihat hubungan antara dua variabel:

  • Korelasi Positif
  • Korelasi Negatif
  • Tidak ada Korelasi

Korelasi Positif
Jika titik-titik dalam grafik naik, bergerak dari kiri ke kanan, maka scatter plot menunjukkan korelasi positif. Artinya, nilai salah satu variabel meningkat dengan variabel lainnya.

Korelasi Negatif
Jika titik-titik dalam scatter graph jatuh saat bergerak dari kiri ke kanan, maka itu disebut sebagai korelasi negatif. Artinya, nilai salah satu variabel menurun dengan variabel lainnya.

Tidak ada Korelasi
Jika titik-titik tersebar di seluruh grafik dan sulit untuk menyimpulkan apakah nilai meningkat atau menurun, maka tidak ada korelasi antara dua variabel.

Contoh Scatter Plot
Mari kita pahami cara menggambar scatter plot dengan contoh berikut:

Pertanyaan:
Gambarkan scatter plot untuk data yang menunjukkan jumlah permainan yang dimainkan dan skor yang dicapai dalam setiap instance.

Jumlah permainan
3
5
2
6
7
1
2
7
1
7

Skor
80
90
75
80
90
50
65
85
40
100

Solusi:
Sumbu X (horizontal axis): Jumlah permainan
Sumbu Y (vertical axis): Skor
Kini, scatter graph akan menjadi:

Catatan: Kita juga dapat menggabungkan scatter plots dalam beberapa grafik per lembar untuk membaca dan memahami formasi yang lebih tinggi pada dataset yang berisi variabel multivariabel, terutama lebih dari dua variabel.

Scatter Plot Matrix
Untuk dataset yang memiliki banyak variabel, kita dapat menggunakan scatter plot matrix. Mereka menggabungkan beberapa scatter plot menjadi satu grafik, memudahkan kita untuk melihat hubungan antara beberapa variabel sekaligus.

Dalam artikel ini, kita telah membahas definisi, penggunaan, dan contoh dari scatter plots. Kita juga telah membahas korelasi dan jenis-jenis korelasi yang dapat terjadi pada scatter plot. Dengan demikian, kita dapat menggunakan scatter plots sebagai alat bantu untuk memahami hubungan antara variabel-variabel dalam dataset.