Dalam analisis data, grafik penyebaran (scatter plot) adalah salah satu cara untuk mewakili data dalam bentuk grafis. Grafik ini digunakan untuk menampilkan hubungan antara dua variabel numerik dengan menggunakan titik-titik. Dalam artikel ini, kita akan membahas lebih lanjut tentang scatter plot dan bagaimana cara menggunakannya.
Apa itu Scatter Plot?
Grafik penyebaran adalah alat yang digunakan untuk menampilkan data dalam bentuk grafis. Grafik ini menggunakan sumbu-x dan sumbu-y untuk mewakili titik-titik, berdasarkan nilai-nilainya. Berikut adalah contoh scatter plot untuk data usia (tahun) dan tinggi (kaki) anak:
Usia Anak
Tinggi
3
2.3
4
2.7
5
3.1
6
3.6
7
3.8
8
4
9
4.3
10
4.5
Aplikasi Scatter Plot
Berikut adalah contoh aplikasi scatter plot dalam kehidupan nyata:
Contoh: Hari Minggu dan Penjualan
Cara Membuat Grafik Penyebaran
Ada tiga langkah sederhana untuk membuat grafik penyebaran:
Langkah I: Identifikasi sumbu-x dan sumbu-y untuk grafik.
Langkah II: Definisikan skala untuk setiap sumbu.
Langkah III: Plot titik-titik berdasarkan nilai-nilainya.
Tipe-Tipe Grafik Penyebaran
Grafik penyebaran membantu menemukan hubungan antara dua variabel. Hubungan ini disebut korrelasi. Berdasarkan korrelasi, grafik penyebaran dapat dikategorikan sebagai berikut:
Grafik Penyebaran untuk Korrelasi Positif
Grafik Penyebaran untuk Korrelasi Negatif
Grafik Penyebaran untuk Korrelasi Nol
Grafik Penyebaran untuk Korrelasi Positif
Grafik penyebaran yang memiliki nilai-nilai meningkat secara terus menerus dapat dikatakan memiliki korrelasi positif. Contoh, grafik hubungan antara waktu belajar dan nilai ujian dapat dikategorikan sebagai memiliki korrelasi positif.
Grafik Penyebaran untuk Korrelasi Negatif
Grafik penyebaran yang memiliki nilai-nilai meningkat pada variabel satu dan menurun pada variabel lainnya dapat dikatakan memiliki korrelasi negatif. Contoh, grafik hubungan antara produksi gandum dan harga gandum dapat dikategorikan sebagai memiliki korrelasi negatif.
Grafik Penyebaran untuk Korrelasi Nol
Grafik penyebaran yang tidak memiliki trend meningkat atau menurun pada nilai-nilai variabel dapat dikatakan memiliki korrelasi nol. Contoh, grafik hubungan antara jumlah burung di pohon dan waktu hari dapat dikategorikan sebagai memiliki korrelasi nol.
Analisis Grafik Penyebaran
Analisis grafik penyebaran membantu kita memahami aspek-aspek berikut dari data:
- Berbagai tingkat korrelasi di antara titik-titik data yang bermanfaat untuk memahami hubungan dalam data.
- Garis fitur terbaik dapat digambar untuk data yang diberikan dan digunakan untuk memprediksi nilai-nilai baru.
- Titik-titik data yang berada di luar set data yang diberikan dapat dengan mudah dikenali untuk menemukan outlier.
- Gruping titik-titik dalam grafik penyebaran dapat dikenali sebagai cluster-cluster dalam data.
FAQ Grafik Penyebaran
-
Apa itu Grafik Penyebaran di Data?
Grafik penyebaran (XY) plot adalah cara untuk menampilkan hubungan antara dua set data secara vertikal. Ini adalah representasi grafis data yang menggunakan set titik-titik yang terplot dalam bidang dua-dimensi atau tiga-dimensi. -
Apa Fungsi Grafik Penyebaran?
Grafik penyebaran digunakan untuk mengamati dan menampilkan hubungan antara dua variabel numerik secara grafis dengan menggunakan titik-titik. Titik-titik dalam grafik penyebaran menunjukkan nilai-nilai data individu. -
Apa yang Dimaksud dengan Interpolasi?
Interpolasi adalah proses mengisi nilai-nilai antara titik-titik data yang diberikan. Interpolasi digunakan untuk memprediksi nilai-nilai baru berdasarkan pola yang terlihat dalam grafik penyebaran. -
Apa yang Dimaksud dengan Regression?
Regression adalah proses memprediksi nilai-nilai variabel dependent dengan menggunakan variasi independent. Regression digunakan untuk menemukan hubungan antara dua variabel numerik dan memprediksi nilai-nilai baru berdasarkan pola yang terlihat dalam grafik penyebaran.
Dengan demikian, grafik penyebaran adalah alat yang sangat bermanfaat dalam analisis data. Dalam artikel ini, kita telah membahas lebih lanjut tentang scatter plot dan bagaimana cara menggunakannya. Grafik penyebaran dapat digunakan untuk menemukan hubungan antara dua variabel numerik dan memprediksi nilai-nilai baru berdasarkan pola yang terlihat dalam data.