Scatterplot adalah sebuah grafik yang biasa digunakan untuk melihat suatu pola hubungan antara 2 variabel. Komponennya terdiri dari garis memanjang (x) sebagai variabel bebas, garis melebar untuk variabel dependen, kemudian titik yang merepresentasikan nilai x dan y.
Membuat Scatterplot
Untuk membuat scatterplot, Anda dapat menggunakan Microsoft Excel atau Google Sheets. Berikut langkah-langkahnya:
- Dalam Excel: pilih data, kemudian pergi ke tab 'Insert' dan pilih 'Scatter' di bawah grup 'Charts'. Pilih jenis scatter plot yang diinginkan.
- Dalam Google Sheets: pilih data, klik 'Insert', lalu pilih 'Chart'. Dalam pengaturan chart, ubah tipe chart menjadi 'Scatter chart'.
Atur Sumbu dan Skala
Sesuaikan skala sumbu X dan Y agar sama dengan rentang data. Pastikan sumbu-sumbu ini dilabeli dengan jelas untuk memudahkan interpretasi.
Tambahkan Judul dan Label
Berikan judul yang jelas untuk scatter plot dan label di masing-masing sumbu. Hal ini penting untuk memberikan konteks kepada pembaca grafik.
Tambahkan Trendline (Opsional)
Jika relevan, tambahkan trendline untuk menunjukkan hubungan umum antara dua variabel. Dalam Excel, klik pada salah satu titik data, kemudian pilih 'Add Trendline' dari menu yang muncul.
Analisis dan Interpretasi
Setelah scatter plot dibuat, analisis pola yang muncul. Lihat apakah ada korelasi positif, negatif, atau tidak ada korelasi yang jelas antara variabel-variabel tersebut. Perhatikan juga adanya titik outlier.
Penyesuaian Visual
Sesuaikan warna titik, ukuran, dan aspek visual lainnya untuk meningkatkan kejelasan dan estetika grafik.
Simpan dan Bagikan
Simpan scatter plot dalam format yang sesuai dan bagikan dengan tim yang relevan.
Tabel Korelasi Scatterplot
Pola Korelasi | Deskripsi |
---|---|
Korelasi Positif | Y cenderung meningkat mengikuti penambahan nilai x. |
Korelasi Negatif | Nilai x yang rendah malah berada di y yang tinggi. |
Tidak Ada Korelasi | Nilai y dan x membentuk persebaran titik secara acak. |
Garis Tengah
Garis tengah dalam visualisasi regresi merepresentasikan line of best fit, yaitu garis yang menjelaskan tren dari persebaran data.
Rumus Line of Best Fit
Gunakan rumus y = a + bx seperti berikut:
- Hitung masing-masing jumlah x dan y.
- Hitung jumlah data.
- Hitung nilai a dan b dengan rumus:
- a = (Σy) / n
- b = (∑(x * y)) – a * (∑x) / n
Contoh penghitungan:
- Σx = 10 + 20 + … + 100
- Σy = 5 + 15 + … + 50
- n = jumlah data (contohnya, 10)
- a = (Σy) / n = (5 + 15 + … + 50) / 10 = 25 / 10 = 2.5
- b = (∑(x * y)) – a * (∑x) / n = ((10 * 5) + (20 * 15) + … + (100 * 50)) – 2.5 * 500 / 10 = …
Rangkuman
Scatterplot adalah visualisasi persebaran titik-titik data yang setiap titiknya berada di koefisien variabel x dan y. Garis tengah dalam visualisasi regresi merepresentasikan line of best fit, yaitu garis yang menjelaskan tren dari persebaran data.
Kuis
Apa pola korelasi yang menjelaskan peningkatan variabel x seiring dengan menurunnya variabel y?
- Korelasi positif
- Korelasi negatif
- Korelasi sempurna
- Tidak ada korelasi