Scatterplot: Visualisasi untuk Regresi dan Nural Learning

Scatterplot: Visualisasi untuk Regresi dan Nural Learning

Scatterplot adalah sebuah grafik yang biasa digunakan untuk melihat suatu pola hubungan antara 2 variabel. Komponennya terdiri dari garis memanjang (x) sebagai variabel bebas, garis melebar untuk variabel dependen, kemudian titik yang merepresentasikan nilai x dan y.

Membuat Scatterplot

Untuk membuat scatterplot, Anda dapat menggunakan Microsoft Excel atau Google Sheets. Berikut langkah-langkahnya:

  1. Dalam Excel: pilih data, kemudian pergi ke tab 'Insert' dan pilih 'Scatter' di bawah grup 'Charts'. Pilih jenis scatter plot yang diinginkan.
  2. Dalam Google Sheets: pilih data, klik 'Insert', lalu pilih 'Chart'. Dalam pengaturan chart, ubah tipe chart menjadi 'Scatter chart'.

Atur Sumbu dan Skala

Sesuaikan skala sumbu X dan Y agar sama dengan rentang data. Pastikan sumbu-sumbu ini dilabeli dengan jelas untuk memudahkan interpretasi.

Tambahkan Judul dan Label

Berikan judul yang jelas untuk scatter plot dan label di masing-masing sumbu. Hal ini penting untuk memberikan konteks kepada pembaca grafik.

Tambahkan Trendline (Opsional)

Jika relevan, tambahkan trendline untuk menunjukkan hubungan umum antara dua variabel. Dalam Excel, klik pada salah satu titik data, kemudian pilih 'Add Trendline' dari menu yang muncul.

Analisis dan Interpretasi

Setelah scatter plot dibuat, analisis pola yang muncul. Lihat apakah ada korelasi positif, negatif, atau tidak ada korelasi yang jelas antara variabel-variabel tersebut. Perhatikan juga adanya titik outlier.

Penyesuaian Visual

Sesuaikan warna titik, ukuran, dan aspek visual lainnya untuk meningkatkan kejelasan dan estetika grafik.

Simpan dan Bagikan

Simpan scatter plot dalam format yang sesuai dan bagikan dengan tim yang relevan.

Tabel Korelasi Scatterplot

Pola Korelasi Deskripsi
Korelasi Positif Y cenderung meningkat mengikuti penambahan nilai x.
Korelasi Negatif Nilai x yang rendah malah berada di y yang tinggi.
Tidak Ada Korelasi Nilai y dan x membentuk persebaran titik secara acak.

Garis Tengah

Garis tengah dalam visualisasi regresi merepresentasikan line of best fit, yaitu garis yang menjelaskan tren dari persebaran data.

Rumus Line of Best Fit

Gunakan rumus y = a + bx seperti berikut:

  • Hitung masing-masing jumlah x dan y.
  • Hitung jumlah data.
  • Hitung nilai a dan b dengan rumus:
  • a = (Σy) / n
  • b = (∑(x * y)) – a * (∑x) / n

Contoh penghitungan:

  • Σx = 10 + 20 + … + 100
  • Σy = 5 + 15 + … + 50
  • n = jumlah data (contohnya, 10)
  • a = (Σy) / n = (5 + 15 + … + 50) / 10 = 25 / 10 = 2.5
  • b = (∑(x * y)) – a * (∑x) / n = ((10 * 5) + (20 * 15) + … + (100 * 50)) – 2.5 * 500 / 10 = …

Rangkuman

Scatterplot adalah visualisasi persebaran titik-titik data yang setiap titiknya berada di koefisien variabel x dan y. Garis tengah dalam visualisasi regresi merepresentasikan line of best fit, yaitu garis yang menjelaskan tren dari persebaran data.

Kuis

Apa pola korelasi yang menjelaskan peningkatan variabel x seiring dengan menurunnya variabel y?

  • Korelasi positif
  • Korelasi negatif
  • Korelasi sempurna
  • Tidak ada korelasi