Pada artikel ini, kita akan mempelajari cara mengolah data dan membuat visualisasi dengan scatterplot di Microsoft Excel. Kita juga akan membahas cara membuat grafik sistem regresi untuk menentukan hubungan antara variabel bebas dan tergantung berdasarkan data.
Mengolah Data
Awalnya, kita harus mendownload dataset "Automobile Dataset" dari Kaggle. Setelah itu, kita dapat memulai mengolah data dengan mengidentifikasi kolom-kolom yang akan dirapihkan. Pada contoh ini, kita akan menggunakan kolom "Engine-size" dan "Price".
- Pilih data yang akan dirapihkan.
- Klik kolom "A" -> Data -> Text to Columns.
- Hasilnya adalah dataset yang sudah dirapihkan.
Membuat Visualisasi dengan Scatterplot
Sekarang kita dapat memulai membuat visualisasi dengan scatterplot untuk mengidentifikasi hubungan antara Engine-size dan Price.
- Copy variable yang akan kita uji (Scatter diagram dan Engine-size) pada lembar ke-2.
- Klik "Price" -> Insert -> Scatter.
- Klik Desain -> pilih format diagram.
- Merapihkan posisi titiknya agar tampilan lebih rapih dengan cara: klik kanan pada diagram (angka vertical/horizontal) -> Format Axis -> Axis Option -> pada pilihan minimum kita ketik angka yang telah ditentukan.
- Hasilnya adalah scatterplot antara Engine-size dan Price.
Menambahkan Garis Trendline
Sekarang kita dapat menambahkan garis trendline untuk memudahkan kita menentukan hubungan pada kedua variable tersebut.
- Klik kiri pada diagram -> Layout -> Trendline -> ceklis "Display R-squared value on chart".
Menghitung Nilai Rata-Rata dan R
Selanjutnya, kita dapat menghitung nilai rata-rata dan R untuk memahami lebih lanjut tentang hubungan antara Engine-size dan Price.
- Menghitung nilai rata-rata dengan rumus "=AVERAGE (pilih range yang telah ditentukan)".
- Menghitung nilai R dengan rumus "=SQRT (cell nilai R2)".
Hasil Scatter Diagram
Dari scatter diagram di atas, kita dapat memahami bahwa:
- Average Engine-size: 127
- Average Price: 13106
- r2: 0,4959
- r: 0,704202
Dengan demikian, terlihat bahwa ada hubungan linier antara Engine-size dan Price, dimana semakin tinggi engine-size semakin tinggi pula pricenya. Hubungannya dapat dikatakan kuat positif melalui hasil korelasi sebesar 0,704202.
Membuat Grafik Sistem Regresi
Analisis regresi digunakan untuk menentukan hubungan antara variabel bebas dan tergantung berdasarkan data. Variabel bebas dimasukkan ke sumbu X dan variabel tergantung ke sumbu Y. Excel dapat digunakan untuk membuat grafik regresi linier dengan mengikuti langkah-langkah seperti memasukkan data ke tabel, memilih jenis scatter plot, dan menampilkan persamaan linier.
Contoh
Berikut adalah contoh cara membuat grafik sistem regresi di Microsoft Excel:
- Memasukkan data ke tabel.
- Memilih jenis scatter plot.
- Menampilkan persamaan linier.
Dengan demikian, kita dapat memahami lebih lanjut tentang hubungan antara variabel bebas dan tergantung berdasarkan data.