Setelah data berhasil di download, langkah pertama adalah merapihkan data. Untuk merapihkan data dapat dilakukan dengan cara klik pada kolom pertama -> Data -> Text To Columns. Pilih delimited untuk memisahkan data dan tentukan Comma sebagai tanda pembatas untuk pemisahan datanya.
Jika sudah, maka data akan terlihat lebih rapi dibandingkan sebelumnya. Berikut adalah contoh bagaimana mengolah data pada dataset automobile.
Membuat Data Visualisasi Diagram Scatterplot pada data Engine-size dan Price
- Membuat Worksheet baru
- Tambahkan data yang akan diuji, yaitu Engine-size dan Price pada Worksheet2.
- Klik kiri pada kolom Price, lalu buka tab Insert dan tambahkan chart dengan jenis scatter.
- Edit chart scatter sesuai keinginan dan kebutuhan.
- Tambahkan chart elements trendline untuk menampilkan trendline pada data yang telah disajikan dalam diagram.
- Untuk mendapatkan nilai R-squared secara otomatis, klik kanan pada trendline -> Format trendline -> Centang bagian “Display R-squared value on chart”.
Dengan demikian, akan tampak seperti gambar di bawah ini.
Membuat Data Visualisasi Diagram Scatterplot pada data Highway-mpg dan Price
Langkah yang dilakukan sama seperti mengvisualisasikan data sebelumnya, yaitu:
- Membuat Worksheet baru
- Tambahkan data yang akan diuji, yaitu Engine-size dan Price pada Worksheet2.
- Klik kiri pada kolom Price, lalu buka tab Insert dan tambahkan chart dengan jenis scatter.
- Edit tampilan chart scatter sesuai keinginan dan kebutuhan.
- Tambahkan chart elements trendline untuk menampilkan trendline pada data yang telah disajikan dalam diagram.
- Untuk mendapatkan nilai R-squared secara otomatis, klik kanan pada trendline -> Format trendline -> Centang bagian “Display R-squared value on chart”.
Dengan demikian, akan tampak seperti gambar di bawah ini.
Hasil Analisis
Dari hasil analisis dapat diperoleh beberapa informasi, yaitu:
- Rata-rata dari variable data Engine-size adalah 126,9073
- Rata-rata dari variable data Price adalah 13207,13
- Nilai R2 adalah 0,4959
- Nilai R adalah 0,704202
Dapat disimpulkan bahwa semakin tinggi nilai pada variable Engine-size maka akan semakin tinggi juga nilai variable Price. Hubungan kedua variable ini dapat dikatakan memiliki nilai positif dengan nilai korelasi yaitu 0,704202.
Demikian pula dengan data Highway-mpg dan Price, dapat disimpulkan bahwa:
- Rata-rata dari variable data Highway-mpg adalah 30,75122
- Rata-rata dari variable data Price adalah 13207,13
- Nilai R2 adalah 0,4709
- Nilai R adalah 0,686222
Dapat disimpulkan bahwa semakin tinggi nilai pada variable Highway-mpg maka akan semakin rendah nilai variable Price. Hubungan kedua variable ini dapat dikatakan memiliki nilai kuat negatif dengan nilai korelasi yaitu 0,686222.