Dalam dunia statistik dan ilmu pengetahuan, model regresi linear adalah salah satu metode terpopuler untuk menganalisis hubungan antara dua variabel. Dalam artikel ini, kita akan membahas tentang bagaimana menghitung koefisien regresi linear dengan menggunakan bahasa pemrograman R.
Hubungan Variabel X dan Y
Dalam diagram scatterplot berikut, kita dapat melihat bahwa variabel X dan Y memiliki hubungan negatif. Yang berarti, semakin tinggi nilai X, maka nilai Y akan semakin kecil.
X | Y
---------
10 | 20
15 | 18
20 | 16
25 | 14
30 | 12
Dengan menggunakan persamaan regresi linear, kita dapat menentukan koefisien a dan b sebagai berikut:
Menghitung Koefisien Regresi
Dalam contoh di atas, kita mendapatkan nilai rata-rata variabel X sebesar 38.25 dan variabel Y sebesar 55.55. Dengan menggunakan persamaan regresi linear, kita dapat menentukan koefisien a dan b sebagai berikut:
Menghitung Model Regresi
Dalam contoh di atas, kita mendapatkan model regresi sebagai berikut:
Cara Menghitung Model Regresi dengan R
Kita dapat menggunakan bahasa pemrograman R untuk menghitung model regresi dengan cepat. Contohnya, kita memiliki data penjualan permen pada bulan Januari, Februari, Maret, April, dan Mei 1998 sebagai berikut:
month | year | penjualan_permen
---------
1 | 1998 | 345646
2 | 1998 | 454344
3 | 1998 | 346987
4 | 1998 | 209854
5 | 1998 | 254634
Dengan menggunakan perintah berikut, kita dapat memprediksi kunjungan dokter:
data_prediksi = data.frame(
month = c(1,2,3,4,5),
year = c(1998, 1998, 1998, 1998, 1998),
penjualan_permen = c(345646,454344,346987,209854,254634)
)
predict(model, data_prediksi)
Interpretasi Model Regresi
Dalam contoh di atas, kita mengetahui bahwa hubungan antara penjualan permen dengan kunjungan ke dokter bersifat positif. Yang berarti, ketika penjualan permen semakin meningkat, maka kunjungan ke dokter akan meningkat juga. Namun efek peningkatan kunjungan dokter ini akan terjadi dalam 4 bulan kedepan.
Kesimpulan
Dalam artikel ini, kita membahas tentang bagaimana menghitung model regresi linear dengan menggunakan bahasa pemrograman R. Dengan menggunakan persamaan regresi linear, kita dapat menentukan koefisien a dan b yang digunakan untuk memprediksi nilai variabel Y berdasarkan nilai variabel X.
Referensi
Belajar Data Science: Bahasa Pemrograman R Cocok untuk Pemula
Untuk menjadi seorang praktisi data yang keren, kamu dapat mengakses Modul baru yang fresh dan tentunya real case industry di DQLab.id. Selamat mencoba!