Sebagai praktisi analisis data, kita seringkali dihadapkan dengan permasalahan bagaimana cara mengetahui interval konfiden dan poin estimasi pada regresi linear. Dalam artikel ini, kita akan membahas bagaimana cara menghitungnya menggunakan R.
Pengertian r2
r2 adalah ukuran goodness-of-fit dari regresi linear sederhana yang memiliki nilai antara 0,0 hingga 1,0 dan tidak memiliki satuan. Nilai r2 sebesar 0,0 berarti mengetahui X tidak membantu memprediksi Y. Tidak ada hubungan linear antara X dan Y, sehingga garis fit yang terbaik adalah garis horizontal yang melalui rata-rata nilai semua variabel Y. Sementara itu, jika r2 sama dengan 1,0 maka semua titik berada tepat pada garis lurus tanpa skat. Mengetahui X memungkinkan kita untuk memprediksi Y dengan sempurna.
Bagaimana r2 dihitung
R2 dihitung menggunakan rumus sebagai berikut:
r2 = (SSreg / SStot)
Di mana SSreg adalah sum of squares vertikal dari titik-titik data terhadap garis regresi, dan SStot adalah sum of squares vertikal dari titik-titik data terhadap garis hipotesis nol.
Manfaat r2
R2 sangat berguna dalam beberapa hal. Misalnya, jika kita memiliki seri eksperimen yang sama, maka kita dapat menggunakan R2 sebagai indikator apakah hasil eksperimen tersebut konsisten dengan eksperimen lainnya. Jika kita mendapatkan R2 sebesar 0,75, maka kita harus curiga dan memeriksa lebih lanjut apakah ada kesalahan dalam metode atau reagen yang digunakan.
Bagaimana Menghitung Interval Konfiden
Untuk menghitung interval konfiden pada regresi linear, kita dapat menggunakan rumus sebagai berikut:
CI = [poin estimasi – (Z * σ / √n), poin estimasi + (Z * σ / √n)]
Di mana CI adalah interval konfiden, poin estimasi adalah nilai rata-rata dari variabel Y, Z adalah nilai z-score yang terkait dengan tingkat kepercayaan tertentu, σ adalah variance dari variabel Y, dan n adalah jumlah data.
Bagaimana Menghitung Poin Estimasi
Untuk menghitung poin estimasi pada regresi linear, kita dapat menggunakan rumus sebagai berikut:
poin estimasi = Σ (x_i * y_i) / Σ x_i^2
Di mana x_i dan y_i adalah nilai variabel X dan Y yang terkait.
Dengan demikian, kita dapat menggunakan R untuk menghitung interval konfiden dan poin estimasi pada regresi linear. Keduanya sangat berguna dalam analisis data dan dapat membantu kita dalam membuat keputusan yang lebih tepat.