Dalam analisis statistik, regresi linear sederhana adalah suatu teknik yang digunakan untuk menganalisis hubungan antara variabel independen dan dependen. Dalam posting ini, kita akan mempelajari cara menggunakan Python dan library matplotlib untuk membuat grafik scatter plot dan melakukan analisis regresi linear sederhana.
Membuat Grafik Scatter Plot
Grafik scatter plot adalah suatu representasi visual dari hubungan antara dua variabel. Dalam contoh ini, kita akan membuat grafik scatter plot yang menunjukkan hubungan antara luas lahan (lot area) dan harga jual rumah.
Kita dapat menggunakan Python dan library matplotlib untuk membuat grafik scatter plot sebagai berikut:
import matplotlib.pyplot as plt
# Data lot area dan harga jual rumah
x = [1, 2, 3, 4, 5]
y = [10, 20, 30, 40, 50]
# Membuat grafik scatter plot
plt.scatter(x, y)
# Menambahkan judul dan label
plt.xlabel('Luas Lahan')
plt.ylabel('Harga Jual Rumah')
plt.title('Hubungan Antara Luas Lahan dan Harga Jual Rumah')
# Mengeksekusi grafik
plt.show()
Grafik scatter plot yang dihasilkan akan menunjukkan hubungan antara luas lahan dan harga jual rumah.
Analisis Regresi Lineer Sederhana
Dalam analisis regresi linear sederhana, kita dapat menggunakan rumus sebagai berikut:
Y = β0 + β1X + ε
Dimana:
- Y adalah variabel dependen (harga jual rumah)
- X adalah variabel independen (luas lahan)
- β0 adalah konstanta
- β1 adalah koefisien regresi
- ε adalah variabel noise
Dalam Python, kita dapat menggunakan library statsmodels untuk melakukan analisis regresi linear sederhana sebagai berikut:
import statsmodels.api as sm
# Data lot area dan harga jual rumah
x = [1, 2, 3, 4, 5]
y = [10, 20, 30, 40, 50]
# Membuat model regresi linear sederhana
X = sm.add_constant(x)
model = sm.OLS(y, X).fit()
# Menampilkan koefisien regresi
print(model.params)
# Mengeksekusi grafik scatter plot dengan garis regresi
plt.scatter(x, y)
plt.plot(x, model.fittedvalues, 'r-')
plt.xlabel('Luas Lahan')
plt.ylabel('Harga Jual Rumah')
plt.title('Hubungan Antara Luas Lahan dan Harga Jual Rumah')
# Mengeksekusi grafik
plt.show()
Grafik scatter plot yang dihasilkan akan menunjukkan hubungan antara luas lahan dan harga jual rumah, serta garis regresi yang menunjukkan koefisien regresi.
Dalam posting ini, kita telah mempelajari cara menggunakan Python dan library matplotlib untuk membuat grafik scatter plot dan melakukan analisis regresi linear sederhana. Dengan menggunakan teknik-teknik ini, kita dapat memahami hubungan antara variabel independen dan dependen dalam data, serta menentukan koefisien regresi yang relevan.