Ketika kita melakukan regresi linier tunggal, kita dapat membuat plot regresi yang menunjukkan hubungan antara variabel terikat dan variasi. Namun, ketika kita memiliki lebih dari satu variasi, maka tidak ada cara langsung untuk membuat plot regresi tunggal. Oleh karena itu, dalam artikel ini kita akan membahas bagaimana cara plotting multiple linear regression results dalam R menggunakan ggplot2.
Penggunaan ggplot2
Ggplot2 adalah salah satu paket visualisasi data yang paling populer di R. Paket ini memungkinkan kita membuat plot yang berbeda-beda, termasuk scatter plots, line plots, dan lain-lain.
Membuat Plot Regresi Multiple
Kita akan menggunakan data frame "Orange" yang tersedia secara bawaan di R. Data frame ini berisi detail tentang pertumbuhan lima jenis pohon jeruk yang berbeda. Kita akan membuat plot regresi multiple dengan menggunakan ggplot2.
Syntax
ggplot(Orange, aes(x=circumference, y=age)) +
geom_point() +
theme_classic()
Membuat Plot Regresi Single
Kita dapat membuat plot regresi single dengan menggunakan fungsi geom_smooth()
dan memilih metode "auto".
ggplot(Orange, aes(x=circumference, y=age)) +
geom_point() +
theme_classic() +
geom_smooth(method="lm", se=FALSE, fullrange=TRUE)
Membuat Plot Regresi Multiple
Kita dapat membuat plot regresi multiple dengan menggunakan fungsi aes()
dan memilih atribut "Tree" sebagai shape.
ggplot(Orange, aes(x=circumference, y=age, shape=Tree)) +
geom_point() +
theme_classic()
Menambahkan Garis Regresi Multiple
Kita dapat menambahkan garis regresi multiple dengan menggunakan fungsi geom_smooth()
dan memilih atribut "Tree" sebagai color.
ggplot(Orange, aes(x=circumference, y=age, shape=Tree)) +
geom_point() +
theme_classic() +
geom_smooth(method="lm", se=FALSE, fullrange=TRUE, aes(color=Tree))
Dalam artikel ini kita telah membahas bagaimana cara plotting multiple linear regression results dalam R menggunakan ggplot2. Kita dapat membuat plot regresi single dan multiple dengan menggunakan fungsi geom_point()
dan geom_smooth()
. Dengan demikian, kita dapat melihat hubungan antara variasi dan variabel terikat lebih jelas.