Dalam analisis data, plot adalah salah satu cara terbaik untuk menampilkan informasi dalam bentuk visual. Dalam hal ini, kita akan belajar bagaimana membuat plot yang jelas dan mudah dipahami dengan menggunakan fungsi-fungsi R.
Membuat Plot dengan Multiple Data
Kita akan membuat plot yang menampilkan data GDP (Gross Domestic Product) dari Amerika Serikat dan Uni Soviet Union. Pertama-tama, kita gunakan fungsi plot()
untuk menampilkan satu set data, kemudian kita tambahkan set data lainnya ke dalam plot dengan fungsi points()
atau lines()
.
plot(usa ~ year,
data = gdp,
main = "GDP of USA and USSR",
xlab = "Year",
ylab = "GDP per capita (1990 international dollar)",
cex = 0.75,
ylim = c(0, 25000))
points(ussr ~ year,
data = gdp,
pch = 0,
cex = 0.75,
col = "red")
grid()
Menambahkan Legenda
Legenda adalah fitur yang penting dalam membuat plot agar lebih jelas dan mudah dipahami. Kita dapat menambahkan legenda dengan fungsi legend()
. Argument pertama dalam fungsi legend()
adalah posisi legenda, sedangkan argument kedua adalah vector karakter yang berisi teks legenda.
legend("topleft",
legend = c("USA", "USSR"),
pch = c(1, 0),
col = c("black", "red"))
Menambahkan Garis Trend
Selain membuat plot dan menambahkan legenda, kita juga dapat menambahkan garis trend dengan fungsi lowess()
.
lines(lowess(gdp$year, gdp$usa))
lines(lowess(gdp$year[!is.na(gdp$ussr)], na.omit(gdp$ussr)),
col = "red")
Tips dan Trik
Dalam membuat plot, beberapa tips dan trik yang perlu diingat:
- Pilih simbol point yang unik untuk setiap data.
- Tambahkan legenda agar lebih jelas dan mudah dipahami.
- Atur range koordinat dengan argument
xlim
danylim
dalam fungsiplot()
. - Jika data memiliki distribusi yang tidak teratur, kita mungkin perlu mengaplikasikan transformasi koordinat sebelum memplotnya.
Dalam tutorial ini, kita telah belajar bagaimana membuat plot yang jelas dan mudah dipahami dengan menggunakan fungsi-fungsi R. Selanjutnya, kita akan membahas tentang re-expression dan cara lain untuk membuat plot yang lebih baik.