Data adalah inti dari penelitian, dan visualisasi data adalah salah satu cara untuk memahami dan menganalisis data. Dalam artikel ini, kita akan membahas tentang bagaimana melakukan visualisasi data dengan menggunakan bahasa pemrograman R.
Data Wide Table dan Long Table
Dalam R, data dapat diwakili dalam dua format, yaitu Format Tabel Lebar (Wide Table) dan Format Tabel Panjang (Long Table). Berikut adalah contoh Format Tabel Lebar:
Sepal.Length | Sepal.Width | Petal.Length | Petal.Width | Species |
---|---|---|---|---|
5.1 | 3.5 | 1.4 | 0.2 | setosa |
4.9 | 3.0 | 1.4 | 0.2 | setosa |
… | … | … | … | … |
Transformation to reform Wie to Long Table format :
iris_long <- iris %>% gather(fitur, value, Sepal.Length:Petal.Width)
iris_long %>% head(5)
Plot dengan plot() Fungsi
Plot adalah salah satu cara untuk visualisasi data. Fungsi plot()
dapat digunakan untuk membuat berbagai jenis plot, seperti scatter plot, line plot, bar chart, dan lain-lain.
plot()
Fungsi plot()
dapat digunakan dengan beberapa parameter, antara lain:
type
: tipe plot yang ingin dibuat.xlab
danylab
: label untuk sumbu X dan Y.main
: judul plot.col
: warna yang akan digunakan dalam plot.
Contoh penggunaan fungsi plot()
adalah sebagai berikut:
plot(iris$Sepal.Length, type = 'b')
Plot dengan dua parameter dapat digunakan untuk membuat scatter plot antara dua variabel numerik.
plot(iris$Sepal.Length, iris$Petal.Length, main='Correlation between Petal Lenght dan Sepal Lenght', xlab='Sepal Length', ylab='Petal Length')
Plot dengan beberapa parameter dapat digunakan untuk membuat plot yang lebih kompleks.
plot(iris$Sepal.Length, iris$Petal.Length, main='Correlation between Petal Lenght dan Sepal Lenght', xlab='Sepal Length', ylab='Petal Length', col=iris$Species)
Bar Chart dengan barplot() Fungsi
Fungsi barplot()
dapat digunakan untuk membuat bar chart yang menunjukkan distribusi data numerik.
t <- table(iris$Species)
barplot(t)
Histogram dengan hist() Fungsi
Fungsi hist()
dapat digunakan untuk membuat histogram yang menunjukkan distribusi data numerik.
hist(iris$Sepal.Length, breaks = 20)
Box Plot dengan boxplot() Fungsi
Fungsi boxplot()
dapat digunakan untuk membuat box plot yang menunjukkan distribusi data numerik berdasarkan median dan quartile, serta untuk mendeteksi nilai outlier.
boxplot(iris$Sepal.Width)
Heatmap dengan heatmap() Fungsi
Fungsi heatmap()
dapat digunakan untuk membuat heatmap yang menunjukkan hubungan antara beberapa variabel numerik.
heatmap(as.matrix(iris[1:30,1:3]))
Correlation Plot dengan corrplot() Fungsi
Fungsi corrplot()
dapat digunakan untuk membuat plot korrelasi antara beberapa variabel numerik. Fungsi ini dapat diakses melalui paket corrplot
.
corrplot(cor(iris[,1:4]))
ggplot2
ggplot2 adalah salah satu paket visualisasi data yang paling populer dan powerful dalam R. Dalam bagian ini, kita akan membahas tentang penggunaan fungsi-fungsi dasar dalam ggplot2.
Introduction to ggplot2
ggplot2 adalah paket R untuk visualisasi data yang dikembangkan oleh Hadley Wickham. Paket ini didesain untuk memudahkan pengguna dalam membuat plot yang indah dan berisi informasi.
Basic Plot using ggplot2
ggplot2 dapat digunakan untuk membuat plot dasar seperti scatter plot, line plot, bar chart, dan lain-lain.
ggplot(iris, aes(x=Sepal.Length, y=Petal.Length)) + geom_point()
Penggunaan ggplot2
Penggunaan ggplot2 sangat luas dan dapat digunakan untuk membuat berbagai jenis plot. Berikut adalah contoh-contoh penggunaannya:
ggplot(iris, aes(x=Sepal.Length, y=Petal.Length)) + geom_point() + theme_classic()
Dalam bagian ini, kita telah membahas tentang beberapa cara untuk melakukan visualisasi data dengan menggunakan R. Selain itu, ada masih banyak cara lain untuk membuat plot yang indah dan berisi informasi.