Dalam analisis data, scatter plot adalah salah satu cara yang paling umum untuk menggambarkan hubungan antara dua variabel numerik. Namun, dalam beberapa kasus, kita perlu menambahkan informasi tambahan ke dalam scatter plot, seperti persentase dari total nilai yang jatuh dalam setiap kotak grid.
Dalam artikel ini, kita akan membahas beberapa contoh dan solusi untuk menggabungkan scatter plot dengan persentase.
1. Menampilkan Persentase di Scatter Plot
Salah satu cara untuk menampilkan persentase adalah dengan menggunakan fitur stat_bin
dalam paket ggplot2
. Contohnya, kita dapat membuat scatter plot seperti berikut:
qplot(mydataf) +
stat_bin(aes(n = nrow(mydataf), y = ..count../n)) +
scale_y_continuous(formatter = "percent")
Namun, jika kita ingin menampilkan persentase dalam bentuk yang lebih rinci, seperti dengan menggunakan huruf "%%" sebagai simbol persentase, maka kita perlu menggunakan fitur scale_y_continuous
dengan argumen formatter
.
2. Menampilkan Persentase di Chart Kategorikal
Ketika kita memiliki data kategori dan ingin menampilkan persentase nilai dalam setiap kelas, maka kita dapat menggunakan fitur stat_bin
lagi. Contohnya:
ggplot(mydataf, aes(x = mydata)) +
geom_bar(aes(y = (..count..)/sum(..count..))) +
scale_y_continuous(formatter = 'percent')
Namun, jika kita ingin menampilkan persentase dalam bentuk yang lebih rinci, maka kita perlu menggunakan fitur scale_y_continuous
dengan argumen formatter
.
3. Menampilkan Proporti di Scatter Plot
Ketika kita memiliki dataset dengan beberapa kelas dan ingin membuat scatter plot untuk setiap kombinasi pasangan fitur, maka kita perlu memastikan bahwa jumlah sampel dalam setiap kelas sama. Namun, jika kita tidak dapat menjamin jumlah sampel sama dalam setiap kelas, maka kita perlu menggunakan fitur stat_bin
dengan argumen binwidth
.
Contohnya:
ggplot(data=mydataf, aes(x = mydata1, y = mydata2)) +
geom_point(aes(color = factor(mydata3)))
Namun, jika kita ingin menampilkan persentase di setiap box grid, maka kita perlu menggunakan fitur stat_bin
dengan argumen binwidth
.
4. Menampilkan Persentase di Grid Box
Ketika kita memiliki data dua-dimensional dan ingin menampilkan persentase nilai yang jatuh dalam setiap kotak grid, maka kita perlu menggunakan fitur stat_bin
dengan argumen binwidth
. Contohnya:
ggplot(data=mydataf, aes(x = mydata1, y = mydata2)) +
geom_tile(aes(fill = (..count..)/sum(..count..))) +
scale_fill_continuous(formatter = 'percent')
Dalam artikel ini, kita telah membahas beberapa contoh dan solusi untuk menggabungkan scatter plot dengan persentase. Kita dapat menggunakan fitur stat_bin
dalam paket ggplot2
untuk menampilkan persentase di scatter plot, chart kategori, atau grid box.