Visualisasi Data dengan Scatter Plot dan Identifikasi Titik

Visualisasi Data dengan Scatter Plot dan Identifikasi Titik

Seiring berkembangnya teknologi informasi, pengumpulan dan analisis data telah menjadi lebih mudah. Salah satu cara yang populer untuk visualisasi data adalah menggunakan scatter plot, sebuah grafik yang digunakan untuk menganalisis hubungan antara dua variabel. Dalam artikel ini, kita akan membahas cara membuat scatter plot dengan R dan mengidentifikasi titik-titik dalam grafik tersebut.

Membuat Scatter Plot

Dalam R, Anda dapat membuat scatter plot menggunakan fungsi geom_point() dari paket ggplot2. Contoh kode berikut menunjukkan bagaimana Anda dapat membuat scatter plot dengan dua variabel, yaitu CPI (Corruption Perceptions Index) dan HDI (Human Development Index), yang diperoleh dari data tahun 2015.

library(ggplot2)

# Membuat scatter plot
ggplot(data, aes(x = CPI, y = HDI)) +
 geom_point() +
 theme_minimal()

Grafik scatter plot akan menunjukkan hubungan antara CPI dan HDI. Anda dapat menggunakan opsi-opsi seperti size, color, dan shape untuk mempersonalisasi grafik.

Mengidentifikasi Titik

Dalam beberapa kasus, Anda mungkin ingin mengidentifikasi titik-titik dalam scatter plot yang memiliki nilai tertentu. Fungsi identify() dari R dapat membantu Anda melakukan hal itu. Contoh kode berikut menunjukkan bagaimana Anda dapat menggunakan fungsi identify() untuk mengidentifikasi titik dalam scatter plot.

# Mengidentifikasi titik dalam scatter plot
identify(x = data$CPI, y = data$HDI, labels = data label)

Fungsi identify() akan membaca posisi pointer mouse dan mencari titik yang paling dekat dengan pointer. Jika titik tersebut dekat dengan pointer, maka index titik tersebut akan dikembalikan sebagai bagian dari nilai fungsi.

Opsi-opsi Fungsi Identify

Fungsi identify() juga memiliki beberapa opsi-opsi yang dapat Anda gunakan untuk mengkonfigurasi fungsi. Contoh opsi-opsi yang tersedia adalah:

  • n: Jumlah maksimum titik yang akan diidentifikasi.
  • plot: Jika TRUE, maka label titik akan dicetak dalam grafik. Jika FALSE, maka label titik tidak akan dicetak.
  • offset: Jarak (dalam karakter lebar) yang memisahkan label dari titik.

Dengan demikian, Anda dapat menggunakan fungsi identify() untuk mengidentifikasi titik dalam scatter plot dan meningkatkan interaktivitas dengan pengguna.