Dalam analisis statistik, visualisasi data menjadi salah satu langkah yang penting untuk memahami perilaku dan hubungan antar variabel. Salah satu contoh visualisasi yang berguna adalah scatter plot, yaitu sebuah diagram yang menunjukkan hubungan antara dua atau lebih variabel. Dalam artikel ini, kita akan membahas tentang h-scatterplot dengan menggunakan library Gstat di R.
Apa itu H-Scatterplot?
H-scatterplot adalah sebuah jenis scatter plot yang digunakan untuk menganalisis data dengan memperhatikan jarak antara titik-titik. Dalam fungsi hscat, kita dapat menentukan formula untuk variabel dependen, data, dan batas-batas jarak (breaks) untuk mengklasifikasikan data.
Fungsi H-Scatterplot
Fungsi h-scatterplot dalam Gstat adalah hscat
. Fungsi ini berbasis pada fungsi xyplot
dan dapat digunakan untuk membuat plot-point pairs dengan jarak specific. Berikut adalah contoh penggunaan fungsi hscat:
hscat(formula, data, breaks, pch = 3, cex = .6, mirror = FALSE,
variogram.alpha = 0, as.table = TRUE, ...)
Argumen Fungsi H-Scatterplot
Fungsi h-scatterplot memiliki beberapa argumen yang dapat disesuaikan untuk memenuhi kebutuhan analisis. Berikut adalah argumen-argemen yang tersedia:
formula
: Spesifikasi variabel dependen.data
: Data di mana variabel dalam formula akan di-resolve.breaks
: Batas-batas jarak untuk mengklasifikasikan data.pch
: Simbol plot.cex
: Ukuran simbol plot.mirror
: Logical; duplikat semua titik-titik yang dipantulkan di sepanjang x=y? (catatan bahwa korrelasi adalah dari titik-titik yang dipplot).variogram.alpha
: Parameter untuk di-pass sebagai alpha parameter ke variogram; jika alpha dispesifikasi, maka hanya akan mempengaruhi xyplot dengan di-pass melalui …as.table
: Logical; jika TRUE, panel-panel plot secara vertical.
Nilai Fungsi H-Scatterplot
Fungsi h-scatterplot akan menghasilkan objek dari kelas trellis, biasanya berupa h scatter plot.
Catatan Penting
Dalam fungsi h-scatterplot, data pairs diplot hanya sekali, maka tidak akan terlihat simetri. Hal ini dapat menjadi masalah jika Anda ingin membandingkan antara dua variabel yang memiliki hubungan tidak simetris.
Contoh Penggunaan Fungsi H-Scatterplot
Berikut adalah contoh penggunaan fungsi hscat:
data(mtcars)
hscat(cyl ~ mpg, data = mtcars, breaks = seq(0, 100, by = 20),
pch = 3, cex = .6, mirror = FALSE, as.table = TRUE)
Dalam contoh di atas, kita menggunakan fungsi hscat untuk membuat scatter plot antara variabel cyl
dan mpg
dari dataset mtcars
. Kita juga menentukan batas-batas jarak (breaks) dengan menggunakan fungsi seq
dan mengklasifikasikan data menjadi 5 kelas. Selain itu, kita juga menentukan simbol plot (pch = 3
) dan ukuran simbol plot (cex = .6
).
Dalam kesimpulan, h-scatterplot adalah sebuah visualisasi yang berguna untuk menganalisis hubungan antar variabel dengan memperhatikan jarak. Dengan menggunakan fungsi hscat dalam Gstat, kita dapat membuat plot-point pairs dengan jarak specific dan menentukan batas-batas jarak untuk mengklasifikasikan data.
Referensi
Pebesma, E.J., 2004. Multivariable geostatistics in S: the gstat package. Computers and Geosciences, 30(6): 683-691.
http://www.gstat.org/