Dalam analisis data, scatter plot adalah salah satu jenis visualisasi yang paling umum digunakan untuk menampilkan hubungan antara dua variabel numerik. Namun, dalam beberapa kasus, scatter plot dapat mengalami masalah overplotting karena terlalu banyak data point yang perlu dipertunjukkan.
Dalam situasi seperti ini, heatmap dapat dijadikan alternatif yang bagus. Heatmap dapat membantu menyelesaikan masalah overplotting dengan cara membagi nilai-nilai menjadi kotak-kotak hitungan. Selain itu, heatmap juga dapat digunakan untuk menampilkan hubungan antara variabel-variabel yang tidak kontinu dan numerik.
Jika kita ingin menambahkan variabel ketiga ke scatter plot dan variabel tersebut berupa timestamp, maka kita dapat menggunakan connected scatter plot. Dalam hal ini, bukan hanya relasi antara dua variabel yang diperlihatkan, tapi juga bagaimana hubungan tersebut berubah seiring waktu.
Alat Visualisasi
Scatter plot adalah chart type dasar yang seharusnya dapat dibuat oleh semua alat visualisasi atau solusi. Penghitungan trend garis linier dasar serta warna point menurut level variabel ketiga juga dapat diaktifkan. Namun, opsi-opsi lain seperti trend garis non-linear dan encoding value variabel ketiga dengan bentuk, tidak selalu tersedia.
Namun, bahkan tanpa opsi-opsi tersebut, scatter plot masih dapat menjadi chart type yang berharga digunakan dalam investigasi relasi antara variabel numerik dalam data. Scatter plot adalah salah satu dari banyak chart type lainnya yang dapat digunakan untuk visualisasi data. Untuk mempelajari lebih lanjut, Anda dapat membaca artikel tentang chart types esensial, cara memilih tipe visualisasi data, atau dengan menjelajahi koleksi artikel tentang chart category.
Penggunaan FeatureScatter
FeatureScatter adalah fungsi yang digunakan dalam Seurat untuk membuat scatter plot dari dua fitur (biasanya ekspresi fitur) di atas sejumlah sel tunggal. Sel-sel tersebut dipertunjukkan berdasarkan identitas kelasnya, dan korrelasi Pearson antara dua fitur ditampilkan di atas plot.
Fungsi FeatureScatter memiliki argumen-argumen berikut:
object
: Seurat objectfeature1
danfeature2
: Fitur pertama dan kedua yang akan dipertunjukkancells
: Sel-sel yang akan dipertunjukkan (nilai default adalah NULL)shuffle
: Apakah data point diacak secara acak (nilai default adalah FALSE)seed
: Benih untuk diacakkan data pointgroup.by
dansplit.by
: Metadata column untuk mengelompokkan atau membagi data pointcols
: Warna yang akan digunakan untuk identitas kelaspt.size
: Ukuran titik pada plotshape.by
: (Dipakai tapi tidak diaktifkan)span
dansmooth
: Opsi untuk membuat grafik yang lebih haluscombine
: Apakah plot dipertunjukkan dalam satu bagianslot
: Slot data yang akan digunakanplot.cor
: Apakah korrelasi diaktifkan dalam judul plotncol
danraster
: Opsi untuk membuat plot dengan beberapa kolom atau rasterraster.dpi
danjitter
: Opsi untuk membuat grafik yang lebih jelas
Contoh penggunaan:
data("pbmc_small")
FeatureScatter(object = pbmc_small, feature1 = 'CD9', feature2 = 'CD3E')
Dengan menggunakan FeatureScatter, Anda dapat dengan mudah membuat scatter plot untuk analisis data.