Pada dasarnya, analisis data melibatkan berbagai teknik untuk memahami hubungan antara variabel-variabel dalam suatu dataset. Salah satu cara yang paling populer adalah dengan menggunakan scatter plot, yaitu plot 2D yang menampilkan hubungan antara dua variabel. Namun, ketika kita memiliki banyak variabel dan ingin melihat hubungan antara setiap pasangan variabel, maka scatter matrix lah yang menjadi pilihan tepat.
Penggunaan Scatter Matrix
Scatter matrix adalah sebuah fungsi yang dikembangkan oleh HoloViews (library Python untuk visualisasi data) yang digunakan untuk menampilkan semua hubungan pairwise antara kolom-kolom dalam suatu dataset. Dalam scatter matrix, setiap entry non-diagonal menampilkan plot 2D dari dua variabel yang berbeda, sementara plot diagonal menampilkan distribusi data dalam masing-masing individu kolom.
Contoh Penggunaan
Berikut adalah contoh penggunaan scatter matrix:
import numpy as np
import pandas as pd
from hvplot.plotting import scatter_matrix
df = pd.DataFrame(np.random.randn(1000, 4), columns=['A','B','C','D'])
scatter_matrix(df, alpha=0.2)
Dalam contoh di atas, kita menggunakan dataset dengan 4 variabel dan menghasilkan scatter matrix yang menampilkan semua hubungan pairwise antara kolom-kolom.
Parameter-Parameter
Scatter matrix juga dilengkapi dengan beberapa parameter yang dapat digunakan untuk mengubah tampilan plot. Beberapa parameter tersebut adalah:
chart
: Memungkinkan kita untuk mengganti tipe plot off-diagonal.diagonal
: Memungkinkan kita untuk mengganti tipe plot diagonal.c
: Memungkinkan kita untuk menambahkan warna pada data berdasarkan kolom tertentu.rasterize
(ataudatashade
): Memungkinkan kita untuk menggunakan Datashader untuk mengrender plot off-diagonal secara lebih efisien.dynspread
(atauspread
): Memungkinkan kita untuk membuat titik-titik pada plot menjadi lebih jelas.
Dengan demikian, scatter matrix dapat digunakan sebagai alat yang sangat berguna dalam analisis data dan membantu kita memahami hubungan antara variabel-variabel dalam suatu dataset.