Dalam artikel ini, kita akan membahas salah satu fungsi plotting yang paling populer dalam pandas, yaitu scatter_matrix
. Fungsi ini digunakan untuk membuat matrix of scatter plots yang menunjukkan hubungan antara variabel-variabel di dalam data frame.
Penggunaan
Fungsi scatter_matrix
dapat dipanggil dengan menggunakan sintaks berikut:
pandas.plotting.scatter_matrix(frame, alpha=0.5, figsize=(10, 10))
Parameter yang tersedia adalah:
frame
: Data frame yang akan digunakan untuk membuat scatter matrix.alpha
: Tingkat transparansi plot (default: 0.5).figsize
: Ukuran plot (lebar dan tinggi) dalam inches.ax
: Matplotlib axis object untuk plot (optional).grid
: Jika True, maka akan menampilkan grid di plot.diagonal
: Pilihan untuk membuat histogram atau Kernel Density Estimation (KDE) di diagonal plot (default: 'hist').marker
: Jenis marker yang digunakan untuk plot (default: '.').density_kwds
danhist_kwds
: Keyword arguments untuk kernel density estimate dan hist functions.range_padding
: Jarak relatif antara nilai minimum dan maximum pada sumbu x dan y.
Fungsi ini akan mengembalikan numpy array yang berisi scatter plots.
Contoh
Berikut adalah contoh penggunaan fungsi scatter_matrix
:
import pandas as pd
import matplotlib.pyplot as plt
# Buat data frame dengan 1000 baris dan 4 kolom
df = pd.DataFrame(np.random.randn(1000, 4), columns=['A', 'B', 'C', 'D'])
# Membuat scatter matrix dengan alpha=0.2 dan figsize=(10, 10)
pd.plotting.scatter_matrix(df, alpha=0.2, figsize=(10, 10))
plt.show()
Menghasilkan output seperti berikut:
Perbaikan Error
Jika Anda mendapatkan error "AttributeError: module 'pandas' has no attribute 'scatter_matrix'", maka Anda perlu menambahkan plotting
sebelum scatter_matrix
, seperti berikut:
pd.plotting.scatter_matrix(df, alpha=0.2, figsize=(10, 10))
Jika Anda masih mendapatkan error "ModuleNotFoundError: No module named 'scipy'", maka Anda perlu menginstall package scipy dengan menggunakan pip:
pip install scipy
Dengan demikian, Anda dapat memanfaatkan fungsi scatter_matrix
untuk membuat scatter matrix yang menarik dan informatif.