Pandas Plotting: scatter_matrix

Pandas Plotting: scatter_matrix

Dalam artikel ini, kita akan membahas salah satu fungsi plotting yang paling populer dalam pandas, yaitu scatter_matrix. Fungsi ini digunakan untuk membuat matrix of scatter plots yang menunjukkan hubungan antara variabel-variabel di dalam data frame.

Penggunaan

Fungsi scatter_matrix dapat dipanggil dengan menggunakan sintaks berikut:

pandas.plotting.scatter_matrix(frame, alpha=0.5, figsize=(10, 10))

Parameter yang tersedia adalah:

  • frame: Data frame yang akan digunakan untuk membuat scatter matrix.
  • alpha: Tingkat transparansi plot (default: 0.5).
  • figsize: Ukuran plot (lebar dan tinggi) dalam inches.
  • ax: Matplotlib axis object untuk plot (optional).
  • grid: Jika True, maka akan menampilkan grid di plot.
  • diagonal: Pilihan untuk membuat histogram atau Kernel Density Estimation (KDE) di diagonal plot (default: 'hist').
  • marker: Jenis marker yang digunakan untuk plot (default: '.').
  • density_kwds dan hist_kwds: Keyword arguments untuk kernel density estimate dan hist functions.
  • range_padding: Jarak relatif antara nilai minimum dan maximum pada sumbu x dan y.

Fungsi ini akan mengembalikan numpy array yang berisi scatter plots.

Contoh

Berikut adalah contoh penggunaan fungsi scatter_matrix:

import pandas as pd
import matplotlib.pyplot as plt

# Buat data frame dengan 1000 baris dan 4 kolom
df = pd.DataFrame(np.random.randn(1000, 4), columns=['A', 'B', 'C', 'D'])

# Membuat scatter matrix dengan alpha=0.2 dan figsize=(10, 10)
pd.plotting.scatter_matrix(df, alpha=0.2, figsize=(10, 10))

plt.show()

Menghasilkan output seperti berikut:

Perbaikan Error

Jika Anda mendapatkan error "AttributeError: module 'pandas' has no attribute 'scatter_matrix'", maka Anda perlu menambahkan plotting sebelum scatter_matrix, seperti berikut:

pd.plotting.scatter_matrix(df, alpha=0.2, figsize=(10, 10))

Jika Anda masih mendapatkan error "ModuleNotFoundError: No module named 'scipy'", maka Anda perlu menginstall package scipy dengan menggunakan pip:

pip install scipy

Dengan demikian, Anda dapat memanfaatkan fungsi scatter_matrix untuk membuat scatter matrix yang menarik dan informatif.