Menggunakan Fungsi `scatter_matrix` dalam Pandas untuk Membuat Grafik Scatter

Menggunakan Fungsi `scatter_matrix` dalam Pandas untuk Membuat Grafik Scatter

Fungsi scatter_matrix dalam Pandas adalah sebuah fungsi yang digunakan untuk membuat grafik scatter, juga dikenal sebagai matrix of scatter plots. Fungsi ini dapat membantu kita dalam menganalisis hubungan antara kolom-kolom dalam data frame.

Sintaks Fungsi

Fungsi scatter_matrix memiliki sintaks berikut:

pd.plotting.scatter_matrix(
 frame,
 alpha=0.5,
 figsize=(6, 6),
 diagonal='hist',
 color='b'
)

Dimana:

  • frame: Data frame yang akan digunakan untuk membuat grafik scatter.
  • alpha: Parameter untuk menentukan transparansi dari grafik scatter (default adalah 0.5).
  • figsize: Ukuran dari grafik scatter (default adalah (6, 6)).
  • diagonal: Tipe plot yang akan digunakan untuk mewakili hubungan antara kolom-kolom di diagonal (opsi lainnya adalah 'kde' dan 'box').
  • color: Warna yang akan digunakan untuk grafik scatter.

Contoh Penggunaan

Berikut ini adalah contoh penggunaan fungsi scatter_matrix:

import pandas as pd
import matplotlib.pyplot as plt

# Membuat data frame sample
data = {
 'A': [1, 2, 3, 4, 5],
 'B': [2, 3, 4, 5, 6],
 'C': [3, 4, 5, 6, 7],
}
df = pd.DataFrame(data)

# Membuat grafik scatter
scatter_matrix = pd.plotting.scatter_matrix(df, alpha=0.8, figsize=(8, 8), diagonal='hist', color='b')

plt.show()

Dalam contoh di atas, kita membuat data frame sample dan kemudian menggunakan fungsi scatter_matrix untuk membuat grafik scatter yang menampilkan hubungan antara kolom-kolom dalam data frame.

Kelebihan Fungsi

Fungsi scatter_matrix memiliki beberapa kelebihan, seperti:

  • Dapat membantu kita dalam menganalisis hubungan antara kolom-kolom dalam data frame.
  • Dapat menampilkan hubungan antara dua kolom dengan menggunakan grafik scatter.
  • Dapat menampilkan distribusi dari nilai-nilai di dalam setiap kolom.

Dalam artikel ini, kita telah mempelajari cara menggunakan fungsi scatter_matrix dalam Pandas untuk membuat grafik scatter. Fungsi ini dapat membantu kita dalam menganalisis data dan mendapatkan insights yang lebih baik tentang hubungan antara kolom-kolom dalam data frame.