Dalam beberapa kasus, Anda mungkin perlu menggambar histogram untuk setiap atribut dalam sebuah data frame pandas. Hal ini sangat bermanfaat jika Anda ingin mengetahui distribusi nilai-nilai pada setiap kolom.
Pada artikel ini, saya akan menjelaskan cara membuat histogram untuk setiap atribut menggunakan Python dan library pandas.
Contoh
Misalnya, kita memiliki sebuah data frame yang berisi tiga atribut: points
, assists
, dan rebounds
. Kita ingin menggambar histogram untuk setiap atribut ini.
import pandas as pd
import numpy as np
# Buat DataFrame
df = pd.DataFrame({'points': np.random.randn(1000),
'assists': np.random.randn(1000),
'rebounds': np.random.randn(1000)})
# Gambar histogram untuk setiap atribut
ax = df.hist(figsize=(10, 6))
Kita menggunakan fungsi hist()
pada library pandas dan mengirimkan parameter figsize
untuk menentukan ukuran gambar. Fungsi ini akan menggambar histogram untuk setiap atribut dalam data frame.
Hasil
Berikut adalah contoh hasil dari kode di atas:
+-----------------+
| points | assists | rebounds |
+-----------------+
| **Histogram** | |
| [plot] | |
+-----------------+
| **Histogram** | [plot] |
| | |
+-----------------+
| **Histogram** | |
| | [plot] |
+-----------------+
Kita dapat melihat bahwa histogram untuk setiap atribut telah digambar dalam sebuah gambar. Histogram ini akan membantu kita mengetahui distribusi nilai-nilai pada setiap atribut.
Tips
- Gunakan parameter
figsize
untuk menentukan ukuran gambar. - Gunakan parameter
sharex
dansharey
untuk menggambar histogram yang berbeda pada kolom-kolom yang sama. - Anda juga dapat menggunakan fungsi
seaborn
untuk membuat histogram yang lebih indah.
Dengan demikian, kita telah belajar cara membuat histogram untuk setiap atribut dalam sebuah data frame pandas. Kita dapat menggunakan histogram ini untuk memahami distribusi nilai-nilai pada setiap atribut dan membuat keputusan yang lebih baik.