산점도 행렬(scatterplot matrix)은 데이터 분석에서 일반적으로 사용되는 그래픽 표현 방법입니다. 이 글에서는 seaborn, pandas, plotly 등의 라이브러리를 사용하여 산점도 행렬을 표현하는 다양한 방법을 보여 드리겠습니다.
1. Seaborn을 사용한 산점도 행렬
Seaborn은 Python의 데이터 분석 라이브러리 중 하나로, 다양한 그래픽 표현 방법을 제공합니다. 다음은 seaborn을 사용한 산점도 행렬의 예시입니다.
import seaborn as sns
import matplotlib.pyplot as plt
sns.pairplot(iris,
diag_kind='kde',
hue="species",
palette='bright')
plt.show()
위 코드에서는 iris 데이터셋을 사용하여 산점도 행렬을 그렸습니다. diag_kind='kde'
는 대각 원소의 커널 밀도 추정 그래프를 표시합니다. hue="species"
는 'species' 열에 따라 색깔을 다르게 표시합니다. palette='bright'
는 밝은 색상을 사용하여 데이터를 표시합니다.
2. Pandas를 사용한 산점도 행렬
Pandas는 Python의 데이터 분석 라이브러리 중 하나로, 다양한 그래픽 표현 방법을 제공합니다. 다음은 pandas를 사용한 산점도 행렬의 예시입니다.
import pandas as pd
import matplotlib.pyplot as plt
from pandas.plotting import scatter_matrix
scatter_matrix(iris,
alpha=0.5,
figsize=(8, 8),
diagonal='kde')
plt.show()
위 코드에서는 iris 데이터셋을 사용하여 산점도 행렬을 그렸습니다. alpha=0.5
는 그래프의 알파 값을 설정합니다. figsize=(8, 8)
은 그래프의 크기를 설정합니다. diagonal='kde'
는 대각 원소의 커널 밀도 추정 그래프를 표시합니다.
3. Plotly를 사용한 산점도 행렬
Plotly는 Python의 데이터 분석 라이브러리 중 하나로, 다양한 그래픽 표현 방법을 제공합니다. 다음은 plotly를 사용한 산점도 행렬의 예시입니다.
import plotly.plotly as py
import plotly.graph_objs as go
import cufflinks as cf
from IPython.core.interactiveshell import InteractiveShell
cf.go_offline()
fig = ff.create_scatterplotmatrix(
iris[['petal_width', 'petal_length', 'sepal_width', 'sepal_length']],
height=800,
width=800,
diag='histogram'
)
iplot(fig)
위 코드에서는 iris 데이터셋을 사용하여 산점도 행렬을 그렸습니다. diag='histogram'
는 대각 원소의 히스토그램 그래프를 표시합니다.
이러한 방법으로 다양한 그래픽 표현 방법을 제공하는 라이브러리를 사용할 수 있습니다. 분석가들은 이러한 그래픽 표현 방법을 사용하여 데이터를 더 잘 이해하고, 데이터를 시각화하여 easier to understand 하게 할 수 있습니다.