Menggambar grafik scatter plot untuk visualisasi klaster dapat membantu dalam memahami struktur data yang tidak terstruktur. Dalam artikel ini, kita akan menjelajahi berbagai metode untuk menggambar scatter plot menggunakan Python's Matplotlib, Seaborn, Plotly, Pandas, dan ggplot.
Metode 1: Menggunakan Matplotlib
Matplotlib adalah salah satu library penggambaran paling populer di Python. Library ini menawarkan banyak pilihan konfigurasi yang dapat membantu dalam menciptakan grafik yang sesuai dengan kebutuhan Anda.
Contoh:
import matplotlib.pyplot as plt
# Sample cluster data
df = px.data.iris()
df['cluster'] = df['species_id'] # Assume 'species_id' as cluster labels
# Create a scatter plot
fig, ax = plt.subplots()
ax.scatter(df['sepal_width'], df['sepal_length'], c=df['cluster'])
plt.show()
Output: Grafik scatter plot yang dapat diinteraktifkan dan dapat dilihat dalam browser web.
Metode 2: Menggunakan Seaborn
Seaborn adalah library penggambaran yang dibuat oleh Matplotlib. Library ini menawarkan cara cepat untuk membuat grafik yang rumit, seperti heatmap, bar charts, dan scatter plots.
Contoh:
import seaborn as sns
import matplotlib.pyplot as plt
# Sample cluster data
df = px.data.iris()
df['cluster'] = df['species_id'] # Assume 'species_id' as cluster labels
# Create a scatter plot with Seaborn
sns.set()
plt.scatter(df['sepal_width'], df['sepal_length'], c=df['cluster'])
plt.show()
Output: Grafik scatter plot yang dapat diinteraktifkan dan dapat dilihat dalam browser web.
Metode 3: Menggunakan Plotly
Plotly adalah library penggambaran yang memungkinkan Anda membuat grafik interaktif yang dapat dizoom, dipan, dan difilter. Library ini sangat cocok untuk menciptakan dashboard dan aplikasi web.
Contoh:
import plotly.express as px
# Sample cluster data
df = px.data.iris()
df['cluster'] = df['species_id'] # Assume 'species_id' as cluster labels
# Create an interactive scatter plot
fig = px.scatter(df, x='sepal_width', y='sepal_length', color='cluster')
fig.show()
Output: Grafik scatter plot yang dapat diinteraktifkan dan dapat dilihat dalam browser web.
Metode 4: Menggunakan Pandas Plot
Pandas sendiri memiliki fitur penggambaran yang dapat membantu Anda membuat grafik cepat dan sederhana. Dengan menggunakan fungsi plot.scatter()
dari Pandas, Anda dapat membuat grafik scatter plot langsung dari DataFrame.
Contoh:
import pandas as pd
# Sample cluster data in DataFrame
df = pd.DataFrame({
'Feature 1': [1, 2, 3, 4, 5],
'Feature 2': [5, 4, 3, 2, 1],
'Cluster': [0, 0, 1, 1, 1]
})
# Create scatter plot
ax = df.plot.scatter(x='Feature 1', y='Feature 2', c='Cluster', colormap='viridis')
plt.show()
Output: Grafik scatter plot yang dapat diinteraktifkan dan dapat dilihat dalam browser web.
Bonus Method 5: Menggunakan ggplot
ggplot adalah implementasi Python dari R's ggplot. Library ini menawarkan sintaks dan styling yang berbeda dengan Matplotlib dan Seaborn, namun dapat menciptakan grafik kompleks multi-layered.
Contoh:
from ggplot import *
# Assume 'df' is a DataFrame with 'Feature 1', 'Feature 2' and 'Cluster'
# Create scatter plot with ggplot
plot = ggplot(df, aes(x='Feature 1', y='Feature 2', color='Cluster')) + geom_point()
print(plot)
Output: Grafik scatter plot yang dapat diinteraktifkan dan dapat dilihat dalam browser web.
Ringkasan
Dalam artikel ini, kita telah menjelajahi berbagai metode untuk menggambar scatter plot menggunakan Python's Matplotlib, Seaborn, Plotly, Pandas, dan ggplot. Setiap metode memiliki kelebihan dan kekurangan yang dapat membantu Anda memilih metode terbaik untuk tujuan Anda.