Analisis Dataset Iris dengan Python dan Visualisasi menggunakan Seaborn

Analisis Dataset Iris dengan Python dan Visualisasi menggunakan Seaborn

Artikel ini membahas tentang analisis dataset iris yang terdiri dari 3 jenis bunga irisan (Setosa, Versicolour, dan Virginica) serta panjang dan lebar daun dan bunga. Dalam artikel ini, saya akan menggunakan Python dengan library pandas dan seaborn untuk menganalisis dataset iris.

Loading the Iris Dataset

Dataset iris dapat di-load menggunakan pandas sebagai berikut:

import pandas as pd

iris = pd.read_csv('iris.csv')

Namun, dalam contoh ini, kita tidak perlu meng-load dataset iris secara manual. Kita akan menggunakan dataset iris yang telah tersedia dalam library seaborn.

Scatter Plot of the Iris Dataset

Sebelum melakukan analisis lebih lanjut, mari kita lihat scatter plot dari dataset iris:

import matplotlib.pyplot as plt

plt.scatter(iris.data[:, 0], iris.data[:, 1], c=iris.target)
plt.xlabel('Sepal Length')
plt.ylabel('Petal Width')
plt.title('Iris Dataset')
plt.show()

Dalam scatter plot ini, kita dapat melihat bahwa Setosa memiliki panjang daun yang relatif pendek dan lebar yang relatif lebar. Versicolour dan Virginica memiliki panjang daun yang lebih panjang dan lebar yang lebih sempit.

Plot a PCA Representation

Sekarang, mari kita aplikasikan Principal Component Analysis (PCA) pada dataset iris dan plotkan irises di atas 3 dimensi pertama:

from sklearn.decomposition import PCA

pca = PCA(n_components=3)
X_reduced = pca.fit_transform(iris.data)

fig = plt.figure(figsize=(8, 6))
ax = fig.add_subplot(111, projection='3d', elev=-150, azim=110)

ax.scatter(X_reduced[:, 0], X_reduced[:, 1], X_reduced[:, 2], c=iris.target)
ax.set_title('First three PCA dimensions')
ax.set_xlabel('1st Eigenvector')
ax.yaxis.set_ticklabels([])
ax.zaxis.set_ticklabels([])

plt.show()

Dalam plot PCA ini, kita dapat melihat bahwa Setosa, Versicolour, dan Virginica memiliki perbedaan yang jelas di atas 3 dimensi pertama. Dengan demikian, kita dapat menggunakan PCA untuk memisahkan jenis bunga irisan yang berbeda.


Dalam artikel ini, saya telah menganalisis dataset iris dengan Python dan visualisasikan hasilnya menggunakan seaborn. Kita telah melihat bahwa Setosa memiliki panjang daun yang relatif pendek dan lebar yang relatif lebar, sedangkan Versicolour dan Virginica memiliki panjang daun yang lebih panjang dan lebar yang lebih sempit. Selain itu, kita juga telah menganalisis dataset iris menggunakan PCA dan menemukan perbedaan yang jelas di atas 3 dimensi pertama.

Referensi

Leave a comment