Artikel ini membahas tentang analisis dataset iris yang terdiri dari 3 jenis bunga irisan (Setosa, Versicolour, dan Virginica) serta panjang dan lebar daun dan bunga. Dalam artikel ini, saya akan menggunakan Python dengan library pandas dan seaborn untuk menganalisis dataset iris.
Loading the Iris Dataset
Dataset iris dapat di-load menggunakan pandas sebagai berikut:
import pandas as pd
iris = pd.read_csv('iris.csv')
Namun, dalam contoh ini, kita tidak perlu meng-load dataset iris secara manual. Kita akan menggunakan dataset iris yang telah tersedia dalam library seaborn.
Scatter Plot of the Iris Dataset
Sebelum melakukan analisis lebih lanjut, mari kita lihat scatter plot dari dataset iris:
import matplotlib.pyplot as plt
plt.scatter(iris.data[:, 0], iris.data[:, 1], c=iris.target)
plt.xlabel('Sepal Length')
plt.ylabel('Petal Width')
plt.title('Iris Dataset')
plt.show()
Dalam scatter plot ini, kita dapat melihat bahwa Setosa memiliki panjang daun yang relatif pendek dan lebar yang relatif lebar. Versicolour dan Virginica memiliki panjang daun yang lebih panjang dan lebar yang lebih sempit.
Plot a PCA Representation
Sekarang, mari kita aplikasikan Principal Component Analysis (PCA) pada dataset iris dan plotkan irises di atas 3 dimensi pertama:
from sklearn.decomposition import PCA
pca = PCA(n_components=3)
X_reduced = pca.fit_transform(iris.data)
fig = plt.figure(figsize=(8, 6))
ax = fig.add_subplot(111, projection='3d', elev=-150, azim=110)
ax.scatter(X_reduced[:, 0], X_reduced[:, 1], X_reduced[:, 2], c=iris.target)
ax.set_title('First three PCA dimensions')
ax.set_xlabel('1st Eigenvector')
ax.yaxis.set_ticklabels([])
ax.zaxis.set_ticklabels([])
plt.show()
Dalam plot PCA ini, kita dapat melihat bahwa Setosa, Versicolour, dan Virginica memiliki perbedaan yang jelas di atas 3 dimensi pertama. Dengan demikian, kita dapat menggunakan PCA untuk memisahkan jenis bunga irisan yang berbeda.
Dalam artikel ini, saya telah menganalisis dataset iris dengan Python dan visualisasikan hasilnya menggunakan seaborn. Kita telah melihat bahwa Setosa memiliki panjang daun yang relatif pendek dan lebar yang relatif lebar, sedangkan Versicolour dan Virginica memiliki panjang daun yang lebih panjang dan lebar yang lebih sempit. Selain itu, kita juga telah menganalisis dataset iris menggunakan PCA dan menemukan perbedaan yang jelas di atas 3 dimensi pertama.
Referensi