Membuat plot multivariabel dapat menjadi tantangan ketika Anda ingin visualisasi data dengan lebih dari dua variabel. Dalam artikel ini, kita akan membahas cara membuat plot multivariabel menggunakan numpy dan seaborn.
Plot Multivariabel dengan Numpy
Pertama-tama, kita perlu memahami bagaimana membuat plot single variable function di Python dengan menggunakan matplotlib. Namun, jika Anda ingin visualisasi data dengan lebih dari dua variabel, maka Anda harus menggunakan multivariate scatter plot.
Contoh kode di bawah ini menunjukkan cara membuat multivariate scatter plot dengan numpy:
import numpy as np
# Generate random data set
x = np.random.randn(30, 2)
x[:, 1] = x[:, 1] * 100
y = 11*x[:,0] + 3.4*x[:,1] - 4 + np.random.randn(30)
# Plot multivariate scatter plot
import matplotlib.pyplot as plt
plt.scatter(x[:, 0], y)
plt.xlabel('x')
plt.ylabel('y')
plt.title('Multivariate Scatter Plot')
plt.show()
Dalam contoh kode di atas, kita menggunakan numpy untuk generate data random dan matplotlib untuk membuat plot multivariabel.
Plot Multivariabel dengan Seaborn
Selain menggunakan numpy, Anda juga dapat menggunakan seaborn untuk membuat plot multivariabel. Seaborn adalah library Python yang memungkinkan Anda membuat plot yang lebih baik dengan menggunakan tema yang bagus.
import seaborn as sns
import matplotlib.pyplot as plt
# Generate random data set
x = np.random.randn(30, 2)
x[:, 1] = x[:, 1] * 100
y = 11*x[:,0] + 3.4*x[:,1] - 4 + np.random.randn(30)
# Plot multivariate scatter plot with seaborn
sns.set()
plt.scatter(x[:, 0], y, c=x[:, 1])
plt.xlabel('x')
plt.ylabel('y')
plt.title('Multivariate Scatter Plot')
plt.show()
Dalam contoh kode di atas, kita menggunakan seaborn untuk membuat plot multivariabel dengan menggunakan tema yang bagus.
Menggunakan Variabel Lain
Saat Anda membuat plot multivariabel, Anda dapat menggunakan variabel lain sebagai encoding. Contohnya, Anda dapat menggunakan warna atau ukuran titik sebagai encoding.
import seaborn as sns
import matplotlib.pyplot as plt
# Generate random data set
x = np.random.randn(30, 2)
x[:, 1] = x[:, 1] * 100
y = 11*x[:,0] + 3.4*x[:,1] - 4 + np.random.randn(30)
# Plot multivariate scatter plot with encoding
sns.set()
plt.scatter(x[:, 0], y, c=x[:, 1], cmap='viridis')
plt.xlabel('x')
plt.ylabel('y')
plt.title('Multivariate Scatter Plot')
plt.show()
Dalam contoh kode di atas, kita menggunakan warna sebagai encoding dan menggunakan tema viridis untuk membuat plot yang lebih bagus.
Menggunakan Plot 3D
Jika Anda ingin visualisasi data dengan lebih dari dua variabel, maka Anda dapat menggunakan plot 3D. Contohnya, Anda dapat menggunakan matplotlib untuk membuat plot 3D.
import numpy as np
import matplotlib.pyplot as plt
# Generate random data set
x = np.random.randn(30, 2)
y = 11*x[:,0] + 3.4*x[:,1] - 4 + np.random.randn(30)
# Plot multivariate scatter plot with 3D encoding
fig = plt.figure(figsize=(8,6))
ax = fig.add_subplot(111, projection='3d')
ax.scatter(x[:, 0], x[:, 1], y)
ax.set_xlabel('x')
ax.set_ylabel('y')
ax.set_zlabel('z')
plt.show()
Dalam contoh kode di atas, kita menggunakan matplotlib untuk membuat plot 3D dengan menggunakan encoding 3D.
Dengan demikian, Anda dapat membuat plot multivariabel yang bagus dengan menggunakan numpy, seaborn, dan matplotlib. Semoga artikel ini membantu Anda dalam memahami cara membuat plot multivariabel di Python!