Dalam artikel ini, kita akan membahas bagaimana membuat scatter plot menggunakan Python dan matplotlib. Selain itu, kita juga akan membahas perbedaan antara fungsi plt.plot()
dan plt.scatter()
, serta tips untuk membandingkan beberapa variabel dalam scatter plot.
Membuat Scatter Plot
Membuat scatter plot dengan Python dapat dilakukan dengan menggunakan library matplotlib. Berikut adalah contoh cara membuat scatter plot:
import matplotlib.pyplot as plt
x = [1, 2, 3, 4, 5]
y = [2, 4, 6, 8, 10]
plt.scatter(x, y)
plt.xlabel('X')
plt.ylabel('Y')
plt.title('Scatter Plot')
plt.show()
Dalam contoh di atas, kita menggunakan fungsi plt.scatter()
untuk membuat scatter plot antara variabel x dan y. Fungsi ini dapat digunakan untuk membuat scatter plot dengan warna yang berbeda untuk setiap data point.
Menyimpan Scatter Plot
Kamu dapat menyimpan scatter plot menjadi gambar dalam format tertentu, seperti PNG, JPEG, atau SVG, dengan menggunakan fungsi savefig()
. Di dalam fungsi tersebut, tuliskan nama dan format gambar yang kamu inginkan. Misalkan seperti berikut:
plt.savefig("scatter_plot.png")
Maka scatter plot kamu akan tersimpan dalam format PNG dengan nama "scatter_plot.png". Biasanya gambar akan tersimpan di directory tempat kamu membuat kode Python.
Perbedaan Plot dan Scatter
Cara lain untuk membuat scatter plot di Python adalah dengan menggunakan fungsi plt.plot()
dibandingkan plt.scatter()
. Lalu, apakah ada perbedaan di antara keduanya?
Baik fungsi plt.plot()
maupun fungsi plt.scatter()
, keduanya memiliki kelebihan dan kekurangan masing-masing bergantung pada kebutuhan kamu. Perbedaan keduanya dapat disimpulkan sebagai berikut:
- Efisiensi: Jika kamu menjalankan kode yang serupa, fungsi
plt.plot()
akan memberikan hasil dengan lebih cepat dan efisien ketimbangplt.scatter()
. Hal ini membuat fungsiplt.plot()
akan berguna untuk data-data besar dan banyak. - Keragaman: Di sisi lain, fungsi
plt.plot()
tidak memiliki keragaman dan fitur kustomisasi sebanyak fungsiplt.scatter()
. Sehingga, jika kamu ingin membuat scatter plot yang lebih advanced, kamu perlu menggunakanplt.scatter()
.
Membandingkan beberapa variabel dalam scatter plot
Dalam membandingkan beberapa variabel dalam scatter plot, kita dapat menambahkan more detail ke dalamnya. Berikut adalah contoh cara membandingkan beberapa variabel:
import matplotlib.pyplot as plt
x = [1, 2, 3, 4, 5]
y1 = [2, 4, 6, 8, 10]
y2 = [20, 40, 60, 80, 100]
plt.scatter(x, y1)
plt.scatter(x, y2)
plt.xlabel('X')
plt.ylabel('Y')
plt.title('Scatter Plot with Multiple Variables')
plt.show()
Dalam contoh di atas, kita menggunakan fungsi plt.scatter()
untuk membuat scatter plot antara variabel x dan y1, serta y2. Dengan demikian, kita dapat membandingkan beberapa variabel dalam satu scatter plot.
Kesimpulan
Dalam artikel ini, kita telah membahas bagaimana membuat scatter plot dengan Python dan matplotlib, serta perbedaan antara fungsi plt.plot()
dan plt.scatter()
. Selain itu, kita juga telah membahas tips untuk membandingkan beberapa variabel dalam scatter plot. Dengan demikian, kamu dapat menggunakan scatter plot sebagai salah satu cara terbaik untuk memvisualisasikan hubungan antar ukuran.
Bagaimana Anda?
Jika Anda ingin mendalami lebih lanjut tentang scatter plot dan visualisasi data, maka Anda dapat bergabung di Bootcamp Data Science yang diadakan oleh Dibimbing.id. Di dalam bootcamp tersebut, Anda akan belajar secara mendalam tentang tools data science, seperti Python, SQL, dan Tableau, sambil dilatih oleh para ahli yang sudah berpengalaman.
** Bergabunglah sekarang! **