Membuat Scatter Plot dengan Python

Membuat Scatter Plot dengan Python

Dalam artikel ini, kita akan membahas bagaimana membuat scatter plot menggunakan Python dan matplotlib. Selain itu, kita juga akan membahas perbedaan antara fungsi plt.plot() dan plt.scatter(), serta tips untuk membandingkan beberapa variabel dalam scatter plot.

Membuat Scatter Plot

Membuat scatter plot dengan Python dapat dilakukan dengan menggunakan library matplotlib. Berikut adalah contoh cara membuat scatter plot:

import matplotlib.pyplot as plt

x = [1, 2, 3, 4, 5]
y = [2, 4, 6, 8, 10]

plt.scatter(x, y)
plt.xlabel('X')
plt.ylabel('Y')
plt.title('Scatter Plot')
plt.show()

Dalam contoh di atas, kita menggunakan fungsi plt.scatter() untuk membuat scatter plot antara variabel x dan y. Fungsi ini dapat digunakan untuk membuat scatter plot dengan warna yang berbeda untuk setiap data point.

Menyimpan Scatter Plot

Kamu dapat menyimpan scatter plot menjadi gambar dalam format tertentu, seperti PNG, JPEG, atau SVG, dengan menggunakan fungsi savefig(). Di dalam fungsi tersebut, tuliskan nama dan format gambar yang kamu inginkan. Misalkan seperti berikut:

plt.savefig("scatter_plot.png")

Maka scatter plot kamu akan tersimpan dalam format PNG dengan nama "scatter_plot.png". Biasanya gambar akan tersimpan di directory tempat kamu membuat kode Python.

Perbedaan Plot dan Scatter

Cara lain untuk membuat scatter plot di Python adalah dengan menggunakan fungsi plt.plot() dibandingkan plt.scatter(). Lalu, apakah ada perbedaan di antara keduanya?

Baik fungsi plt.plot() maupun fungsi plt.scatter(), keduanya memiliki kelebihan dan kekurangan masing-masing bergantung pada kebutuhan kamu. Perbedaan keduanya dapat disimpulkan sebagai berikut:

  • Efisiensi: Jika kamu menjalankan kode yang serupa, fungsi plt.plot() akan memberikan hasil dengan lebih cepat dan efisien ketimbang plt.scatter(). Hal ini membuat fungsi plt.plot() akan berguna untuk data-data besar dan banyak.
  • Keragaman: Di sisi lain, fungsi plt.plot() tidak memiliki keragaman dan fitur kustomisasi sebanyak fungsi plt.scatter(). Sehingga, jika kamu ingin membuat scatter plot yang lebih advanced, kamu perlu menggunakan plt.scatter().

Membandingkan beberapa variabel dalam scatter plot

Dalam membandingkan beberapa variabel dalam scatter plot, kita dapat menambahkan more detail ke dalamnya. Berikut adalah contoh cara membandingkan beberapa variabel:

import matplotlib.pyplot as plt

x = [1, 2, 3, 4, 5]
y1 = [2, 4, 6, 8, 10]
y2 = [20, 40, 60, 80, 100]

plt.scatter(x, y1)
plt.scatter(x, y2)

plt.xlabel('X')
plt.ylabel('Y')
plt.title('Scatter Plot with Multiple Variables')
plt.show()

Dalam contoh di atas, kita menggunakan fungsi plt.scatter() untuk membuat scatter plot antara variabel x dan y1, serta y2. Dengan demikian, kita dapat membandingkan beberapa variabel dalam satu scatter plot.

Kesimpulan

Dalam artikel ini, kita telah membahas bagaimana membuat scatter plot dengan Python dan matplotlib, serta perbedaan antara fungsi plt.plot() dan plt.scatter(). Selain itu, kita juga telah membahas tips untuk membandingkan beberapa variabel dalam scatter plot. Dengan demikian, kamu dapat menggunakan scatter plot sebagai salah satu cara terbaik untuk memvisualisasikan hubungan antar ukuran.

Bagaimana Anda?

Jika Anda ingin mendalami lebih lanjut tentang scatter plot dan visualisasi data, maka Anda dapat bergabung di Bootcamp Data Science yang diadakan oleh Dibimbing.id. Di dalam bootcamp tersebut, Anda akan belajar secara mendalam tentang tools data science, seperti Python, SQL, dan Tableau, sambil dilatih oleh para ahli yang sudah berpengalaman.

** Bergabunglah sekarang! **