=====================================================
Membuat scatter plot adalah salah satu cara visualisasi yang paling efektif untuk menunjukkan hubungan antara dua set data numerik. Dalam artikel ini, kita akan mempelajari bagaimana membuat scatter plot menggunakan library Matplotlib di Python.
Langkah-Langkah Membuat Scatter Plot
1. Instalasi dan Iмпор Library
Jika kamu belum memiliki Matplotlib di lingkungan Python, kamu bisa menginstalnya menggunakan pip, yaitu package manager Python. Buka terminal atau command prompt dan jalankan perintah pip install matplotlib
. Setelah terinstal, kamu perlu mengimpor Matplotlib ke dalam script Python dengan menggunakan sintaks import matplotlib.pyplot as plt
.
2. Persiapan Data
Sebelum membuat scatter plot, kamu perlu menyiapkan data yang akan divisualisasikan. Data harus terdiri dari dua variabel; satu untuk sumbu x dan satu lagi untuk sumbu y. Data bisa dalam bentuk list, array NumPy, atau kolom dari DataFrame Pandas.
TIPS:
- Pastikan data bersih dan tidak mengandung nilai yang hilang (missing values).
- Pilih variabel yang ingin kamu bandingkan atau analisis hubungannya.
- Pastikan variabel yang dipilih adalah variabel numerik, karena scatterplot hanya dapat mencari hubungan antar variabel yang bersifat numerik.
3. Membuat Scatter Plot
Untuk membuat scatter plot, gunakan fungsi plt.scatter()
dari Matplotlib. Berikut contoh kode untuk membuat scatter plot sederhana:
import matplotlib.pyplot as plt
# Data sumbu x dan y
x = [1, 2, 3, 4, 5]
y = [10, 15, 20, 25, 30]
plt.scatter(x, y)
4. Menyesuaikan Tampilan Plot
Agar scatter plot lebih informatif, tambahkan judul, label sumbu, dan legend.
TIPS:
- Gunakan parameter
color
untuk mengubah warna marker. - Gunakan parameter
s
untuk mengubah ukuran marker.
5. Menyimpan dan Menampilkan Plot
Setelah scatter plot dibuat dan disesuaikan, simpan ke dalam file gambar atau tampilkan di layar.
TIPS:
- Untuk menyimpan scatter plot ke dalam file, gunakan fungsi
plt.savefig()
sebelumplt.show()
:plt.savefig('scatterplot.png')
- Sementara untuk menampilkan plot di layar, cukup panggil
plt.show()
setelah semua pengaturan plot selesai.
Menambahkan Garis Tren ke Scatter Plot
=====================================================
Menambahkan garis tren ke scatter plot adalah cara untuk memvisualisasikan hubungan antara dua set data. Berikut caranya:
- Impor library yang diperlukan: pastikan kamu telah mengimpor Matplotlib dan NumPy ke dalam script Python.
- Persiapkan data: siapkan data yang ingin kamu plot. Biasanya, kamu akan memiliki dua array atau list: satu untuk nilai x (variabel independen) dan satu lagi untuk nilai y (variabel dependen).
- Buat scatter plot: gunakan Matplotlib untuk membuat scatter plot dari data kamu.
- Hitung garis tren: gunakan
np.polyfit()
untuk menghitung parameter garis tren. Fungsi ini mengembalikan koefisien dari polinomial fitting terbaik yang sesuai dengan data. Untuk garis lurus, gunakan derajat polinomial 1. - Tambahkan garis tren ke plot: setelah memiliki fungsi polinomial untuk garis tren, gunakan ini untuk menghitung nilai y tren berdasarkan x dan tambahkan garis tren ke plot kamu dengan
plt.plot()
. - Menampilkan plot: akhirnya, tampilkan scatter plot dengan garis tren menggunakan
plt.show()
.
Menambahkan Label ke Setiap Titik di Scatter Plot
=====================================================
Menambahkan label ke setiap titik di scatter plot Python memberikan informasi tambahan tentang setiap titik data, sehingga visualisasi lebih informatif. Berikut cara menambahkan label ke setiap titiknya:
- Gunakan fungsi
text()
untuk menambahkan label ke setiap titik. - Kamu bisa mengatur posisi teks relatif terhadap titik data dengan menggunakan parameter
textcoords
danxytext
. - Untuk setiap titik data, panggil
text()
dengan koordinat titik dan label yang sesuai.
Dengan demikian, kita telah mempelajari bagaimana membuat scatter plot di Python dengan Matplotlib. Selanjutnya, kita dapat meningkatkan visualisasi dengan menambahkan garis tren dan label ke setiap titik.