Dalam analisis data, scatter plot adalah salah satu alat yang paling berguna dan umum digunakan. Scatter plot adalah grafik yang menampilkan hubungan antara dua variabel numerik dengan menggunakan titik-titik sebagai representasi data. Dalam artikel ini, kita akan membahas penggunaan scatter plot dalam matplotlib untuk menganalisis data.
Mengapa Menggunakan Scatter Plot?
Scatter plot digunakan karena dapat menunjukkan hubungan antara dua variabel numerik yang tidak dapat dilihat dengan menggunakan grafik lainnya. Misalnya, jika kita ingin mengetahui apakah terdapat hubungan antara variabel X dan Y, maka scatter plot dapat membantu kita dalam memvisualisasikan data tersebut.
Contoh Penggunaan Scatter Plot
Dalam contoh berikut, kita akan menggunakan scatter plot untuk menganalisis hubungan antara variabel X dan Y:
import matplotlib.pyplot as plt
# Data X dan Y
x = [1, 2, 3, 4, 5]
y = [10, 15, 20, 25, 30]
# Membuat scatter plot
plt.scatter(x, y)
# Menampilkan grafik
plt.show()
Dalam contoh di atas, kita membuat scatter plot dengan menggunakan fungsi scatter()
dari matplotlib. Fungsi ini memerlukan dua input, yaitu data X dan Y. Kemudian, kita menampilkan grafik dengan menggunakan fungsi show()
.
Parameter Scatter Plot
Scatter plot memiliki beberapa parameter yang dapat digunakan untuk mengatur tampilan grafik. Beberapa parameter tersebut antara lain:
x
dany
: Data X dan Y.s
: Ukuran marker (default: 10).c
: Warna marker (default: 'b').marker
: Tipe marker (default: 'o').cmap
: Colormap yang digunakan untuk mewarnai data (default: 'viridis').norm
: Normalisasi yang digunakan untuk skalakan data ke dalam rentang [0, 1] (default: linear).vmin
danvmax
: Rentang nilai data yang akan ditampilkan (default: otomatis).
Dalam contoh di atas, kita tidak menggunakan parameter-parameter tersebut. Namun, jika kita ingin mengubah tampilan grafik, maka kita dapat menggunakan parameter-parameter tersebut.
Kelebihan dan Kekurangan Scatter Plot
Scatter plot memiliki beberapa kelebihan dan kekurangan. Kelebihannya antara lain:
- Dapat menunjukkan hubungan antara dua variabel numerik.
- Dapat digunakan untuk menganalisis data yang tidak terstruktur.
Kekurangannya antara lain:
- Tidak dapat menampilkan informasi lebih lanjut selain hubungan antara dua variabel numerik.
- Tidak dapat digunakan untuk menganalisis data yang memiliki lebih dari dua variabel numerik.
Dalam kesimpulan, scatter plot adalah salah satu alat analisis data yang paling berguna dan umum digunakan. Dengan menggunakan parameter-parameter yang tersedia, kita dapat mengatur tampilan grafik dan menganalisis data dengan lebih baik.