Dalam visualisasi data, scatter plot adalah salah satu metode yang paling populer untuk mewakili hubungan antara dua variabel. Namun, kadang-kadang kita ingin mengurutkan scatter plot berdasarkan nilai Y axis sehingga dapat membantu dalam analisis dan interpretasi hasil.
Dalam matplotlib, Anda dapat mengurutkan scatter plot dengan cara mengsort data terlebih dahulu sebelum memplotnya. Salah satu contoh adalah dengan menggunakan fungsi df.sort_values('freq', ascending=True, inplace=True)
untuk mengurutkan data berdasarkan nilai frekuensi (Y axis) menurun.
Contoh kode:
import matplotlib.pyplot as plt
import pandas as pd
# Buat data dummy
x = [1, 2, 3, 4, 5]
y = [10, 20, 30, 40, 50]
freq = [100, 200, 300, 400, 500]
df = pd.DataFrame({'x': x, 'y': y, 'freq': freq})
# Mengurutkan data berdasarkan nilai frekuensi (Y axis) menurun
df.sort_values('freq', ascending=True, inplace=True)
# Membuat scatter plot
plt.scatter(df['x'], df['y'])
# Menambahkan judul dan label sumbu
plt.title('Scatter Plot dengan Nilai Y Axis Menurun')
plt.xlabel('X Axis')
plt.ylabel('Y Axis')
# Menampilkan plot
plt.show()
Dalam contoh di atas, kita membuat data dummy yang terdiri dari tiga kolom: x, y, dan frekuensi. Kemudian, kita mengurutkan data berdasarkan nilai frekuensi menurun menggunakan fungsi df.sort_values()
. Setelah itu, kita membuat scatter plot dengan menggunakan fungsi plt.scatter()
.
Dengan demikian, kita dapat melihat bahwa scatter plot yang dihasilkan telah dikurutkan berdasarkan nilai Y axis menurun.