Dalam beberapa kasus, kita ingin membuat scatter plot untuk data yang memiliki hanya satu variabel. Namun, perlu diingat bahwa scatter plot secara tradisional digunakan untuk menerapkan hubungan antara dua variabel. Dalam artikel ini, kita akan membahas bagaimana membuat scatter plot untuk variabel tunggal menggunakan Python dan Pandas.
Mengapa Membuat Scatter Plot untuk Variabel Tunggal?
Sebelum kita lanjut ke bagian coding, perlu diingat bahwa membuat scatter plot untuk variabel tunggal mungkin tidak begitu penting seperti membuat scatter plot untuk dua variabel. Namun, dalam beberapa kasus, kita memerlukan cara untuk mewakili data yang hanya memiliki satu variabel dengan menggunakan visualisasi scatter plot.
Contoh Data
Mari kita lihat contoh data yang akan kita gunakan sebagai contoh:
tweetcricscore 51 high active
tweetcricscore 46 event based
tweetcricscore 12 event based
tweetcricscore 46 event based
tweetcricscore 1 viewers
tweetcricscore 178 viewers
tweetcricscore 46 situational
tweetcricscode 23 situational
tweetcricscore 1 situational
tweetcricscore 8 situational
tweetcricscore 56 situational
Membuat Scatter Plot untuk Variabel Tunggal
Kita dapat membuat scatter plot untuk variabel tunggal dengan menggunakan Pandas dan Python. Namun, perlu diingat bahwa scatter plot biasanya digunakan untuk menerapkan hubungan antara dua variabel.
Mari kita lihat contoh coding yang akan kita gunakan:
import pandas as pd
import matplotlib.pyplot as plt
# Membaca data dari file CSV
df = pd.read_csv('input.csv', header=None)
# Mengganti nama kolom menjadi lebih rapi
df.columns = ['col1', 'col2', 'col3']
# Membuat scatter plot untuk variabel tunggal
plt.scatter(df['col2'])
# Menampilkan grafik
plt.show()
Dalam contoh di atas, kita membaca data dari file CSV dengan menggunakan Pandas. Kemudian, kita mengganti nama kolom menjadi lebih rapi dan membuat scatter plot untuk variabel tunggal dengan menggunakan matplotlib.
Contoh Output
Berikut adalah contoh output yang akan kita dapatkan:
col2
0 51
1 46
2 12
3 46
4 1
5 178
6 46
7 23
8 1
9 8
10 56
Dalam contoh di atas, kita dapat melihat bahwa scatter plot hanya menampilkan nilai dari variabel tunggal tanpa membuat hubungan antara dua variabel.
Kesimpulan
Membuat scatter plot untuk variabel tunggal memang tidak seperti biasanya, namun kita dapat melakukan hal itu dengan menggunakan Python dan Pandas. Dalam contoh di atas, kita lihat bahwa membuat scatter plot untuk variabel tunggal hanya menampilkan nilai dari variabel tunggal tanpa membuat hubungan antara dua variabel.
Namun, perlu diingat bahwa scatter plot biasanya digunakan untuk menerapkan hubungan antara dua variabel. Jika Anda ingin membuat scatter plot yang lebih signifikan, maka Anda dapat mencoba menggunakan library lain seperti Bokeh atau Seaborn.
Referensi
- Pandas: https://pandas.pydata.org/
- Matplotlib: https://matplotlib.org/
- Bokeh: https://bokeh.pydata.org/
- Seaborn: https://seaborn.pydata.org/