Dalam tutorial ini, kita akan membuat plot stacked bar menggunakan Pandas dan Matplotlib untuk membandingkan populasi dan tahun 2020 untuk setiap kota. Kita juga akan menambahkan fitur untuk mencolokkan dua seri data dalam satu plot.
Membuat DataFrame dengan Data Kota
Pertama-tama, kita akan membuat DataFrame dengan data kota menggunakan Pandas.
import pandas as pd
data = [["New York", 8.6, 20],
["Chicago", 2.7, 20],
["Los Angeles", 3.9, 20],
["Philadelphia", 1.5, 20],
["Houston", 2.1, 20]]
df = pd.DataFrame(data, columns=["City", "Population(million)", "Year(2020)"])
Membuat Plot Stacked Bar
Selanjutnya, kita akan membuat plot stacked bar menggunakan Matplotlib.
import matplotlib.pyplot as plt
df.plot(x="City", y=["Population(million)", "Year(2020)"],
kind="bar", figsize=(10, 10), stacked=True)
plt.show()
Dalam kode di atas, kita menggunakan parameter x
untuk menentukan kolom yang akan digunakan sebagai label x, serta menggunakan parameter y
untuk menentukan seri data yang akan digunakan. Kita juga menggunakan parameter kind="bar"
untuk membuat plot bar, dan stacked=True
untuk menggabungkan dua seri data dalam satu plot.
Hasil
Setelah menjalankan kode di atas, kita akan mendapatkan plot stacked bar seperti berikut:
[Plot Stacked Bar]
Dalam plot tersebut, kita dapat melihat populasi dan tahun 2020 untuk setiap kota. Kita juga dapat melihat bahwa dua seri data tersebut digabungkan dalam satu plot menggunakan fitur stacking.
Membuat Plot Line
Jika kita ingin membuat plot line untuk membandingkan trend populasi dan tahun 2020 untuk setiap kota, kita dapat menggunakan parameter kind="line"
sebagaimana berikut:
df.plot(x="City", y=["Population(million)", "Year(2020)"],
kind="line", figsize=(10, 10))
plt.show()
Dalam kode di atas, kita menggunakan parameter kind="line"
untuk membuat plot line. Kita juga dapat menambahkan fitur lainnya seperti label x dan y, serta memodifikasi tampilan plot dengan menggunakan parameter figsize
.
Membuat Plot Scatter
Jika kita ingin membuat plot scatter untuk membandingkan populasi dan tahun 2020 untuk setiap kota, kita dapat menggunakan method plot.scatter
sebagaimana berikut:
import matplotlib.pyplot as plt
df.plot.scatter(x="City", y=["Population(million)", "Year(2020)"])
plt.show()
Dalam kode di atas, kita menggunakan method plot.scatter
untuk membuat plot scatter. Kita juga dapat menambahkan fitur lainnya seperti label x dan y, serta memodifikasi tampilan plot dengan menggunakan parameter figsize
.
Dalam tutorial ini, kita telah belajar cara membuat plot stacked bar, line, dan scatter menggunakan Pandas dan Matplotlib. Kita juga telah melihat bahwa kita dapat menambahkan fitur lainnya seperti label x dan y, serta memodifikasi tampilan plot dengan menggunakan parameter figsize
. Dengan demikian, kita dapat lebih mudah membandingkan data dan mencapai hasil yang lebih baik dalam analisis data.