Analisis Korelasi Antara Kandungan Gula, Popularitas, dan Harga Candy

Analisis Korelasi Antara Kandungan Gula, Popularitas, dan Harga Candy

Dalam analisis ini, kita akan menggunakan library Seaborn untuk membuat scatter plot dan menambahkan garis regresi. Tujuan dari analisis ini adalah untuk mengetahui apakah kandungan gula pada candy memiliki hubungan dengan popularitas dan harga candy.

Scatter Plot

Pertama-tama, kita akan membuat scatter plot antara sugarpercent (kandungan gula) dan winpercent (popularitas). Dengan menggunakan sintaks sns.scatterplot(x='sugarpercent', y='winpercent'), kita dapat membuat scatter plot yang menunjukkan hubungan antara kandungan gula dan popularitas candy.

Scatter Plot

Dari gambar di atas, terlihat bahwa kandungan gula tidak memiliki hubungan yang signifikan dengan popularitas candy. Namun, kita dapat menambahkan garis regresi untuk melihat apakah ada korelasi positif antara kandungan gula dan popularitas candy.

Garis Regresi

Kita akan menggunakan sintaks sns.regplot(x='sugarpercent', y='winpercent') untuk membuat scatter plot dengan garis regresi. Dari gambar di atas, terlihat bahwa ada korelasi positif antara kandungan gula dan popularitas candy.

Scatter Plot with Regression Line

Chocolate Candy vs Non-Chocolate Candy

Selanjutnya, kita akan membuat scatter plot untuk melihat hubungan antara pricepercent (harga) dan winpercent (popularitas) dengan kategori chocolate (cokelat) sebagai variabel penentu. Dengan menggunakan sintaks sns.lmplot(x='pricepercent', y='winpercent', hue='chocolate'), kita dapat membuat scatter plot yang menunjukkan hubungan antara harga, popularitas, dan kandungan cokelat pada candy.

Scatter Plot with Regression Line and Color by Chocolate

Dari gambar di atas, terlihat bahwa chocolate candy (kandungan cokelat) memiliki hubungan yang positif dengan popularitas dan harga. Chocolate candy cenderung lebih populer dan harganya lebih mahal dibandingkan non-chocolate candy.

Swarm Plot

Terakhir, kita akan membuat swarm plot untuk melihat hubungan antara winpercent (popularitas) dan chocolate (kandungan cokelat). Dengan menggunakan sintaks sns.swarmplot(x='chocolate', y='winpercent'), kita dapat membuat swarm plot yang menunjukkan distribusi data dari kandungan cokelat pada candy.

Swarm Plot

Dari gambar di atas, terlihat bahwa chocolate candy (kandungan cokelat) cenderung lebih populer dibandingkan non-chocolate candy.

Kesimpulan

Visualisasi data menggunakan Seaborn dapat membantu kita dalam mengetahui distribusi data dan korelasi antara dua variabel numerik. Dalam analisis ini, kita melihat bahwa kandungan gula tidak memiliki hubungan dengan popularitas candy, namun chocolate candy cenderung lebih populer dan harganya lebih mahal dibandingkan non-chocolate candy.

Sekian latihan visualisasi data menggunakan Seaborn kali ini. Dengan latihan singkat ini kita sudah berlatih membuat scatter plot baik dengan atau tanpa garis regresi, membuat swarm plot, dan belajar menginterpretasikan data.

Leave a comment