Analisis Korelasi dan Visualisasi dengan Python

Analisis Korelasi dan Visualisasi dengan Python

Korelasi adalah suatu konsep penting dalam statistika yang menunjukkan hubungan antara dua variabel. Dalam analisis data, korelasi dapat membantu kita memahami hubungan antara variabel-variabel yang diteliti. Dalam artikel ini, kita akan membahas cara membuat heatmap korelasi menggunakan Python.

Definisi Korelasi

Korelasi adalah suatu nilai yang menunjukkan seberapa besar hubungan antara dua variabel. Ada beberapa jenis korelasi, yaitu:

  1. Korelasi Positif: Kedua variabel meningkat bersama-sama dan mengurangi bersama-sama. Contohnya, jika demand produk meningkat, maka profit juga akan meningkat.
  2. Korelasi Negatif: Satu variabel meningkat dan lainnya menurun bersama-sama. Contohnya, jika jarak antara magnet meningkat, maka tarikan antara mereka akan menurun.
  3. Korelasi Nol (Tidak Korelasi): Kedua variabel tidak berhubungan dengan cara apapun.

Membuat Heatmap Korelasi dengan Python

Heatmap korelasi adalah suatu visualisasi yang digunakan untuk memahami hubungan antara variabel-variabel. Berikut langkah-langkah membuat heatmap korelasi menggunakan Python:

  1. Importing Libraries: Import library-library yang dibutuhkan, seperti sklearn, numpy, matplotlib.pyplot, dan pandas.
  2. Menghitung Korelasi: Menghitung nilai korelasi antara dua variabel menggunakan library pandas.
  3. Plotting Graph: Membuat graph dengan menggunakan library matplotlib. Dalam kasus ini, kita akan membuat scatter plot yang menunjukkan hubungan antara dua variabel.

Contoh

Berikut contoh kode Python untuk membuat heatmap korelasi:

import seaborn as sns

# Load dataset
flights = sns.load_dataset("flights")

# Membuat heatmap korelasi
ax = sns.heatmap(flights.corr(), annot=True)

# Tampilkan heatmap
plt.show()

Dalam contoh di atas, kita menggunakan library seaborn untuk membuat heatmap korelasi dari dataset "flights". Heatmap tersebut menunjukkan hubungan antara variabel-variabel dalam dataset.

Konklusi

Dalam artikel ini, kita membahas cara membuat heatmap korelasi menggunakan Python. Heatmap korelasi dapat membantu kita memahami hubungan antara variabel-variabel yang diteliti dan menunjukkan pola-pola yang tidak terlihat dengan cara lain. Dengan demikian, heatmap korelasi adalah salah satu alat analisis data yang sangat berguna dalam statistika dan ilmu pengetahuan lainnya.