Kompabilitas Multiple Variabel dengan Scatterplot Matrix
Scatterplot matrix adalah kumpulan scatterplot yang disusun dalam sebuah grid (atau matriks). Setiap scatterplot menampilkan hubungan antara pasangan variabel. Dalam contoh ini, kita akan menggunakan data Solubility.jmp untuk memahami bagaimana scatterplot matrix dapat membantu kita dalam membandingkan multiple variabel.
Scenario
Seorang teknisi laboratorium ingin mengetahui apakah ada hubungan antara setiap pasangan bahan kimia. Terdapat enam pasang bahan kimia yang harus diuji. Untuk menjawab pertanyaan ini, kita akan menggunakan scatterplot matrix dari empat pelarut.
Membuat Scatterplot Matrix
- Pilih Help > Sample Data Folder dan buka Solubility.jmp.
- Pilih Graph > Scatterplot Matrix.
- Pilih Ether, Chloroform, Benzene, dan Hexane, lalu klik Y, Columns.
- Klik OK.
Interpretasi Scatterplot Matrix
Scatterplot matrix memberikan jawaban sebagai berikut:
- Semua enam pasang variabel memiliki korelasi positif. Sebagai salah satu variabel meningkat, variabel lainnya juga meningkat.
- Hubungan yang paling kuat tampaknya terjadi antara Benzene dan Chloroform. Data point dalam scatterplot untuk Benzene dan Chloroform terlihat sangat terkumpulkan di sekitar garis imajiner.
Interaksi dengan Scatterplot Matrix
Jika Anda memilih titik dalam salah satu scatterplot, maka titik tersebut juga dipilih dalam semua scatterplot lainnya. Contohnya, jika Anda memilih titik dalam scatterplot Benzene vs Chloroform, maka titik yang sama akan dipilih dalam lima plot lainnya.
Pembahasan
Scatterplot matrix sangat berguna dalam membandingkan multiple variabel dan menemukan hubungan antara mereka. Dengan menggunakan scatterplot matrix, kita dapat dengan mudah mengetahui apakah ada hubungan antara setiap pasangan variabel dan menemukan hubungan yang paling kuat.
Python Scatter Plot with Multiple Y values for each X
Saya mencoba menggunakan Python untuk membuat scatter plot yang berisi dua kategori X "cat1" dan "cat2", serta masing-masing memiliki nilai Y yang banyak. Saya dapat mendapat hasil jika jumlah nilai Y untuk setiap X sama-sama dengan menggunakan kode berikut:
import numpy as np
import matplotlib.pyplot as plt
y = [(1, 1, 2, 3), (1, 1, 2, 4)]
x = [1, 2]
plt.plot(x, y)
plt.show()
Namun, jika jumlah nilai Y untuk setiap X tidak sama-sama, maka saya mendapat error. Contohnya, kode berikut tidak bekerja:
import numpy as np
import matplotlib.pyplot as plt
y = [(1, 1, 2, 3, 9), (1, 1, 2, 4)]
x = [1, 2]
plt.plot(x, y)
plt.show()
Bagaimana saya dapat membuat scatter plot dengan nilai Y yang berbeda untuk setiap X dan bagaimana saya dapat mengubah axis X dari menjadi angka 1 dan 2 ke kategori text "cat1" dan "cat2"? Saya sangat mengharapkan bantuan pada hal ini!