Scatterplot adalah sebuah grafik yang digunakan untuk menganalisis hubungan antara dua variabel. Grafik ini biasanya terdiri atas beberapa unsur, seperti:
- Sumbu X yang mewakili nilai dari variabel kontinu.
- Sumbu Y yang mewakili nilai dari variabel lainnya juga kontinu.
- Simbol-simbol yang digunakan untuk mewakili data pada koordinat (X, Y).
- Garis fit yang dapat ditambahkan untuk mengetahui seberapa baik model tersebut memenuhi data.
Dalam analisis persentase lemak tubuh dan indeks massa tubuh (BMI) pada gadis remaja, scatterplot menunjukkan hubungan yang kuat dan positif. Semakin tinggi nilai BMI, maka semakin tinggi pula persentase lemak tubuh. Hubungan tersebut tampak sedikit melengkung karena nilai-nilai untuk BMI yang lebih tinggi menjadi kurang signifikan.
Untuk memodelkan kerengkangannya, analisys menambahkan suku-suku kuadrat dalam modelnya. Garis fit yang dihasilkan mengikuti kerengkangan data dan menunjukkan bahwa model tersebut sangat baik.
Menganalisis Hubungan antara Variabel
Scatterplot dapat digunakan untuk menganalisis arah, kekuatan, dan linearitas hubungan antara dua variabel. Apabila nilai-nilai suatu variabel meningkat seiring dengan meningkatnya nilai variabel lainnya, maka terjadi korrelasi positif.
Namun, apabila satu variabel meningkat seiring dengan menurunnya nilai variabel lainnya, maka terjadi korrelasi negatif. Kekuatan hubungan dapat dilihat dari clustering data yang lebih ketat. Namun, perlu diingat bahwa perubahan skalanya dapat mempengaruhi kekuatan hubungan.
Menganalisis Hubungan yang Berbentuk Kurva
Apabila data memiliki hubungan berbentuk kurva, maka diperlukan model regression yang lebih kompleks untuk menggambarnya. Garis fit yang dihasilkan dapat digunakan untuk mengetahui seberapa baik model tersebut memenuhi data.
Mengidentifikasi Kelompok dan Menganalisis Perbedaan
Apabila data memiliki kelompok, maka dapat dianalisis apakah hubungan antara dua variabel berbeda antara kelompok-kelompok. Untuk melakukan analisis tersebut, diperlukan variabel kategorial yang mendefinisikan kelompok.
Mengidentifikasi Data Outlier
Scatterplot juga dapat digunakan untuk mengidentifikasi data outlier. Data outlier adalah data yang memiliki nilai-nilai yang sangat berbeda dengan data lainnya.
Dalam analisis persentase lemak tubuh pada gadis remaja, scatterplot dapat membantu dalam mengetahui hubungan antara BMI dan persentase lemak tubuh. Grafik ini juga dapat digunakan untuk mengidentifikasi data outlier dan menganalisis perbedaan antara kelompok-kelompok.
Referensi
- Interpreting Scatterplots and Assessing Relationships between Variables
- Positive and Negative Correlation and Relationships
- Strength of Relationships
- Linear and Curved Relationships
- Determining Whether the Relationship Changes between Groups
- Finding Outliers and Unusual Observations with Scatterplots