Dalam analisis statistik, scatterplot adalah salah satu alat yang paling berguna untuk menunjukkan hubungan antara dua variabel. Dalam hal ini, kita akan membahas tentang correlation, outliers, dan model types dalam scatterplot.
Correlation
Correlation adalah suatu ukuran yang digunakan untuk mengetahui sejauh mana dua variabel terkait atau tidak terkait. Pada dasarnya, correlation dapat berupa nilai positif, negatif, atau nihil. Correlation yang positif menunjukkan bahwa dua variabel tersebut memiliki hubungan yang baik, sedangkan correlation yang negatif menunjukkan bahwa mereka memiliki hubungan yang buruk. Sebaliknya, correlation nihil menunjukkan bahwa mereka tidak terkait sama sekali.
Outliers
Outliers adalah data point yang tidak sesuai dengan tren lainnya dalam scatterplot. Mereka dapat berupa nilai yang sangat tinggi atau sangat rendah dibandingkan dengan trend lainnya. Outliers dapat dianggap sebagai nilai yang salah atau sebagai varianasi alami. Dalam beberapa kasus, outliers dapat mempengaruhi hasil analisis statistik.
Model Types
Model types adalah jenis-jenis model matematika yang digunakan untuk menggambarkan hubungan antara dua variabel dalam scatterplot. Tiga jenis model yang paling umum digunakan adalah linear, quadratic, dan exponential.
- Linear model menunjukkan bahwa hubungan antara dua variabel tersebut dapat digambarkan dengan garis lurus.
- Quadratic model menunjukkan bahwa hubungan antara dua variabel tersebut dapat digambarkan dengan kurva yang membulat.
- Exponential model menunjukkan bahwa hubungan antara dua variabel tersebut dapat digambarkan dengan fungsi eksponensial.
Penggunaan Scatterplot dalam Analisis Statistik
Dalam analisis statistik, scatterplot dapat digunakan untuk:
- Mengecek correlation antara dua variabel.
- Mengidentifikasi outliers yang tidak sesuai dengan trend lainnya.
- Menentukan model types yang paling sesuai untuk menggambarkan hubungan antara dua variabel.
Contoh
Dalam contoh di bawah ini, kita akan membahas tentang correlation, outliers, dan model types dalam scatterplot.
[ Gambar 1: Scatterplot dengan correlation positif ]
Dalam gambar ini, kita lihat bahwa data pointnya tampak berada pada garis lurus yang memungkinkan kita untuk menggambarkan hubungan antara dua variabel tersebut sebagai linear. Jadi, model types yang paling sesuai adalah linear.
[ Gambar 2: Scatterplot dengan outliers ]
Dalam gambar ini, kita lihat bahwa ada satu data point yang tidak sesuai dengan trend lainnya, yaitu (6, 7). Mereka dapat dianggap sebagai outlier. Jadi, kita harus mengabaikan data point tersebut dalam analisis statistik.
[ Gambar 3: Scatterplot dengan model exponential ]
Dalam gambar ini, kita lihat bahwa data pointnya tampak berada pada kurva yang membulat dan kemudian naik tajam. Mereka dapat dianggap sebagai fungsi eksponensial. Jadi, model types yang paling sesuai adalah exponential.
Kesimpulan
Dalam analisis statistik, scatterplot adalah salah satu alat yang paling berguna untuk menunjukkan hubungan antara dua variabel. Correlation, outliers, dan model types adalah beberapa konsep yang penting dalam scatterplot. Dengan menggunakan scatterplot, kita dapat memahami hubungan antara dua variabel dan menggambarkan model yang sesuai untuk menginterpretasikan data.
Referensi
Purplemath. (n.d.). Scatterplot Regression: Correlation, Outliers, and Model Types. Retrieved from https://www.purplemath.com/modules/scattreg2.htm