Dalam analisis data, scatter plot atau grafik tersebar adalah salah satu alat visualisasi yang paling populer dan bermanfaat. Grafik ini digunakan untuk menampilkan hubungan antara dua variabel kuantitatif, seperti contoh, ukuran kapasitas paru dan waktu yang dibutuhkan seseorang untuk menahan nafas.
Sejarah Scatter Plot
Grafik tersebar pertama kali diperkenalkan oleh Karl Pearson pada tahun 1901. Namun, konsep ini sebenarnya telah dipakai oleh para ilmuwan dan matematikawan lainnya sejak beberapa decade sebelumnya. Pada awal abad ke-20, grafik tersebar menjadi sangat populer dalam analisis statistik.
Bagaimana Scatter Plot Bekerja
Proses membuat scatter plot cukup sederhana. Pertama-tama, Anda harus memilih dua variabel kuantitatif yang ingin Anda analisis, kemudian mengumpulkan data dari setiap individu atau observasi. Data ini kemudian akan diplot pada grafik dengan horizontal axis untuk variabel pertama dan vertical axis untuk variabel kedua.
Contoh
Sebagai contoh, sebuah peneliti ingin mengetahui apakah terdapat hubungan antara kapasitas paru seseorang dan waktu yang dibutuhkan untuk menahan nafas. Peneliti ini akan memilih sekelompok orang untuk diwawancarai, kemudian mengukur kapasitas paru masing-masing individu (variabel pertama) dan waktu yang dibutuhkan untuk menahan nafas (variabel kedua). Data ini kemudian akan diplot pada grafik dengan horizontal axis untuk variabel pertama dan vertical axis untuk variabel kedua.
Scatter Plot Matrix
Grafik tersebar juga dapat digunakan dalam bentuk matriks, yang disebut scatter plot matrix. Matriks ini menampilkan semua plot pairwise dari variabel-variabel yang dikumpulkan, sehingga Anda dapat melihat hubungan antara beberapa variabel sekaligus.
Visualisasi Data
Dalam era modern, visualisasi data telah menjadi sangat populer dan penting dalam analisis data. Beberapa contoh visualisasi data lainnya adalah:
- Rug plot
- Bar graph
- Line chart
- Scagnostics
- Dot plot (statistics)
- Parity plot
Referensi
- Friendly, Michael; Denis, Dan (2005). "The early origins and development of the scatterplot". Journal of the History of the Behavioral Sciences. 41 (2): 103–130.
- Cleveland, William (1993). Visualizing data. Murray Hill, N.J. Summit, N.J: At & T Bell Laboratories Published by Hobart Press.
- Nancy R. Tague (2004). "Seven Basic Quality Tools". The Quality Toolbox. Milwaukee, Wisconsin: American Society for Quality.
- Emerson, John W.; Green, Walton A.; Schoerke, Barret; Crowley, Jason (2013). "The Generalized Pairs Plot". Journal of Computational and Graphical Statistics. 22 (1): 79–91.
Sumber Daya
- Cattaneo, Matias D.; Crump, Richard K.; Farrell, Max H.; Feng, Yingjie (2024). "On Binscatter". American Economic Review. 114 (5): 1488–1514.
- Media related to Scatterplots at Wikimedia Commons
- What is a scatterplot? [Archived]
- Correlation scatter-plot matrix for ordered-categorical data – Explanation and R code
- Density scatterplot for large datasets (hundreds of millions of points)