Scatterplot adalah salah satu cara yang paling berguna untuk memahami tren di dalam data statistik. Setiap observasi (atau titik) pada scatterplot memiliki dua koordinat. Koordinat pertama berhubungan dengan bagian data pertama dalam pasangan, sedangkan koordinat kedua berhubungan dengan bagian data kedua dalam pasangan. Titik yang mewakili observasi tersebut ditempatkan di tempat pertemuan dua koordinat.
Contoh Scatterplot: Suhu Luar dan Suara Kumbang
Gambar di atas menunjukkan scatterplot untuk suhu luar dan suara kumbang. Data ini disajikan dalam tabel sebagai berikut:
Data Suhu dan Suara Kumbang (Ringkasan)
Suhu (Fahrenheit)
Jumlah Suara (dalam 15 Detik)
57
18
60
20
64
21
65
23
68
27
71
30
74
34
77
39
Karena data disusun berdasarkan nilai X, titik-titik pada scatterplot mencorak dari kiri ke kanan dengan observasi-observasi yang diberikan dalam tabel, dalam urutan yang terdapat.
Membaca Scatterplot
Anda membaca scatterplot dengan mencari pola di dalam data ketika Anda bergerak dari kiri ke kanan:
- Jika data menunjukkan pola naik sebagai Anda bergerak dari kiri ke kanan, maka ini menunjukkan hubungan positif antara X dan Y. Ketika nilai X meningkat (bergerak ke kanan), nilai Y juga cenderung meningkat (bergerak ke atas).
- Jika data menunjukkan pola turun sebagai Anda bergerak dari kiri ke kanan, maka ini menunjukkan hubungan negatif antara X dan Y. Ketika nilai X meningkat (bergerak ke kanan), nilai Y juga cenderung menurun (bergerak ke bawah).
- Jika data tidak memiliki pola sama sekali, maka tidak ada hubungan antara X dan Y.
Pola Khusus: Pola Linear
Pola yang paling menarik adalah pola linear, di mana data memiliki penampilan umum seperti garis yang naik atau turun. Dalam gambar sebelumnya, Anda dapat melihat bahwa terdapat hubungan linear positif antara suhu dan jumlah suara kumbang. Artinya, ketika suhu meningkat, jumlah suara kumbang juga meningkat.
Namun, scatterplot hanya menunjukkan adanya hubungan linear antara dua set nilai. Tidak berarti bahwa peningkatan suhu menyebabkan peningkatan jumlah suara kumbang.
Hubungan Linear
Hubungan linear antara X dan Y terjadi ketika pola X- dan Y-values mirip seperti garis, baik naik (dengan slope positif) atau turun (dengan slope negatif).
Scatterplot menunjukkan kemungkinan asosiasi atau hubungan antara dua variabel. Namun, hanya karena Anda melihat sesuatu terjadi pada gambar atau chart, tidak berarti bahwa ada hubungan sebab-akibat.
Contoh: Dokter mencatat bahwa orang yang mengkonsumsi vitamin C setiap hari cenderung memiliki gejala influenza yang lebih sedikit. Apakah ini berarti vitamin C mencegah flu? Tidak perlu. Mungkin orang yang lebih sihat mengkonsumsi vitamin C, tetapi mereka juga memakan makanan seimbang, tidak gemuk, berolahraga setiap hari, dan mencuci tangan dengan lebih sering.
Jika dokter ingin mengetahui apakah vitamin C yang sebenarnya melindungi dari flu, maka ia perlu melakukan eksperimen yang baik yang menghilangkan faktor-faktor lainnya.