Mengapa Outlier dalam Scatter Plot Dapat Mempengaruhi Interpretasi Data

Mengapa Outlier dalam Scatter Plot Dapat Mempengaruhi Interpretasi Data

Dalam analisis data, scatter plot adalah salah satu alat yang paling fundamental untuk visualisasi hubungan antara dua variabel. Namun, keberadaan outlier – titik data yang sangat berbeda dengan sisanya – dapat sangat mempengaruhi interpretasi data. Outlier dapat menjadi hasil dari kesalahan pengukuran, kesalahan entri data, atau mungkin menjadi representasi anoma lainnya dalam dataset. Mengenali dan memahami dampak outlier sangat penting agar analisis Anda merefleksikan sifat sebenarnya data dan tidak menimbulkan kesimpulan yang keliru.

Apakah Outlier Berpengaruh pada Scatter Plot?

Scatter plot seringkali memiliki pola. Kita dapat menganggap titik data sebagai outlier jika tidak sesuai dengan pola tersebut. Misalnya, dalam scatter plot di atas, kita lihat bahwa dua titik data tidak sesuai dengan pola yang lain. Titik data ini telah ditandai dengan nama Brad dan Sharon, yang mewakili siswa-siswi yang melakukan perjalanan backpacking. Sharon dapat dianggap sebagai outlier karena ia memanggarkan sepatu backpack yang lebih berat daripada prediksi pola. Brad dapat juga dianggap sebagai outlier karena ia memanggarkan sepatu backpack yang lebih ringan daripada prediksi pola.

Cara Identifikasi Outlier dan Clustering dalam Scatter Plot

Untuk mengidentifikasi outlier dan clustering dalam scatter plot, kita dapat menggunakan dua langkah berikut:

  1. Tentukan apakah titik data dalam scatter plot mengikuti pola umum. Titik-titik data yang mengikuti pola umum adalah bagian dari cluster.
  2. Tentukan apakah titik data dalam scatter plot sangat berbeda dengan sisanya dan dapat dianggap sebagai outlier.

Dengan demikian, kita dapat mengidentifikasi outlier dan clustering dalam scatter plot dan memahami bagaimana outlier tersebut mempengaruhi interpretasi data.

Bagaimana Outlier Mempengaruhi Interpretasi Scatter Plot?

Outlier dapat mempengaruhi interpretasi scatter plot dengan cara berikut:

  • Outlier dapat membuat pola yang tampak jelas menjadi tidak jelas.
  • Outlier dapat menimbulkan kesimpulan yang keliru tentang hubungan antara dua variabel.
  • Outlier dapat mengaburkan informasi penting lainnya dalam data.

Dengan demikian, penting untuk memahami bagaimana outlier mempengaruhi interpretasi scatter plot dan mengidentifikasi outlier sebelum membuat kesimpulan.

Leave a comment