Dalam analisis data, plot skatter adalah salah satu cara yang paling umum untuk menggambarkan hubungan antara dua variabel. Dalam plot skatter, titik-titik data berada di atas grid koordinat, mewakili nilai dari kedua variabel. Namun, dalam beberapa kasus, dapat terlihat bahwa salah satu titik data tidak sesuai dengan pola yang ditemukan pada plot lainnya.
Titik-data yang tidak sesuai dengan pola ini disebut sebagai outlier. Dalam artikel ini, kita akan mempelajari bagaimana cara mengidentifikasi point outlier dalam plot skatter.
Apa itu Outlier?
Sebelum kita mulai, mari kita definisi apa itu outlier. Outlier adalah titik-data yang tidak sesuai dengan pola yang ditemukan pada plot skater lainnya. Idenya, titik-data ini berada di luar dari cluster dan tidak mengikuti pola yang sama seperti titik-data lainnya.
Contoh: Identifikasi Outlier dalam Plot Skatter
Mari kita lihat beberapa contoh identifikasi outlier dalam plot skatter. Dalam contoh pertama, kita memiliki data tentang backpacking trip yang dilakukan oleh siswa. Plot skater menunjukkan pola yang jelas, tetapi ada dua titik-data yang tidak sesuai dengan pola ini.
Titik-data Sharon tidak sesuai dengan pola karena dia membawa backpack yang lebih berat dari yang diprediksi. Titik-data Brad juga tidak sesuai dengan pola karena dia membawa backpack yang lebih ringan dari yang diprediksi.
Bagaimana Identifikasi Outlier dalam Plot Skatter?
Ada beberapa cara untuk mengidentifikasi outlier dalam plot skater. Berikut adalah langkah-langkahnya:
- Tentukan apakah ada titik-data yang mengikuti pola umum pada plot skater. Titik-data yang mengikuti pola ini termasuk cluster.
- Tentukan apakah ada titik-data yang jauh dari pola umum lainnya. Titik-data ini disebut sebagai outlier.
Contoh: Identifikasi Outlier dalam Plot Skater
Mari kita lihat contoh identifikasi outlier dalam plot skater. Dalam contoh pertama, kita memiliki data tentang computer shopping.
Plot skater menunjukkan pola yang jelas, dengan cluster yang terlihat jelas. Dua titik-data yang tidak sesuai dengan pola ini adalah outliers.
Dalam contoh kedua, kita memiliki data tentang test scores. Plot skater menunjukkan pola yang tidak jelas, tetapi ada tiga titik-data yang tidak sesuai dengan pola ini dan disebut sebagai outliers.
Kesimpulan
Identifikasi outlier dalam plot skater dapat membantu kita untuk lebih memahami data yang kami analisis. Dengan menggunakan langkah-langkah yang dijabarkan di atas, kita dapat mengidentifikasi titik-data yang tidak sesuai dengan pola yang ditemukan pada plot skater lainnya.
Referensi
- "Identifying Outliers & Clustering in Scatter Plots" | Algebra