Menentukan Outlier pada Scatter Plot

Menentukan Outlier pada Scatter Plot

Pembahasan scatter plot dapat membantu kita menemukan pola-pola yang tidak terlihat pada data. Salah satu cara untuk memahami scatter plot adalah dengan menentukan apakah ada titik-titik data yang jauh dari pola umum lainnya. Titik-titik ini disebut outlier.

Langkah-Langkah Menentukan Outlier

  1. Perhatikan scatter plot untuk mengetahui apakah pola umum terlihat, seperti garis lurus atau kurva tertentu.
  2. Identifikasi titik-titik pada scatter plot yang tidak sesuai dengan pola umum yang diuraikan dalam langkah 1. Titik-titik ini, jika ada, adalah outlier dan akan berada jauh dari pola umum lainnya.

Definisi Scatter Plot dan Outlier

Scatter Plot: Grafik scatter plot terbentuk oleh mengplotkan titik-titik untuk mewakili nilai data tanpa menghubungkan titik-titik. Scatter plot akan mirip dengan kumpulan titik pada grid koordinat, dan hubungan antara variabel dapat ditemukan dengan menentukan apakah titik-titik mengikuti pola umum garis atau kurva.

Outlier: Titik data yang tidak sesuai dengan pola trend lainnya. Titik ini dapat berupa titik yang terlalu tinggi atau terlalu rendah relatif terhadap titik sekitarnya.

Contoh

Kita akan menggunakan langkah-langkah di atas dan definisi untuk menentukan outlier pada scatter plot pada contoh-contoh berikut.

Contoh 1

Seorang guru mencatat nilai-nilai siswa yang diterima pada ujian terkait dengan jumlah jam masing-masing siswa menghabiskan waktu untuk belajar. Scatter plot di bawah ini menampilkan hasil data tersebut. Identifikasi apakah ada outlier pada scatter plot dan lingkariannya, atau nyatakan bahwa tidak ada outlier.

Scatterplot Contoh 1

Langkah 1: Perhatikan scatter plot untuk mengetahui apakah pola umum terlihat, seperti garis lurus atau kurva tertentu.

Titik-titik pada scatter plot mengikuti trend linear positif (garis lurus yang naik dari kiri ke kanan). Garis lurus sebagaimana di bawah ini menunjukkan:

Trend Linear

Langkah 2: Identifikasi titik-titik pada scatter plot yang tidak sesuai dengan pola umum yang diuraikan dalam langkah 1. Titik-titik ini, jika ada, adalah outlier dan akan berada jauh dari pola umum lainnya.

Ada satu titik yang dapat dianggap sebagai outlier – siswa yang mendapat nilai 90% lebih tinggi dengan waktu belajar kurang dari satu jam. Titik ini lingkari pada scatter plot berikut:

Lingkaran Outlier

Contoh 2

Jumlah galon bensin yang tersisa pada tangki setelah mengendarakan kendaraan berbagai jarak waktu dicatat dan diplotkan di bawah ini. Identifikasi apakah ada outlier pada scatter plot dan lingkariannya, atau nyatakan bahwa tidak ada outlier.

Scatterplot Contoh 2

Langkah 1: Perhatikan scatter plot untuk mengetahui apakah pola umum terlihat, seperti garis lurus atau kurva tertentu.

Titik-titik pada scatter plot mengikuti trend kurva (garis yang turun dari kiri ke kanan). Trend scatter plot sebagaimana di bawah ini menunjukkan:

Trend Scatter Plot

Langkah 2: Identifikasi titik-titik pada scatter plot yang tidak sesuai dengan pola umum yang diuraikan dalam langkah 1. Titik-titik ini, jika ada, adalah outlier dan akan berada jauh dari pola umum lainnya.

Ada dua titik yang dapat dianggap sebagai outlier – kendaraan yang memiliki galon bensin tersisa sebanyak 1 galon setelah mengendarakan 1 jam dan kendaraan yang memiliki galon bensin tersisa sebanyak 8 galon setelah mengendarakan 9 jam. Titik-titik ini lingkari pada scatter plot berikut:

Lingkaran Outlier

Diskusi

Scatter plot di atas menunjukkan bahwa terdapat hubungan linear dasar antara X dan Y untuk sebagian besar data, serta satu outlier (pada X = 375).

Outlier adalah titik data yang tidak sesuai dengan pola trend lainnya. Titik ini dapat berupa titik yang terlalu tinggi atau terlalu rendah relatif terhadap titik sekitarnya.

Dalam artikel ini, kita telah menentukan outlier pada scatter plot menggunakan langkah-langkah yang tepat dan definisi. Kita juga telah memahami bahwa outlier dapat membantu kita memahami pola-pola yang tidak terlihat pada data.