Apa Itu Outlier

Apa Itu Outlier

Outlier adalah nilai yang jauh berbeda dari nilai lainnya dalam kumpulan data. Nilai ini muncul sebagai pengecualian dalam pola data yang ada. Nilai yang ada di outlier bisa jauh lebih tinggi maupun lebih rendah dibandingkan dengan nilai-nilai lain dalam dataset. Outlier bisa terjadi karena beberapa alasan, seperti kesalahan input, noise, atau situasi yang tidak umum.

Ciri-Ciri Outlier

Outlier biasanya memiliki beberapa ciri-ciri, yaitu:

  1. Berada di luar kuartil pertama hingga kuartil ketiga dalam data.
  2. Memiliki nilai Z-Score sangat tinggi (di atas 3) atau sangat rendah (di bawah -3).
  3. Berada di luar rentang Interquartile Range (IQR) dari kumpulan data.

Contoh Data Outlier

Berikut adalah contoh adanya data outlier:

  • Suhu harian di Jakarta selama satu bulan, mayoritas suhu berada di antara 25-30 derajat celcius. Namun, pada suatu hari, suhu mencapai 40 derajat.
  • Penjualan toko X rata-rata 500 unit per hari. Pada satu hari tertentu, penjualan mencapai 5.000 unit.

Cara Mencari Outlier

Ada beberapa cara untuk mencari outlier, yaitu:

  1. Box plot: menggunakan alat visualisasi yang menampilkan outlier berupa titik atau bintang di luar "kotak" utama plot.
  2. Z-Score: menggunakan ukuran statistik yang menunjukkan seberapa jauh suatu nilai dari rata-rata kumpulan data.
  3. Interquartile Range (IQR): menggunakan rentang antara kuartil pertama dan ketiga dalam data.

Cara Mengatasi Data Outlier

Berikut beberapa cara untuk mengatasi data outlier:

  1. Mengidentifikasi outlier: langkah pertama dalam mengatasi outlier adalah identifikasi.
  2. Transformasi data: transformasi data bisa digunakan untuk mengurangi efek outlier.
  3. Menghapus outlier: penghapusan outlier merupakan pilihan paling tepat jika outlier merupakan hasil dari kesalahan input atau noise.
  4. Imputasi: imputasi adalah proses penggantian nilai outlier dengan nilai lain.

FAQ

Bagaimana cara mengatasi data outlier?

  • Mengidentifikasi outlier
  • Transformasi data
  • Menghapus outlier
  • Imputasi

Namun, penting untuk berhati-hati saat menghapus outlier karena terkadang outlier justru bisa memberikan informasi penting.