Dalam artikel ini, kami akan membahas tentang algoritma biweight multivariate S-estimator untuk memperkirakan lokasi dan scatter (variabilitas) dari suatu dataset. Algoritma ini dikembangkan oleh Valentin Todorov, Matias Salibian-Barrera, Victor Yohai, dan lain-lain.
Algoritma ini dapat digunakan untuk menghitung S-estimator yang lebih robust terhadap outliers dan noise dalam data. Salah satu kelebihan algoritma ini adalah kemampuan untuk memperkirakan lokasi dan scatter secara simultan, sehingga dapat membantu dalam menentukan pola data yang lebih akurat.
Parameter
Algoritma ini memiliki beberapa parameter yang dapat diatur:
maxiter
: Jumlah maksimum iterasi yang diperbolehkan dalam komputasi S-estimator.nsamp
: Jumlah random subset yang dianggap. Default adalah 500.impMeth
: Metode imputasi yang akan digunakan – pilih salah satu dari "norm", "seq", atau "rseq". Default adalah "norm".seed
: Nilai awal untuk generator acak. Default adalah NULL.trace
: Apakah hasil intermediate akan dicetak? Default adalah FALSE.tolSolve
: Toleransi numerik yang digunakan untuk inversi matrix kovarian (mahalanobis).scalefn
: Fungsi untuk menghitung estimasi skala yang robust atau string karakter yang menentukan fungsi tersebut. Digunakan untuk menghitung S-estimator yang "deterministik" (method="sdet").method
: Algoritma yang akan digunakan – pilih salah satu dari "sfast", "surreal", "bisquare", "rocke", atau "sdet". Default adalah "sfast".control
: Benda kendali (S4) kelas CovControlSest-class yang mengandung opsi estimasi. Jika benda kendali disuplai, parameter dari itu akan digunakan.t0
danS0
: Estimasi awal HBDP untuk lokasi dan matrix kovarian.initcontrol
: Benda kendali awal untuk menghitung estimasi awal HBDP.
Detail
Algoritma ini dapat dijalankan menggunakan salah satu dari empat algoritma berbeda:
- FAST-S: Algoritma yang mirip dengan yang dikembangkan oleh Salibian-Barrera dan Yohai (2006) untuk kasus regresi.
- SURREAL: Algoritma Ruppert's SURREAL ketika method = "surreal".
- BISQUARE: Bisquare S-Estimate dengan method = "bisquare".
- ROCKE: Rocke type S-Estimate dengan method = "rocke".
Hasil
Algoritma ini menghasilkan objek S4 kelas CovNASest-class yang adalah subclass dari virtual class CovNARobust-class.
Autors
Algoritma ini dikembangkan oleh Valentin Todorov, Matias Salibian-Barrera, Victor Yohai, dan lain-lain. Lihat juga kode dari Kristel Joossens, K.U. Leuven, Belgium dan Ella Roelant, Ghent University, Belgium.
Referensi
M. Salibian-Barrera dan V. Yohai (2006) A fast algorithm for S-regression estimates, Journal of Computational and Graphical Statistics, 15, 414-427.
R. A. Maronna, D. Martin dan V. Yohai (2006). Robust Statistics: Theory and Methods. Wiley, New York.
Todorov V & Filzmoser P (2009), An Object Oriented Framework for Robust Multivariate Analysis. Journal of Statistical Software, 32(3), 1-47. doi:10.18637/jss.v032.i03.
Contoh
Contoh penggunaan algoritma ini dapat dilihat sebagai berikut:
library(rrcov)
data(bush10)
CovNASest(bush10)
Dalam contoh di atas, kita menggunakan dataset bush10
dan menghitung S-estimator menggunakan default parameter. Kita juga dapat memodifikasi parameter dengan cara yang berbeda, seperti:
c0 <- CovNASest(bush10)
c1 <- CovNASest(bush10, bdp = 0.25)
c2 <- CovNASest(bush10, control = CovControlSest(bdp = 0.25))
c3 <- CovNASest(bush10, control = new("CovControlSest", bdp = 0.25))
Dalam contoh di atas, kita menggunakan parameter bdp
untuk menghitung S-estimator dengan rentang 0.25. Kita juga dapat memodifikasi parameter lainnya, seperti maxiter
, nsamp
, dan sebagainya.
Kesimpulan
Algoritma biweight multivariate S-estimator adalah algoritma yang dapat digunakan untuk menghitung lokasi dan scatter secara simultan dari suatu dataset. Algoritma ini dapat membantu dalam menentukan pola data yang lebih akurat dan dapat digunakan dalam berbagai aplikasi, seperti analisis statistik dan machine learning.