Menguji Normalitas Data dengan Kolmogorov-Smirnov dan Shapiro-Wilk

Menguji Normalitas Data dengan Kolmogorov-Smirnov dan Shapiro-Wilk

Dalam analisis statistik, menguji normalitas data adalah salah satu langkah awal yang sangat penting. Dalam beberapa kasus, kita harus mengetahui apakah data kita terdistribusi secara normal atau tidak. Salah satu cara untuk menguji normalitas data adalah dengan menggunakan test Kolmogorov-Smirnov dan Shapiro-Wilk.

Kolmogorov-Smirnov

Test Kolmogorov-Smirnov adalah salah satu jenis test nonparametric yang digunakan untuk menguji hipotesis bahwa data kita terdistribusi secara normal. Test ini bekerja dengan cara membandingkan fungsi distribusi empirik dari data kita dengan fungsi distribusi normal ideal. Jika hasil signifikan (p < 0,05), maka data kita tidak terdistribusi secara normal.

Shapiro-Wilk

Test Shapiro-Wilk adalah test lain yang digunakan untuk menguji hipotesis bahwa data kita terdistribusi secara normal. Test ini bekerja dengan cara membandingkan fungsi distribusi empirik dari data kita dengan fungsi distribusi normal ideal, serta memperhitungkan nilai W-statistik dan p-value. Jika hasil signifikan (p < 0,05), maka data kita tidak terdistribusi secara normal.

Pemilihan Test

Jika kita memiliki dua test yang sama-sama efektif untuk menguji normalitas data, maka pertanyaan yang muncul adalah: "Kolmogorov-Smirnov atau Shapiro-Wilk?"

Berdasarkan beberapa penelitian, jika jumlah sampel kita kecil (kurang dari 50), maka Shapiro-Wilk lebih direkomendasikan. Namun, jika jumlah sampel kita besar (lebih dari 50), maka Kolmogorov-Smirnov lebih direkomendasikan.

Namun, Yap dan Sim (2011) menyarankan bahwa Shapiro-Wilk adalah teknik yang paling powerful untuk menguji normalitas data. Bahkan beberapa software statistik tidak menyediakan test Kolmogorov-Smirnov untuk menguji normalitas.

Keterbatasan Test

Kedua test ini memiliki keterbatasan sendiri. Field (2009) menyarankan bahwa baik Kolmogorov-Smirnov maupun Shapiro-Wilk sangat sensitif terhadap jumlah sampel. Jika jumlah sampel yang digunakan besar, maka ada kecenderungan hasil statistik kedua test ini menjadi signifikan, yang berarti data kita tidak normal.

Penggunaan Metode Visual

Untuk menilai data kita normal atau tidak, tidak cukup dengan satu cara. Jika jumlah sampel kita kecil, maka analisis statistik (Kolmogorov-Smirnov dan Shapiro-Wilk) dapat membantu. Namun, jika jumlah sampel kita besar, maka metode visual seperti histogram, boxplot, dan Q-Q plot dapat digunakan.

Penggunaan Kombinasi Analisis Statistik dan Metode Visual

Oleh karena itu, kombinasi penggunaan analisis statistik dan metode visual untuk menguji normalitas data diperlukan. Jangan terlalu percaya dengan hasil analisis Kolmogorov-Smirnov dan Shapiro-Wilk jika data kita banyak.

Catatan Penting

Beberapa orang menguji normalitas dengan test Kolmogorov-Smirnov melalui menu nonparametric test, bukan melalui menu explore. Jika kita menggunakan SPSS versi 22 ke atas, hasilnya akan sama saja. Namun, jika kita menggunakan SPSS versi lama (20 ke bawah), maka akan ada perbedaan.

Analisis melalui menu nonparametric test di SPSS versi lama tidak dilakukan koreksi Lilliefors, sehingga sebenarnya kurang tepat jika kita menguji normalitas dengan SPSS versi lama melalui menu nonparametric test.

Leave a comment