Mengukur Kemiringan Linier dalam Analisis Regresi

Mengukur Kemiringan Linier dalam Analisis Regresi

Dalam analisis regresi, kemiringan linier antara dua variabel (yaitu X dan Y) adalah salah satu syarat yang harus dipenuhi sebelum kita dapat melakukan analisis. Kemiringan linier berarti bahwa rata-rata nilai respons (Y) pada setiap nilai prediktor (X) harus menjadi fungsi linear dari prediktor.

Dalam model regresi linear sederhana, kita hanya memiliki satu prediktor dan satu respons. Dalam kasus ini, kita dapat mendapatkan pandangan yang baik tentang syarat kemiringan linier hanya dengan melihat scatter plot. Berikut adalah tiga contoh yang berbeda.

Contoh 1: Kanker Kulit dan Mortalitas

Apakah data menunjukkan bahwa fungsi linear adekuat dalam menerangkan hubungan antara kanker kulit mortalitas dan lintang (Skin Cancer dataset)?

Jawabnya adalah ya! Dalam scatter plot, tampaknya hubungan antara lintang dan kanker kulit mortalitas memang linear. Oleh karena itu, kita dapat menggunakan fungsi linear untuk meringkas trend dalam data.

Contoh 2: Alligator

Panjang alligator dapat diestimasi dengan akurat dari foto udara atau perahu. Namun, menghitung berat alligator jauh lebih sulit. Salah satu pendekatan adalah menggunakan model regresi yang meringkas trend antara panjang dan berat alligator. Panjang alligator dapat kemudian digunakan untuk memprediksi berat alligator. Dalam mengambil pendekatan ini, beberapa ahli biologi hutan liar mengumpulkan contoh acak 25 alligator. Mereka mencatat panjang (x, dalam inci) dan berat (y, dalam pound) masing-masing alligator. (Alligator dataset)

Apakah data yang dihasilkan menunjukkan bahwa fungsi linear adekuat dalam menerangkan hubungan antara panjang dan berat alligator?

Jawabnya adalah tidak! Tidakkah Anda pikir bahwa fungsi kurva lebih tepat untuk menjelaskan trend? Scatter plot memberikan kita pandangan yang baik tentang syarat kemiringan linier, yang menunjukkan bahwa model linear tidak adekuat dalam kasus ini.

Contoh 3: Korosi Alloy

Tiga belas (n = 13) contoh alloy terdiri dari 90% copper dan 10% nickel — masing-masing dengan kandungan besi tertentu — dites untuk korosi. Masing-masing contoh diputar dalam air laut garam pada kedalaman 30 ft per second selama 60 hari. Korosi diukur dalam kehilangan berat dalam miligram/detik persegi/hari. Peneliti ingin mempelajari hubungan antara kandungan besi (x) dan korosi (y). (Corrosion dataset)

Apakah data yang muncul dalam scatter plot menunjukkan bahwa fungsi linear adekuat dalam menerangkan hubungan antara kandungan besi dan korosi?

Jawabnya adalah ya! Dalam contoh ini, visual inspection dari data menunjukkan bahwa model linear adekuat dalam menjelaskan trend antara kandungan besi dan korosi.

Scatter Plot: Suatu Assumtion Analisis Regresi

Apa nilai memeriksa scatter plot untuk analisis regresi?
Plot residual memberikan penilaian visual terhadap asumsi homoscedasticity antara skor respons prediktif dan kesalahan predicatif. Manfaat utama adalah bahwa asumsi dapat dilihat dan dianalisis dengan sekali pandang; oleh karena itu, pelanggaran apa pun dapat dipastikan dengan cepat dan mudah. Ketika analisis memenuhi asumsi, kemungkinan terjadinya kesalahan Type I dan Type II berkurang, yang memperbaiki akurasi hasil penelitian.

Plot residual adalah suatu gambar yang menampilkan satu sumbu untuk skor predikatif dan satu sumbu lainnya untuk kesalahan predicatif. Pemeriksaan awal dapat mengisolasi outlier (nilai ekstrem) dalam dataset. Tabachnick dan Fidell (2007) menjelaskan residual (perbedaan antara nilai respons yang diperoleh dan nilai respons yang diprediksi) dan varian residual harus sama untuk semua skor predikatif (homoscedasticity). Jika ini benar, asumsi dipenuhi dan plot residual mengambil bentuk persegi; skor akan rata-rata di sekitar nilai mean.

Leave a comment