Dalam analisis statistik, korelasi adalah salah satu jenis analisis yang digunakan untuk mengetahui hubungan antara dua variabel. Variabel Y dapat diwakili sebagai dependent variable (variabel tergantung) dan variabel X sebagai independent variable (variabel independen). Dalam beberapa kasus, nilai koefisien korelasi yang negatif berarti hubungan kedua variabel tersebut berbanding terbalik. Peningkatan variabel X bersamaan dengan penurunan variabel Y.
Penggunaan RStudio
RStudio adalah salah satu alat bantu analisis statistik yang sangat populer digunakan oleh para peneliti. Alat ini memungkinkan kita untuk melakukan analisis korelasi dan regresi dengan lebih mudah dan cepat. Dalam tutorial ini, kita akan menggunakan RStudio untuk melakukan analisis korelasi pada data perilaku merokok.
Data
Data yang digunakan dalam analisis ini adalah data perilaku merokok yang dapat diunduh dari sini. Data tersebut berisi beberapa variabel, seperti sikap dan perilaku merokok. Script setwd("C:/Users/Hanif/Google Drive/BLOGSPOT/UNTUK DIDOWNLOAD") dan read.csv("perilaku merokok.csv", header=TRUE, sep = ";") digunakan untuk memanggil kembali data.
Analisis Korelasi
Ada beberapa jenis analisis korelasi yang dapat digunakan, seperti korelasi Pearson dan Spearman. Korelasi Pearson adalah korelasi yang digunakan pada data interval atau rasio, sedangkan korelasi Spearman dilakukan jika data kita adalah data ordinal atau yang berbentuk rangking.
Korelasi Pearson
Untuk melakukan analisis korelasi Pearson, kita hanya perlu memasukkan script cor.test(perilakucsv$PERILAKU, perilakucsv$SIKAP). Maka akan dihasilkan output sebagai berikut:
Dari output tersebut dapat kita simpulkan bahwa ada hubungan yang signifikan antara perilaku dan sikap (p-value < 0.01). Nilai koefisien korelasi r adalah sebesar 0,55 yang menunjukkan hubungan yang sedang.
Korelasi Spearman
Jika kita ingin melakukan analisis korelasi dengan salah satu variabelnya berbentuk ordinal, maka kita menggunakan korelasi Spearman. Misalnya, ingin melihat hubungan antara penghasilan dan perilaku merokok. Penghasilan dalam data ini sudah dikelompokkan menjadi 4 tingkatan. Script yang digunakan dalam analisis ini adalah cor.test(perilakucsv$PERILAKU, perilakucsv$penghasilan, method = "spearman"). Maka akan dihasilkan output sebagai berikut:
Dari output tersebut dapat kita simpulkan bahwa tidak ada hubungan antara penghasilan dengan perilaku merokok. Korelasi Spearman menghasilkan koefisien rho, dalam hal ini sebesar 0,11, memang kecil.
Scatterplot
Scatterplot merupakan pesebaran titik nilai variabel X dan variabel Y. Dari tampilan scatterplot kita bisa melihat secara sekilas apakah ada kecenderungan hubungan linear dua variabel X dan Y. Untuk menampilkan scatterplot, kita hanya perlu memasukkan script plot(perilakucsv$PERILAKU ~ perilakucsv$SIKAP), lalu run.
Dalam tampilan scatterplot tersebut, kita dapat melihat secara umum jika nilai sikap rendah, maka nilai perilaku juga rendah, begitu juga sebaliknya. Meskipun demikian, analisis korelasi dengan melihat scatterplot hanya gambaran awal saja, untuk mengujinya akan lebih tepat jika digunakan analisis korelasi Pearson atau Spearman.