Membuat Scatterplot di SPSS: Panduan Pemula

Membuat Scatterplot di SPSS: Panduan Pemula

Scatterplot adalah salah satu jenis visualisasi data yang paling umum digunakan dalam analisis statistik. Dalam artikel ini, kita akan membahas bagaimana membuat scatterplot di SPSS dan mengapa mereka sangat berguna.

Contoh Kasus

Sebuah bank ingin memahami tingkat kesatisfaksian karyawan. Mereka melakukan survei dan hasilnya terdapat dalam file data bank_clean.sav. Survei tersebut mencakup jam kerja per minggu dan gaji bulanan.

Penelitian Pertanyaan

Tampaknya, jam kerja berhubungan dengan gaji bulanan: karyawan yang bekerja lebih lama menghasilkan uang lebih banyak. Namun, kita ingin mengetahui lebih lanjut tentang hubungan ini sehingga penelitian kita adalah "Bagaimana kuat hubungan antara gaji bulanan dan jam kerja?"

Kita telah memeriksa file data tersebut (dan mengatur nilai yang hilang) sehingga kita dapat langsung menjalankan korelasi antara jam kerja dan gaji bulanan. Hasilnya menunjukkan bahwa korelasi adalah 0,648, yaitu hubungan linear yang kuat. Namun, scatterplot akan menunjukkan bahwa ada lebih banyak dalam hubungan ini.

Membuat Scatterplot di SPSS

Kita akan membuat scatterplot dengan cara yang paling umum digunakan: dengan mengikuti screenshot berikut ini.

[ Gambar 1 ]

Syntax untuk membuat scatterplot sebagai berikut:

GRAPH /SCATTERPLOT(BIVAR)=whours WITH salary /MISSING=LISTWISE.

Jika Anda ingin membuat scatterplot dengan cara yang lebih cepat, Anda dapat menggunakan sintaks graph/scatter whours with salary.

Hasil

[ Gambar 2 ]

Dalam scatterplot ini, kita melihat bahwa tidak ada hubungan linear yang sederhana. Pertama, kita melihat bahwa titik-titik menjadi lebih tersebar sebagai pekerjaan karyawan meningkat; semakin lama karyawan bekerja, semakin besar variance gaji bulanan. Ini adalah contoh tekstual heteroskedastisitas, yang sebaliknya dengan homoskedastisitas, sebuah asumsi penting untuk regresi.

Kedua, kita melihat pola titik "menggulung" ke kanan sisi grafik. Ini adalah indikasi jelas nonlinearity, yang juga melanggar asumsi regresi.

Membuat Scatterplot dengan Legend

Kita akan menambahkan variable jtype (jenis pekerjaan) untuk membuat scatterplot dengan legend. [ Gambar 3 ]

Syntax untuk membuat scatterplot dengan legend sebagai berikut:

GRAPH /SCATTERPLOT(BIVAR)=whours WITH salary BY jtype /MISSING=LISTWISE /TITLE "Monthly Salary by Weekly Hours | n = 464".

Hasil

[ Gambar 4 ]

Dalam scatterplot ini, kita melihat bahwa heteroskedastisitas dan nonlinearity disebabkan oleh pekerjaan karyawan yang lebih tinggi memiliki gaji jam kerja yang sangat tinggi. Grafik ini juga menunjukkan bahwa kita tidak seharusnya menggabung semua jenis pekerjaan: untuk pegawai penjualan (titik merah), hubungan antara jam kerja dan gaji bulanan tampak linear -mungkin karena gaji jam kerjanya relatif tetap. Sebaliknya, bagi atasan (titik hitam), hubungan antara jam kerja dan gaji bulanan tampak sebaliknya.

Korelasi untuk Jenis Pekerjaan Terpisah

Kita akan memeriksa korelasi untuk setiap grup pekerjaan terpisah. [ Gambar 5 ]

Syntax untuk membuat sintaks sebagai berikut:

CORRELATIONS salary with whours.

Hasil

[ Gambar 6 ]

Dalam sintaks ini, kita melihat bahwa korelasi antara jam kerja dan gaji bulanan adalah 0,79 untuk pegawai penjualan dan 0,21 untuk atasan. Kita akan meninggalkan itu sebagai latihan bagi pembaca untuk membuat scatterplot untuk setiap grup pekerjaan terpisah.

Catatan Akhir

Pertama kali kita menemukan hasil data ini adalah hanya korelasi antara jam kerja dan gaji bulanan sebesar 0,65. Namun, scatterplot menunjukkan bahwa itu tidak sesederhana itu. Saya berharap artikel ini dapat membantu Anda dalam membuat scatterplot di SPSS dan mengapa mereka sangat berguna.