Analisis Scatter Plot dan Korelasi

Analisis Scatter Plot dan Korelasi

Scatter plot adalah salah satu jenis representasi data yang menunjukkan hubungan antara dua variabel numerik. Setiap anggota dataset mendapatkan titik yang terdefinisikan oleh koordinat x-y yang terkait dengan nilai variabel-variabel tersebut.

Dalam artikel ini, kita akan membahas berbagai contoh scatter plot dan korelasi yang terkait dengannya. Misalnya, apakah scatter plot berbentuk "V" memiliki korelasi positif, negatif, atau tidak?

Scatter Plot "V"

Jika scatter plot berbentuk "V" sempurna simetriks, maka tidak akan ada korelasi linear. Oleh karena itu, jika scatter plot berbentuk "V" hampir simetriks, maka diharapkan memiliki sedikit atau tidak ada korelasi linear.

Scatter Plot "O"

Jika scatter plot berbentuk "O", maka akan memiliki sangat sedikit korelasi. Namun, dalam kehidupan sehari-hari, tidak mungkin memiliki bentuk simetriks yang sempurna. Oleh karena itu, jika semua titik dalam scatter plot membentuk "O" yang hampir simetriks, maka diharapkan memiliki sangat sedikit korelasi.

Scatter Plot "X"

Jika scatter plot berbentuk "X", maka akan memiliki korelasi negatif. Korelasi ini dapat dilihat karena titik-titik dalam scatter plot membentuk garis vertikal yang jelas.

Scatter Plot Garis Vertikal Lurus

Jika scatter plot berupa garis vertikal lurus, maka akan menunjukkan korelasi linear sempurna. Jika semua titik dalam scatter plot berada di atas atau di bawah garis vertikal tersebut, maka korelasi yang terjadi adalah positif. Sebaliknya, jika semua titik berada di bawah atau di atas garis vertikal tersebut, maka korelasi yang terjadi adalah negatif.

Scatter Plot Tak Linear

Ketika data mempunyai tendensi untuk tidak berada dalam suatu koridor linear, maka scatter plot tersebut dapat disebut sebagai tak linear. Contohnya, jika semua titik dalam scatter plot berada di salah satu sudut, maka korelasi yang terjadi adalah tidak linear.

Scatter Plot Clustering

Jika data mempunyai clustering, maka korelasi yang terjadi adalah tidak linear. Scatter plot dengan clustering dapat menunjukkan bahwa data tidak memiliki hubungan linear yang jelas. Oleh karena itu, perlu diperhatikan distribusi overall titik-titik dalam scatter plot untuk menentukan apakah ada sistematisisme antara variabel-variabel yang dipplot.

Contoh

Misalnya, Mary membuat scatter plot dari dua dataset: jumlah curah hujan (inch) dan jumlah umbrella yang terjual. Jika precipitation dijadikan sebagai nilai x dan jumlah umbrellanya sebagai nilai y, maka kita dapat mengharapkan korelasi positif; orang biasanya membeli lebih banyak umbrella ketika jumlah curah hujan meningkat.

Membuat Scatter Plot

Untuk membuat scatter plot, Anda dapat menggunakan tabel atau grafik yang menunjukkan bagaimana data dipplot. Misalnya, Anda memiliki tinggi (cm) dan berat badan (kg) siswa Emmy. Jika Emmy memiliki tinggi 140 cm dan berat badan 45 kg, maka Anda dapat memplot titik di scatter plot dengan koordinat x=45 dan y=140.

Dalam artikel ini, kita telah membahas beberapa contoh scatter plot dan korelasi yang terkait dengannya. Dengan memahami bagaimana scatter plot bekerja, kita dapat lebih mudah menganalisis data dan membuat keputusan yang lebih baik.