Penggunaan Scatter Plot dalam Visualisasi Data

Penggunaan Scatter Plot dalam Visualisasi Data

Dalam dunia analisis data, visualisasi adalah salah satu cara terbaik untuk memahami dan menginterpretasikan data. Salah satu jenis visualisasi yang sangat populer adalah scatter plot (plot atau diagram kordinat Cartesius) yang digunakan untuk menampilkan nilai-nilai untuk biasanya dua variabel pada set data. Dalam artikel ini, kita akan membahas tentang penggunaan scatter plot dalam visualisasi data dan contoh-contohnya.

Definisi Scatter Chart

Scatter Chart (juga disebut sebagai scatter plot, scatter graph, atau scatter diagram) adalah tipe plot atau diagram matematika menggunakan kordinat Cartesius untuk menampilkan nilai-nilai untuk biasanya dua variabel pada set data. Data tersebut dipresentasikan sebagai kumpulan titik, masing-masing memiliki nilai salah satu variabel yang menentukan posisi pada sumbu horizontal dan nilai lainnya yang menentukan posisi pada sumbu vertikal. Jika titik-titik ditandai dengan warna, bentuk, atau ukuran, maka variabel tambahan dapat dipresentasikan, biasanya disebut sebagai bubble chart.

Ketika Menggunakan Scatter Chart

Scatter charts sangat berguna untuk menunjukkan korrelasi antar variabel dan memvisualisasikan cluster data titik. Titik-titik tersebut menunjukkan pola yang tidak terlihat jika tidak menggunakan scatter plot. Orang-orang menggunakan scatter chart untuk kasus-kasus berikut:

  • Scatter Diagrams adalah mudah dibuat.
  • Mudah dipahami dan diinterpretasikan.
  • Menunjukkan korrelasi antar dua variabel.
  • Observasi dan bacaan pola serta trend sangat mudah.

Contoh Penggunaan Scatter Chart

Berikut ini adalah contoh penggunaan scatter chart untuk menampilkan korelasi antara penggunaan CPU dan memori:

  • Cross-measurement correlation: Contoh ini mengexplore kemungkinan korrelasi antara penggunaan CPU dan memori menggunakan data yang dikumpulkan dengan plugin Telegraf Mem dan CPU.
  • Query CPU and memory usage: Query ini menciptakan union dari penggunaan CPU dan memori. Penggunaan CPU di-skala untuk lebih baik alignment dengan baseline memori penggunaan.

Perbedaan Scatter Plot dengan Heatmap

Scatter plot dan heatmap keduanya digunakan untuk visualisasi distribusi data titik pada sumbu X dan Y. Namun, scatter plot dapat "menghilangkan" titik-titik jika mereka memiliki koordinat yang sama. Sebagai contoh, dashboard berikut ini memvisualisasikan hasil query yang sama:

  • Heatmap menunjukkan titik-titik yang sangat padat, tidak terlihat pada scatter plot.
  • Pada scatter plot, titik-titik yang memiliki koordinat yang sama muncul sebagai satu titik.

Bulan dan Saya

Jika Anda ingin berkontribusi dalam pembuatan artikel ini, silakan tulis komentar di bawah ini. Terima kasih atas umpan balik Anda!

Leave a comment