Menambahkan Label dan Highlight Pada Grafik Scatter

Menambahkan Label dan Highlight Pada Grafik Scatter

Grafik scatterplot adalah salah satu jenis grafik yang paling sering digunakan untuk menggambarkan hubungan antara dua variabel. Grafik ini sangat efektif dalam menyajikan informasi sebanyak-banyaknya sekaligus. Namun, tidak semua data dapat diterapkan pada grafik scatterplot.

Dalam beberapa kasus, kita memiliki jumlah observasi yang sangat banyak sehingga tidak mudah untuk memahami grafik tersebut. Selain itu, jika kita memiliki data survei dengan hanya beberapa nilai diskrit pada variabel-variabel, maka grafik scatterplot akan terlihat sangat aneh. Dalam hal ini, diagram bar mungkin lebih sesuai.

Dalam artikel ini, kita akan membahas cara menambahkan label dan highlight pada grafik scatterplot. Kita akan menggunakan data yang berisi informasi tentang CPI (Consumer Price Index) dan Polity II (skala politik) untuk beberapa negara.

Menambahkan Label

Kita dapat menambahkan label pada grafik scatterplot dengan menggunakan opsi mlabel(). Opsi ini memungkinkan kita untuk menentukan variabel yang akan digunakan sebagai label. Dalam kasus ini, kita akan menggunakan variabel cname (nama negara) sebagai label.

Kita juga dapat menambahkan opsi mlabsize(vsmall) untuk membuat label menjadi lebih kecil dan lebih mudah dibaca.

Contoh:

twoway (scatter ti_cpi p_polity2, mlabel(cname) mlabsize(vsmall))

Highlight Specific Observations

Grafik scatterplot dapat menjadi tidak terbaca jika kita memiliki banyak observasi. Dalam kasus ini, kita dapat menggunakan variabel selektor untuk memfilter observasi yang akan dilihat.

Kita menggunakan perintah generate dan if-statement untuk membuat variabel selektor. If-statement menggunakan simbol "or" (|) yang berarti kondisi keseluruhan dipenuhi jika salah satu kondisi sub-kondisi dipenuhi.

Contoh:

gen select = 1 if cname=="Singapore" | cname=="Qatar" | cname=="Denmark" ///
 | cname =="Korea, North" | cname=="Somalia"

Kita kemudian menambahkan layer baru pada grafik scatterplot dan hanya menampilkan label untuk layer tersebut. Kita juga menggunakan if-statement dalam layer tersebut.

Contoh:

twoway (scatter ti_cpi p_polity2) ///
 (scatter ti_cpi p_polity2 if select==1, mlabel(cname) mlabsize(vsmall)) ///
 , legend(off)

Dengan demikian, kita dapat melihat dua grafik scatterplot yang bertumpuk, satu lapisan untuk semua observasi dan lainnya hanya menampilkan observasi yang memenuhi kondisi selektor. Untuk layer yang kedua, kita juga menampilkan label.

Kesimpulan

Grafik scatterplot adalah cara yang efektif untuk menggambarkan hubungan antara dua variabel dan menyajikan informasi sebanyak-banyaknya sekaligus. Namun, tidak semua data dapat diterapkan pada grafik scatterplot. Jika kita memiliki jumlah observasi yang sangat banyak atau data survei dengan hanya beberapa nilai diskrit, maka diagram bar mungkin lebih sesuai. Dalam menulis tesis atau paper, cobalah untuk menggabungkan struktur dan penampilan grafik sehingga menjadi menarik dan pedagogis sekaligus.