====================================================
Corosync Cluster Engine ('UNKNOWN'): started and ready to provide service
Corosync adalah sebuah engine cluster yang digunakan untuk mengelola klaster jaringan. Pada artikel ini, kita akan membahas penggunaan Corosync dengan SBD Stonith (Stoneage Block Device) untuk menjamin keterandalan data pada klaster.
Penggunaan SBD Stonith
SBD Stonith adalah sebuah modul yang digunakan untuk mengelola proses fensing pada klaster. Proses fensing ini bertujuan untuk memastikan bahwa semua node dalam klaster tetap dalam kondisi normal dan tidak gagal. Jika suatu node gagal, maka SBD Stonith akan langsung mengfencing-kan node tersebut sehingga data pada klaster dapat dijamin keamanannya.
Menguji Kinerja SBD Stonith
Untuk menguji kinerja SBD Stonith, kita dapat menggunakan perintah ps aux | grep sbd
untuk melihat proses-proses yang berjalan pada node tersebut. Jika SBD Stonith tidak bekerja dengan baik, maka akan terlihat bahwa node tersebut tidak akan segera di-reboot setelah timeout watchdog tercapai.
Penggunaan Softdog sebagai Solusi
Jika watchdog module yang digunakan tidak berfungsi, maka kita dapat menggunakan softdog sebagai solusi. Caranya adalah dengan menambahkan softdog
ke dalam file /etc/sysconfig/kernel/
untuk memastikan bahwa softdog module tersebut di-load pada saat boot.
Mengatasi Masalah Timeout/Wait Mismatch
Masalah timeout/wait mismatch dapat terjadi jika nilai timeout pada sbd device tidak sesuai dengan nilai stonith-timeout pada cluster. Kita harus memastikan bahwa nilai stonith-timeout selalu lebih besar atau setara dengan nilai Timeout (msgwait)
di sbd device, yaitu (Timeout (msgwait)) / 100 * 120
.
Contoh Kasus
Berikut adalah contoh kasus yang terjadi pada suatu node klaster:
Sep 29 13:16:24 whiskey stonith-ng: [19622]: ERROR: remote_op_timeout: Action reboot (27837044-1b8c-409a-8e93-64450e03affe) for vodka timed out
Pada kasus ini, nilai stonith-timeout
tidak sesuai dengan nilai Timeout (msgwait)
sehingga node tersebut gagal di-reboot setelah timeout watchdog tercapai. Untuk mengatasi masalah ini, kita dapat menyetelkan nilai stonith-timeout
menjadi 216s.
Kesimpulan
Penggunaan Corosync Cluster Engine dan SBD Stonith adalah salah satu cara untuk menjamin keterandalan data pada klaster. Dalam artikel ini, kita telah membahas cara menguji kinerja SBD Stonith serta mengatasi masalah timeout/wait mismatch yang dapat terjadi. Dengan menggunakan Corosync dan SBD Stonith, kita dapat memastikan bahwa data pada klaster tetap aman dan stabil.
Lisensi
Materi ini diperlukan untuk tujuan informasi, pribadi atau non-komersial dalam organisasi Anda dan disajikan "AS IS" TANPA JAMINAN APA PUN.