Penggunaan Corosync Cluster Engine dan SBD Stonith untuk Menjamin Keterandalan Data

Penggunaan Corosync Cluster Engine dan SBD Stonith untuk Menjamin Keterandalan Data

====================================================

Corosync Cluster Engine ('UNKNOWN'): started and ready to provide service

Corosync adalah sebuah engine cluster yang digunakan untuk mengelola klaster jaringan. Pada artikel ini, kita akan membahas penggunaan Corosync dengan SBD Stonith (Stoneage Block Device) untuk menjamin keterandalan data pada klaster.

Penggunaan SBD Stonith

SBD Stonith adalah sebuah modul yang digunakan untuk mengelola proses fensing pada klaster. Proses fensing ini bertujuan untuk memastikan bahwa semua node dalam klaster tetap dalam kondisi normal dan tidak gagal. Jika suatu node gagal, maka SBD Stonith akan langsung mengfencing-kan node tersebut sehingga data pada klaster dapat dijamin keamanannya.

Menguji Kinerja SBD Stonith

Untuk menguji kinerja SBD Stonith, kita dapat menggunakan perintah ps aux | grep sbd untuk melihat proses-proses yang berjalan pada node tersebut. Jika SBD Stonith tidak bekerja dengan baik, maka akan terlihat bahwa node tersebut tidak akan segera di-reboot setelah timeout watchdog tercapai.

Penggunaan Softdog sebagai Solusi

Jika watchdog module yang digunakan tidak berfungsi, maka kita dapat menggunakan softdog sebagai solusi. Caranya adalah dengan menambahkan softdog ke dalam file /etc/sysconfig/kernel/ untuk memastikan bahwa softdog module tersebut di-load pada saat boot.

Mengatasi Masalah Timeout/Wait Mismatch

Masalah timeout/wait mismatch dapat terjadi jika nilai timeout pada sbd device tidak sesuai dengan nilai stonith-timeout pada cluster. Kita harus memastikan bahwa nilai stonith-timeout selalu lebih besar atau setara dengan nilai Timeout (msgwait) di sbd device, yaitu (Timeout (msgwait)) / 100 * 120.

Contoh Kasus

Berikut adalah contoh kasus yang terjadi pada suatu node klaster:

Sep 29 13:16:24 whiskey stonith-ng: [19622]: ERROR: remote_op_timeout: Action reboot (27837044-1b8c-409a-8e93-64450e03affe) for vodka timed out

Pada kasus ini, nilai stonith-timeout tidak sesuai dengan nilai Timeout (msgwait) sehingga node tersebut gagal di-reboot setelah timeout watchdog tercapai. Untuk mengatasi masalah ini, kita dapat menyetelkan nilai stonith-timeout menjadi 216s.

Kesimpulan

Penggunaan Corosync Cluster Engine dan SBD Stonith adalah salah satu cara untuk menjamin keterandalan data pada klaster. Dalam artikel ini, kita telah membahas cara menguji kinerja SBD Stonith serta mengatasi masalah timeout/wait mismatch yang dapat terjadi. Dengan menggunakan Corosync dan SBD Stonith, kita dapat memastikan bahwa data pada klaster tetap aman dan stabil.

Lisensi

Materi ini diperlukan untuk tujuan informasi, pribadi atau non-komersial dalam organisasi Anda dan disajikan "AS IS" TANPA JAMINAN APA PUN.