=====================================================
Pengguna Domino memperoleh kemampuan untuk mengatur dan mengawasi executor melalui Dispatcher interface. Berikut adalah beberapa tindakan yang dapat dilakukan melalui interface ini:
- Mengaktifkan mode perawatan (Maintenance Mode) pada executor
- Menjalankan atau menghentikan executor
- Mengakhiri executor
- Merestart executor
Pengawasan Kesehatan
Executor Domino dilakukan pengawasan kesehatan berulang. Ada dua jenis pengecekan kesehatan yang memeriksa apakah Dispatcher dapat terhubung ke layanan vital yang berjalan di executor. Selain itu, ada juga pengecekan kesehatan disk space yang dapat dikonfigurasikan. Jika opsi com.cerebro.domino.executor.minUsableSpaceInGB
dipasang menjadi nilai tidak nol, maka pengecekan kesehatan disk space akan berjalan dan executor akan gagal jika ruang disk tersedia kurang dari minimal dua opsi konfigurasi.
- Namespace: common
- Key: com.cerebro.domino.executor.diskSpaceRunsGarbageCollectorFreeSpaceLimit
- Value: bilangan bytes (default: 50 GB)
- Namespace: common
- Key: com.cerebro.domino.executor.minUsableSpaceInGB
- Value: bilangan gigabyte (default: 0)
Jika opsi ini dipasang menjadi nilai default 0, maka pengecekan kesehatan disk space akan dihentikan dan tidak akan berjalan atau mempengaruhi executor.
Gagal Pengecekan Kesehatan
Jika executor gagal dalam pengecekan kesehatan, maka proses sebagai berikut akan terjadi:
- Pada tick Dispatcher berikutnya, Dispatcher tidak akan menjadwalkan Runs pada executor
- Executor menjadi idle setelah Runs yang ada selesai
- Setelah 5 menit (konfigurasi) menjadi idle, executor masuk ke dalam state Unusable
- Setelah 15 menit (konfigurasi) dalam state Unusable, executor dihentikan
- Setelah 48 jam (konfigurasi) setelah dihentikan, executor yang dalam state Unusable diakhiri
Executor Tidak Responsif
Jika executors sebelumnya menjadi tidak responsif, Domino akan mengikuti proses sebagai berikut:
- Setelah 15 menit (konfigurasi) menjadi tidak responsif, executor masuk ke dalam state Unusable dan dihentikan
- Setelah 48 jam (konfigurasi) setelah dihentikan, instance yang tidak responsif diakhiri
Executor Mati Saat Kelahiran
Jika Domino mencoba menjalankan executor baru yang tidak pernah menjadi responsif, maka proses sebagai berikut akan terjadi:
- Setelah 15 menit (konfigurasi) menjadi tidak responsif, executor masuk ke dalam state Unusable dan dihentikan
- Setelah 48 jam (konfigurasi) setelah dihentikan, instance yang tidak responsif diakhiri
Mode Perawatan
Dari interface Actions untuk individu executor, administrator Domino dapat mengaktifkan mode perawatan pada executor. Mode ini melakukan beberapa hal sebagai berikut:
- Executor dalam mode perawatan tidak akan diberi Runs baru oleh Dispatcher
- Executor dalam mode perawatan tidak akan diakhiri secara otomatis karena state Unusable
- Executor dalam mode perawatan tidak menghitung terhadap batas executor untuk tingkat hardware
- Executor yang responsif dan telah berada dalam mode perawatan selama 120 menit (konfigurasi) akan dihentikan
- Executor yang tidak responsif dan telah berada dalam mode perawatan selama 15 menit (konfigurasi) akan dihentikan
- Executor yang melewati pengecekan kesehatan sementara dalam mode perawatan akan mencoba untuk bergabung kembali dengan pool executor yang tersedia di tingkat hardwarenya ketika mode perawatan diaktifkan kembali
Pengaturan Waktu
Ada beberapa pengaturan waktu yang dapat dikonfigurasikan sebagai berikut:
- Namespace: common
- Key: com.cerebro.domino.executor.maxIdleMaintenanceModeTimeInMinutes
- Value: bilangan menit (default: 120)
- Namespace: common
- Key: com.cerebro.domino.dispatcher.clusterHealthMonitoring.unhealthyExecutorMMTimeout
- Value: JODA duration (default: 15 menit)
- Namespace: common
- Key: com.cerebro.domino.executor.minUsableSpaceInGB
- Value: bilangan gigabyte (default: 0)
Kesimpulan
Pengguna Domino dapat mengatur dan mengawasi executor melalui Dispatcher interface. Berbagai tindakan dan pengaturan waktu yang dapat dilakukan untuk memantau kinerja executor dan mencegah masalah yang terkait dengan keterlambatan atau kehilangan data.