Postingan ini akan mengilustrasikan bagaimana RHEVM memantau kondisi penyimpanan secara mendetail.
Pantau Kesehatan Pengelola Kumpulan Penyimpanan
Storage Pool Manager (SPM) adalah peran manajemen yang ditetapkan ke salah satu host di pusat data yang memungkinkannya mengelola domain penyimpanan pusat data. RHEVM memeriksa ketersediaan SPM dan integritas metadata pada setiap tingkat polling SPM 10 detik.
Anda dapat memeriksa konfigurasi mesin tersebut sebagai berikut. Tidak disarankan untuk mengubah parameter di bawah ini kecuali jika direkomendasikan oleh teknisi Dukungan untuk kasus penggunaan tertentu:
$ engine-config -g StoragePoolRefreshTimeInSeconds StoragePoolRefreshTimeInSeconds: 10 version: general $ engine-config -g SpmCommandFailOverRetries SpmCommandFailOverRetries: 3 version: general $ engine-config -g SPMFailOverAttempts SPMFailOverAttempts: 3 version: general $ engine-config -g DelayResetForSpmInSeconds DelayResetForSpmInSeconds: 20 version: general
Pantau Kesehatan Domain Penyimpanan
Kesehatan domain penyimpanan dipantau oleh mesin RHEVM dan KVM Vdsm.
1. RHEVM memantau domain penyimpanan
Interval waktu dalam detik untuk polling status Host oleh RHEVM adalah 3 detik secara default. Selama proses, itu akan memeriksa status penyimpanan. Jika kode laporan getRepoStats bukan nol atau lastcheck(statsGenTime – domStatus.checkTime) lebih tinggi dari MaxStorageVdsTimeoutCheckSec (30 detik secara default), maka domain penyimpanan menjadi bermasalah dan timer dimulai untuk domain. Batas waktu kegagalan domain penyimpanan adalah StorageDomainFailureTimeoutInMinutes (5 menit default). Jika status domain penyimpanan yang bermasalah tidak dipulihkan selama waktu ini, maka host akan ditetapkan sebagai non-operasi. Jika domain yang bermasalah dipulihkan selama waktu tersebut, maka RHEVM akan mengaktifkan kembali host KVM secara otomatis.
Berikut adalah konfigurasi mesin terkait:
$ engine-config -g VdsRefreshRate VdsRefreshRate: 3 version: general $ engine-config -g StorageDomainFailureTimeoutInMinutes StorageDomainFailureTimeoutInMinutes: 5 version: general $ engine-config -g MaxStorageVdsTimeoutCheckSec MaxStorageVdsTimeoutCheckSec: 30 version: general $ engine-config -g MaxStorageVdsDelayCheckSec MaxStorageVdsDelayCheckSec: 5 version: general
2. Kesehatan penyimpanan monitor host KVM:
Jika host KVM tidak dapat mengakses domain penyimpanan, itu akan menjadi Non-Operasional. Vdsm akan menyegarkan penyimpanan dengan interval monitor sd_health_check_delay. Itu memanggil getStorageDomainStats untuk mendapatkan dom.getStats status domain dan mengembalikan statusnya kembali ke RHEVM melalui repoStats di _getDomsStats. Baik repo_stats_cache_refresh_timeout dan sd_health_check_delay dapat dikonfigurasi di /etc/vdsm/vdsm.conf .