Postingan ini akan membahas lebih dalam tentang RHV Power Management.
Apa itu Manajemen Daya Host (Pagar)?
Saat Manajemen Daya dikonfigurasi, RHV dapat mem-boot ulang host yang berada dalam status NonOperasional atau NonResponsif. RHV mendukung perangkat manajemen daya berikut:
- Konversi Daya Amerika (apc)
- IBM Bladecenter (Bladecenter)
- Sistem Komputasi Terpadu Cisco (cisco_ucs)
- Kartu Akses Jarak Jauh Dell 5 (drac5)
- Kartu Akses Jarak Jauh Dell 7 (drac7)
- Sakelar Daya Elektronik (eps)
- HP BladeSystem (hpblade)
- Lampu Mati Terintegrasi (ilo, ilo2, ilo3, ilo4,ilo_ssh)
- Antarmuka Manajemen Platform Cerdas (ipmilan)
- Adaptor Pengawas Jarak Jauh (rsa)
- Fujitsu-Siemens RSB (rsb)
- Western Telematic, Inc (wti)
RHV menggunakan agen pagar untuk berkomunikasi dengan perangkat manajemen daya.
Apa itu Pagar Otomatis?
Ketika Host mengalami kegagalan yang tidak terduga, status Host akan berubah menjadi terhubung dan Host akan berada dalam status ini untuk masa tenggang. Jika batas waktu ini berlalu, Host akan berubah menjadi status 'NonResponsive' atau "NonOperational". Untuk bereaksi terhadap keadaan itu, Engine memagari host yang bermasalah dengan melakukan reboot. Engine menggunakan agen pagar untuk kartu manajemen daya pada host untuk menghentikan host, mengonfirmasi telah berhenti, memulai host, dan mengonfirmasi bahwa host telah dimulai.
Masa Tenggang Pagar Otomatis:
Secara default, Engine akan mencoba dua kali untuk menanyakan status vdsm:
option_name | option_value | default_value -------------------------+--------------+--------------- VDSAttemptsToResetCount | 2 | 2 (1 row)
Grace Period = TimeoutToResetVdsInSeconds + DelayResetPerVmInSeconds*(Number of VMs on host) + DelayResetForSpmInSeconds(isSPM)
Misalnya, jika Host adalah SPM dengan dua VM dan default_value, maka masa tenggang=60+ 0.5*2+20=81s
option_name | option_value | default_value ----------------------------+--------------+--------------- TimeoutToResetVdsInSeconds | 60 | 60 DelayResetForSpmInSeconds | 20 | 20 DelayResetPerVmInSeconds | 0.5 | 0.5 VDSAttemptsToResetCount | 2 | 2 (4 rows)
Pagar Kdump:
Saat mengaktifkan “integrasi Kdump”, itu hanya menunda hard-fence sampai host selesai menulis dump memorinya jika terjadi crash.
Pagar Lembut:
Ini dapat dikonfigurasi dari Level Cluster:
AdminPortal-->Compute-->Cluster-->Edit Cluster-->Fencing Polciy-->Enable Fencing
Sebelum 'me-reboot' host, Engine mencoba memulai ulang VDSM melalui SSH pada host 'non-responsif' dengan "SSH Soft Fencing".
option_name | option_value | default_value | version -----------------------+-------------------------------------------------+------------------------------------------------+--------- SshSoftFencingCommand | /usr/bin/vdsm-tool service-restart vdsmd | /usr/bin/vdsm-tool service-restart vdsmd | 4.3 (1 row)
Soft-fencing melalui SSH dapat dijalankan pada host yang tidak memiliki manajemen daya yang dikonfigurasi. Ini berbeda dari "anggar". Fencing hanya dapat dijalankan pada host yang memiliki konfigurasi manajemen daya.
Memilih Proxy
Preferensi Proxy Manajemen Daya default adalah cluster, dc. Ada opsi untuk menambahkan "other_dc". Ini akan menemukan host proxy dalam status “UP”.
# engine-config -g FenceProxyDefaultPreferences FenceProxyDefaultPreferences: cluster,dc version: general
Aliran:
Aliran Mesin:
Meta-data Konfigurasi
Berikut adalah Meta-data dari VdsFenceType,VdsFenceOptionTypes,VdsFenceOptionMapping,FenceAgentMapping dan FenceAgentDefaultParams:
-[ RECORD 1 ]+---------------------------------------------------------------------------------------------------------- option_name | VdsFenceType option_value | apc,apc_snmp,bladecenter,cisco_ucs,drac5,drac7,eps,hpblade,ilo,ilo2,ilo3,ilo4,ilo_ssh,ipmilan,rsa,rsb,wti version | 4.3 -[ RECORD 2 ]-+--------------------------------------------------------------------------------------------------------- option_name | VdsFenceOptionTypes option_value | encrypt_options=bool,secure=bool,port=int,slot=int default_value | encrypt_options=bool,secure=bool,port=int,slot=int -[ RECORD 3 ]-+---------------------------------------------------------------------------------------------------------- option_name | VdsFenceOptionMapping option_value | apc:secure=secure,port=ipport,slot=port; apc_snmp:port=port,encrypt_options=encrypt_options; bladecenter:secure=secure,port=ipport,slot=port; cisco_ucs:secure=ssl,slot=port; drac5:secure=secure,slot=port; drac7:;eps:slot=port; hpblade:port=port; ilo:secure=ssl,port=ipport; ipmilan:; ilo2:secure=ssl,port=ipport; ilo3:; ilo4:; ilo_ssh:port=port; rsa:secure=secure,port=ipport; rsb:;wti:secure=secure,port=ipport,slot=port default_value | apc:secure=secure,port=ipport,slot=port; apc_snmp:port=port,encrypt_options=encrypt_options; bladecenter:secure=secure,port=ipport,slot=port; cisco_ucs:secure=ssl,slot=port; drac5:secure=secure,slot=port; drac7:; eps:slot=port; hpblade:port=port; ilo:secure=ssl,port=ipport; ipmilan:; ilo2:secure=ssl,port=ipport; ilo3:; ilo4:; ilo_ssh:port=port; rsa:secure=secure,port=ipport; rsb:; wti:secure=secure,port=ipport,slot=port -[ RECORD 4 ]-+---------------------------------------------------------------------------------------------- option_name | FenceAgentMapping option_value | drac7=ipmilan,ilo2=ilo default_value | drac7=ipmilan,ilo2=ilo -[ RECORD 5 ]-+----------------------------------------------------------------------------------------------- option_name | FenceAgentDefaultParams option_value | drac7:privlvl=OPERATOR,lanplus=1,delay=10;ilo3:power_wait=4;ilo4:power_wait=4;ilo_ssh:secure=1 default_value | drac7:privlvl=OPERATOR,lanplus=1,delay=10;ilo3:power_wait=4;ilo4:power_wait=4;ilo_ssh:secure=1
Meta-data di atas dapat dikonfigurasi di engine-config:
# engine-config -a |grep 'CustomFence\|CustomVdsFence' CustomFenceAgentMapping: version: general CustomFenceAgentDefaultParams: version: general CustomFenceAgentDefaultParamsForPPC: version: general CustomVdsFenceOptionMapping: version: general CustomVdsFenceType: version: general CustomFencePowerWaitParam: version: general
Konfigurasi Lainnya(Waktu habis dan coba lagi):
# engine-config -a |grep 'FenceStart\|FenceStop' FenceStartStatusRetries: 18 version: general FenceStartStatusDelayBetweenRetriesInSec: 10 version: general FenceStopStatusRetries: 18 version: general FenceStopStatusDelayBetweenRetriesInSec: 10 version: general