RedHat Virtualization (RHV) 中的集群防护策略

这篇文章将说明集群的防护策略。

https://onitroad.com 更多教程

如果主机在存储上有实时租用,则跳过fencing

如果选中此复选框,则群集中没有响应但仍连接到存储的任何主机都不会受到防护。
当主机连接到存储时,它必须至少每 60 秒更新一次存储租约,因此如果启用该选项并且引擎尝试使用隔离代理(集群/DC 中具有良好连接的另一台主机)隔离主机),fence 代理检查无响应主机是否在最后一个 HostStorageLeaseAliveCheckingInterval 90 秒内更新了它的存储租约,这确保在主机长时间无响应之前不执行 fencing。
如果租约被续签,围列将被中止。
HostStorageLeaseAliveCheckingInterval 是当主机停止响应监控时检查主机存储租用状态的安全间隔(以秒为单位)。
我们可以使用以下命令检查 HostStorageLeaseAliveCheckingInterval 设置:

$ /usr/share/ovirt-engine/dbscripts/engine-psql.sh -c "select option_name,default_value,option_value,version from vdc_options where option_name='HostStorageLeaseAliveCheckingInterval';"
                      option_name           | default_value | option_value  | version
--------------------------------------------+---------------+---------------+--------
    HostStorageLeaseAliveCheckingInterval   |      90       |       90      | general
(1 row)

启用fencing

默认情况下,集群上启用了fencing。
但是,如果需要,可以禁用它。
如果禁用此选项,则意味着它将完成禁用群集中主机的防护。
这在引擎和主机之间存在临时网络问题的情况下(例如在更换交换机期间)非常有用,因此我们可以禁用防护,更换交换机,并在连接恢复时再次启用防护。
请注意,如果禁用防护,在无响应主机上运行的高可用虚拟机将不会在其他地方重新启动。

跳过集群连接问题的fencing

如果选中此复选框,如果集群中遇到连接问题的主机百分比大于或者等于定义的阈值,则将暂时禁用防护。
阈值可用值为 25. 50、75 和 100。
此选项在主机数少于 3 的集群中无用。

日期:2020-09-17 00:12:52 来源:oir作者:oir