精华内容
下载资源
问答
  • vSphere HA 原理与配置

    2019-11-15 21:23:30
    内容预览:  1. vSphere HA 概述  2. vSphere HA 提供的保护级别  3. vSphere HA运行原理 ... 4. vSphere HA 故障支持场景 ... 配置vSphere HA的基础条件  8. 虚拟机组件保护  9. 开启vSp...

    内容预览:

      1. vSphere HA 概述

      2. vSphere HA 提供的保护级别

      3. vSphere HA运行原理

      4. vSphere HA 故障支持场景

      5. vSphere HA接入控制策略

      6. 如何选择vSphere HA 的接入控制策略 

      7.  配置vSphere HA的基础条件

      8.  虚拟机组件保护

      9. 开启vSphere HA功能

     

     

     1. vSphere HA 概述

        HA,High Availability,中文翻译为高可用。
        其运行机制是监控群集中的ESXi主机及虚拟机,通过配置合适的策略,当群集中的ESXi主机或虚拟机发生故障,可以自动到其他的ESXi主机上进行重新启动,最大限度保证重要服务不中断。

                                                      

     

     

    2. vSphere HA 提供的保护级别

        2.1 针对ESXi主机硬件故障的保护(HA和FT技术)
        2.2 针对零停机计划内的维护(vMotion)
        2.3 针对ESXi主机计划外停机和灾难的保护(HA和FT技术)

                                                         

     

    3. vSphere HA运行原理

      3.1. HA运行的基本原理

      当在群集启用HA时,系统会自动选举一台ESXi主机作为首选主机(也称为Master主机),其余的ESXi主机作为从属主机(也称为Slave主机)。Master主机与vCenter Server进行通信,并监控所有受保护的从属主机(也称为Slave主机)的状态。Master主机使用管理网络和数据存储检测信号来确定故障的类型。当不同类型的ESXi主机故障时,Master主机检测并相应地处理故障,让虚拟机重新启动。当Master主机本身出现故障时,Slave主机会重新选举产生Master主机。

      3.2. Master/Slave选举机制
      3.2.1). Master/Slave主机的选举是存储最多的ESXi主机,如果ESXi主机的存储相同时,会使用MOID(Managed Objective ID,数值大的为Master,)来进行选举。当Master主机产生后,会通告给其他Slave主机。当选举产生的Master主机故障时,会重新选举产生新的Master主机

      3.2.2). Master主机监控所有Slave主机,当Slave主机出现故障时重启启动虚拟机

      3.2.3). Master主机监控所有被保护虚拟机的电源状态,如果被保护的虚拟机出现故障,将重启虚拟机

      3.2.4). Master主机发送心跳信息给Slave主机,让Slave主机知道Master的存在

      3.2.5). Master主机执行状态信息给vCenter Server,vCenter Server正常情况下只和Master主机通信

      3.2.6). Slave主机监视本地运行的虚拟机状态,把这些虚拟机运行状态的显著变化发送给Master主机

      3.2.7). Slave主机监控Master主机的健康状态,如果Master主机出现故障,Slave主机将参与与Master主机的选举  

      3.3. Esxi主机的故障类型
      3.3.1)  主机停止运行

      主机由于物理硬件故障或电源等原因引起故障

      3.3.2)  主机与网络隔离

      一个或多个slave丢失了所有的管理网络连接,这样的slave既不能联系到master也不能联系到其他ESXi hosts。这种情况下,slave主机通过存储网络来通知master,它已经是隔离状态。

      我们知道HA使用管理网络及存储设备进行通信监测状态,如果Master主机不能通过管理网络与Slave主机通信,那么会通过存储来确认ESXi主机是否存活,这样的机制可以让HA判断主机是否处于网络隔离状态。在这种情况下,Slave主机通过heartbeat datastores来通知Master主机它已经是隔离状态,具体上这个Slave是通过一个特殊的二进制文件--host-Xpoweron,来通知Master主机能够采取适当的措施来确保保护虚拟机。Master主机看到这个标志后,就知道Slave主机已经是隔离状态,然后Master主机通过HA锁定其他文件(datastores上的其他文件),当Slave主机看到这些文件已经被锁定,就知道Master主机正在重新启动虚拟机,然后Slave主机可以执行配置过的隔离响应动作(如关机或者关闭电源)

      3.3.3)  主机与网络分区

      一个或多个slave通过管理网络联系不到master,这样的slave虽不能联系到master但能联系到其他ESXi hosts,这种情况下,vSphere HA能够了使用存储网络来检测分离的主机是否存活以及否要保护它们里面的虚拟机。

      3.4. ESXi主机故障的响应方式

      3.4.1) 虚拟机重新启动优先级

      3.4.2) 主机隔离响应

     

    4. vSphere HA 故障支持场景

      4.1.  esxi host 物理服务器故障

      4.2.  虚拟机故障

      4.3.  虚拟机操作系统故障

      4.4.  Application 故障

     

    5. vSphere HA接入控制策略

      5.1.  按插槽及插槽大小

                                                                

      5.1.1). 插槽大小由每个虚拟机的CPU和内存决定,取CPU和内存的需求最大值,通过上图虚拟机可以得知插槽大小为2GHz CPU和2GB内存。

      5.1.2). HA计算CPU组件的方法是先获取每台已打开电源虚拟机的CPU预留,如果没有为虚拟机指定CPU预留,则系统会为其分配一个默认值32MHz。

      5.1.3). HA计算内存组件的方法是先获取每台已打开电源虚拟机的内存预留,如果没有为虚拟机指定内存预留,则系统会为其分配一个默认值。

      5.1.4). 插槽计算:用主机的CPU资源数除以插槽大小的CPU组件,然后将结果化整。对主机内存资源数进行同样的计算。然后,比较这两个数字,较小的那个数字即为主机可以支持的插槽数。

     

      5.2  接入控制策略--按静态主机数量定义故障切换容量

      所谓按静态主机数量定义故障切换容量策略,就是允许HA群集中几台ESXi主机可以发生故障,如果设置为1,当群集中有1台ESXi主机发生故障时,故障ESXi主机上的虚拟机会重新启动。同时这个策略需要使用插槽及插槽大小的概念。

     

      5.3  接入控制策略--通过预留一定百分比的群集资源来定义故障切换容量

                                                  

      5.3.1). 计算出主机的CPU和内存资源总和,从而得出虚拟机可使用的主机资源总数。

      5.3.2). 生产环境需要注意的是,预留资源越多,ESXi主机在非故障切换时能够运行的虚拟机就会减少。

     

      5.4  接入控制策略--使用指定故障切换主机

      4.4.1). 在主机发生故障时,vSphere HA 将尝试在任一指定的故障切换主机上重新启动其虚拟机。如果不能使用此方法(例如,故障切换主机发生故障或者资源不足时),则 vSphere HA 会尝试在群集内的其他主机上重新启动这些虚拟机。

      4.4.2). 为了确保故障切换主机上拥有可用的空闲容量,将阻止您打开虚拟机电源或使用 vMotion 将虚拟机迁移到故障切换主机。而且,为了保持负载平衡,DRS 也不会使用故障切换主机。

     

     6. 如何选择vSphere HA 的接入控制策略 

     

      选择接入控制策略时,应当考虑的因素很多。应当基于可用性需求和群集的特性选择 vSphere HA 接入控制策略。

      6.1) 选择什么样的接入控制策略?

      生产环境比较常见的是选择按静态主机数量定义故障切换容量、预留一定百分比的群集资源来定义故障切换容量这两种策略。

      选择前者的话,如果群集中某一台虚拟机所需的CPU或内存资源较大(3,3),而其他虚拟机所需的CPU或内存资源比较平均,会影响到ESXi主机支持的插槽数量计算。

      因此,如果群集中虚拟机所需的CPU和内存资源差距较大,推荐使用使用预留一定百分比的群集资源来定义故障切换容量策略。

      6.2) 避免资源碎片

       “群集资源的百分比”策略不解决资源碎片问题。

      通过将插槽定义为虚拟机最大预留值,“群集允许的主机故障数目”策略的默认配置可避免资源碎片。

      使用“指定故障切换主机”策略不会出现资源碎片,因为该策略会为故障切换预留主机。

      6.3) 故障切换资源预留的灵活性

      为故障切换保护预留群集资源时,接入控制策略所提供的控制粒度会有所不同。“群集允许的主机故障数目”策略允许设置多个主机作为故障切换级别。“群集资源的百分比”策略最多允许指定 100% 的群集 CPU 或内存资源用于故障切换。通过“指定故障切换主机”策略可以指定一组故障切换主机。

      6.4) 群集的异构性

      从虚拟机资源预留和主机总资源容量方面而言,群集可以异构。在异构群集内,“群集允许的主机故障数目”策略可能过于保守,因为在定义插槽大小时它仅考虑最大虚拟机预留,而在计算当前故障切换容量时也假设最大主机发生故障。其他两个接入控制策略不受群集异构性影响。

     

    7.  配置vSphere HA的基础条件

      7.1)  vCenter Server

      HA这个高级特性必须依赖于vCenter Server才能实现,没有vCenter Server将无法启用HA

      7.2)  启用vMotion

      当ESXi主机发生故障时,HA会选择新的ESXi主机对虚拟机进行重新启动, 这个过程实质是迁移主机,而迁移主机使用的技术是vMotion,也就是说启用vMotion是前提。

      7.3)  网络冗余

      HA本身要求网络具有冗余功能,特别是管理网络,如果管理网络没有冗余,HA会给出对应的配置错误提示。

      7.4)  安装VMware Tools

      它不仅是添加了虚拟机的驱动程序,一些HA的检测机制也是通过VMware Tools完成的。

      7.5) 群集ESXi主机数量

      将多台ESXi主机添加到一个群集的目的,是可以统一管理及使用高级特性。但是每台ESXi主机的资源是有限的,必须合适考虑群集中ESXi主机的数量,特别是这个群集中ESXi主机数量少于5台,而运行的虚拟机数量超过50台的情况需要特别注意。

      当某台ESXi主机发生物理故障,上面的虚拟机需要在其他ESXi主机上重新启动时,要考虑其他ESXi主机资源使用情况。如果资源不够,可能会导致虚拟机无法重新启动,或启动后性能较低。

     

    8.  虚拟机组件保护

      8.1)  如果启用虚拟机组件保护(VMCP),vSphere HA可以检测到数据存储可访问性故障,并为受影响的虚拟机提供自动恢复。

      当发生数据存储可访问性故障时,受影响的主机无法再访问特定数据存储的存储路径,可确定vSphere HA将对此类故障作出的响应,从创建事件警报到虚拟机在其他主机上重新启动。

     

      8.2)  错误状况和虚拟机响应选项

      8.2.1)  虚拟机重新启动优先级

      重新启动优先级用于确定主机发生故障或主机隔离时虚拟机的重新启动顺序。优先级较高的虚拟机将首先启动。

      8.2.2)  针对主机隔离的响应

      主机内的虚拟机将在正常运行的其他主机上重新启动

     

      8.3)  存在两种类型的数据存储可访问性故障

      8.3.1)  PDL(permanent device loss 永久设备丢失):是在存储设备报告主机无法再访问数据存储时发生的不可恢复的可访问性丢失,如果不关闭虚拟机的电源,此状况将无法恢复。

      8.3.2)  APD(All-Paths-Down 全部路径异常):暂时性或未知的可访问性丢失,或I/O处理中的任何其他未识别的延迟,此类型的可访问性问题是可恢复的。

        a). 关闭虚拟机电源再重新启动虚拟机(保守):

        受影响的Vms会被关闭电源,然后在连接正常的ESXi主机上重启。如果故障主机无法与Master主机通讯则将无法激活

        b). 关闭虚拟机电源再重新启动虚拟机(积极):

        受影响的Vms会被关闭电源,无论是否有主机可以通过重启承载这些Vms。不论Master主机是否存在,是否能和其它主机通讯以及是否有足够的资源

      8.3.3)  APD 的虚拟机故障切换延迟:140S以后

     

      8.4)  VMCP恢复时间轴

      8.4.1)  以下时间轴以图形方式显示VMCP如何从存储故障进行恢复

                                                

        ► T=0;检测到存储故障,vSphere HA将启动恢复过程。对于PDL事件,将立即启动工作流并重新启动群集中正常主机上的虚拟机。如果是APD事件导致存储丢失。APD超时定时器将启动(默认为140秒)。

        ► T=140s:主机将声明APD超时,到无响应存储设备的非虚拟机I/O都将失败。

        ► 介于T=140s和320s之间:这是APD的虚拟机故障延迟定义的时间段,默认为3分钟,长时间无法访问存储可能导致客户机应用程序不稳定,如果此时间段的APD己清除,重置虚拟机的选项将可用。

        ► T=320s:经过APD的虚拟机故障切换延迟时间(APD超时后3分钟)后,vSphere HA将启动APD恢复响应。

      8.5)  虚拟机监控敏感度:
        8.5.1)  故障时间间隔(30S):如果在30S的时间间隔内未收到主机与虚拟机间的检测信号,vSphere HA会重新启动虚拟机。

        8.5.2)  最短正常运行时间(120S):发现故障后,不会立即重启虚拟机,先进行120S的和存储I/O的信息监测,以免故障误判。das.iostatsinterval

        8.5.3)  每个虚拟机的最大重置次数(3次)

        为了避免因非瞬态错误而反复重置虚拟机,默认情况下,在某个可配置的时间间隔内将对虚拟机仅重置三次,在对虚拟机执行过三次重置后,指定的时间结束之前,vSphere HA 不会在后续故障出现后进一步尝试重置虚拟机,可以使用每个虚拟机的最大重置次数自定义设置来配置重置次数。

        8.5.4)  最大重置时间段(1小时)

     

     9. 开启vSphere HA功能

     

    展开全文
  • 部署VMware vSphere的一个原因在于利用高可用性HA功能。 使用vSphere HA,可让虚拟服务器停止,系统自动将其切换到新服务器上的第二个相同的虚拟机上,并且不会丢失心跳。 首先,配置VMware集群节点,并在通用标准...

    部署VMware vSphere的一个原因在于利用高可用性HA功能。

     如何配置vSphere HA实现自动故障转移?

    使用vSphere HA,可让虚拟服务器停止,系统自动将其切换到新服务器上的第二个相同的虚拟机上,并且不会丢失心跳。

    首先,配置VMware集群节点,并在通用标准下运行起来。你需要对所有节点后执行相同的更新,该案例中是两台服务器,并拥有一个共享的存储空间,你的第三台存储服务器提供给节点使用。所有虚拟机及其配置文件必须驻留并能访问共享存储。如果不能,当一个节点坏掉,另一个新节点起来,新节点上的数据将不会更新。

    创建集群后,使用主机填充并配置vSphere HA设置。

    要创建vSphere High Availability集群,先在vSphere里选择Hosts & Clusters。然后右击正确的数据中心。点击New Cluster并按照向导进行。暂时别启用vSphere HA或支持功能Distributed Resource Scheduler。集群创建好后点击完成。

    右击新创建的集群,选择Edit Settings。在Cluster Features页面点击Turn On vSphere HA。按照你的需求配置vSphere HA。最后,点击OK退出集群设置窗口。

    在vSphere创建HA集群时,一台主机自动被选作为控制主机,它可以监控虚拟化的状态,驾驭其他主机并与vSphere服务器通信。

    要指定行为,如定位从网络隔离的某主机的位置,通过设置对话框进入vSphere HA高级选项设置。

    如果你想要的是结实的虚拟故障恢复,无论小型或大型扩展,没有好的路径可循。VMware vSphere High Availability对于一个拥有两台服务器的集群,以及部署上百台服务器的共享存储来说,其部署都相同。



    作者:何妍 

    来源:51CTO

    展开全文
  • vSphere 6.5 High Availability New Features – Proactive HA vSphere 6.5高可用性新功能–主动HA http://www.vmwarearena.com/vsphere-6-5-high-availability-new-features-proactive-ha/ 由MOHAMMED RAFFIC...

    vSphere 6.5 High Availability New Features – Proactive HA

    vSphere 6.5高可用性新功能–主动HA

    http://www.vmwarearena.com/vsphere-6-5-high-availability-new-features-proactive-ha/ 

    MOHAMMED RAFFIC发表于最后更新时间:2017年2月23日,上午6:18 | 公布于2017年2月23日在高可用性中VSPHERE 6.5 | 26139浏览
     

    vSphere 6.5已发布,其中包含许多新功能,其中大多数正在等待。vSphere 6.5,其业界领先的虚拟化平台的最新版本。此新版本的vSphere具有大大简化的体验,全面的内置安全性以及可运行任何应用程序的通用应用程序平台。与每个vSphere版本一样,它继续为关键业务应用程序工作负载提供最佳可用性和资源管理功能。vSphere 6.5还添加了新功能和改进功能。我们将讨论vSphere 6.5 High Availability&DRS可用的新功能。

    • 主动医管局
    • vSphere HA Orchstrated重新启动
    • 简化的vSphere HA准入控制

     

    will talk about new features available with vSphere 6.5 High Availability & DRS.

    • Proactive HA
    • vSphere HA Orchestrated Restart
    • Simplified vSphere HA Admission Control

    通过vSphere 6.5 High Availability 提供的多项新功能,我们将在本文中详细讨论Proactive HA。

     vSphere 6.5高可用性–主动式高可用性

    现在,vSphere 6.5 High Availability(HA)还可以检测ESXi主机的硬件状况,并允许您在Proactive HA的帮助下在硬件问题导致虚拟机中断之前撤离虚拟机。主动式HA与监视解决方案的硬件供应商一起工作,以接收硬件组件(例如内存,风扇和电源)的运行状况。您可以将vSphere HA配置为根据硬件组件的故障进行响应。此功能通过检测硬件故障并根据配置选项将esxi主机置于隔离模式或维护模式,从而主动避免虚拟机停机。您需要在群集上启用DRS才能使用主动HA。

    如果任何硬件组件发生故障,并且通过硬件监视将其标记为不正常,vSphere将根据组件故障将受影响的ESXi主机分类为中度降级或严重降级。vSphere会将受影响的ESXi主机置于称为“隔离模式”的新状态。

     

    在隔离模式下,DRS不会将ESXi主机用于新的虚拟机放置,并且DRS将尝试撤离该主机,只要它不会引起性能问题。您还可以配置主动型HA,以将降级的ESXi主机置于维护模式,这将对群集中的其他正常ESXi主机执行虚拟机的vMotion。主动式HA可以响应不同类型的故障。当前,支持五种失败事件:

    • 电源
    • 记忆
    • 风扇
    • 存储
    • 网络

    如何配置vSphere 6.5 Proactive HA?

    从vSphere Web Client->群集属性->单击编辑,右键单击ESXi群集。您可能会注意到默认情况下禁用了vSphere Proactive HA。

    vSphere 6.5高可用性主动HA

    选中“打开主动HA”复选框。您可以在“主动式HA失败和响应”下配置配置选项

    vSphere 6.5高可用性_主动HA_2

     

    有两个vSphere Proactive HA自动化级别:

    手册:  vCenter Server将仅建议虚拟机的迁移建议。您需要从降级的主机中手动迁移虚拟机。

     

    自动化:虚拟机将迁移到运行状况良好的主机,降级的主机将进入隔离或维护模式的补救措施,具体取决于已配置的主动HA自动化级别

    vSphere 6.5高可用性_主动式HA_3

    对于部分故障主机,有三种补救措施:

    • 隔离模式:主机上没有新的VM添加
    • 混合模式:保持VM在主机上运行,​​以免出现中度故障。但是它将迁移虚拟机以防止严重故障
    • 维护模式:从主机迁移所有虚拟机,并将ESXi主机置于维护模式。

    vSphere 6.5高可用性_主动HA_4

    以下是三个修复操作的详细信息,这些操作确定了部分降级的主机会发生什么情况:

    • 所有故障的隔离模式: 此选项通过避免使用部分降级的主机(只要虚拟机性能不受影响)来平衡性能和可用性。简而言之,在部分降级的主机上没有添加新的VM
    • 混合模式(中等故障的隔离模式和严重故障的维护模式):使    VM在主机上运行时发生中等故障。但是它将迁移VM导致严重故障。 只要不影响虚拟机性能,此选项就可以避免使用性能下降的主机,从而平衡性能和可用性。这样可以确保虚拟机不会在严重故障的主机上运行。
    • 所有故障的维护模式: 从主机迁移所有虚拟机,并将ESXi主机置于维护模式。确保虚拟机不在部分故障的主机上运行

    vSphere 6.5高可用性_主动HA_5

    选中复选框以为此群集启用主动HA提供程序。当已安装相应的vSphere Web Client插件并且提供程序监视群集中的每个主机时,主动HA提供程序将显示在下方。单击编辑链接以查看/编辑提供者支持的故障条件。由于我尚未安装任何主动型HA提供程序vSphere Web客户端,因此在我的演示环境中未提供任何信息。而已。我们已经完成了配置vSphere 6.5 Proactive HA的工作。我希望这对您有帮助。谢谢阅读!!社交,并在社交媒体上分享,如果您觉得值得分享。

     

     

    vSphere 6.5 High Availability New Features – Proactive HA

    POSTED BY MOHAMMED RAFFIC ON LAST UPDATED FEB 23, 2017 AT 6:18AM | PUBLISHED ON FEB 23, 2017 IN HIGH AVAILABILITYVSPHERE 6.5 | 26139 VIEWS

    vSphere 6.5 released with lot of new features that most of them were waiting for. vSphere 6.5, the latest version of its industry-leading virtualization platform.  This new release of vSphere features a dramatically simplified experience, comprehensive built-in security, and a universal app platform for running any app. As usual with the release of each vSphere version,It continues to provide the best availability and resource management features for business critical application workloads. vSphere 6.5 also added new and improved features. We will talk about new features available with vSphere 6.5 High Availability & DRS.

    • Proactive HA
    • vSphere HA Orchestrated Restart
    • Simplified vSphere HA Admission Control

    From the multiple new features available from vSphere 6.5 High Availability, We will talk in detail about Proactive HA in this article.

     vSphere 6.5 High Availability – Proactive HA

    vSphere 6.5 High Availability (HA) now also detect the hardware conditions of the ESXi host and allow you to evacuate the Virtual machines before the hardware issues cause an outage to Virtual machines with the help of Proactive HA. Proactive HA works in conjunction with hardware vendors monitoring solutions to receive the health status of the hardware components such as memory, fans and power supplies. You can configure vSphere HA to respond according to the failure of hardware components. This feature proactively avoids the virtual machine downtime by detecting the hardware failures and place that esxi host in Quarantine Mode or Maintenance mode based on configuration option. You need to have DRS enabled on the cluster to make use of Proactive HA.

    If any hardware components is failed and it is marked as unhealthy by hardware monitoring, vSphere will classify the affected ESXi host as either moderately degraded or severely degraded based on the component failure. vSphere will place that affected ESXi host into new state called “Quarantine Mode”.

     

    In the Quarantine Mode, DRS will not use the ESXi host for new Virtual machine placements and also DRS will attempt to evacuate the host as long as it would not cause performance issue. You can also configure proactive HA to place the degraded ESXi hosts into Maintenance mode, which perform the vMotion of Virtual machine to other healthy ESXi hosts in the cluster. Proactive HA can respond to different types of failures. Currently, there are five failure events that are supported:

    • Power Supply
    • Memory
    • Fan
    • Storage
    • Network

    How to Configure vSphere 6.5 Proactive HA?

    Right-Click your ESXi cluster from vSphere Web Client -> Cluster Properties -> Click on Edit. You can notice vSphere Proactive HA is disabled by default.

    vSphere 6.5 High Availability Proactive HA

    Select the checkbox “Turn on Proactive HA”. You can configure configuration options under “Proactive HA Failures and Responses”

    vSphere 6.5 High Availability_Proactive HA_2

     

    There are two vSphere Proactive HA Automation Levels:

    Manual: vCenter Server will suggest only the migration recommendations for virtual machines. You need to manually migrate the virtual machines out from the degraded hosts.

     

    Automated: Virtual Machines will be migrated to healthy hosts and degraded hosts will be entered into remediation action either quarantine or maintenance mode depending on the configured Proactive HA automation level

    vSphere 6.5 High Availability_Proactive HA_3

    There are three remediation actions for partial failed hosts:

    • Quarantine Mode : No New VM additions on the host
    • Mixed Mode :  Keeps VMs running on the host  for moderate failure. But it will migrate VMs for severe failures
    • Maintenance Mode : Migrates all the Virtual Machines from the host and place ESXi host in maintenance mode.

    vSphere 6.5 High Availability_Proactive HA_4

    Here are the detailed information of three Remediation actions which determine what happens to partially degraded hosts:

    • Quarantine mode for all failures : This option balances performance and availability, by avoiding the usage of partially degraded hosts as long as virtual machine performance is unaffected. In Simple terms, No New VM additions on the partially degraded host
    • Mixed Mode (Quarantine mode for moderate and Maintenance Mode for Severe Failure)  :   Keeps VMs running on the host  for moderate failure. But it will migrate VMs for severe failures. This option balances performance and availability, by avoiding the usage of moderately degraded hosts as long as virtual machine performance is unaffected. This ensures virtual machines do not run on severely failed hosts.
    • Maintenance mode for all failures: Migrates all the Virtual Machines from the host and place ESXi host in maintenance mode.Ensures virtual machines do not run on partially failed hosts

    vSphere 6.5 High Availability_Proactive HA_5

    Select the check boxes to enable Proactive HA providers for this cluster.  Proactive HA Providers appear below when their corresponding vSphere Web Client plugin has been installed and the providers monitor every host in the cluster. Click on the edit link to view/edit the failure conditions supported by the provider. Since I don’t have installed any of the Proactive HA providers vSphere Web client, It is not providing any information in my demo environment. That’s it. We are done with configuring vSphere 6.5 Proactive HA. I hope this is informative for you. Thanks for Reading!! Be social and share it in social media, if you feel worth sharing it.

     

     

    展开全文
  • 虚拟化管理员应正确配置vSphere HA,保护虚拟化应用的性能,确保业务价值的实现。vSphere HA特性最早在ESX 3中引入,硬件出错或者管理员误操作后,能够恢复受影响的虚拟机。正是这些特性使vSphere成为了标准的企业...

    ESXi服务器发生故障后,VMware的vSphere HA将会快速重启受影响的虚拟机。但是启动虚拟机所需的资源足够用吗?如果不足,可能无法交付必需的虚拟机性能。虚拟化管理员应正确配置vSphere HA,保护虚拟化应用的性能,确保业务价值的实现。

    vSphere HA特性最早在ESX 3中引入,硬件出错或者管理员误操作后,能够恢复受影响的虚拟机。正是这些特性使vSphere成为了标准的企业虚拟化平台。

    vSphere HA解决了虚拟化的一个主要的关注点:当10个、20个或者100个虚拟机运行在单台ESXi服务器上时存在的脆弱性。在虚拟化之前,单台物理服务器故障只会影响一个应用。现在单台物理服务器可能会承载30个应用。如果ESXi服务器发生故障,HA将会快速重启虚拟机,将硬件故障带来的影响降至最低。

    但是vSphere HA只保护预留的资源,因此在配置vSphere高可用性环境时,设置合理的预留值是非常重要的一部分。既然vSphere HA保护为虚拟机预留的资源,那么设置预留值将非常重要;否则在硬件发生故障时虚拟机性能将受到影响。

    这是一个常见的误解:HA并不保护虚拟机所消耗的资源,只保护设置的预留资源。如果预留资源不够,将无法保证性能。

    如何确保虚拟机正确重启

    虚拟化管理员配置HA集群,主设置决定了是否针对故障提供保护以及预留多少资源来应对服务器故障。在生产环境中,你总想使用访问控制设置来应对故障。你应该在访问控制策略设置中预留足够多的资源来应对故障。进行了上述设置后,如果其中一台主机发生故障,能够确保正在运行的虚拟机正常重启。

    我们无法确定虚拟机重启之后的性能以及集群中其他虚拟机的性能状况,因为这些虚拟机共享着同一个资源池。这是因为ESXi主机默认并不保证向虚拟机交付任何的CPU或者内存;除非设置了资源预留值否则不会为虚拟机预留任何资源。

    在之前的文章《利用优先级列表提升关键虚拟机性能:设定恰当的预留值》中,我们讨论了预留的重要性。预留确保了虚拟机获取到了交付相应的服务级别所需要的最小资源数量。在你使用vCenter启动虚拟机时,在配置完故障级别后HA集群将检查是否有足够多未预留的资源。如果预留值为零,HA将允许你开启大量的虚拟机,但可用的资源将会减少或者虚拟机性能将会下降。

    在问题出现前,通过限制正在运行的虚拟机的数量可以确保在主机发生故障后虚拟机能够交付所必需的性能。但更好的方式是为虚拟机配置预留值。为虚拟机设置预留值后,你可能会发现HA不允许你在集群中启动太多的虚拟机,而且ESXi服务器的资源利用率也不会非常高。如果主机出现故障,虚拟机的性能级别将不会受到影响,特别是具有高预留值的运行关键业务虚拟机。关键虚拟机对业务的重要性表明ESXi服务器发生故障将对业务连续性产生不小的影响。

    当集群中优先级低的虚拟机较多时,为虚拟机设置的预留值较低,你可能仍会看到ESXi主机硬件资源的利用率较为正常,因为在ESXi服务器发生故障时这些虚拟机占用的资源较少,仍能够继续运行。

    来源:51cto.com

    展开全文
  • VMware vSphere环境中,之前因为主机资源使用较高,无法满足HA的切换需求,在集群的摘要里报“配置问题 vsphere HA 启动了虚拟机故障切换操作”, 之后再资源使用降下来后,集群摘要里仍然报“配置问题 vsphere HA...
  • 由于昨天交换机重启,导致虚拟机和主机都发生了HA切换,还不清楚昨天交换机重启时的情况,是两台一起重启的,还是分先后顺序的,今早主机发生HA失败的报警,且进行HA重新配置的操作后也不成功。 1、首先检查主机的...
  • 咨询虚拟化厂商,应对措施多采用配置HA 插槽数来优化。 HA 工作原理 当在群集启用HA时,系统会自动选举一台ESXi主机作为首选主机(也称为Master主机),其余的ESXi主机作为从属主机(也称为Slave主机)。Master主机...
  • 转载于:https://blog.51cto.com/williamliuwen/1686552
  • Vmware Vsphere HA

    千次阅读 2019-03-12 10:14:38
    这里写自定义目录标题 1 应用层高可用性:如实现mysql、oracle数据库应用程序的储群集,主要是判断mysql、oracle应用程序是否停止...3 虚拟化层的高可用性:如vsphere high availability(HA)和vsphere fault toler...
  • vSphere HA

    2017-11-15 21:38:00
    计划停机时间:物理服务器进行硬件维护、硬件更新(vMotion虚拟化主机迁移)非计划停机时间:物理服务器故障,快速恢复、连续可用性,减少非计划停机时间(HA和FT) 集群(HA)是将多个主机(服务器)通过网络连接的...
  • vSphere HA状况:未知配置错误解决办法
  • 问题:vSphere HA配置出现未知错误,导致打不开主机上的虚拟机电源,vmware client连接vcenter后,主机显示警报信息,例如以下: 解决:例如以下图,选中有问题的物理主机,然后又一次配置HA就可以: ...
  • 例如,您可使用 vSphere vMotion 将已打开电源的虚拟机从主机上移开,以便执行维护、平衡负载、并置相互通信的虚拟机、将多个虚拟机分离以最大限度地减少故障域、迁移到新服务器硬件等等。 您可使用冷迁移或热迁移...
  • 在布署App HA之前你必须满足如下对于磁盘空间、内存和网络的要求:组件最低要求CPU2vCPUsMemory(内存)4GBDisk Size(磁盘空间)20GBNetwork(网络)1Gbps 2、App HA软件需求;布署之前必要满足以下软件要求: 1)...
  • vSphere故障案例】案例九:ESXi主机HA配置错误2013-03-29 17:04:38标签:vSphereHAESXi原创作品,允许转载,转载时请务必以超链接形式标明文章原始出处、作者信息和本声明。否则将追究法律责任。...
  • 完成了上述几篇文章的配置和准备...通过vsphere web client导航到清单中的vCenter 对象,选择配置vCenter HA配置 启动配置vCenter HA向导可以看到这里有上述见到的基本和高级两种配置模式,并且由于本...
  • VMware vSphere HA深入解析

    千次阅读 2013-11-22 16:39:48
    相信大家都知道怎么在vSphere环境中配置HA功能,知道HA故障切换时间为VM系统启动时间+应用启动时间+15秒左右的心跳检测时间,知道HA不受DRS和vMotion影响,知道HA不需要依赖vCenter(vCenter挂了,License授权ESXi...
  • vSphere4安装配置图解

    2011-06-13 09:41:59
    vSphere 4安装配置图解 包括HA DRS的配置
  • 必须创建群集,然后有主机填充群集,并配置vSphere HA设置,才能建立故障切换保护。可以为群集启用vSphere HA。启用了vSphere HA的群集是Fault Tolerance的必备条件。可以先创建 空群集。在规划好群集的资源和网络...
  • 一天,集群中的主机上的vsphere HA主机状态都错误 “无法正确安装或配置 vSphere HA...1.首先尝试 重新配置vsphere HA,显示下列错误。 2.然后找到KB文档https://kb.vmware.com/articleview?docid=2056299&la...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 2,326
精华内容 930
关键字:

ha配置vsphere