高可用集群软件_集群有高可用集群和负载均衡集群,()集群是我们常说的双机互备 - CSDN
精华内容
参与话题
  • HA 工程的一个组成部分,也是目前开源HA项目中最成功的一个例子,Linux-HA的全称是High-Availability Linux,这个开源项目的目标是:通过社区开发者的共同努力,提供一个增强linux可靠性(reliability)、可用性...

    一、Heartbeat的定义

           Heartbeat 项目是 Linux-HA 工程的一个组成部分,也是目前开源HA项目中最成功的一个例子,Linux-HA的全称是High-Availability Linux,这个开源项目的目标是:通过社区开发者的共同努力,提供一个增强linux可靠性(reliability)、可用性(availability)和可服务性(serviceability)(RAS)的群集解决方案,它实现了一个高可用集群系统。心跳服务和集群通信是高可用集群的两个关键组件,在 Heartbeat 项目里,由 heartbeat 模块实现了这两个功能。

    Linux-HA的官方网站:

                                       http://www.linux-ha.org

                                       http://hg.linux-ha.org

    二、HA集群中的相关术语

    1)节点(node)
           运行heartbeat进程的一个独立主机,称为节点,节点是HA的核心组成部分,每个节点上运行着操作系统和heartbeat软件服务,在heartbeat集群中,节点有主次之分,分别称为主节点和备用/备份节点,每个节点拥有唯一的主机名,并且拥有属于自己的一组资源,例如,磁盘、文件系统、网络地址和应用服务等。主节点上一般运行着一个或多个应用服务。而备用节点一般处于监控状态。
    2)资源(resource)
           资源是一个节点可以控制的实体,并且当节点发生故障时,这些资源能够被其它节点接管,heartbeat中,可以当做资源的实体有:
                磁盘分区、文件系统
                IP地址
                应用程序服务
                NFS文件系统
    3)事件(event)
         也就是集群中可能发生的事情,例如节点系统故障、网络连通故障、网卡故障、应用程序故障等。这些事件都会导致节点的资源发生转移,HA的测试也是基于这些事件来进行的。
    4)动作(action)
         事件发生时HA的响应方式,动作是由shell脚步控制的,例如,当某个节点发生故障后,备份节点将通过事先设定好的执行脚本进行服务的关闭或启动。进而接管故障节点的资源。

    三、Heartbeat的版本与组件

         说明:Heartbeat有三个版本分别为Heartbeat v1.x,Heartbeat v2.x,Heartbeat v3.x。Heartbeat v1.x和Heartbeat v2.x版本的组成结构十分简单,所有模块都集中在heartbeat中,到了v3版本后,整个heartbeat项目进行了拆分,分为不同的项目来分别进行开发。

    1)Heartbeat v1.x与v2.x的组件

    •     heartbeat:节点间通信检测模块

    •     ha-logd:集群事件日志服务

    •     CCM(Consensus Cluster Membership):集群成员一致性管理模块

    •     LRM (Local Resource Manager):本地资源管理模块

    •     Stonith Daemon: 使出现问题的节点从集群环境中脱离或重启

    •     CRM(Cluster resource management):集群资源管理模块

    •     Cluster policy engine: 集群策略引擎

    •     Cluster transition engine:集群转移引擎(也叫策略执行引擎)

    Heartbeat v1.x与Heartbeat v2.x区别:在Heartbeat v2.x中增加了一个新的集群资源管理器crm,在Heartbeat v1.x中的集群资源管理器是haresource,Heartbeat v2.x中为了兼容v1.x保留了haresource,但同时又新增了一个功能更强大的crm资源管理器。crm管理方式有,一种是基于命令行crmsh,一种是基于图形界面的hb_gui。

    2)Heartbeat v3.x的组件

    •     Heartbeat:将原来的消息通信层独立为heartbeat项目,新的heartbeat只负责维护集群各节点的信息以及它                           们之前通信。

    •     Cluster Glue:相当于一个中间层,它用来将heartbeat和pacemaker关联起来,主要包含2个部分,即为LRM                             和STONITH。

    •     Resource Agent:用来控制服务启停,监控服务状态的脚本集合,这些脚本将被LRM调用从而实现各种资源                                     启动、停止、监控等等。

    •     Pacemaker:也就是Cluster Resource Manager(集群资源管理器,简称CRM),用来管理整个HA的控制中                           心,客户端通过pacemaker来配置管理监控整个集群。

    四、Heartbeat的各版本之间的区别

    与v1.x风格相比,Heartbeat v2.x版本之后功能变化如下:

            1)保留原有所有功能

            2)自动监控资源

    默认情况下每2分钟检测资源运行情况,如果发现资源不在,则尝试启动资源, 如果60s后还未启动成功,则资源切换向另节点。时间可以修改。

            3)可以对各资源组实现独立监控

    比如apache运行在node1上,mysql运行在node2上,Heartbeat可同时实现两台主机的服务监控

            4)同时监控系统负载

    可以自动将资源切换到负载低的node上

            5)新增crm资源管理器

    crm管理器可以让heartbeat基于图形界面管理,即hb_gui

    与v2.x风格相比,Heartbeat 3最主要变化是功能拆分,Heartbeat官方最后一个STABLE release 2.x 版本是2.1.4,Heartbeat 3官方正式发布的首个版本是3.0.2,Heartbeat 3与Heartbeat2.x的最大差别在于,Heartbeat3.x按模块把的原来Heartbeat2.x拆分为多个子项目,但是HA实现原理与Heartbeat2.x基本相同,配置也基本一致。

    五、heartbeat集群中的概念解析

    ha_aware如果一个应用程序自己能够利用底层心跳信息传递层的功能完成集群事物决策的过程的软件就叫ha_aware。

    DC:Designated Coordinator选定的协调员,当DC所在的主机挂了就会先选出一个DC,再由DC做出事物的决策。注意:在高可用集群中最核心的、最底层的管理的单位叫资源,把资源组合在一起来组合成一个服务。

    CRM:Cluster Resources Manager集群资源管理,真正做出决策的是CRM。 

    高可用集群中任何资源都不应该自行启动,而是由CRM管理启动启动的;

    heartbeat v1版时就有了资源管理的概念,而v1版的资源就是heartbeat自带的,叫haresources,这个文件是个配置文件;而这个配置文件接口就叫haresources;
    当heartbeat v2第二版的时候,heartbeat被做了很大的改进,自己可以做为一个独立进程来运行,并而可以通过它接收用户请求,它就叫crm,在运行时它需要在各节点上运行一个叫crmd的进程,这个进程通常要监听在一个套接字上,端口就是5560,所以服务器端叫crmd,而客户端叫crm(可以称为crm shell),是个命令行接口,通过这个命令行接口就可以跟服务器端的crm通信了,heartbeat也有它的图形化界面工具,就叫heartbeat-GUI工具,通过这个界面就可以配置进行。
    第三版heartbeat v3,被独立成三个项目heartbeat、pacemaker(心脏起博器)、cluster-glue(集群的贴合器),架构分离开来了,可以结合其它的组件工作了。

    RA:resource agent资源代理,其实就是能够接收CRM的调度用于实现在节点上对某一个资源完成管理的工具,这个管理的工具通常是脚本,所以我们通常称为资源代理。任何资源代理都要使用同一种风格,接收四个参数:{start|stop|restart|status},包括配置IP地址的也是。每个种资源的代理都要完成这四个参数据的输出。

    失效转移(failover):当某一个节点出现故障时,其上面的资源被自动转移到其它正常的备用节点上并启动的这个过程叫故障转移,也称为失效转移。

    故障转回(failback):如果出现故障的节点又回来的,那我们就要把这个节点添加回来,那这个添加回来的过程我们就叫失效转回,也称故障转回。

    资源争用、资源隔离:
    万一集群发生分裂时,为了避免不再成为集群上的节点继续使用资源而发生资源争用情况,导致有挂载文件系统的系统文件发生崩溃,成为新的集群的就会给不再成为集群的节点补一枪,让不是集群节点的服务死透,不再接收请求,这就叫stonith(shoot the other node in the head),而这种功能就叫资源隔离。争用共享存储的后果是非常严重的,轻则共享存储崩溃,重则整个文件系统都崩溃,数据全部丢失。


    资源隔离有两种级别:
           
    节点级别:这种就叫STONITH,这种就是不管怎么样直接把对方的电源给切断,一般这种主机都是连接到电源交换机上的。
           
    资源级别:这种需要依赖一些硬件设备来完成,比如连接到共享存储的光纤交换机,把需要踢除出去的节点的光纤接口屏蔽了,这种就叫资源级别的隔离。
           对于服务器左右分隔的这种情况通常称为脑裂(brain-split),左右不协调了,在高可以用集群中避免资源争用完成资源隔离是我们在设计高可用集群中必须要考滤的问题。

          两个节点的模式下,一旦发生集群分隔以后,其中一个节点发生故障,在我们无法判定哪个节点不正常的时候,而正常的节点一定是可以连到互联网上去的,这样的话就说明正常的节点是可以跟前端路由通信的,所以我们就把前端路由当成第三个节点,这里我们称为ping节点,当每个节点联系到对方之后先去ping前端的节点,如果可以ping通,那就说明自己是正常的,就说明该节点是有多票法定票数的节点,而前端的ping节点就叫仲裁设备,帮助节点判断哪个节点是优胜一方的,偶数节点数时就会借助于仲裁设备。
           RHCS不是使用ping节点来判断的,他是使用了一个共享存储的设备,偶数个节点处于活动的节点不断的往磁盘中写数据,按照心跳信息频率每隔一个信息频率就往磁盘里写一个数据位,只要这个设备每隔一个心跳时间间隔就更新一次数据位,就说明这个设备处于活动状态的,如果发现节点多次没有写数据位了就认为节点挂了,这种也叫仲裁设备(qdisk)。仲裁设备又有两种:分别为ping node和qdisk;

    那心跳是怎么传递的呢,在多台主机之机又是怎么互相工作良好呢,如图:高可用主从的两个节点;

    wKiom1NXJgWSL8J2AALpfiAJ3U8039.jpg

    信息层(Messaging Layer):主从两个节点的心跳信息都要基于信息层来实现,也叫底层基础架构层,用于传递心跳信息的,而能够实现这种功能的有Corosync和heartbeat,corosync是openAIS的一个组件,
    资源分配层(Resource Allocation):也叫资源管理器层,这层的核心组件叫CRM(Cluster Resourcce Manager集群资源管理器),CRM上必须有一个资源被推举成为管理者的,叫Leader,它的工作是决策集群中的所有事物的,这里称为DC(Designated Coordinator指定协调员),任何DC上会额外运行两个进程,一个叫PE(Policy Engine策略引擎),所谓策略引擎就是将底层信息层收集整个集群中所有节点上的信息在本地生成一个大图big pic来策略节点运行在哪个节点上,并通知其实节点上的资源管理器来实现资源的启动和关闭等操作;一个叫TE(Transition Engine 传输引擎),它主要是把PE做出的决策通告给对应节点的CRM;
           集群资源管理器必须借助于Messageing Layer通告给每一个节点,自动的广播或组播给每一个节点,这样就保证了每一个节点上的信息都是一样的,而这些数据在计算机中又怎么样来交互数据的呢,这里就要基于扩展标记语言来实现数据的格式传递的,这种叫半结构化数据基于XML的,所以在各节点之间实现配置信息保存都是通过XML文件保存的,而要能够理解这个XML文件保存的信息使用到一个工具叫CIB(Cluster Information Base集群信息库);只要能连接到CRM上都可以去配置这个XML文件,首先它会先保存到DC的XML中,然后再由DC同步支每个节点上的XML文件中去的;
    Resources层:而PE(策略引擎)就是根据XML这个库来获取资源的配置信息的,并通过Messaging Layer不获取当前节点的活动信息,而后做出决策,一旦做得决策就要启动资源了;所以PE借助于本地的Messaging Layer通知给其实节点的集群信息库来实现对某些资源信息的传递,比如说通告其它CRM要启动某一资源了,收到信息后CRM并不负责启动,转由LRM(Local Resource Manager本地资源管理)启动,每个节点上都运行在这个LRM,而并发资源又借助于RA(Resource Agent资源代理)实现资源管理,这就是它的工作原理;CRM负责收集信息,推举为DC的由PE运行,PE负责整合整个集群中的所有资源,并确保某些资源在合适的节点上运行起来,一旦做出决策就会通告给其它节点上的CRM,对应节点上的CRM收到通告以后会调用自己的LRM,由LRM指挥RA完成相关的操作;



    本文转自 jerry1111111 51CTO博客,原文链接:http://blog.51cto.com/jerry12356/1855377,如需转载请自行联系原作者

    展开全文
  • 事实上国内已经出现了中兴新支点Newstart HA等成熟的高可用集群软件,可以保障系统可用。下面就具体地给大家分享一下。 可用的基本定义 可用(High Availability)是系统架构设计中必须考虑的因素之一,它...

    许多人还不清楚高可用的定义,也不知道该如何保障系统的高可用性。事实上国内已经出现了中兴新支点Newstart HA等成熟的高可用集群软件,可以保障系统高可用。下面就具体地给大家分享一下。

    高可用的基本定义

    高可用(High Availability)是系统架构设计中必须考虑的因素之一,它通常是指,通过设计减少系统不能提供服务的时间。

    如何衡量高可用性?

    可用性通常表示为一个百分比,表示在给定时间段内特定系统或组件的正常运行时间,其中100%的值表示系统永不失效。例如,在一年的时间内保证99%可用性的系统最多可以有3.65天的停机时间(1%)。

    这些值是根据几个因素计算的,包括计划和非计划维护周期,以及从可能的系统故障中恢复的时间。

    目前大部分企业的高可用目标是4个9,也就是99.99%,也就是允许这台系统的年停机时间为52.56分钟。

     

    高可用的目标

    消除基础架构中的单点故障。

    单点的定义是:技术堆栈中的某个组件,如果它变得不可用,将导致服务中断。

    因此,应用程序中没有冗余的正常功能的部件被认为是单一故障点。

    要消除单点故障,必须为堆栈的每一层做好冗余准备。

    高可用简单示意

    例如,假设您的基础架构由负载均衡器后面的两个相同的冗余Web服务器组成。来自客户端的流量将在Web服务器之间平均分配,但如果其中一个服务器出现故障,负载均衡器会将所有流量重定向到剩余的在线服务器。

    此方案中的Web服务器层不是单点故障,因为:

    适用于同一任务的冗余组件

    该层顶部的机制(负载均衡器)能够检测组件中的故障并调整其行为以便及时恢复

     

    另外一种情况,如果负载均衡器宕机,消除这个剩余的单点故障可能具有挑战性; 即使您可以轻松配置额外的负载均衡器以实现冗余,但在负载均衡器之上没有明显的点来实现故障检测和恢复。

    因此,仅冗余不能保证高可用性。必须有一种机制来检测故障并在堆栈的某个组件不可用时采取措施。

    可以使用从上到下的方法实现冗余系统的故障检测和恢复:顶部的层负责监视其下方的层以确定故障。在这里,基础架构中有一个点,即顶层不存在或不可及,负载平衡器层就是这种情况。为外部服务器中的负载均衡器创建故障检测服务只会创建新的单点故障。

    对于负载平衡器的情况,由于名称服务器的工作方式,还有一个额外的复杂因素。从负载平衡器故障中恢复通常意味着故障转移到冗余负载平衡器,这意味着必须进行DNS更改才能将域名指向冗余负载平衡器的IP地址。

     

    这样的更改可能需要相当长的时间才能在Internet上传播,这会导致此系统严重停机。

    一种可能的解决方案是使用DNS循环负载平衡。但是,这种方法不可靠,因为它使客户端应用程序的故障转移。

    更强大和可靠的解决方案是使用允许灵活IP地址重映射的系统,例如浮动IP。按需IP地址重新映射通过提供可在需要时轻松重新映射的静态IP地址,消除了DNS更改中固有的传播和缓存问题。域名可以保持与相同的IP地址关联,而IP地址本身也可以在服务器之间移动。

     

    高可用集群软件能保障系统的高可用

    在高可用集群朝多样化、易操作维护等方向迅速发展的今天,市场上的集群软件产品也品种繁多,但对于任何一款高可用集群产品,故障监视都是最核心的功能。监视资源种类的多少和监视层次的深浅,都成为评价一款集群软件高可用性的重要指标。目前市面上成熟的高可用集群软件已有不少,比如国外就有Rose ,而国内则以中兴新支点的Newstart HA 为代表。

     

    高可用集群软件怎样保障系统的高可用?以国内的Newstart HA为例,无需改变任何服务和应用,NewStart HA即可保证系统故障和部件故障时应用不中断;可以自动监控服务器、网卡、浮动 IP 、存储和业务,生产中心失效会自动切换到灾备中心;可实现数据实时同步,切换时间为秒级,因此可以提供电信级,高达 99.999% 的高可用性。因此,系统要实现高可用,高可用集群软件不失为一个很好的选择。

    高可用性是可靠性工程的重要子集,专注于确保系统或组件在给定的时间段内具有高水平的操作性能。乍一看,它的实施可能看起来相当复杂;但是,它可以为需要提高可靠性的系统带来巨大的好处。

    展开全文
  • Linux集群主要分成三大类( 高可用集群, 负载均衡集群,科学计算集群) 高可用集群( High Availability Cluster)负载均衡集群(Load Balance Cluster)科学计算集群(High Performance Computing Cluster)=============...

     Linux集群主要分成三大类( 高可用集群, 负载均衡集群,科学计算集群) 

    高可用集群( High Availability Cluster)
    负载均衡集群(Load Balance Cluster)
    科学计算集群(High Performance Computing Cluster)
    ================================================

    高可用集群(High Availability Cluster)

    常见的就是2个节点做成的HA集群,有很多通俗的不科学的名称,比如”双机热备”, “双机互备”, “双机”.
    高可用集群解决的是保障用户的应用程序持续对外提供服务的能力。 (请注意高可用集群既不是用来保护业务数据的,保护的是用户的业务程序对外不间断提供服务,把因软件/硬件/人为造成的故障对业务的影响降低到最小程度)

    Linux平台常见的高可用集群 有这些:

    1.  RedHat 公司 的 开放源代码RedHat Cluster Suite, 简称RHCS . (产品介绍http://www.redhat.com/solutions/clustersuite/)

    - RHCS实际上是一个套件,除了现在提到的高可用集群软件,还包含了一个基于LVS的负载均衡软件.

    - RHCS包含的集群软件,是GPL协议下开放源代码的集群系统.

    <script src="http://pagead2.googlesyndication.com/pagead/show_ads.js" type="text/javascript"></script>

    - RHCS目前的版本有 RHCS v3和 v4,分别对应于RedHat 企业版Linux的 3.0家族和4.0家族.

    - RHCS是一个独立的产品,不包括在RedHat Enterprise Linux当中,无论是购买还是下载,都是单独存在的.

    RHCS的获得:

    RHCS的获得有三个途径:

    a. 从redhat 的官方销售渠道购买,得到的是RedHat RHCS产品的二进制代码(光盘或直接从RHN-RedHat Network下载),源代码,以及支持和升级服务.
    b. 从redhat 的官方站点下载SRPM包,编译并安装. 无原厂商业支持和升级服务. 这里下载 (ftp://ftp.redhat.com/pub/redhat/linux/enterprise/4/en/RHCSftp://ftp.redhat.com/pub/redhat/linux/enterprise/3/en/RHCS)
    c. 从centOS官方站点下载RHCS的二进制代码包并安装,无原厂商业支持和升级服务. 这里下载(http://mirror.centos.org/centos/4/csgfs/, 请阅读此目录中的README文件)

    2. Novell 公司 的 开放源代码高可用集群HA套件

    Novell 公司并购了欧洲Linux第一大厂SuSE之后,成为全球能够抗衡RedHat的主要力量.

    SuSE企业版Linux 带有一套开放源代码的HA集群软件,包括 HA project的heartbeat, heartbeat-ldirectord, heartbeat-pils, heartbeat-stonith, 集群关联的存储软件drbd, 虚拟IP的 src_vipa软件.和RHCS不同的是,SuSE/Novell 企业版Linux自带的 HA集群软件并非一个独立的软件,如上介绍,而是由不同的开放源代码项目提供的不同部分的程序。

    集群软件的获得:
    本集群软件组件已经附带在SuSE Linux Enterprise Server 光盘中(SLES9, SLES10), SuSE Linux Enterprise Server(SLES9, SLES10)的光盘,可以免费从download.novell.com获得,并提供2个月的在线网络更新服务. 用户只需要在novell站点上免费注册一个novell 站点账号,就可以下载SLES9, SLES10的所有光盘ISO.

    3. Novell 公司的Novell Cluster Service

    Novell 在败落前,曾经是一家非常伟大的公司,有着非常雄厚的技术力量。 早在10多年前,Novell公司就在集群领域独树一帜,是当时唯一能够在PC服务器上构建出32节点集群的厂商.
    Novell收购SuSE公司之后,将原来在Novell netware操作系统上的大量企业级应用移植和整合到了SuSE Linux Enterprise Linux平台, Novell 当时名震集群领域的Novell Cluster Service 也被整合移植到了Linux平台.

    Novell Cluster Service是一个商业系统,并非开放源代码产品

    这里可以看到细节
    http://www.novell.com/products/openenterpriseserver/ncs.html

    产品的获得

    直接从Novell 公司购买.

    4. Steeleye Lifekeeper for linux (产品介绍http://www.steeleye.com/)

    steeleye 公司是集群行业非常著名的公司,他们的集群系统最早是AT&T 贝尔实验室开发的,后来被卖给了金融行业的著名IT公司NCR公司。(不少朋友到ATM取钱的时候也许会看到NCR制造的ATM机). lifekeeper集群的历史非常悠久,后来steeleye又得到了几个从当时的巨头DEC跳槽来的核心开发人员.因此lifekeeper的构架和 品质是有非常好的口碑的.

    产品获得

    a. 从steeleye官方渠道申请试用版
    b. 从steeleye 官方购买

    5. HP MC/Service Guard for linux (http://h71028.www7.hp.com/enterprise/cache/6468-0-0-0-121.aspx)

    HP在和Compaq合并之前,在HP-UX平台有一套旗舰级的高可用集群系统(MC/SG for HP-UX),被广泛部署在各种关键业务计算领域。比如银行,电信,金融等等。主要的硬件平台是PA-RISC架构的小型机和中型机系统.
    Compaq在和HP合并之前,在Alpha 平台有一套旗舰级的高可用集群,叫做(TruCluster).被广泛部署在各种关键业务计算领域,比如国防,航天,制造等等。主要的硬件平台是Alpha架构的小型机和中型机.
    随着两个公司的合并,两套著名的集群系统也完成了合并,新的产品仍旧叫做MC/SG,但是可以跑在PA-RISC, IA, IA64平台.
    5年前,HP将MC/SG集群系统移植到了linux平台,并发展至今.  HP MC/SG for linux有着非常高的品质和长期在高度关键业务要求的领域发展的背景。

    软件的获得:

    从HP官方渠道购买并获得技术支持和升级服务.

    6. 开放源代码的 HA 项目 (http://www.linux-ha.org/)

    linux-HA 项目历史悠久, 很多linux 发行附带的HA集群都是采用了linux-HA 的heartbeat系统和相关的组件.需要构建完全的开源,自由而且免费的高可用集群的用户可以选择.

    软件获得:
    免费下载,没有商业支持和商业升级服务.

    7. Turbolinux  高可用集群系统

    Turbolinux 这几年发展的颇不顺利,从创始人走人到公司在日本的股权变动. 颇让人担忧。

    TurboLinux 的高可用集群软件有两个.

    a. TurboLinux Cluster HA 3.1
    b. TurboLinux8 ClusterPro

    因为都没有在具体的项目中深入用过,不做更多解释.

    软件获得:

    从Turbolinux 官方购买,并获得技术支持和升级服务

    展开全文
  • Linux集群主要分成三大类:可用集群(High Availability Cluster)、负载均衡集群(Load Balance Cluster)、科学计算集群(High Performance Computing Cluster)。...而在Linux平台下常见的高可用集群软件

    Linux集群主要分成三大类:高可用集群(High Availability Cluster)、负载均衡集群(Load Balance Cluster)、科学计算集群(High Performance Computing Cluster)。

    其中高可用集群具有保障应用程序持续提供服务的能力,可以将因软、硬件、人为造成的故障对业务的影响降低到最小程度。在高可用集群中,最常见的就是两个节点做成的HA集群,有很多通俗的名称,比如“双机热备”、“双机互备”、“双机”。

    而在Linux平台下常见的高可用集群软件有这些:

    1、RedHat 公司的RHCS

    RHCS 全称是RedHat Cluster Suite,实际上是一个套件,除了现在提到的高可用集群软件,还包含了一个基于LVS的负载均衡软件。RHCS包含的集群软件,是GPL协议下开放源代码的集群系统。RHCS是一个独立的产品,不包括在RedHat Enterprise Linux当中,无论是购买还是下载,都是单独存在的。

     

    2、中兴新支点的Newstart HA

    Newstart HA由中兴子公司“新支点”研发,是国内具有代表性的一款成熟的高可用集群软件。NewStart HA无需改变任何服务和应用,即可保证系统故障和部件故障时应用不中断;可以自动监控服务器、网卡、浮动 IP 、存储和业务,生产中心失效会自动切换到灾备中心;可实现数据实时同步,切换时间为秒级,因此可以提供电信级,高达 99.999% 的高可用性。

     

    3、Novell公司的Novell Cluster Service

    Novell收购SuSE公司之后,将原来在Novell netware操作系统上的大量企业级应用移植和整合到了SuSE Linux Enterprise Linux平台,Novell 当时名震集群领域的Novell Cluster Service也被整合移植到了Linux平台。Novell Cluster Service是一个商业系统,并非开放源代码产品。

    4、Steeleye公司的Lifekeeper for Linux

    Steeleye公司是集群行业非常著名的公司,他们的集群系统最早是AT&T 贝尔实验室开发的,后来被卖给了金融行业著名的IT公司NCR公司。Lifekeeper集群的历史非常悠久,后来Steeleye又得到了几个从当时的巨头DEC跳槽而来的核心开发人员,因此Lifekeeper的架构和品质都是有非常好的口碑的。

     

    5、Keepalived高可用集群软件

    Keepalived 集群软件是一个基于VRRP协议来实现的LVS(四层协议)服务高可用方案,可以避免单节点故障。LVS服务需要有2台服务器运行Keepalived服务,一台为主服务器(MASTER),一台为备份服务器(BACKUP),但是对外只有一个虚拟IP,主服务器会发送特定的消息给备份服务器,当备份服务器收不到这个消息的时候,备份服务器认为主服务器宕机并会接管虚拟IP提供服务,从而保证了服务的高可用性。

    展开全文
  • 高可用集群软件

    2019-06-17 21:47:30
    一、Messaging Layer 集群信息层软件 1、heartbeat (v1, v2) 2、heartbeat v3 可以拆分为:heartbeat, pacemaker, cluster-glue 3、corosync 从OpenAIS分离的项目。 4、cman 5、keepalived 一般用于两个节点的集群 6...
  • 高可用集群管理工具的总结

    千次阅读 2018-01-23 15:52:55
    今天我们要说的就是在我们对于集群管理时,可使用的一个方便快捷的管理工具,他可以对我们的服务器进行完成调度,内存控制等一系列的功能 准备工作 三台虚拟机,在三台虚拟机里面,配置yum源如下 [root@server1...
  • 高可用Kubernetes集群原理介绍

    万次阅读 2016-08-19 08:28:22
    Kubernetes作为容器应用的管理中心,对集群内部所有容器的生命周期进行管理,结合自身的健康检查及错误恢复机制,实现了集群内部应用层的高可用性。 Kubernetes服务本身的稳定运行对集群管理至关重要,影响服务稳定...
  • 架构综合-集群、分布式、负载均衡区别与联系(转)

    万次阅读 多人点赞 2019-03-04 00:04:47
    1、Linux集群主要分成三大类( 高可用集群, 负载均衡集群,科学计算集群) 集群是一个统称,他分为好几种,如性能科学群集、负载均衡群集、可用性群集等。科学群集 、性能集群(High performance cluster,HPC...
  • 集群架构及常见集群特性介绍

    千次阅读 2017-10-26 21:12:31
    计算机集群简称”集群”,是一种计算机系统,它通过一组松散集成的计算机软件和/或硬件连接起来高度紧密地协作完成计算工作。在某种意义上,他们可以被看作是一台计算机。集群系统中的单个计算机通常称为节点,通常...
  • 什么是集群(cluster)

    万次阅读 2008-02-18 15:43:00
    1、集群 1.1 什么是集群 简单的说,集群(cluster)就是一组计算机,它们作为一个整体向用户提供一组网络资源。这些单个的计算机系统就是集群的节点(node)。一个理想的集群是,用户从来不会意识到集群系统底层的节点...
  • 高可用集群

    万次阅读 多人点赞 2017-07-27 16:08:05
    本文将详细介绍:可用集群、可用集群衡量标准、可用集群实现原理、可用集群工作模型、可用集群构架、高可用集群软件、共享存储
  • 集群软件的分类

    千次阅读 2013-09-15 21:12:20
    集群软件的分类  在现在存储环境中,集群软件是一个很重要的模块。然而,很多人不清楚集群软件的分类,不知道... 一般来讲,集群软件根据侧重的方向和试图解决的问题,分为三大类:性能集群(High performa
  • linux高可用集群(HA)原理详解

    万次阅读 2018-05-02 10:39:32
    高可用集群一、什么是高可用集群 高可用集群就是当某一个节点或服务器发生故障时,另一个节点能够自动且立即向外提供服务,即将有故障节点上的资源转移到另一个节点上去,这样另一个节点有了资源既可以向外提供服务...
  • 集群分为几种,用的软件分别是什么? 补充:涉及的组件 1.1、apache 跨平台的网页服务器,主要使用它做静态资源服务器,也可以做代理服务器转发请求 1.2、ngnix 性能的 HTTP和反向代理服务器,ngnix处理能力...
  • 1、Linux集群主要分成三大类( 高可用集群, 负载均衡集群,科学计算集群) 集群是一个统称,他分为好几种,如性能科学群集、负载均衡群集、可用性群集等。 科学群集 、性能集群(High performance cluster...
  • 集群NAS技术架构

    万次阅读 热门讨论 2011-05-15 17:19:00
    集群NAS是一种横向扩展(Scale-out)存储架构,具有容量和性能线性扩展的优势,已经得到全球市场的认可,集群NAS已经成为主流存储技术之一。这里主要剖析集群NAS的三种技术架构,并简单介绍了开源集群NAS解决方案。
  • 集群存储高可用方法

    万次阅读 2013-05-03 22:18:34
    性能计算、医学影像、石油和天然气勘探、数字媒体和社会化WEB等大量数据密集型应用导致数据的井喷,不断对存储方法提出新的严峻挑战。集群存储是一种横向扩展(Scale-out)存储架构,具有容量和性能线性扩展的优势...
  • (三)mycat的高可用集群

    千次阅读 2018-11-01 17:41:16
    HAProxy提供高可用性、负载均衡以及基于TCP和HTTP应用的代理,支持虚拟主机,它是免费、快速并且可靠的一种解决方案。HAProxy 相比 LVS 的 使用要简单很多,功能方面也很丰富,免费开源,稳定性也是非常好,可以与 ...
  • 一、什么是集群? 集群(Cluster)是由...集群系统一般通过两台或多台节点服务器系统通过相应的硬件及软件互连,每个群集节点都是运行其自己进程的独立服务器。这些进程可以彼此通信,对网络客户机来说就像是形成了一
  • 一、涉及到的几个组件1.1、apache —— 它是Apache软件基金会的一个开放源代码的跨平台的网页服务器,属于老牌的web服务器了,支持基于Ip或者域名的虚拟主机,支持代理服务器,支持安全Socket层(SSL)等等,目前...
1 2 3 4 5 ... 20
收藏数 102,858
精华内容 41,143
关键字:

高可用集群软件