精华内容
下载资源
问答
  • 提供VMware双活数据中心与灾备解决方案PPT版本,详细介绍了相关双活数据中心与灾备的解决方案,请参考。
  • 华为双活数据中心解决方案与VMware最佳实践 华为双活数据中心解决方案与VMware最佳实践
  • 双活数据中心架构分析及优缺点

    万次阅读 2016-09-13 13:18:48
    什么是双活数据中心 ? 首先我们要知道双活就是Active-Active,故名思义就是两边都是活动在线提供服务的,是相对于传统的主备模式Active-Standby模式的。一个真正的双活方案是应该涵盖基础设施、中间件、应用程序...

    什么是双活数据中心 ?

    首先我们要知道双活就是Active-Active,故名思义就是两边都是活动在线提供服务的,是相对于传统的主备模式Active-Standby模式的。一个真正的双活方案是应该涵盖基础设施、中间件、应用程序各个层次的。

    双数据中心同时对外提供业务生产服务的双活模式,两个数据中心是对等的、不分主从、并可同时部署业务,可极大的提高资源的利用率和系统的工作效率、性能,让客户从容灾系统的**中获得最大的价值。

    • a.两个生产中心部署相同的业务系统,结合网络层、主机层或应用的负载均衡技术,实现业务系统在两个数据中心并行工作和负载分担。
    • b.两个生产中心部署不同的业务系统,互相实时灾备接管。

    数据中心双活又分为:同城双活、异地双活。

    双活数据中心架构分析及优缺点

    传统主备模式的缺点

    出于灾备(Disaster Recovery)的目的,一般都会建设2个(或多个)数据中心。一个是主数据中心用于承担用户的业务,一个是备份数据中心用于备份主数据中心的数据、配置、业务等。

    主备数据中心之间一般有热备、冷备、双活三种备份方式。

    热备的情况下,只有主数据中心承担用户的业务,此时备数据中心对主数据中心进行实时的备份,当主数据中心挂掉以后,备数据中心可以自动接管主数据中心的业务,用户的业务不会中断,所以也感觉不到数据中心的切换。

    冷备的情况下,也是只有主数据中心承担业务,但是备用数据中心不会对主数据中心进行实时备份,这时可能是周期性的进行备份或者干脆不进行备份,如果主数据中心挂掉了,用户的业务就会中断。

    双活是觉得备用数据中心只做备份太浪费了,所以让主备两个数据中心都同时承担用户的业务,此时,主备两个数据中心互为备份,并且进行实时备份。一般来说,主数据中心的负载可能会多一些,比如分担60~70%的业务,备数据中心只分担40%~30%的业务。

    传统主备模式是一个业务只在一个数据中心运行,企业结合灾备等级需求和业务需求,在备份中心部署了大量的备份服务器,但备份中心仅为该业务提供灾备服务,只有当灾难发生、生产数据中心瘫痪时,灾备中心的业务系统才启动这些服务器,造成备份中心服务器资源浪费,广域网链路也无法得到充分的利用。

    双活数据中心优点

    • 充分利用资源,避免了一个数据中心常年处于闲置状态而造成浪费。通过资源整合,“双活”数据中心的服务能力是双倍的。
    • 双活数据中心如果断了一个数据中心,另外一个数据中心还在运行,对用户来说是不可感知的。

    而一个灾备中心的模式,如果生产数据中心瘫痪,需要半个小时、甚至两个小时、甚至更长时间才能启动灾备中心,在启动灾备中心的时间里,用户交易会严重受损。

    双活数据中心的最大优势是有效利用资源。灾备中心建设的投资巨大及每年运维成本极高,如果资源处于闲置状态,资源是相当浪费的,有了虚拟化,能够把闲置的资源整合,服务能力会提高一倍。银行系统中很多资源都是弹性需求,如基金、贵金属交易、电子支付、和网银交易,在交易火爆时一天交易量可能达到全年交易量总和。故银行系统容量规划时是充分考虑到交易峰值的,但这样在正常时间就有很大的交易浪费,以淘宝“双十一”活动为例,交易量在几分钟内就可能达到全年交易量的总和,需要系统服务能力提高十倍,这时双活数据中心和灵活快速的资源调度就充分发挥出了作用。云计算技术,让IT系统有了资源整合的能力,让系统有了充分的弹性,随时可以调度十台机器来提高服务能力,来保证交易的突发需求,以及各种突发因素造成的交易量猛增。

    有了云计算技术,不代表投入会更少,但是资源利用率会更高,系统但抗冲击能力会更强,自由调度能力会更强。

    自动化是“双活”与“云计算”必不可少的前提条件

    云计算需要自动化手段来帮助系统维护人员进行自动的资源调配。比如,通过虚拟化技术虚拟出了上万台虚拟机器,白天需要50台机器给网银系统提供web服务,晚上网银交易少了,贵金属交易多了,这50台机器要调配到另一个系统上。这五十台不可能一个人一台台调配,那可能配一晚上都配不完,就需要自动化的软件来自动调整资源分配。

    双活数据中心架构分析及优缺点

     

    异地“双活”难度大

    当然,部署“双活”数据中心的难度也非常大,尤其是异地“双活”,涉及到数据同步效率问题。如果数据同步效率达不到要求,在灾难发生时就会造成一段时间的交易丢失。在异地“双活”的模式中,两地数据中心同时接纳交易,技术难度很大,需要更改众多底层程序。

    双活数据中心的建设三个条件

    双活数据中心的建设首先要满足三个条件,第一个是应用双活,也就是说数据库一定要实现双活,第二个是网络要双活,业务网络要保证能够同时联通两个数据中心,第三个是数据要双活,两边的数据要能够实现被独立使用。

    双活数据中心解决方案缺点

    虽然双活容灾解决方案对于集中式管理的数据中心更大限度的保证了业务生产的在线性及有效的防御了灾难性事件恢复业务生产的能力。但是双活数据中心的容灾方案还是存在一定的不足之处,理想与现实总存在一定的距离。

    1.脑裂现象

    双活数据中心方案实现了站点级的冗余的容灾解决方案,但是受限于当前的技术等因素,在建设过程中解决了企业当前面临的业务连续性问题,同时也产生了新的问题,就是双活解决方案普遍存在的脑裂现象,在意外事件发生时,若监测技术不到位、系统平台不健康、两数据中网络波动性中断等因素的发生,使得两个数据中心一体化的业务系统会分裂成两个独立的数据中心。使用户很难取舍那一个是唯一的生产数据,那一个是将要废掉的非生产数据。这就是早年veritas VVR解决方案退出灾备舞台的原因之一。

    2.非“零丢失”,不具备软错误的保障

    双活容灾解决方案的优势强调在健康的运行平台下,大型灾难事件发生是的“零”数据丢失,但是若双活平台本身不健康或者遭遇逻辑故障时,并不能保障数据零丢失。这种故障发生的数据恢复或渐变式灾难发生的情况下,还需借助备份系统的数据恢复手段或方法。因此,双活容灾方案大多数情况下不具备解决软错误的保障,而恰恰这种事件发生的概率远远超过站点级的灾难及硬件故障事件。在2012年时,某省政府部门的业务系统已建设容灾系统,但是在业务系统进行升级时出错,导致业务宕机一周多时间,而这期间的大部分时间是查找依据恢复数据。

    3.需容忍高可靠性及性能的下降

    双活容灾解决方案虽然提升了站点级的冗余保护,但是,在实际中确除低了整体业务平台的可靠性及性能。在可靠性方案,双活容灾解决方案就是把本地的双机双柜的硬件冗余方案跨站点建设,无论是传统的集群系统、虚拟化主机平台Vmware,还是Oracle RAC等,跨站点建设都会无形中在业务平台中增添几分不稳定的因素,我想从现在流行的一体机解决方案更能说明这方面的问题,即系统越简单越稳定。在性能方案,站点间的监测、业务会话的同步确认等的网络延迟数,加上数据同步双写的光纤延迟,都或多或少的影响了整体业务处理的性能。距离越远影响越明显,如果距离较近,也会失去建设双活容灾数据中心的意义。

    4.运营维护并不简单

    双活容灾解决方案灾难切换方面变的较为简单,但在实际的维护方面并不简单,除了要求企业用户提升自己的维护能力,还需双活容灾解决方案提供商的售后服务能力。

    a.企业自身人员的维护能力必须加强,才具备能力维护跨站点的双活系统,也就是需企业用户自身人维护人员必须从维护设备的能力转变为具备维护双活系统架构的能力,才能维稳系统的正常运行,让双活系统实现该有的效果。

    b.提供商的服务能力也直接影响双活容灾系统部署后的效果,在已有的案例中,我们经常看到提供商的800电话,除了收集日志还是收集日志,除了正在后台诊断还是后台诊断,经常让一个小小问题需有好多层、次的沟通才能解决,这样的方式如何保障双活容灾系统的稳定?如保达到用户对双活系统在线性要求的期望?

    5.性价比并不会太高

    我们经常会听到双活容灾方案可以让生产中心和容灾中心都“活”起来,有效的利用资源,面临灾难性事件时,最大化业务系统的在线性,解除原有灾备系统有灾无备等等的不足之处。但是,当我们认真考虑建设双活容灾系统时发现,如果自身IT人员的维护能力不足,很难达到我们期望的效果。在现实案例中,很多用户一次性的费用建设的系统,后续的维保经费很难申请,这种情况很难有效的保障我们的信息系统的健康运行。宁夏银行就是在没有后续维保经费支撑的情况下,硬件出故障,自身IT人员修复过程中出现人为错误而引起的重大事故。因此,建设双活容灾系统的同时,必须要保障后续的维护经费。使得双活容灾系统向高大上偏移。

    更多双活数据中心相关内容:

    双活容灾系统建设 有利有弊客观看

    分布式双活数据中心部署模式

    为什么采用两地三中心GDPS 双活解决方案

    使用 Q 复制实现 DB2 数据库系统的高可用性和双活

    民生银行采用IBM GDPC做同城异地双活灾备

    思科两地三中心双活解决方案详解及下载

    展开全文
  • 双活数据中心

    2017-11-08 21:26:00
    根据EMC全球的最佳实践,推荐实施双活数据中心的两个应用场景:一个是全虚拟化环境;一个是读多写少的数据库环境(查询类应用)。该公司正是前一种环境。实施双活数据中心,是对传统容灾概念的颠覆。传统的容灾中心...

    根据EMC全球的最佳实践,推荐实施双活数据中心的两个应用场景:一个是全虚拟化环境;一个是读多写少的数据库环境(查询类应用)。该公司正是前一种环境。实施双活数据中心,是对传统容灾概念的颠覆。传统的容灾中心有主有备。从主数据中心切换到备份数据中心,因为切换需要手动操作,一定会有停机时间。该公司的需求为RTO=1小时,就是为这一时延留出的时间。在双活数据中心,虚拟机从一个中心切换到另一个中心的时间接近于零。例如,用VMware高可用软件HA,虚拟机的重启时间为3毫秒,终端用户几乎感受不到时延。也就是说,可以实现RTO=0。  该公司欣然接受了EMC建立双活数据中心的解决方案。新机房与原机房距离1公里,通过光纤直连。总共有40至50台虚拟机,每个中心4台ESX服务器,实现负载均衡。采用VPLEXMetro异地虚拟化存储,实现两侧机房数据实时同步。VPLEX结合VMwareHA高可用软件,实现双活数据中心。
    2011年5月,该公司双活数据中心建成。完全达到预期目标。灾备演练结果显示,应用的切换时间为5-10毫秒,终端用户几乎感觉不到时延。客户对EMC双活数据中心的方案非常满意。目前已经有80%应用运行其上,明年将实现所有应用全部运行在双活数据中心上。
    图1 大连某日资公司双活数据中心拓扑图


     VPLEXMetro:双活数据中心的关键
    VPLEXMetro是实现双活数据中心的关键。VPLEXMetro可以实现两个数据中心的不同主机同时访问同一个数据卷。VPLEX的关键技术是AccessAnywhere缓存一致性技术。借助这一技术,可以为VPLEX群集之间显示、共享、访问或重新定位的数据提供一致的查看视图。到目前为止,在存储层面,只有VPLEX可以实现两个数据中心的不同主机同时访问同一个数据卷。
    VPLEX读数据在本地存储进行,写数据时除了本地写入外,会传输一份数据到远端存储写入,保持数据同步。由于只有写数据需要远程写,两个数据中心之间的带宽也不是问题。
    VMwareHA高可用软件是该公司双活数据中心的另一个重要工具。HA可以在某个物理主机出故障时,自动在另一个物理主机重启备份的虚拟机。由于VPLEX可以实现不同的主机访问同一个数据卷,因此重启的虚拟机可以立即投入工作。
    这就是私有云
    双活数据中心给该公司带四大方面的好处。一是业务连续性大大提高。由于不需要灾难切换,使RTO趋近于0。二是使生产中心和容灾中心的资源利用率都提高,降低TCO总拥有成本。三是可以减少占地空间,降低能耗。四是简化了计算资源、存储资源和网络资源的管理。
    服务器虚拟化加存储虚拟化,虚拟化资源池加动态应用和数据移动,就是联邦。该公司通过VPLEX实现了存储虚拟化,通过VMware实现了服务器虚拟化。虚拟机及其应用可以在不同主机、不同存储上移动,不需要人工干预。
    从数据中心的发展及特征来看,该公司的双活数据中心就是大家一直在谈论云数据中心。通过这个案例我们可以发现,私有云离我们并不遥远,它就在我们的身边。
    图2 数据中心的发展及特征






















    本文转自东方之子736651CTO博客,原文链接:http://blog.51cto.com/ecloud/1419216 ,如需转载请自行联系原作者



    展开全文
  • EMC Vplex 双活数据中心,结合Orcacle RAC或Vmware vsphere虚拟化HA来实现应用级容灾功能。
  • 分布式双活数据中心

    千次阅读 2016-09-15 22:25:18
    分布式双活数据中心在传统“两地三中心”模式的基础上,针对不同双活模型部署不同的技术。基于IP地址发布业务的数据中心在前端网络的Ingress方向(客户端到服务器)上需要设备支持RHI特性,在Egress方向(服务器到...

    分布式双活数据中心在传统“两地三中心”模式的基础上,针对不同双活模型部署不同的技术。基于IP地址发布业务的数据中心在前端网络的Ingress方向(客户端到服务器)上需要设备支持RHI特性,在Egress方向(服务器到客户端)上需要配置网关分离。在数据中心后端需要部署服务器负载均衡与HA,以及数据分布式双活技术。基于域名发布业务的数据中心在前端网络需要采用全局负载分担设备(GSLB)进行选路。以下将对各类实现方式与技术进行介绍分析。

    1 数据中心前端分布式双活网络技术

    在分布式双活数据中心网络环境下,通过数据中心前端分布式双活技术,用户能快速访问“距离最近”的可用数据中心相对应的业务,提高服务响应速度,提升用户访问体验。数据中心的业务对外发布时,可以采用纯IP地址也可以采用DNS域名方式。根据业务对外发布方式的不同,数据中心前端也相应采用不同的技术实现分布式网络双活。

    1.1 纯IP地址方式发布业务的前端网络双活技术

    所示,当业务采用纯IP方式对外发布时,正常情况下只有主中心DC A对外发布业务路由,从而将用户访问流量牵引到主中心,实现主中心业务访问。而备中心DC B的流量管理设备(支持RHI特性)只探测业务地址,因没有探测到而不对外发布业务路由,实现主中心的备份作用。

    当主中心业务迁移到备中心后,备中心的流量管理设备探测到业务IP已经转移到备中心,从而对外发布业务路由,引导用户访问备中心的业务IP,从而实现基于纯IP发布业务的数据中心前端网络双活。

    值得注意的是,该方案需要备中心流量管理设备支持RHI特性(如图2所示),能够对外发布路由。数据中心间需配置网关分离(如采用ACL方式对相关报文进行控制)。若数据中心互联采用EVI方式,则天然支持网关分离,无需配置。

    1.2 域名方式发布业务的前端网络双活技术

    当业务系统基于DNS域名方式对外发布时,可以采用基于智能DNS解析的GSLB[1]。GSLB解决了第一步即引导数据中心前端广域网用户流量访问适当的数据中心问题,所以GSLB的应用环境往往是基于域名的多数据中心之间的负载分担和相互之间的容灾备份。

    GSLB 基于DNS的流量管理机制主要完成DNS解析请求的负载均衡、服务器状态监控、用户访问路径优化。用户访问应用时,域名解析请求将由GSLB负责处理,它通过一组预先定义好的策略,将最接近用户的节点地址提供给用户,使其可以得到快速的服务。同时,它还与分布在各DC的所有GSLB节点保持通讯,搜集各节点的健康状态,以保证不将用户的请求分配到任何一个已经不可用的节点上。GSLB 通过就近探测实现负载分担.

    数据中心A、B、C各部署一个GSLB,其中DC A的GSLB为主GSLB,响应流程如下:

    1. Local DNS向主GSLB发起域名解析请求;

    2. GSLB-A、GSLB-B、GSLB-C将访问local DNS的延迟时间等相关信息返回给GSLB-A汇总,并判断最优的地址返回给local DNS;

    3. 以站点的响应时间作为引导用户的依据,用户的访问请求被导向到性能好,响应时间快的站点。

    DNS方式的GSLB主要功能和特性如下:

    l 应用智能:感知应用,及时发现业务中断;

    l 可管理:自动切换,通知用户改变数据访问点;

    l 高性能:支持流量在数据中心的动态负载均衡。

    2 服务器负载均衡与HA技术

    为了保证分布式双活数据中心的持续业务提供能力,需要在后端采用服务器负载均衡与HA技术,和前端网络双活配合,实现服务资源的调配和高可用保证。

    2.1 服务器负载均衡

    为了满足高性能和高可靠性的服务需求,将多台服务器通过网络设备相连组成一个服务器集群,每台服务器都提供相同或相似的网络服务。服务器集群前端部署一台SLB[2] 设备,负责根据已配置的均衡策略将用户请求在服务器集群中分发,为用户提供服务,并对服务器可用性进行维护。

    服务器负载均衡可以工作在L4或L7模式下,一般采用L4模式。负载均衡的工作方式有以下两种。

    l DR(Direct Routing)方式。(如图5所示)负载均衡设备对数据流量优化时,采用旁挂方式部署,在此模式下只有客户端的请求报文通过负载均衡设备,服务器的响应报文不经过负载均衡设备,从而减轻负载,有效的避免了其成为网络瓶颈。客户端请求报文的目的地址为虚服务地址(VSIP),此地址由负载均衡设备对外呈现。负载均衡设备分发服务请求时,不改变目的IP地址,而将报文的目的MAC替换为实服务的MAC后直接把报文转发给实服务。

    l NAT方式组网更加灵活,后端服务器可以位于不同的物理位置或不同的局域网内。客户端将发往VSIP的请求发送至服务器群前端的负载均衡设备,负载均衡设备上的虚服务接收客户端请求,根据持续性功能、调度算法依次选择真实服务器,再通过网络地址转换,用真实服务器地址重写请求报文的目标地址后,将请求发送给选定的真实服务器;真实服务器的响应报文通过负载均衡设备时,报文的源地址被还原为虚服务的VSIP,再返回给客户,完成整个负载调度过程。

    一般情况下,SLB更加适合在一个数据中心内部部署,而不是跨数据中心部署。因为当SLB跨数据中心部署时,会导致跨中心的广域/城域链路承载流量多,而且跨中心转发一般延迟高,流量路径复杂低效,不利于实现高性能的负载均衡集群(如图7所示)。而GSLB更加适合实现跨数据中心的负载均衡,所以GSLB和SLB配合能够很好的实现从数据中心前端到数据中心内部全路径的负载均衡,以及更好的实现服务器健康状态检测(如图8所示),主要包括:

    l GSLB可针对SLB、服务器做状态监测,可消除单点故障,并引导流量避开性能较低的站点和服务器;

    l 通过收集这些设备的性能测量数据,GSLB可了解网络状态,对包速率、每秒千字节、磁盘、内存、CPU 利用率以及连接数量等参数进行测量。

    2.2 服务器HA技术

    高可用性集群(High Availability Cluster,HA Cluster)是以减少服务器中断时间为目的实现故障屏蔽的服务器集群技术,主要包括可靠性和容错性两方面。在这种高可用集群环境下,若某台服务器出现故障导致服务中断,预先设定的接管服务器会自动接管相关应用并继续对用户提供服务,具有更高的可用性、可管理性和更优异的可伸缩性。HA Clusters是可用于“热备模式容灾”的集群技术(如表1所示),其技术特点是:

    l 需要共享存储资源(磁盘卷或是复制卷),HA集群可在同城或较近距离内部署;

    l 对客户端来说,集群只有一个IP地址,由Active节点响应ARP;

    l 需要一个独立的网络做节点之间的进程通信(心跳);

    l 心跳网络对传输延迟不敏感(如微软MSCS要求的最小心跳间隔是1秒),因此两节点间的传输延迟小于500ms即可;

    l 因为对外只有一个虚IP地址,所有节点需在一个网段(二层互联);

    双节点的高可用性集群典型的工作方式有以下两种。

    l 主/主( Active/Active) 。集群中两节点同时运行各自的应用并且相互监控对方的情况, 当一台主机宕机后,预先设定好的另一台主机立即接管它的一切工作。这种工作方式允许最大程度的利用硬件资源,一般要求各节点具有相等或相似的处理能力,所有的服务在故障转移后仍保持可用。

    l 主/从( Active /Standby) 。主机工作,从机处于监控准备状况。当主机宕机后,从机接管主机的一切工作,继续为客户机提供服务,待主机恢复正常后,用户可以自行设定以自动或手动方式将服务从Standby 上切换到Active 上,也可不切换。

    厂商名称简要说明

    IBM? HACMP应用于小型机的高可用服务器集群技术

    OracleRAC数据库应用集群技术

    Microsoft? MSCS应用于X86 Windows环境的服务器集群技术

    VMware? SRM应用于虚拟化环境下的服务器集群技术

    表1 常见的HA CLUSTER 产品

    2.3 延时对服务器集群部署的影响

    与传统IP网络应用能够容忍较大的网络传输延时不同,存储网络对传输延时非常敏感。由于服务器集群成员一般是共享存储,所以必须考虑存储延时对服务器集群部署的影响。

    以通信线路SDH 155M链路(其中50M用于存储业务)为例,经过测算:光纤距离为50KM(典型的同城距离)时的单向延时为1.51 ms,正常存储系统能够接受;光纤距离为1000KM(典型的异地距离)时的单向延时为7.26 ms,将导致共享存储部署时服务器应用能力急剧下降到不可接受的程度。可见,距离因素对传输延时的影响巨大。

    因此在“两地三中心”数据中心灾备方案中,远距离的异地范围要部署采用异步复制的暖备灾备方案(如图9所示),即采用广域链路如SDH、ATM或IP相连,通过存储异步复制方式实现灾备功能;同城范围内则可以部署基于共享存储的服务器HA方案(如图10所示),即两个中心之间用裸光纤、波分或SDH项链,通过存储同步复制方式部署HA Cluster,在这种部署环境下,主备中心之间需要二层互联以满足集群成员之间二层通信需求,同时还需要SAN互联以实现数据同步复制。

    3 数据分布式双活技术

    3.1 数据库分布式双活技术

    目前主要的数据库备份技术有两种。

    l 主-备方式

    (如图11所示)主数据库服务器(PRIMARY)承担生产业务,备用数据库服务器(STANDBY)只完成数据复制功能。当主数据库中发生事务操作时,会同时将日志文件通过TCP/IP协议传送到备用数据库服务器,然后备用数据库对接受到的日志文件进行重放(Replay),从而保持与主数据库的一致性。当主数据库发生故障时,备用数据库服务器才会接管主数据库服务器的事务处理。此时,备用数据库服务器作为新的主数据库服务器进行数据库的读写操作,而客户端应用程序的数据库连接可以通过自动客户端重新路由机制转移到新的主服务器。当原来的主数据库服务器被修复后,又可以作为新的备用数据库服务器加入系统。主流的数据库(如IBM DB2、Oracle、SQL Server等)都支持通用主-备方式数据备份技术,金融行业业务以该备份方式为主。

    l 双活数据库备份技术

    随着技术的发展,出现了更加先进的双活数据库备份技术(如图12所示),采用双活数据库备份技术的主、备数据库能够同时承担生产业务并且实现备份功能,即主-主方式的数据库双活技术。极大提高数据库的利用效率。

    双活数据库备份技术在源数据库端实时读取交易日志数据,捕获数据的变化部分并暂存到队列中,然后将变化的数据经过压缩和加密后通过网络传送到目的地。在目的数据库端,变化的数据被还原为标准的SQL语句提交到目的库实现修改数据的备份功能。这个备份过程是双向复制的,即可以从目的端向源端数据库做类似的复制。双活数据库备份技术能够支持灵活的拓扑复制结构(包括单向、双向、点对多点、集中和分级等方式),如图13所示。

    双活数据库备份技术可以应用于高可用的容灾备份环境中,最大化利用灾备中心的IT设施,实现加倍的计算能力,提升系统整体性能,实现双中心负载均衡,改善地域分布,提高系统及网络响应实现分布式双活的数据库,双向复制,同时两端数据库都是活动的,可以对两端的数据库同时进行操作,并保证两端数据库的同步。

    双活数据库备份技术提供异构环境下交易数据的实时捕捉、变换、投递,支持多种类型的异构数据库(如Oracle、DB2 UDB、Microsoft SQL Server、Sybase ASE、Teradata、Ingres、 Enscribe、SQL/MP、SQL/MX)和操作系统平台(如Windows 2000/2003/ XP、Linux、Sun Solaris、HP NonStop、HP-UX、HP TRU64、IBM AIX、IBM z/OS)。

    3.2 存储分布式双活技术

    在容灾备份的存储应用环境中,有两种典型的存储备份工作方式。

    l 主-备方式

    这是主流存储厂商如EMC、IBM、HDS等都支持的存储备份方式,即建立物理上独立的两个存储系统之间的完全的、实时的数据镜像,数据中心现场发生灾难时,确保另有一套完整的生产数据安全可用,达到容灾级别的数据高可用性。由于传统的存储备份技术是采用主备方式,从而决定了主中心和灾备中心也工作在主动-被动方式,即在同城灾备中心建立主中心的同步镜像备份,当主中心出现故障不能工作时灾备中心利用备份的存储数据接管主中心工作.

    该备份技术广泛应用于各个行业,特别是在追求安全稳定高可靠地金融行业。

    l 分布式双活存储技术

    存储分布式双活解决方案基于存储虚拟化技术实现,用于数据中心内、跨数据中心和在数据中心之间进行信息虚拟化、访问、共享和迁移。本地联合提供站点内信息基础架构的透明协作;分布式联合提供跨远距离两个位置的读写访问能力。随着技术的不断发展,存储分布式双活技术逐步成熟,为实现分布式双活数据中心打下了良好的基础。

    存储分布式双活方案承载于一个硬件与软件虚拟化平台,作为基于存储虚拟化的解决方案,可实现本地和分布式数据中心存储。通过部署存储分布式双活技术,跨数据中心实现了统一的逻辑存储映像,进而支撑分布式双活数据中心业务实现,如图15所示。

    存储分布式双活技术对数据中心产生重要的价值。

    ? 提高数据中心可用性:分布式中心都承担生产工作负载并且同时互相提供恢复能力;

    ? 提高资产利用率:被动的备份中心价格昂贵并且通常闲置资源,存储分布式双活使得原来的被动备份中心也成为了承担生产任务的主中心;

    ? 提高性能(局部访问数据):数据不需要从“生产”站点读取,在两个站点上可以读写访问同样的数据

    4 结束语

    随着数据中心的建设和技术发展,分布式双活数据中心已经成为当前的技术热点。而实现分布式双活的数据中心是一个具有挑战性的系统工程,涉及到数据中心的网络系统、服务器系统、数据库系统和存储系统等多个系统的分工合作。随着数据库与存储双活技术的发展,未来分布式双活数据中心将消除数据层面对双活的限制,从而具有更好的灵活性。

    展开全文
  • [转载]分布式双活数据中心 转自https://blog.csdn.net/techsupporter/article/details/52551324 分布式双活数据中心在传统“两地三中心”模式的基础上,针对不同双活模型部署不同的技术。基于IP地址发布业务...
        

    [转载]分布式双活数据中心

    分布式双活数据中心在传统“两地三中心”模式的基础上,针对不同双活模型部署不同的技术。基于IP地址发布业务的数据中心在前端网络的Ingress方向(客户端到服务器)上需要设备支持RHI特性,在Egress方向(服务器到客户端)上需要配置网关分离。在数据中心后端需要部署服务器负载均衡与HA,以及数据分布式双活技术。基于域名发布业务的数据中心在前端网络需要采用全局负载分担设备(GSLB)进行选路。以下将对各类实现方式与技术进行介绍分析。

    1 数据中心前端分布式双活网络技术

    在分布式双活数据中心网络环境下,通过数据中心前端分布式双活技术,用户能快速访问“距离最近”的可用数据中心相对应的业务,提高服务响应速度,提升用户访问体验。数据中心的业务对外发布时,可以采用纯IP地址也可以采用DNS域名方式。根据业务对外发布方式的不同,数据中心前端也相应采用不同的技术实现分布式网络双活。

    1.1 纯IP地址方式发布业务的前端网络双活技术

    所示,当业务采用纯IP方式对外发布时,正常情况下只有主中心DC A对外发布业务路由,从而将用户访问流量牵引到主中心,实现主中心业务访问。而备中心DC B的流量管理设备(支持RHI特性)只探测业务地址,因没有探测到而不对外发布业务路由,实现主中心的备份作用。

    当主中心业务迁移到备中心后,备中心的流量管理设备探测到业务IP已经转移到备中心,从而对外发布业务路由,引导用户访问备中心的业务IP,从而实现基于纯IP发布业务的数据中心前端网络双活。

    值得注意的是,该方案需要备中心流量管理设备支持RHI特性(如图2所示),能够对外发布路由。数据中心间需配置网关分离(如采用ACL方式对相关报文进行控制)。若数据中心互联采用EVI方式,则天然支持网关分离,无需配置。

    1.2 域名方式发布业务的前端网络双活技术

    当业务系统基于DNS域名方式对外发布时,可以采用基于智能DNS解析的GSLB[1]。GSLB解决了第一步即引导数据中心前端广域网用户流量访问适当的数据中心问题,所以GSLB的应用环境往往是基于域名的多数据中心之间的负载分担和相互之间的容灾备份。

    GSLB 基于DNS的流量管理机制主要完成DNS解析请求的负载均衡、服务器状态监控、用户访问路径优化。用户访问应用时,域名解析请求将由GSLB负责处理,它通过一组预先定义好的策略,将最接近用户的节点地址提供给用户,使其可以得到快速的服务。同时,它还与分布在各DC的所有GSLB节点保持通讯,搜集各节点的健康状态,以保证不将用户的请求分配到任何一个已经不可用的节点上。GSLB 通过就近探测实现负载分担.

    数据中心A、B、C各部署一个GSLB,其中DC A的GSLB为主GSLB,响应流程如下:

    1. Local DNS向主GSLB发起域名解析请求;

    2. GSLB-A、GSLB-B、GSLB-C将访问local DNS的延迟时间等相关信息返回给GSLB-A汇总,并判断最优的地址返回给local DNS;

    3. 以站点的响应时间作为引导用户的依据,用户的访问请求被导向到性能好,响应时间快的站点。

    DNS方式的GSLB主要功能和特性如下:

    l 应用智能:感知应用,及时发现业务中断;

    l 可管理:自动切换,通知用户改变数据访问点;

    l 高性能:支持流量在数据中心的动态负载均衡。

    2 服务器负载均衡与HA技术

    为了保证分布式双活数据中心的持续业务提供能力,需要在后端采用服务器负载均衡与HA技术,和前端网络双活配合,实现服务资源的调配和高可用保证。

    2.1 服务器负载均衡

    为了满足高性能和高可靠性的服务需求,将多台服务器通过网络设备相连组成一个服务器集群,每台服务器都提供相同或相似的网络服务。服务器集群前端部署一台SLB[2] 设备,负责根据已配置的均衡策略将用户请求在服务器集群中分发,为用户提供服务,并对服务器可用性进行维护。

    服务器负载均衡可以工作在L4或L7模式下,一般采用L4模式。负载均衡的工作方式有以下两种。

    l DR(Direct Routing)方式。(如图5所示)负载均衡设备对数据流量优化时,采用旁挂方式部署,在此模式下只有客户端的请求报文通过负载均衡设备,服务器的响应报文不经过负载均衡设备,从而减轻负载,有效的避免了其成为网络瓶颈。客户端请求报文的目的地址为虚服务地址(VSIP),此地址由负载均衡设备对外呈现。负载均衡设备分发服务请求时,不改变目的IP地址,而将报文的目的MAC替换为实服务的MAC后直接把报文转发给实服务。

    l NAT方式组网更加灵活,后端服务器可以位于不同的物理位置或不同的局域网内。客户端将发往VSIP的请求发送至服务器群前端的负载均衡设备,负载均衡设备上的虚服务接收客户端请求,根据持续性功能、调度算法依次选择真实服务器,再通过网络地址转换,用真实服务器地址重写请求报文的目标地址后,将请求发送给选定的真实服务器;真实服务器的响应报文通过负载均衡设备时,报文的源地址被还原为虚服务的VSIP,再返回给客户,完成整个负载调度过程。

    一般情况下,SLB更加适合在一个数据中心内部部署,而不是跨数据中心部署。因为当SLB跨数据中心部署时,会导致跨中心的广域/城域链路承载流量多,而且跨中心转发一般延迟高,流量路径复杂低效,不利于实现高性能的负载均衡集群(如图7所示)。而GSLB更加适合实现跨数据中心的负载均衡,所以GSLB和SLB配合能够很好的实现从数据中心前端到数据中心内部全路径的负载均衡,以及更好的实现服务器健康状态检测(如图8所示),主要包括:

    l GSLB可针对SLB、服务器做状态监测,可消除单点故障,并引导流量避开性能较低的站点和服务器;

    l 通过收集这些设备的性能测量数据,GSLB可了解网络状态,对包速率、每秒千字节、磁盘、内存、CPU 利用率以及连接数量等参数进行测量。

    2.2 服务器HA技术

    高可用性集群(High Availability Cluster,HA Cluster)是以减少服务器中断时间为目的实现故障屏蔽的服务器集群技术,主要包括可靠性和容错性两方面。在这种高可用集群环境下,若某台服务器出现故障导致服务中断,预先设定的接管服务器会自动接管相关应用并继续对用户提供服务,具有更高的可用性、可管理性和更优异的可伸缩性。HA Clusters是可用于“热备模式容灾”的集群技术(如表1所示),其技术特点是:

    l 需要共享存储资源(磁盘卷或是复制卷),HA集群可在同城或较近距离内部署;

    l 对客户端来说,集群只有一个IP地址,由Active节点响应ARP;

    l 需要一个独立的网络做节点之间的进程通信(心跳);

    l 心跳网络对传输延迟不敏感(如微软MSCS要求的最小心跳间隔是1秒),因此两节点间的传输延迟小于500ms即可;

    l 因为对外只有一个虚IP地址,所有节点需在一个网段(二层互联);

    双节点的高可用性集群典型的工作方式有以下两种。

    l 主/主( Active/Active) 。集群中两节点同时运行各自的应用并且相互监控对方的情况, 当一台主机宕机后,预先设定好的另一台主机立即接管它的一切工作。这种工作方式允许最大程度的利用硬件资源,一般要求各节点具有相等或相似的处理能力,所有的服务在故障转移后仍保持可用。

    l 主/从( Active /Standby) 。主机工作,从机处于监控准备状况。当主机宕机后,从机接管主机的一切工作,继续为客户机提供服务,待主机恢复正常后,用户可以自行设定以自动或手动方式将服务从Standby 上切换到Active 上,也可不切换。

    厂商名称简要说明

    IBM? HACMP应用于小型机的高可用服务器集群技术

    OracleRAC数据库应用集群技术

    Microsoft? MSCS应用于X86 Windows环境的服务器集群技术

    VMware? SRM应用于虚拟化环境下的服务器集群技术

    表1 常见的HA CLUSTER 产品

    2.3 延时对服务器集群部署的影响

    与传统IP网络应用能够容忍较大的网络传输延时不同,存储网络对传输延时非常敏感。由于服务器集群成员一般是共享存储,所以必须考虑存储延时对服务器集群部署的影响。

    以通信线路SDH 155M链路(其中50M用于存储业务)为例,经过测算:光纤距离为50KM(典型的同城距离)时的单向延时为1.51 ms,正常存储系统能够接受;光纤距离为1000KM(典型的异地距离)时的单向延时为7.26 ms,将导致共享存储部署时服务器应用能力急剧下降到不可接受的程度。可见,距离因素对传输延时的影响巨大。

    因此在“两地三中心”数据中心灾备方案中,远距离的异地范围要部署采用异步复制的暖备灾备方案(如图9所示),即采用广域链路如SDH、ATM或IP相连,通过存储异步复制方式实现灾备功能;同城范围内则可以部署基于共享存储的服务器HA方案(如图10所示),即两个中心之间用裸光纤、波分或SDH项链,通过存储同步复制方式部署HA Cluster,在这种部署环境下,主备中心之间需要二层互联以满足集群成员之间二层通信需求,同时还需要SAN互联以实现数据同步复制。

    3 数据分布式双活技术

    3.1 数据库分布式双活技术

    目前主要的数据库备份技术有两种。

    l 主-备方式

    (如图11所示)主数据库服务器(PRIMARY)承担生产业务,备用数据库服务器(STANDBY)只完成数据复制功能。当主数据库中发生事务操作时,会同时将日志文件通过TCP/IP协议传送到备用数据库服务器,然后备用数据库对接受到的日志文件进行重放(Replay),从而保持与主数据库的一致性。当主数据库发生故障时,备用数据库服务器才会接管主数据库服务器的事务处理。此时,备用数据库服务器作为新的主数据库服务器进行数据库的读写操作,而客户端应用程序的数据库连接可以通过自动客户端重新路由机制转移到新的主服务器。当原来的主数据库服务器被修复后,又可以作为新的备用数据库服务器加入系统。主流的数据库(如IBM DB2、Oracle、SQL Server等)都支持通用主-备方式数据备份技术,金融行业业务以该备份方式为主。

    l 双活数据库备份技术

    随着技术的发展,出现了更加先进的双活数据库备份技术(如图12所示),采用双活数据库备份技术的主、备数据库能够同时承担生产业务并且实现备份功能,即主-主方式的数据库双活技术。极大提高数据库的利用效率。

    双活数据库备份技术在源数据库端实时读取交易日志数据,捕获数据的变化部分并暂存到队列中,然后将变化的数据经过压缩和加密后通过网络传送到目的地。在目的数据库端,变化的数据被还原为标准的SQL语句提交到目的库实现修改数据的备份功能。这个备份过程是双向复制的,即可以从目的端向源端数据库做类似的复制。双活数据库备份技术能够支持灵活的拓扑复制结构(包括单向、双向、点对多点、集中和分级等方式),如图13所示。

    双活数据库备份技术可以应用于高可用的容灾备份环境中,最大化利用灾备中心的IT设施,实现加倍的计算能力,提升系统整体性能,实现双中心负载均衡,改善地域分布,提高系统及网络响应实现分布式双活的数据库,双向复制,同时两端数据库都是活动的,可以对两端的数据库同时进行操作,并保证两端数据库的同步。

    双活数据库备份技术提供异构环境下交易数据的实时捕捉、变换、投递,支持多种类型的异构数据库(如Oracle、DB2 UDB、Microsoft SQL Server、Sybase ASE、Teradata、Ingres、 Enscribe、SQL/MP、SQL/MX)和操作系统平台(如Windows 2000/2003/ XP、Linux、Sun Solaris、HP NonStop、HP-UX、HP TRU64、IBM AIX、IBM z/OS)。

    3.2 存储分布式双活技术

    在容灾备份的存储应用环境中,有两种典型的存储备份工作方式。

    l 主-备方式

    这是主流存储厂商如EMC、IBM、HDS等都支持的存储备份方式,即建立物理上独立的两个存储系统之间的完全的、实时的数据镜像,数据中心现场发生灾难时,确保另有一套完整的生产数据安全可用,达到容灾级别的数据高可用性。由于传统的存储备份技术是采用主备方式,从而决定了主中心和灾备中心也工作在主动-被动方式,即在同城灾备中心建立主中心的同步镜像备份,当主中心出现故障不能工作时灾备中心利用备份的存储数据接管主中心工作.

    该备份技术广泛应用于各个行业,特别是在追求安全稳定高可靠地金融行业。

    l 分布式双活存储技术

    存储分布式双活解决方案基于存储虚拟化技术实现,用于数据中心内、跨数据中心和在数据中心之间进行信息虚拟化、访问、共享和迁移。本地联合提供站点内信息基础架构的透明协作;分布式联合提供跨远距离两个位置的读写访问能力。随着技术的不断发展,存储分布式双活技术逐步成熟,为实现分布式双活数据中心打下了良好的基础。

    存储分布式双活方案承载于一个硬件与软件虚拟化平台,作为基于存储虚拟化的解决方案,可实现本地和分布式数据中心存储。通过部署存储分布式双活技术,跨数据中心实现了统一的逻辑存储映像,进而支撑分布式双活数据中心业务实现,如图15所示。

    存储分布式双活技术对数据中心产生重要的价值。

    ? 提高数据中心可用性:分布式中心都承担生产工作负载并且同时互相提供恢复能力;

    ? 提高资产利用率:被动的备份中心价格昂贵并且通常闲置资源,存储分布式双活使得原来的被动备份中心也成为了承担生产任务的主中心;

    ? 提高性能(局部访问数据):数据不需要从“生产”站点读取,在两个站点上可以读写访问同样的数据

    4 结束语

    随着数据中心的建设和技术发展,分布式双活数据中心已经成为当前的技术热点。而实现分布式双活的数据中心是一个具有挑战性的系统工程,涉及到数据中心的网络系统、服务器系统、数据库系统和存储系统等多个系统的分工合作。随着数据库与存储双活技术的发展,未来分布式双活数据中心将消除数据层面对双活的限制,从而具有更好的灵活性。

    展开全文
  • 今天和大家一起聊聊双活数据中心,即双活IDC. 什么是双活数据中心 ? 首先我们要知道双活就是Active-Active,故名思义就是两边都是活动在线提供服务的,是相对于传统的主备模式Active-Standby模式的。一个真正的双活...
  • 针对数据中心双活解决方案如何构建,笔者把大家常见的疑问和问题进行汇总,加上我个人的见解写成一篇比较全面的文章,分享出来供大家参考。由于工作原因,可能今后近一个月的时间不能给及时大家写文章了,但是过了这...
  • HPE 3PAR存储有个非常有用的特性叫Storage Federation(存储联邦),存储联邦特性主要解决多个存储数据敏捷性和流动性,主要包括Peer Motion、Online Import 和 Peer Persistence三个特性,Peer Motion和Online Import...
  • 双活数据中心技术架构(PDF版) https://mp.weixin.qq.com/s/aAuI7m8fAhj3x3tD-Hqxjg 数据中心运维管理昨天
  • 对于云环境下的企业来...但是对于不同行业的业务类型,其互联网应用对于IT系统容灾有不同的要求,今天主要以Vmware NSX与F5的集成系统为例,讨论如何构建出高可用的双活数据中心。   F5和Vmware NSX集成构建双活数...
  • 对于正在转型的企业,架构双活数据中心也是提高运营效率的刚需了。那么如何平衡数据中心的稳定、可靠和应用的灵捷、弹性呢?我以F5公司的双活数据架构为例,来和大家探讨下。 基于F5 BIG-IP DNS 及 NSX 实现微服务多...
  • 双活数据中心解决方案(最新)_图文_百度文库 双活数据中心解决方案(最新)_图文_百度文库单元化与分布式架构的切分问题 – 后端技术 by Tim Yang po...
  • 数据中心双活该如何构建

    万次阅读 2016-04-25 21:54:24
    双活本身其实有广义和狭义之分,但是在数据中心这个前提下,我们所说的双活就是广义上的应用、网络、存储和数据的端到端的数据中心双活,顾名思义,应用、网络、存储都应该是双活状态,当然在项目部署和实施过程中,...
  • 出于灾备的目的,用户一般会建设两个(或多个)数据中心,一个主数据中心用于承载业务的运行,另一个备份数据中心用于备份主数据中心的数据和应用。一旦发生灾难,主数据中心宕机,备份数据...因此双活数据中心的...
  • 接下来我们将以某省移动运营商为例,介绍其是如何从传统灾备系统建设迈向双活数据中心的。 方案背景 1 问题提出 2014年6月,XX移动接到集团业务连续性检查要求,...
  • 深入剖析Vplex双活数据中心存储方案

    万次阅读 2017-09-23 00:00:00
    EMC上一代存储双活方案是通过vPlex网关产品实现,具备异构其他厂商存储的能力,将各厂商存储虚拟化为统一的存储池,为上层服务器提供存储资源。从2010年vPlex发布以来其的硬件已经更新了VS1、VS2和VS6三代。2016年...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 1,061
精华内容 424
关键字:

vmware双活数据中心