精华内容
下载资源
问答
  • 干货丨一文带你了解灾备系统的衡量指标
    2021-02-26 15:06:55

    本文转自@灾备有道,作者:Q先生。

    灾备恢复的衡量指标

    核心指标:RTO,RPO

    RTO(Recovery Time Objective)
    RTO是指灾难发生后,从IT系统崩溃导致业务停顿开始,到IT系统完全恢复,业务恢复运营为止的这段时间长度。RTO用于衡量业务从停顿到恢复的所需时间。

    RPO(Recovery Point Objective)
    IT系统崩溃后,可以恢复到某个历史时间点,从历史时间点到灾难发生的时间点的这段时间长度就称为RPO。RPO用于衡量业务恢复所允许丢失的数据量。

    我们来举个例子,假设在业务系统正常运行的情况下,随着时间的推移,会持续产生新的业务数据。IT运维人员考虑到业务的重要性,小心又谨慎,写了个脚本对业务系统进行周期性的备份。

    虽然机智的IT运维人员已经非常小心,但是还是避免不了系统出现故障。在发现系统故障后,IT运维人员迅速响应,利用最近一次的备份数据进行恢复。经过漫长的等待,IT系统最终恢复正常。

    从上图可以直观看出,RPO是 “备份时间点” 到 “IT系统出现故障” 的时间长度,RTO是指 “IT系统出现故障” 到 “IT系统恢复正常” 的时间长度。

    在RPO的这段时间内,存在一部分实际数据的丢失,所以一般认为RPO越小,丢失的数据量就越小。在RPO+RTO的这段时间内,本来有预期的业务数据增长,但由于IT系统故障需要时间修复,这部分的预期增长就损失掉了。可见RTO+RPO越小,对业务营收的损失也就越小。因此,越重要的业务越需要保证RPO和RTO趋近于0,当然所需要的投入也就越大。RPO和RPO也成为衡量灾难恢复的最核心指标。

    其他指标

    随着灾备技术的不断升级,灾备系统的建设越来越复杂,就开始出现了一些新的指标。虽然这里边部分指标实在是不怎么知名,但为了满足大家的好奇心,还是费点周折,给大家解释一下。

    RRO(Recovery Reliability Objective)
    恢复可靠性指标RRO,用于衡量业务恢复的可靠性。如果一个业务连续性系统在10次恢复/切换中出现了2次失败,那么这个可靠性就只有80%。虽然成功的恢复/切换可以帮助你短时间内的恢复业务,但如果恢复/切换失败了,那可能就需要花更多的时间来排查和解决问题。因此,将RRO和RTO结合起来可以更好的评估灾难恢复的时间。

    基于上面的案例,假设IT运维人员写了不错的备份脚本,但是恢复脚本没有经过详细的测试,质量不咋滴。在IT系统修复过程中,总出现恢复失败的情况,需要边定位失败的原因边进行恢复。那么我们就可以认为这个脚本的RRO指标很低,会导致RTO变长。

    RIO (Recovery Integrity Objective)
    当灾备系统因为逻辑错误或数据丢失,就会造成实际恢复/切换的数据同样存在逻辑错误,或者数据丢失/不完整的情况。因此,单独的RPO不能保证灾备系统对数据丢失的防范能力,故引入恢复完整性指标****RIO。RIO指标可以反映出业务系统灾难恢复到某个正确完整的状态的能力。

    基于上面的案例,假设IT运维人员写的备份脚本也出了问题,数据恢复是恢复出来了,但是只恢复了一部分,还有一部分数据因为脚本存在bug漏备了。那么我们就可以认为这个脚本的RIO指标也很低,RPO数据丢失的基础上再添损失。 说到这里,可怜的IT运维人员背了锅,也许你该考虑采购专业的灾备产品了。

    DOO(Degraded Operations Objective)
    DOO 是指灾难事件发生期间数据中心不可用时,关键业务系统在灾备中心运行的服务级别允许降低到一个可接受程度。这意味着灾难事件发生时,为了加快恢复速度,可以允许关键业务恢复到一个较低的服务级别,这个事先确定的允许降低的服务级别就是 DOO。
    服务降级一般是由IT系统本身提供的能力,并不由灾备厂商来提供,当然专业的业务连续性管理也会将IT系统本身的容错、服务降级能力考虑在内。

    NRO(Network Recovery Objective)
    网络恢复目标NRO 是指在灾难发生后切换到灾备中心所需的时间。在这一预定时间内不仅要求将网络连接从数据中心切换到灾备中心,还要使用户的网络访问能够成功地转移到灾备中心。

    灾备恢复的三个层次

    在行业中,一般认为灾备分为3个等级:**数据级灾备、应用级灾备、业务级灾备。**其中数据级和应用级的灾备一般都在IT系统的范畴,可以通过专业的灾备产品做到。业务级灾备在数据级、应用级的基础上,还需要对IT系统之外的因素进行保障,比如办公地点、办公人员等等。

    数据级灾备的关注点在于保证用户的数据不会丢失或者遭到破坏。高级的数据级灾备会考虑将本地的通过某些手段(人工/灾备工具)保存到异地。而应用级灾备更强调实际的IT系统可以在遇到灾难后能够直接接管。一般来讲应用级灾备需要在异地灾备中心有完整的设备、网络条件,借助专业灾备产品做到生产中心到灾备中心的数据同步。

    国际标准SHARE78的七级灾备

    目前,通用的灾难恢复标准采用的是 1992 年在 AnaheimM028 会议上制定的 SHARE78 标准。根据定义,灾备方案可以根据以下主要方面所达到的程度而分为七级:

    Tier0 层:没有异地数据 (No off-site Data)
    即没有任何异地备份或应急计划。数据仅在本地进行备份恢复,没有数据送往异地。

    Tier1 层:PTAM 卡车运送访问方式 (Pickup Truck Access Method)
    异地备份 , 能够备份所需要的信息并将它存储到异地。PTAM 指将本地备份的数据用交通工具送到远方。这种方案相对来说成本较低,但难于管理。

    Tier2 层:PTAM 卡车运送访问方式 + 热备份中心 (PTAM + Hot Center)
    相当于 Tier1 再加上热备份中心能力。热备份中心就是指在异地制定相应的灾难恢复计划,将运送到此处的数据定期的进行恢复,以确保生产中心出现灾难后热备份中心可以尽快接管。当然,热备份中心拥有足够的硬件和网络设备去支持关键应用。

    Tier3 层:电子链接 (Electronic Vaulting)
    在 Tier2 的基础上用网络传输取代了卡车进行数据的传送。

    Tier4 层:活动状态的备份中心 (Active Secondary Center)
    指两个中心同时处于活动状态并同时互相备份。在这种场景下,两中心通过备份软件系统进行周期性的备份和恢复。在灾难发生时,关键应用的恢复也可降低到小时级或分钟级。

    Tier5层:两个活动的数据中心,确保数据一致性的两阶段提交(Two-Site Two-Phase Commit)
    它提供了更好的数据完整性和一致性。Tier5 要求两中心的数据能够同时更新。在灾难发生时,仅是传送中的数据被丢失,恢复时间被降低到分钟级。

    Tier6 层:0 数据丢失 (Zero Data Loss),自动系统故障切换
    Tier6 可以实现 0 数据丢失,是灾难恢复的最高级别,在本地和远程的所有数据被更新的同时,利用了双重在线存储和网络切换能力,当发生灾难时,能够提供跨站点动态负载平衡和自动系统。

    更多相关内容
  • 鲲鹏 BCManager 存储灾备系统详解

    千次阅读 2021-10-24 14:01:24
    鲲鹏 BCManager 存储灾备系统详解

    鲲鹏云服务搭建BCManager存储灾备系统

    鲲鹏云服务:华为基于鲲鹏自研芯片和服务器开发的公有云资源
    BCManager:华为自研容灾备份软件

    一、灾备的概念与作用

    1. 信息与数据

    • 数据是对物理世界所有事物的数字表示(eg:温度、湿度等等)
    • 信息是经过加工处理后的数据,用于支持决策(eg:气温降低我们要增加衣服,如果明天下雨我们要准备雨具)
    • 信息与数据对个人、企业、国家都相当重要
    • 数据具有一定的生命周期

      数据产生–>数据处理–>数据传输–>数据展示–>数据应用–>数据销毁

    2. 存储是信息与数据的载体

    • 狭义的存储定义:主要指硬件(eg:CD、DVD、ZIP、磁带、磁盘等)
    • 广义的存储定义
      • 存储硬件系统(磁盘阵列,控制器,磁盘柜,磁带库等)
      • 存储软件(备份软件;管理软件,快照,复制等增值软件)
      • 存储网络(HBA卡,光纤交换机,FC/SAS线缆等)
      • 存储解决方案(集中存储,归档,备份,容灾等)

    3. 存储灾备作用与概念

    • 存储要具备容灾备份能力
      • 灾难无法预知(自然灾害与人为因素)
      • 业务中断,数据丢失,经济与信誉损失巨大
      • 政策监督与企业运营需要
    • 容灾与备份
      • 容灾即灾难发生后恢复业务可用保证数据安全,表征了对灾难的容忍程度
      • 备份即对系统或数据创建副本,用于业务与数据恢复
      • 备份是容灾的一种手段,通常说的灾备是将容灾与备份结合

    4. 灾备系统的关键指标

    • RPO:故障发生后,丢失的数据量或者容忍丢失的数据量
    • RTO:故障发生后,业务恢复可用所需要的时间
    • RPO与RTO越小,系统的可用性就越高,需要的投资也越大
      在这里插入图片描述

    二、灾备的原理与应用

    1. 灾备方案一 • 本地保护

    1.1 灾备方案——本地保护

    • 本方案只涉及生产站点
    • 维护终端:供系统维护人员接入it系统
    • 容灾管理服务器:用于配置管理容灾应用
    • 生产应用主机:可以是公司的文件服务器
    • 生产存储:用于存放公司的共享材料,可以利用快照技术生成特定时刻的副本,一旦源数据不可读取/不可用,可以快速恢复数据到特定时刻
      在这里插入图片描述

    1.2 灾备原理——快照技术

    • 快照技术类似于定格拍照,速度快,占用空间小
    • 通过COW(Copy On Write)技术实现,用于非物理故障恢复场景(比如软件Bug、数据丢失等)
      在这里插入图片描述

    2. 灾备方案二 • 主备容灾

    2.1 灾备方案——主备容灾

    在这里插入图片描述

    2.2 灾备原理——LUN克隆技术

    LUN可以理解为存储的逻辑划分

    • 克隆是源数据在某个时间点的完整副本(不同于快照,快照需要依赖于源LUN才可进行数据恢复,非完整副本,只是临时性的部分副本)
    • 能够在不中断主机业务的情况下实现LUN级别数据的恢复
      在这里插入图片描述

    3. 容灾方案三 • 双活数据中心

    3.1 灾备方案——双活数据中心

    同一时刻,两个生产站点都对外提供服务(不同于主备容灾,主备方案同一时刻只有一个站点对外提供服务)
    可以进一步扩展为多活数据中心

    在这里插入图片描述

    3.2 灾备原理——数据双写与数据变更日志

    • 通过数据双写和数据变更日志机制实现存储层数据的双活,两个数据中心同时对主机提供数据读写的能力
      在这里插入图片描述
      在这里插入图片描述

    4. 灾备方案四 • 两地三中心

    4.1 容灾方案——两地三中心

    在这里插入图片描述

    4.2 灾备原理——存储复制

    • 利用存储同步/异步远程复制功能,将业务数据从生产中心复制到灾备中心,实现生产中心的数据复制和保护
      在这里插入图片描述

    5. 灾备案例 • 某企业OA系统

    在这里插入图片描述

    三、华为灾备方案BCManager介绍

    1. 华为容灾软件OceanStor BCManager

    • 底层存储系统所提供的增值特性:快照、克隆、复制等技术
    • 对各类常见应用系统和文件系统提供数据保护及容灾恢复

    快照:基于原始数据的一部分进行恢复,恢复需要依赖于原始数据
    克隆:原始数据的一个完整副本,恢复不需要原始副本
    复制:两个站点之间同步数据

    2. BCManager 相关概念

    • 生产站点和灾备站点
      • 生产站点:生产系统所在的站点,也是我们要保护的站点,该站点运行企业单位的各类业务系统,即提供服务的站点
      • 灾备站点:灾备系统的站点,可以为生产系统提供灾备能力,当灾难发生时,可以基于该站点恢复业务,根据不同的灾备方案(前面已经提及)提供服务
    • 主机和主机组
      • 主机:生产站点/灾备站点中的应用服务器(生产主机/灾备主机)
      • 主机组:一组主机的集合(一般是同类主机的组合,组内主机通常为同一个型号/操作系统版本/业务类型相似)
    • 保护组(保护对象和保护策略)
      • 将容灾管理系统进行容灾保护的业务对象和保护策略关联起来
      • 保护对象:
        在这里插入图片描述
      • 保护策略:容灾管理系统对保护对象进行容灾保护的保护方式/调度策略(eg:多久一次备份,备份哪些数据,备份的速率,备份的时间点)
    • 恢复计划
      • 容灾管理系统进行容灾恢复的业务对象,用户可以对恢复计划执行测试、清理、计划性迁移、重保护、故障恢复、切换等容灾业务操作

    3. BCManager 软件架构

    • 基于B/S架构(Browser/Server)架构进行容灾管理
    • 支持安装在windows和Linux操作系统上
      在这里插入图片描述

    四、华为云搭建BCManager环境

    1. 实验拓扑介绍

    • ECS:作为业务主机承载应用
    • estor安装存储模拟器,提供存储资源
    • BCManager:部署灾备软件,用来实现业务主机上文件的容灾恢复
      在这里插入图片描述

    2. 磁盘阵列 DiskArray 简介

    • 磁盘阵列就是包含一堆磁盘的存储设备在这里插入图片描述

    3. IP-SAN简介

    • 硬盘域、存储池
      • 硬盘域:一堆磁盘,由同种类型/不同类型的硬盘组合而成,不同硬盘域间的业务相互隔离
      • 存储池:创建在硬盘域中的,由若干不同性能的硬盘按照一定的规则组成
    • LUN(组)
      • 逻辑单元号,从存储池中获取存储空间,LUN是应用服务器能够识别的最小存储逻辑单元
      • 一个LUN组可以包含一个或多个LUN
    • 主机(组)
    • 存储映射与使用
    • estor模拟器
      在这里插入图片描述

    4. 华为云服务——网络

    • VPC:虚拟私有云(Virtual Private Cloud):提供隔离的网络环境
    • EIP:Elastic IP:可向外访问公网,对公网提供服务
    • 安全组及规则:放通/禁止对应的服务/端口
      在这里插入图片描述

    5. 华为云服务——鲲鹏计算(基于ARM和RISC)

    • ECS:Elastic Cloud Server,弹性云服务器
      在这里插入图片描述

    6. 华为云服务——对象存储OBS服务

    • 对象(Object)
    • 桶(bucket)
    • AK和SK
      在这里插入图片描述

    五、BCManager灾备实验

    1. 云环境准备

    2. 部署存储环境

    • 发放业务主机
    • 制作estor镜像
      • 通过OBS上传
    • 部署estor存储
    • 配置SAN业务

    3. 部署BCManager

    • 发放鲲鹏ECS
    • 部署BC软件
    • 登录BC管理端

    4. 灾备测试

    • 添加站点及资源
    • 配置保护组
    • 数据误删恢复
    • 释放资源

    最后,欢迎大家关注我的个人微信公众号 『小小猿若尘』,获取更多IT技术、干货知识、热点资讯。同时,我在公众号中分享了精心整理的一些视频资料(包括 Python全栈教程、AI教程、前端、数据库等),大家回复相应关键词即可获取网盘视频链接,感谢大家的关注😊

     在这里插入图片描述

    展开全文
  • 很好的数据中心灾备系统建设方案,帮您解决应用之优。
  • 容灾系统、灾备系统解决方案.ppt
  • 两地三中心灾备系统平台解决方案
  • 容灾系统及灾备系统建设解决方案共47页.pptx
  • 中国进出口银行灾备系统项目选择了CA公司的CA BEB产品,决定通过桥接器来实现带库备份网络架构从LAN到SAN的转移。硬件架构:利用现有SAN环境,将STK L80带库从备份服务器的SCSI直连剥离,通过一台SCSI to Fiber ...
  • CommVault灾备系统恢复手册_v11
  • 灾备系统实施方案

    2015-02-06 09:38:22
    灾备系统实施方案,是系统集成项目人员参考案例,对进一步掌握信息化建设提供参考。
  • 1、备份和容灾体系的现状和目标 2、CDP灾备一体化技术介绍 3、持续数据保护平台灾备系统案例分析
  • 综合业务异地灾备系统三层异构云服务平台.pdf
  • 1.2. 系统存在问题 XXX政法系统由公安、检察、法院、司法等系统构成,各系统经调研存在以下问题: 1) 数据安全性有待加强 目前有的系统没有备份,有的系统只有本地备份,在出现系统崩溃、或本地备份中心不可预料的...
  • 灾备建设意义 灾备设计方法 华为灾备解决方案 华为的优势 成功案例
  • 前言   随着信息技术和网络技术的发展,特别是互联网的发展,使电力行业信息化实现了跨越式发展。电力企业作为国家支柱型企业,又因其具有技术...同时,普遍建立了用电管理信息系统,地(市)级供电企业基本实...

    前言

     

    随着信息技术和网络技术的发展,特别是互联网的发展,使电力行业信息化实现了跨越式发展。电力企业作为国家支柱型企业,又因其具有技术密集、资产密集特点,决定了其信息化体系完善和发展的重要性。信息技术基础条件提升, 使得各电力公司本部主要岗位工作人员使用计算机的比例接近100%,各省电力公司本部局域网覆盖本部机关业务工作达90%以上。同时,普遍建立了用电管理信息系统,地(市)级供电企业基本实现业务受理的计算机化。国家电网公司所属各级公司积极开展管理信息系统的建设,开发了生产、设备、安全监督、电力负荷、营销管理等企业管理信息系统,实现了办公环境网络化和计算机化。

    因此,在电力信息化建设中,除了加强信息系统建设过程中的质量管理及运行安全管理外,采取容灾措施防范系统风险,也是保障电力信息系统安全运行的重要手段。

     

    行业概况

     

    系统概况

    电力生产由发电厂发电,经过升压送入智能电网进行统一调配,输送到各地,再降压送到终端用户使用。这一系列过程中,电网的监控与调配起着核心关键作用,它保障了整个电网的协调运行。我国电网调度采取了分层设计,分为县级、地区级、省级、大区级和国家层级。其中最重要的是大区级调度中心,如华北、华中、华东、西北、西南电网等等,这些大区调度中心承担着具体的电力监控调度职能。我国自行研制的Open3000、DMIS或新一代的D5000电网调度自动化管理系统是电网的核心监控调度系统。

    D5000智能电网调度控制系统是电力调度系统的基础平台及核心,它是按照等级保护四级系统保护要求,基于国产服务器和网络设备,采用国产B级安全操作系统,国产安全数据库,国产中间件等基础软件的分布式一体化调度支持平台。

     

    某省电力调度机房I区的业务服务器分布情况

     

    存在问题

     

    由于各个网调、省调的业务系统非常重要,针对系统及硬件可能出现的不可靠性,电力调度系统已经采取了不同的措施来确保业务系统的持续不间断运行。针对重要系统,如scada、前置服务器、通讯服务器,大多都采用了双机甚至多机热备的形式。

    但是,这种保护机制依然存在较大的缺陷:

    (1)双机热备软件是解决IT系统高可用的需求,即应对的是某一系统组件(例如主机、网络或系统进程)失效时系统可用性的问题,而不能解决数据安全保护的问题。例如,在一个双机系统中出现人为误操作删除数据,双机系统是无法应对的。(核心数据只有一份)

    (2)由于信息系统包括软件系统、硬件系统的复杂性,在日常使用时,不可避免的会带来维护的问题,如软件的升级、故障硬件的更换、修复等工作。一旦其中一台机器需要停机维护时,将直接导致另一台机器处于单机运行状态,这给系统的安全运行带来了极大的威胁。

    (3)目前,各个网调或省调中心的机房里,都运行着大量的服务器。这些服务器及业务系统所带来的维护工作量非常大,维护工作出现差错,很可能导致业务停机,直接影响电力的安全生产。

    如何寻找一种解决方案,能够避免双机这种机制的隐患,降低服务器及系统的维护工作量,减少出错的几率,是电力行业所一直寻求的解决之道。

     

    精容数安保护之道

     

    灾备系统设计原则

     

    1、适度安全

    系统需要安全措施的强度,是与该系统所承担的业务职能和系统的重要性相关的,依据国家相关标准和业务需求,确保重点,平衡成本与风险,达到适度安全、等级灾备,才能真正做到合理的安全防护;

    2、统筹规划

    须充分保证灾备系统的高扩展能力和高容错能力,具有性能调节能力,提供极为充分的可靠性各项指标设计。在项目实施过程中建立一套完善的灾难恢复体系和3-5年滚动发展规划用于指导灾难恢复实施;

    3、资源共享

    充分利用已有的网络基础、业务系统和信息资源,加强整合,建设过程中应确保既能够满足当前灾备的要求,也能满足未来的扩展需求。

    4、开放性

    系统符合开放性设计原则,具备可扩展性和稳定性,对现有技术具有兼容能力,支持开放系统平台,运行于现有或既然将成为标准的各种相关技术标准上。兼顾产品和技术的成熟性,增强信息基础设施的整体稳定性。

    5、充分利旧

    必须充分利用原有数据级的资源,避免重复投资。

    6、可管理性 

    灾备系统需具备统一管理和统一监控能力。

     

    灾备建设关键任务

     

    1、数据级灾备

    1)业务影响分析、应用影响分析;

    2)灾备指标(RTO、RPO)确定;

    3)灾备中心基础设施建设;

    4)数据复制和验证必需的IT基础设施及网络环境建设;

    5)运维、安全、灾备验证等支持能力的构建。

    2、应用级灾备

    1)继承数据级灾备数据复制方式,细化应用影响分析;

    2)应用接管必需的软硬件及网络环境准备、应用同步;

    3)支持灾备切换的平台服务及通用服务建设;

    4)应用级灾备必须的应用改造;

    5)灾备预案的编制、演练;

    6)运维、能力的提升和优化。

     

    灾备架构描述

     

    方位、多角度解决业务连续性问题

     

    数据备份架构

     

     

    一、架构描述

    系统备份

    通常用在快速恢复业务上,举例说明:

    系统故障后的常用处理方式:修复/更换服务器→安装操作系统→安装业务应用→应用配置→恢复业务数据。

    采用系统备份后的处理方式:修复/更换服务器→恢复系统→恢复业务数据。

    可以看到,采用系统备份后的系统恢复将三个步骤减少成一个步骤,大大缩减了系统恢复时间。但是操作系统备份通常只作一次,即配置业务完成,之后的数据备份就可以数据备份代替,第一是大大减少了备份时间,二是节约了备份介质空间。

    数据备份

    数据备份指的是数据包括文件,数据库,应用程序等贮存起来,用于数据恢复时使用。数据备份可以通过定制备份策略,将所有系统数据统一备份到备份介质中,已达到保护数据安全的作用。

    并且,数据备份是最基础的灾备方式,适用于任何系统和平台。

    二、备份策略制定

    日常备份制度描述了每天的备份以什么方式,使用什么备份介质进行,是系统备份方案的具体实施细则。对于备份策略的设定应该结合具体业务、维护需求,需要对备份、恢复策略进行精心设计,在制订完毕后,同样应严格按照制度进行日常备份,否则将无法达到备份方案的目标。

    根据备份存储容量的估算,以下备份策略可作为参考:

    系统名称

    数据类型

    备份策略

    数据库服务器

    数据库

    每天晚上全备;

    每2-4小时备份一次日志

    邮件、监控服务器

    非结构化数据

    每周一次全备;

    每天进行1-2次增量备份

     

     

    三、恢复场景概述

    经过备份方案的规划设计,在出现一般数据丢失时,都可以及时恢复,在出现服务器故障,需要系统重新安装时,也可以在很短的时间内恢复服务器运行,以下我们假设出现一些意外情况,描述下如何对数据进行恢复:

     

    误删除文件

    如果由于意外的误删除了文件服务器上的单个文件或目录,由于每天都有相应的备份,所以可以通过备份系统的恢复功能,找到最新的备份集并展开,点选相应需要的文件或目录进行恢复即可,备份系统进自动去调取相应的备份设备。

     

    误删除数据库

    如果由于意外的误删除了数据库服务器上的记录或文件,丢失了部分或全部数据库记录后,那就要进行数据库的恢复(Restore),我们先通过备份系统找到最新的保留全备份的设备,通过备份系统图形化界面执行恢复操作,并将数据库恢复。

     

    磁盘阵列故障,数据丢失

    如果由于磁盘阵列的故障,导致存储文件或数据库的所有数据丢失,那就要执行全部数据的恢复,我们先通过备份系统找到最新的保留全备份的设备,先执行全备份的恢复,然后再找到全备份后的全部增量备份集(一般是从全备份完成的第二天到故障发生的前天晚上),逐步执行每个增量备份,直到最新的增量备份也被恢复。

     

    应用级灾备架构描述

     

     

    一、架构描述

    该架构要求灾备系统需独立于业务系统,并配置在灾备中心,以便避免发生灾难时,业务系统和灾备系统同时崩溃。

    另外,业务系统和灾备系统必须配置完全一样的应用程序,平时只有业务系统运行,一旦发生故障,灾备系统可以迅速接管过来。

    最后,业务系统和灾备系统必须配置数据同步功能,已确保业务系统发生故障时,灾备系统仍然拥有一套和业务系统完全一致的数据。

    简要配置和原理如下:

    1)灾备系统服务器与业务系统服务器一一对应,通数据复制软件将业务系统服务器的数据实时复制到其对应的灾备系统服务器上;

    2) 完成第一次同步任务后,后续转变为增量同步,所以数据同步对网络带宽的占用是极小的;

    3)当业务系统出现灾难需要切换到灾备系统,无需恢复过程,只需要将灾备系统的应用服务抬起,并将应用流引导至灾备系统即可实现业务接管;

    4)当业务系统恢复,只需把灾备中心数据回传,即可实现业务系统的回切。

    二、容灾运行流程

    以单台服务器容灾为例,容灾运行流程详述如下:

    1) 在业务服务器上安装容灾代理;

    2) 建立起从业务系统到容灾系统的同步任务;

    3) 业务系统正常对外提供服务;

    4) 数据进入业务系统,此时数据变化被容灾代理感知,将数据复制成两份,一份正常写入业务存储,并记录写入日志,另一份数据发送往容灾系统;

    5) 容灾系统接收数据,并记录写入日志;

    6) 容灾系统实时将业务系统和自身的上述日志进行比对,确认两边写入了相同数据,如不同则由容灾代理重发这份数据,保证两端数据实时同步;

    7) 若业务服务器发生故障宕机,容灾服务器感知到这个情况,容灾环境自动或者手动接管服务;

    8) 客户网络自动或手动切换,将业务流量引导至容灾环境(此步骤自动功能需要网络设备支持);

    9) 容灾系统接管对外服务,同时业务服务器接收维修;

    10) 业务服务器维修完毕上线,容灾系统建立反向数据同步,将接管时间内生成的数据写回业务服务器;

    11) 将业务流量切换回业务服务器,业务服务器正式接管服务。

    至此,一个完整的故障切换和业务系统恢复周期成功运行,业务保持了连续性,数据也不会丢失。

     

    方案优势

     

    1支持全国产技术体系,产品具备自主知识产权

    • 国产操作系统:银河麒麟、中标麒麟、普华、凝思、浪潮K1 UNIX

    • 国产数据库:南大通用、人大金仓、神舟通用、达梦

    • 国产虚拟化平台:H3C CAS、华为FusionSphere

    • 国产整机厂商:新华三、中科曙光、浪潮、宝德、五舟

     

    2支持丰富的接口及介质

     

     

    3实现容量与性能的线性扩容

    • 支持分布式介质服务器;

    • 不同备份数据域管理;

    • 灵活的介质池保存周期,满足不同的合规要求;

    • 存储介质的分级管理;

    • 支持单台设备多通道并行读写

     

    4支持多租户数据安全管理平台

    • 物理统一,逻辑隔离

    • 多级权限管理

    • 不同租户不同授权模式

    • 备份速度控制

    • 备份空间控制

     

    (本文部分信息来源于网络)

     

     

    展开全文
  • 容灾系统及灾备系统建设解决方案共47页.ppt
  • 应用感知AI智能灾备系统Applying Awareness AI to Intelligent Disaster Preparedness System支持全业务系统,专门针对MSSQL、domain、Atlassian,Oracle,PostgreSQL和Veeam等应用程序优化了支持插件通过即时故障...

    1755f960ac8c6e38d31997c7e4d8d49a.png应用感知AI智能灾备系统

    Applying Awareness AI to Intelligent Disaster Preparedness System

    支持全业务系统,专门针对MSSQL、domain、Atlassian,Oracle,PostgreSQL和Veeam等应用程序优化了支持插件

    通过即时故障切换和近零恢复时间(RTO和RPO)保持关键I T系统的持续可用性

    使用能够监控应用程序运行状况和配置的应用程序感知技术防止用户停机

    保护物理,虚拟和云环境

    a040fa5209e44a1a5afc81d40e9b88db.png选择AI,既选择不停机

    Choose AI and choose not to shut down

    云备姆应用级灾备系统可以保护您的大多数任务关键型应用程序,目标是实现零停机。它通过主动监控应用程序的运行状况并确保其始终处于健康状态和健康的站点,提供接近零恢复时间的即时故障切换。该站点可以位于主站点,辅助站点,甚至是第三站点。

    简而言之,我们可以帮助您准备和保护您的应用程序,服务器和数据免受灾难而不会错过任何一个节拍。

    2d503bdacbca5b0d40a66d8f19919d43.png主动监控和保护,防止发生故障

    Active monitoring and protection to prevent failure

    云备姆应用级灾备系统监控应用程序生态系统的运行状况,包括系统级资源的可用性,容量和消耗以及应用程序级行为,如响应时间,服务和数据库可用性。

    与简单地响应故障的基于恢复的系统不同,云备姆应用级灾备系统通过在发生停机事件之前修复活动应用程序来主动保护应用程序。

    a040fa5209e44a1a5afc81d40e9b88db.png近零恢复时间(RPO和RTO)的实时复制和即时故障转移

    Real-time replication and instant failover of near-zero recovery time (RPO and RTO)

    云备姆应用级灾备系统通过实时复制到热备用服务器(或多个服务器)来保护应用程序,文件和数据库。

    当系统检测到潜在的应用程序或服务器错误时,它会执行一组预定的业务连续性规则 - 所有这些都在主应用程序或服务器实际失败之前。

    一旦问题得到解决,故障恢复就完全自动化且无中断。

    1755f960ac8c6e38d31997c7e4d8d49a.png对任何服务器环境(物理,云或虚拟)上的任何应用程序的持续保护

    Continuous protection of any application on any server environment (physical, cloud or virtual)

    云备姆应用级灾备系统提供了一系列插件,从VMware到Microsoft,可以智能地识别组件何时可能出现故障。自定义应用?没问题。云备姆应用级灾备系统有你的背。

    它可以在任何虚拟机管理程序和任何服务器上一致地工作,而不依赖于共享存储,因此没有单点故障。是否需要使用VMware vSphere故障转移保护Microsoft Hyper-V VM?它也是这样做的!

    展开全文
  • 赛门铁克灾备系统项目经验分享.ppt
  • 异地灾备系统管理办法.doc
  • 数据中心灾备系统建设方案.docx
  • 行业分类-设备装置-基于混合云平台的应用灾备系统及灾备配置方法.zip
  • 容灾技术是灾备系统的核心,技术因素考虑的是否完善,对于灾备系统建设的成败可以说起到非常关键的作用。如果灾备方案提供商在企业灾备建议之初,能从企业切实的容灾系统技术和工程可行性出发,为企业找出最佳的灾备...
  • 银行异地灾备系统建设方案.docx
  • 为了提升misc系统总体稳定性,中国移动公司网络部制定了misc容灾方案及应急预案
  • 数据中心灾备系统解决方案大全.docx
  • 英方云灾备系统 v5.6

    2019-10-31 05:51:35
    英方云是一款基于字节级复制技术的企业级云灾备软件。支持服务器、云主机、虚机、云存储、文件、网站、电商平台、数据库、应用程序等数据的实时备份与瞬间恢复,改变了传统的数据备份及灾难恢复方式,全面整合了数据...
  • ** 该项目已移至新位置:http://relax-and-recover.org/ ** Relax-and-Recover (Rear) 是领先的开源灾难恢复解决方案,也是 mkcdrec 的继承者。 它包含一个模块化框架和适用于许多常见情况的现成工作流,用于生成可...
  • 虚拟化平台灾备系统规划设计.docx
  • 按照容灾系统对应用系统的保护程度可以分为数据级容灾和应用级容灾,业务级容灾的大部分内容是非IT系统。 数据级容灾系统只保证数据的完整性、可靠性和安全性,但提供实时服务的请求在灾难中会中断。应用级容灾系统...
  • 数据中心灾备系统建设与方案大全.doc

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 18,616
精华内容 7,446
关键字:

灾备系统