精华内容
下载资源
问答
  • 2019-10-26 14:14:47

    一:系统可靠性的定义及包含的4个子特性,并简要指出提高系统可靠性技术一般采用什么技术

    系统可靠性定义:系统在规定的时间内及规定的环境条件下,完成规定功能的能力,就是系统无故障运行的概率。
    根据国家标准《软件工程 产品质量 第一部分:质量模型》(GB/T 16260.1-2006)的规定,系统可靠性的4个主要子特性

    1. 成熟性:指系统避免因错误的发生而导致失效的能力
    2. 容错性:在系统发生故障或违反指定接口的情况下,系统维持规定的性能级别的能力
    3. 易恢复性:系统发生失效的情况下,重建规定的性能级别并恢复受直接影响的数据的能力
    4. 依从性:系统依附于可靠性相关的标准、约定和规约的能力。

    通常,提高系统的可靠性采用冗余技术、软件容错技术、双机容错技术和集群技术4类技术

    软件可靠性技术

    容错设计技术

    对于软件失效后果特别严重的场合,如飞机的飞行控制系统可采用容错设计方法。常见的软件容错技术主要有恢复块设计N版本程序设计冗余设计

    1. 恢复块设计:选择一组操作作为容错设计单元,从而把普通的程序块变成恢复块。一个恢复块包含若干个功能相同、设计差异的程序块文本,每一时刻有一个文本处于运行状态。一旦该文本出现故障,则用备份文本加以替换,从而构成“动态冗余”。
    2. N版本程序设计:N版本的核心是通过设计出多个模块或不同版本,对于相同初始条件和相同输入的操作结果,实行多数表决,防止其中某一模块/版本的故障提供错误的服务,以实现软件容错。
    3. 冗余设计:冗余设计技术实现原理是在一套完整的软件系统之外,设计一种不同路径,不同算法或不同实现方法的模板或系统作为备份,在出现故障时可以使用冗余的部分进行替换,从而维持软件系统的正常运行。

    检错设计

     在软件系统中,对无需在线容错的地方或不能采用冗余设计技术的部分,如果可靠性要求较高,故障可能导致严重的后果。这时一般采用检错技术,在软件出现故障后能及时发现并报警,提醒维护人员进行处理。
     采用检测设计技术需要着重考虑几个要素:检测对象检测延时实现方式处理方式

    • 检测对象:即检测点和检测内容。在设计时应该考虑把检测点放在容易出错的地方和出错对软件系统影响较大的地方,检测内容选取那些有代表性的、易于判断的指标。
    • 检测延时:在软件检测设计时要充分考虑到检测延时,如果延时长到影响故障的及时报警,则需要更换检测对象或检测方式。
    • 实现方式:最直接的一种方式是判断返回结果,如果返回结果超出正常范围,则进行异常处理。计算运行时间也是一种常用的技术,如果某个模块或函数运行超过预期的时间,可以判断出现故障。另外还有置状态标志位等多种方法,自检的实现方式要根据实际情况来选用。
    • 处理方式:大多数检测采用“查出故障-停止软件系统运行-报警“的处理方式”,但也有采用不停止或部分停止软件系统运行的情况,这一般由故障是否需要实时处理来决定。

    检错设计和容错技术的差异

     检测技术实现的代价一般低于容错技术和冗余技术,但有一个明显的缺点,就是不能自动解决故障,出现故障后如果不进行人工干预,将最终导致软件系统不能正常运行。

    降低复杂度设计

     在保证实现软件功能的基础上,简化软件结构,缩短程序代码长度,优化软件数据流向,降低软件复杂度从而提高软件可靠性。

    软件可靠性分析

    在软件可靠性设计之前和软件可靠性设计过程中,都需要采用软件可靠性分析和预测方法,来确定当前系统中的主要可靠性因素和目标。常见的软件可靠性分析方法包括故障树分析(FTA)、==失效模式与效应分析(FMEA)==等

    故障树分析方法

     一种自顶向下的软件可靠性分析方法,即从软件系统不希望发生的事件(顶事件),特别是对人员和设备的安全及可靠性产生重大影响的事件开始,向下逐步追查导致顶事件发生的原因,直至基本事件(底事件)。从而确定软件故障原因的各种可能组合方式或发生概率。基本的步骤是软件故障树的建立、定性分析和定量分析

    失效模式与效应分析方法

     在软件的开发阶段的早期,通过识别软件失效模式,分析造成的后果。研究分析各种失效模式产生的原因,寻找消除和减少其有害后果的方法,以便尽早发现潜在的问题,采取相应的措施,从而提高软件的可靠性和安全性。SFMEA的分析对象,可以是开发早期阶段的高层次的子系统、部件,也可以是详细设计阶段的单元模块。对于不同的分析对象,其软件失效模式是不同的。采用的SFMEA分析方法也不同,前者采用系统分析方法(system FMEA),后者为详细分析方法(detailed FMEA)。其步骤是系统定义软件失效模式分析、软件失效原因分析、软件失效影响分析、改进措施分析

    更多相关内容
  • 系统可靠性分析与设计

    千次阅读 2022-04-23 22:34:46
    系统可靠性是系统分析、设计和实施过程中采用一定的技术措施才能获得的。可靠性分析与设计的重要内容是建立可靠性模型,以及可靠性指标的预计与分配。在系统分析与设计过程中,系统分析师及相关人员要反复地进行可靠...

    系统可靠性指系统不出故障的能力;可用性指系统出故障后是否能很快恢复服务的能力。

    系统可靠性是系统分析、设计和实施过程中采用一定的技术措施才能获得的。可靠性分析与设计的重要内容是建立可靠性模型,以及可靠性指标的预计与分配。在系统分析与设计过程中,我们要反复地进行可靠性预计和分配,并不断深化,以选择合适的方案,预测系统可靠性水平,找出薄弱环节,逐步地将可靠性指标分配到系统各个层次中。这是一个迭代的过程。

    一、系统可靠性概述

    系统可靠性包括4个子特性:
    1)成熟性
    是指系统避免因错误的发生而导致失效的能力

    2)容错性
    系统发生故障或违反指定接口的情况下,系统维持规定的性能级别的能力

    3)易恢复性
    系统发生失效的情况下,重建规定的性能级别并恢复受直接影响的数据的能力

    4)可靠性的依从性
    系统依附于与可靠性相关的标准、约定或规定的能力

    1、系统故障模型
    一般来说,故障模型建立的级别越低,进行故障处理的代价也就越低,但故障模型覆盖的故障也就越少。级别由低到高:

    【逻辑级的故障】
    硬件逻辑出现的故障

    【数据结构级的故障】

    【软件故障和软件差错】
    软件故障指软件设计与设计说明不一致。软件故障只与设计有关。
    软件故障在数据结构或程序输出中的表现称为软件差错。

    【系统级的故障】
    系统输出与系统设计说明不一致。

    2、系统可靠性指标
    1)平均无故障时间
    MTTF(Mean Time To Failure)

    2)平均故障修复时间
    MTTR

    3)平均故障间隔时间
    MTBF=MTTF + MTTR

    4)系统可用性
    系统可用性是指在某个时间点上系统能够按照需求执行的概率。

    可用性 = MTTF/(MTTF + MTTR) * 100%

    3、系统可靠性模型
    【时间模型】
    时间模型基于一个假设:系统中的故障数目在某一时刻为常数。随着故障被纠正,故障数目逐渐减少。在此假设下,经过一段时间调试后剩余故障的数目可用公式估算。

    【故障植入模型】
    以系统中的错误数作为衡量可靠性的标准。

    【数据模型】
    系统n次连续运行中系统完成指定任务的概率。

    二、系统可靠性分析

    计算机系统十分复杂,影响可靠性的因素很多,很难直接进行可靠性分析。但是,通过建立适当的数学模型,把大系统分割成若干子系统,可以简化分析过程。其中,分析组合模型是分析系统可靠性最常用的方法。

    1、串联系统
    在这里插入图片描述

    系统可靠度

    R = R1 * R2 * ... * Rn
    

    2、并联系统
    在这里插入图片描述

    R = 1 - (1 - R1) * (1 - R2) *...*(1 - Rn) 
    

    3、模冗余系统
    在这里插入图片描述
    串并联混合。
    在这里插入图片描述

    三、冗余技术

    提高系统可靠性的技术可以分为避错(排错)技术和容错技术。

    【避错】
    通过技术评审、系统测试和正确性证明等技术,在系统正式运行之前避免、发现和改正错误。

    【容错】
    指系统在运行过程中发生一定的硬件故障或软件错误时,仍能保持正常工作而不影响正确结果的一种性能或措施。容错技术主要采用冗余方法来消除故障的影响。

    1、冗余技术的分类
    1)结构冗余
    静态冗余、动态冗余、混合冗余

    【静态冗余】
    又叫屏蔽冗余或被动冗余,常用的有三模冗余和多模冗余。静态冗余通过表决和比较来屏蔽错误。

    【动态冗余】
    又称为主动冗余。通过故障检测、故障定位及故障恢复等手段达到容错目的。主要方式是多重模块待机储备,当系统检测到某工作模块出现错误时,就用一个备用的模块来顶替它并重新运行。各备用模块在待机时,可与主模块一起工作(热备份系统、双重系统),也可不工作(冷备份系统、双工系统、双份系统)。

    【混合冗余】
    先使用静态冗余中的故障屏蔽技术,使系统免受某些可以被屏蔽的故障的影响;而对那些无法屏蔽的故障,则采用主动冗余中的故障检测、故障定位和故障恢复等技术,并且对系统可以作重新配置。

    2)信息冗余
    在实现正常功能所需要的信息外,再添加一些信息,以保证运行结果正确性的方法。如检错码、纠错码。

    信息冗余的主要任务在于研究出一套理想的编码和译码技术来提高信息冗余的效率。目前应用最广泛的是奇偶校验码、海明校验码和循环冗余校验码。

    3)时间冗余
    以时间(即降低系统运行速度)为代价以减少硬件冗余和信息冗余的开销,来达到提高可靠性的目的。

    实现时间冗余的基本思想是重复执行,然后将每次结果存放起来比较。但这种方法只能检测瞬时性故障而不宜检测永久性的故障。

    4)冗余附加
    是指为实现上述冗余技术所需的资源和技术,包括程序、指令、数据,以及存放和调用它们的空间等。

    2、冗余系统
    1)故障检测
    2)故障屏蔽
    3)故障限制
    4)复执
    5)故障诊断
    6)系统重配置
    7)系统恢复
    8)系统重新启动
    9)修复
    10)系统重组合

    四、软件容错技术

    软件容错的基本思想是从硬件容错中引申而来,利用软件设计的冗余和多样化来达到屏蔽错误的影响,提高系统可靠性的目的。软件容错的主要方法是提供足够的冗余信息和算法程序,使系统在实际运行时能够及时发现程序设计错误,采取补救措施,以提高系统可靠性,保证整个系统的正常运行。

    软件容错技术主要有N版本程序设计、恢复块方法和防卫式程序设计等;也可以从计算机平台环境、软件工程和构造异常处理模块等不同方面达到;还可以利用高级语言本身的容错特性,如try catch语句。

    1、N版本程序设计
    一种静态的故障屏蔽技术,采用前向恢复的策略。设计思想是用N个具有相同功能的程序同时执行一项计算,结果通过多数表决来选择。其中N个版本的程序必须由不同的人(小组)独立设计,使用不同的方法、不同的设计语言、不同的开发环境和工具来实现,目的是减少N个版本的程序在表决点上出错的概率。
    在这里插入图片描述
    2、恢复块方法
    在这里插入图片描述
    恢复块方法提供具有相同功能的主块和几个后备块,一个块就是一个执行完整的程序段,主块首先投入运行,结束后进行验证测试,如果没有通过验证测试,系统恢复现场后由后备块1运行,结束后同样进行验证测试,不行到后备块2,重复这一过程,直到所有后备块耗尽,或某个故障超出预期,导致无法恢复。

    程序设计时,应保证实现主块和后备块之间的独立性,避免错误相互影响。

    3、防卫式程序设计
    N版本程序设计和恢复块方法都是基于设计冗余的思想,增加了许多额外的工作,结构本身也会带来一些问题和困难。

    防卫式程序设计的基本思想是通过在程序包含错误检查代码和错误恢复代码,一旦发生错误,程序就能撤销错误状态,恢复到一个已知的正确状态中去。实现策略包括错误检测、破坏估计和错误恢复三个方面。

    五、双机容错技术

    双机容错技术是一种软硬件结合的容错应用方案。该方案由两台服务器和一个外接共享磁盘阵列及相应的双机软件组成。
    在这里插入图片描述
    两台服务器互为主从关系。每台服务器至少2块网卡,一块连网,一块连对方,侦测对方的工作状态,同时又与共享磁盘阵列相连。采用心跳方法保证主系统与备用系统的联系。

    两台服务器的工作方式,可以有双机热备模式、双机互备模式和双机双工模式。
    【双机热备】
    一台作为主机工作,一台备用。主机故障,则激活备用机。应用较多,但有点浪费。

    【双机互备】两台服务器均处于工作状态,为客户机提供不同的服务,并互相检测对方的运行情况,一台出现故障,另一台则接管。

    【双机双工】集群工作模式,两台服务器都处于工作状态,并提供相同的服务。

    六、集群技术

    集群技术就是将多台计算机组织起来协同工作。它是提高系统可用性和可靠性的一种技术。在集群系统中,每台计算机均承担部分计算任务和容错任务,当其中一台出现故障时,系统采用集群软件将其剔除隔离,负载转嫁给其他计算机,同时向系统管理员发出警报。这样通过功能整合和故障过渡,集群系统实现了系统的高可用性和可靠性。

    1、集群技术概述
    集群技术是将同构或异构的计算机用集群软件连接在一起,组成一个高度透明的大型计算机群,其中单个的计算机系统称为节点(node)。集群系统作为一个整体为用户服务,用户不必关心服务来自哪台计算机,只需关心服务是否能连续工作。集群系统可以协调管理各节点出现的错误和故障,并可透明地向集群中加入新节点。

    1)集群系统的特点
    可伸缩性
    高可用性
    可管理性:集群系统能够管理大规模和物理分散的节点。
    高性价比:最少的投资获得最大的性能。
    高透明性

    2)资源管理与调度
    集群系统的主要目标是通过网络互连实现全系统范围内的资源共享,从而提高资源利用率,获得高性能。集群系统进行任务调度的主要方法是进程迁移技术。

    3)集群的分类
    高性能计算集群
    负载均衡集群
    高可用性集群

    实际应用中,这三种基本类型经常会发生混合与交杂。所以,集群类别的划分是一个相对的概念,而不是绝对的。

    从硬件环境角度看,这三种集群,区别不大,主要还是通过网络将计算机连接起来,作为整体对外提供服务。分为高性能、负载均衡、高可用三种类型,主要区别是集群软件和集群的服务类型。比如高性能,是将一个任务拆分成几块,分给集群节点并行执行;负载均衡,将压力分摊给集群节点;高可用,则是节点失效后的失效转移。(个人理解)

    2、高性能计算集群

    高性能计算集群是指以提高科学计算能力为目的计算机集群技术,它是一种并行计算集群的实现方法。并行计算是指将一个应用程序分割成多块可以并行执行的部分,并指定到多个处理器上执行的方法。

    高性能计算集群系统是利用高速互连网络将一组PC(或工作站)连接起来,在并行程序设计和集成开发环境支持下,统一调度和协调处理,实现高效并行处理的系统。特点是
    1)系统开发周期短
    2)用户投资风险小(节点都是很便宜的PC或工作站)
    3)系统价格低
    4)节约系统资源
    5)扩展性好
    6)用户编程方便

    高性能计算集群系统中,节点的处理能力参差不齐,当整个系统任务较多时,各节点上的负载可能产生不均衡现象,就会降低这个系统的利用率。这就是负载不平衡问题。负载不平衡问题解决得好坏,直接影响到并行计算的性能。

    3、负载均衡集群

    许多基于WEB的大型系统功每秒钟需要处理上百万各甚至更多的请求,单台服务器有限的性能难以应付。解决这个问题,采用高性能主机,比如小型机或大型机的话,一来价格昂贵,可扩展性差,很多情况下也不能同时处理上百万并发请求。因为高速主机系统只是对于复杂大衣任务和有限并发处理显得高性能,而互联网中的Web应用大多数处理是简单任务、高强度并发处理,因此,即使投入大量资金,采购高性能、高价格的主机,也满足不了WEB应用的需要。

    一种方案是采用集群技术,利用多台计算机实现负载均衡集群。

    负载均衡是指处理节点的负载信息通过某代理软件传递给均衡器,由均衡器做出决策并对负载进行动态分配,从而使集群中各处理节点的负载相对趋于平衡。

    负载均衡的分类
    根据负载均衡的位置不同,可以分为客户端负载均衡和服务器端负载均衡;

    按照负载均衡所在层次不同,可以分为应用层负载均衡、传输层负载均衡、网络层负载均衡和数据链路层负载均衡。

    客户端负载均衡是指客户端的均衡器根据集群的负载情况,主动选择由集群中哪台计算机为其服务。

    服务器端负载均衡又可分为集中式负载均衡和分布式负载均衡。集中式负载均衡的均衡器位于集群中一台计算机上,而分布式负载均衡有多个均衡器,位于集群中不同的计算机。集中式负载均衡实现简单,但可扩展性不强,安全性较差,有单点故障隐患,实现不够灵活,比较难配置不同的均衡策略。

    数据链路层负载均衡根据数据的目的MAC地址选择不同的路径;

    网络层负载均衡利用基于IP地址的分配方式将数据流疏通到多个节点;

    传输层和应用层的交换技术,本身就是一种基于访问流量的控制方式,以此可以实现负载均衡。

    4、高可用性集群
    高可用性集群是一种以减少服务中断时间为目标的计算机集群技术,可以提供7*24小时昼夜不停的可靠保证,确保系统不停息地运转。

    在高可用性集群系统中,多台计算机一起工作,各自运行一个或几个服务,各为服务定义一个或多台备用计算机。当某台计算机出现故障时,备用计算机便立即接管该故障计算机的应用,继续为前端的用户提供服务。如果只有2台计算机组成高可用性集群,则相当于双机双工方式。
    在这里插入图片描述

    5、负载均衡技术
    集群的最大特征是多个节点的并行和共同工作,如何让所有节点承受的负荷平均,不出现局部过大负载或过轻负载的情况,是负载均衡的重要目的。如果局部过大,必然导致硬件承压,老化和损坏的概率增加;局部过轻,设备资源浪费,不符合成本最低原则。

    负载均衡有两方面的含义。首先,大量的并发访问或数据流量分担到多个节点上分别处理,减少用户等待响应的时间;其次,单个重负载的运算分担到多个节点上做并行处理,每个节点处理结束后,将结果汇总,返回给用户,系统处理能力得到大幅提升。
    1)调度算法
    轮转、加权、最小连接数、哈希、随机等等。

    2)技术实现
    (1)基于特定软件的负载均衡

    (2)基于DNS的负载均衡
    DNS服务器中为同一个域名配置多个IP地址,在应答DNS查询时,DNS服务器对每个查询按记录的IP顺序返回不同的解析结果,将客户端的访问引导到不同节点,使得不同的客户端访问不同的节点,从而达到负载均衡的目的。

    DNS负载均衡的优点是经济、简单易行,并且节点可以位于互联网上的任意位置。但DNS需要经常刷新,容易造成额外的网络流量;DNS修改后不会立即生效;DNS负载均衡采用的是简单的轮转算法,不能区分节点之间的差异,不能反映节点的当前运行状态。另外,每个节点需要对应一个IP地址,占用过多IP地址。

    (3)基于NAT的负载均衡
    将一个外部IP地址映射为多个内部IP地址,对连接请求动态地转换为1个内部节点的地址,将连接请求引导到该节点,从而达到负载均衡的目的。

    NAT负载均衡通过软硬件都可以实现。软件方式往往受到带宽和系统本身处理能力的限制;硬件一般是处于内部节点到外部网络之间的网关位置,如路由器、防火墙、四层交换机、专用负载均衡器等,均衡算法也较灵活。

    (4)反向代理负载均衡
    将来自互联网的连接请求以反向代理的方式动态地转发给内部网络上的多个节点进行处理,从而达到负载均衡的目的。

    反向代理均衡也是可以通过软硬件都能实现;可以将负载均衡与高速缓存技术相结合,提升静态资源的访问速度,改善系统性能。同时,由于外部网络用户不能直接访问真实的节点计算机,具备额外的安全性(同理NAT也有此优点)。

    缺点是反向代理处于应用层,必须为每种应用服务专门开发一个反向代理服务器,限制了反向负载均衡技术的应用范围,现在一般用做WEB服务器的负载均衡;其次,每次代理,代理服务器都需要打开2个连接,一个对外,一个对内,并发连接数量非常大的时候,容易成为瓶颈;容易出现单点故障。

    (5)混合型负载均衡

    6、进程迁移技术
    进程迁移是指当进程运行时,在(集群内)源节点和目标节点之间转移进程的行为。由于这个过程中转移的是活跃进程,因此又称为抢占式进程迁移。

    在这里插入图片描述

    进程迁移是支持负载均衡和高容错性的一种非常有效的手段,是实现负载均衡的基础。集群系统进行任务调度的主要方法是进程迁移技术。

    展开全文
  • 一、可靠性概述 与可靠性相关的概念主要有:可靠度、可用度、可...三、串联系统与并联系统可靠性计算 四、可靠性设计 1. N版本程序设计 2. 恢复块方法 3. 防卫式程序设计 4. 双机容错 5. 集群模式的优点 ...

    一、可靠性概述

    与可靠性相关的概念主要有:可靠度、可用度、可维度、平均无故障时间、平均故障修复时间及平均故障间隔时间等。

    可靠性和可用性
    在这里插入图片描述
    在这里插入图片描述

    二、可靠性指标

    在这里插入图片描述

    三、串联系统与并联系统可靠性计算

    在这里插入图片描述
    在这里插入图片描述

    四、可靠性设计

    在这里插入图片描述
    1. N版本程序设计
    在这里插入图片描述
    2. 恢复块方法
    在这里插入图片描述
    3. 防卫式程序设计
    在这里插入图片描述
    4. 双机容错
    在这里插入图片描述
    5. 集群模式的优点
    在这里插入图片描述

    五、扩展

    看门狗:

    看门狗技术是一种计算机程序监视技术,防止程序由于干扰等原因而进入死循环,一般用于计算机控制系统。

    原理:是不断监测程序循环运行的时间,一旦发现程序运行时间超过循环设定的时间,就认为系统已陷入死循环,然后强迫程序返回到已安排了出错处理程序的入口地处,使系统回到正常运行。从其定义与特点可知当看门狗定时器超时的时候,会产生看门狗中断。

    展开全文
  • 快速上下电对系统可靠性设计的意义前言一、如何加快系统上电时间?二、如何快速使系统下电??总结 前言 电路设计中,满足MCU的上电时序,是系统设计最基本最重要的要求之一,因此设计中我们会格外关注系统电源的...


    前言

    电路设计中,满足MCU的上电时序,是系统设计最基本最重要的要求之一,因此设计中我们会格外关注系统电源的上下电时间,如果上下电时间过长,可能会导致MCU启动失败或系统运行逻辑混乱,因此缩短MCU电源的上电和放电时间就显得尤为重要。


    一、如何加快系统上电时间?

    以LDO或Buck类电源为例,之前项目中遇到一个问题,因为使能引脚EN输入电压范围跟输入引脚VIN一样,因此设计时直接将使能引脚接电源,后面板子回来做硬件测试时发现电源上电期间有抖动现象,且上电时间比较长。后来通过分压电阻将使能引脚用起来,上电抖动消失,并且上电时间明显减小。

    那么,为什么会有这种情况?

    原因:使能引脚通过外部上拉来默认使能,会过早地让电源芯片达到使能阈值,输出就会跟随输入,即输入有多慢输出就有多慢,且上电时输入端的抖动也会传送给输出,并且这种接法在输入电压不高的情况下打开芯片可能会导致芯片输出又跌落的情况发生。如下图所示为设置EN直接上拉和采用分压电路时的输出曲线示意图。
    在这里插入图片描述
    曲线①,使能上拉至输入,此时输出上升时间长且会受到输入波动的影响;

    曲线②,合理采用分压电阻,当VIN上升到70%80%的时候,再使EN的电压到达使能阈值,此时输出上升边沿陡峭,输出平稳,摒除了输入电源的不稳定阶段,减小了输入电压波动的影响。同时预留了20%30%的余量,避免电源波动导致输出关闭。此时的上电对于MCU来说才是干净利落的!


    二、如何快速使系统下电??

    系统快速下电的必要性

    系统在做快速上下电测试时,经常会遇到由于下电缓慢,导致系统下电不完全导致的重新开机逻辑混乱问题。如下图所示:
    图 2 掉电缓慢示意图
    如上图所示,当电源掉电,负载不能及时泄放能量时,就会出现MCU等数字器件掉电缓慢的情况。若此时重新上电,由于芯片内部无法及时“归零”,对MCU等数字器件来说,这是一种不确定的状态,此时再对系统进行重新上电的操作,就容易造成MCU逻辑混乱,系统不能启动的情况。

    因此电源关闭后使MCU的电源快速下降至近0V,使系统在短时间内到达一种确定的状态,也是快速重新上电时系统能正常启动的关键因素。

    哪些方法:

    1、 带快速泄放功能的电源芯片

    以LDO为例,有的LDO芯片内部是带有快速泄放电路的,如下图3规格书中描述。这是一款带有快速放电功能的电源芯片。其内部功能框图如下图4所示,基本原理是使能引脚EN拉低后,通过反相器变为高电平到达内部NMOS,此时NMOS的Vgs>0,因此导通将输出VOUT拉低到GND泄放能量。
    在这里插入图片描述
    在这里插入图片描述2、分立器件搭建电路
    搭建分立电路做快速泄放电路,很多人分享过,这里大概讲下原理,电路原理图如下图5所示。

    开关SW闭合时:

    5V电源通过二极管D1成为电压4.7V-Out。因为二极管D1是一个肖特基二极管,其正向压降比较小,约为0.3V。

    此时三极管Q1的b极电压为5V,e极电压为4.7V,Q1不导通

    开关SW断开时:

    三极管Q1的e极电压从4.7V开始下降,b极电压从4V开始下降,Vbe = -0.7V,将Q1打开,大电容C1的电压4.7V-Out通过三极管Q1、电阻R2快速泄放到地。
    在这里插入图片描述
    仿真波形图如下:可以看出加了泄放电路的下电波形明显要快于未添加的。

    未添加泄放电路的仿真图在这里插入图片描述
    添加泄放电路的仿真图在这里插入图片描述


    总结

    快速上下电设计是保证系统可靠性设计的重要一环,设计中必须格外注意。

    展开全文
  • 嵌入式软件是电子系统的重要组成部分,它具有不同于硬件系统的可靠性特征和可靠性设计方法。 随着系统应用时间的推移,系统功能逐步完善,bug逐步修复,其可靠性不会随时间下降,相反会随着时间推移而上升。软件...
  • 系统的可靠性分析与设计是系统...另外也涉及系统可靠性分析与计算、系统可靠性评估和系统配置方法等概念与理论的实际工程运用等内容。  与可靠性相关的概念主要有:可靠度、可用度、可维度、平均无故障时间、平均...
  • 论软件的可靠性设计

    千次阅读 2020-12-29 10:19:42
    2019年11月,我所在的软件公司承接了某保险集团下健康险服务实施管理系统的开发工作,本人有幸参与该项目,并担任系统架构师职务,主要负责软件架构设计和可靠性设计的工作。该项目是基于集团内网,为全国各省市...
  • 系统可靠性

    千次阅读 2019-04-22 08:52:12
    系统的可靠性分析与设计...另外也涉及系统可靠性分析与计算、系统可靠性评估和系统配置方法等概念与理论的实际工程运用等内容。 可靠性相关的概念主要有:可靠度、可用度、可维度、平均无故障时间、平均故障修复时...
  • 软件架构设计之九:系统可靠性

    千次阅读 2013-08-31 13:00:26
    包括可靠性设计(容错技术、避错技术)、可靠性指标与评估、系统配置方法(双份、双重、热备份、容错、集群)。 2)系统架构设计案例分析和论文。包括系统的故障模型和可靠性模型、系统的可靠性分析和可靠度计算、...
  • 提高系统可靠性的措施  防止故障造成系统失效的两种技术是故障掩蔽技术和系统重组技术,故障掩蔽技术是指防止故障造成差错的各种技术,系统重组技术是防止差错导致系统失效的各种技术。故障掩蔽技术和系统重组技术...
  • 系统可靠性模型  与系统故障模型对应的就是系统的可靠性模型。人们经常说某系统“十分可靠”,那么这个“十分”究竟如何衡量呢?下面介绍几种常用的模型。 1 时间模型  最著名的时间模型是由 Shooman 提出的...
  • 产品的可靠性设计

    千次阅读 2018-07-23 03:58:37
    0.2、产品的可靠性设计是一个非常复杂的工程,此文只是设计一个框架,具体内容持续改进、增加中…… 1、器件可靠性  a、元器件的采购尽量选择大牌的供应商;  b、做好物料的来料检验工作;  c、确认产品的使用...
  • 系统可靠性计算

    万次阅读 2019-04-27 17:32:05
    系统可靠性计算是软考考试的一个重点,近些年几乎每次考试都会考到,但这个知识点的难度不高,了解基本的运算公式,即可轻松应对。 可靠性计算主要涉及三种系统,即串联系统、并联系统和冗余系统,其中串联系统和...
  • 电子设计硬件可靠性设计--总结

    千次阅读 2020-09-15 00:38:22
    质量和可靠性的区别 质量:产品特性满足要求的程度,可以以参数衡量。 可靠性:产品维持质量的持久程度,无法以参数衡量。 产品寿命和产品个体故障之间的关系 产品寿命和产品个体故障之间均为一种统计数据,产品寿命...
  • 系统可靠性

    千次阅读 2019-04-22 08:40:43
    系统可靠性是指系统在运行过程中抗干扰(系统的故障和人为的故障)和保证其正常工作的能力,它体现在系统工作的连续性和工作的正确性。一般说,系统可靠性包括查错、纠错能力;在错误干扰下不发生崩溃及重新恢复...
  • 可靠性设计基本流程

    千次阅读 2018-04-15 12:03:30
    1、首先了解客户需求(Customer needs analysis),根据客户需求,厘清可靠性设计的基本目标。2、对过往的可靠性历史资料进行分析(Reliablity history analysis)。可能是硬件中元器件的使用情况、电路拓朴的使用情况,...
  • 计算机系统可靠性分析评测技术【全讲解】

    千次阅读 多人点赞 2020-08-30 17:10:27
    今天在这里和大家记录一下关于计算机系统可靠性分析的相关技术和常用方法。同时它也是分析和评价计算机系统性能的一项重要指标,一台计算机的好坏就看它啦! 计算机可靠性概述 在一般情况下,计算机系统的硬件...
  • 信息系统可靠性

    千次阅读 2019-02-28 13:31:43
    系统系统可靠性 排错:避免故障 容错:发生故障后能正常运行 即使使用了排错技术计算机系统仍然会出现故障,因此必须考虑一旦发生故障能自动检测故障并使用系统自动恢复业务正常运行 。 容错设计系统可以有...
  • 系统安全分析与设计

    千次阅读 2022-04-17 22:05:09
    必须掌握系统安全知识,在进行系统分析与设计时,足够重视安全分析,根据系统的环境约束和用户要求,结合当前技术的发展,为信息系统构筑铜墙铁壁,确保用户应用和数据的安全。 一、信息系统安全体系 对于一个信息...
  • 可靠性一般指产品可靠性,是元件、产品、系统在一定时间内、在一定条件下无故障地执行指定功能的能力或可能性。 光看定义比较抽象,下面看一个具体的例子。 如果某个系统在每小时崩溃1ms,那么它的可用性就超过99....
  • 可靠性测试

    千次阅读 2021-07-23 11:42:40
    可靠性测试就是为了评估产品在规定的寿命期间内,在预期的使用、运输或储存等所有环境下,保持功能可靠性而进行的活动。是将产品暴露在自然的或人工的环境条件下经受其作用,以评价产品在实际使用、运输和储存的环境...
  • 网络的可靠性设计出来的

    千次阅读 2017-08-03 10:42:55
    网络可靠性的定义 根据国家标准GB-6583的规定,...是指设备运行的无故障性或寿命,专业名称叫MTBF(Mean Time Between Failure),即平均无故障时间,它是描述整个系统可靠性的重要指标。对于一个网络系统来说,M
  • 文章目录一、可靠性的定义:二、可靠性测试点:1、异常值输入:2、故障植入法:3、稳定性测试:4、压力测试:5、恢复测试:6、性能测试:7、易用性测试:三、测试用例设计方法SP1:SP2:SP3:SP4: 一、可靠性的定义:...
  • 产品可靠性指标预计

    千次阅读 2021-07-23 06:13:49
    假设对某一产品/系统要求的可靠性为:mtbf大于2000h,那么在对此系统立项时,mtbf应该设立怎么样的目标值?如何达到这一目标值,这就关系到可靠性预计和分配。开展可靠性预计和分配工作,是确保设计、生产“好”产品...
  • 软件的可靠性对系统可靠性的影响越来越大。而实践证明,保障软件可靠性最有效、最经济、最重要的手段是在软件设计阶段采取措施进行可靠性控制,为此提出了软件可靠性设计的概念。 软件可靠性设计就是在常规的软件...
  • 产品可靠性需求

    千次阅读 2022-01-16 10:03:07
    可靠性需求反映了系统在一定条件下无故障地运行的能力。 计算公式 可靠性 =总的有效运行时间 /总运行时间。 可靠性分为硬件可靠性和软件可靠性。 1硬件可靠性 硬件可能会出现故障。出现故障的原因是,设备元...
  • 网络工程师考试考察知识点繁多,形式多样。如何有效把握每种考察形式,拿到相应分数?...通过基本概念阐述->历年真题强化训练->独家解题技巧总结,三大步骤帮助考生掌握系统可靠性的计算方法,拿到相应分数。
  • 系统可靠性(摘抄)

    千次阅读 2016-04-26 16:19:37
    常见的评价系统可靠性的指标为: (1)平均无故障时间 (2)平均故障修复时间 (3)平均故障间隔时间 (4)系统可用性提高系统可靠性的技术可以分为避错技术和容错技术 1、软件容错技术 N版本程序设计,不同...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 433,707
精华内容 173,482
关键字:

系统可靠性设计