精华内容
下载资源
问答
  • Oracle 网络&磁盘心跳机制

    千次阅读 2018-08-20 21:04:20
    磁盘心跳机制 网络心跳 网络心跳(Network Hearbeat)是RAC的内部通信机制,每隔一秒钟,CSSD的一个线程(sending进程)发送一个TCP网络心跳包给自己和集群中的其他节点,同时CSSD的另外一个进程(receiving进程...

    Oracle 网络&磁盘心跳机制

    • 网络心跳
      网络心跳(Network Hearbeat)是RAC的内部通信机制,每隔一秒钟,CSSD的一个线程(sending进程)发送一个TCP网络心跳包给自己和集群中的其他节点,同时CSSD的另外一个进程(receiving进程)接收到心跳。如果网络传输包被drop或者出现错误,那么TCP的错误纠正机制会重传这个数据包,Oracle在这种场景下不参与网络包的重传。如果一个节点在15秒(50% of misscount)内都接收不到来自其它节点的心跳信息,那么在CSSD日志中会发现关于心跳丢失的“WARNING”信息。同样当该节点在22秒(75% of misscount)以及在27秒(90% of misscount)都没有接收到其他节点的心跳信息时,在CSSD日志中会依次发生警告。一直到30秒(Oracle 默认是30秒,可调节)为心跳丢失的完整周期,该节点会被驱逐。
    • 磁盘心跳
      磁盘心跳(Disk Heartbeat)是发生在集群间以及仲裁盘间的心跳。每个RAC节点中的CSSD进程会在仲裁盘(voting disk)上面通过读写方式进行磁盘心跳维护,通过调用操作系统层pread/pwrite进程对1个操作系统block块进行一定偏移量的读写操作。除了维护自己的磁盘心跳(读写磁盘的偏移块),CSSD进程还会监控集群中其他节点CSSD进程维护的磁盘心跳。/这个不断被刷新的数据库头部记录节点名称和计数位,该计数位会在发生心跳探测时被集群中其他节点刷新(通过pwrite)。磁盘心跳是通过CSSD进程维护在心跳盘(vote disk)上面,如果存在某一节点由于IO超时没有刷新磁盘心跳,那么该节点会被宣布死掉。如果一个节点处于未知状态,没有真正的死掉,但是没有在存活的群组里,那么该节点会被驱逐,该节点会被在vote磁盘磁盘上更新为kill,被驱逐掉。
      总而言之,网络心跳每秒钟会相互ping一次,集群节点必须在css_miscount(默认值是30s)设置的时间内响应,如果规定时间内未响应,则会导致被驱逐。同时,对于磁盘心跳,每秒钟集群节点会通过vote盘读写进行集群通信,节点必须在disk timeout时间内响应。
    展开全文
  • Oracle 集群心跳及其参数misscount/disktimeout/reboottime 在OracleRAC中,可以从多个层次,多个不同的机制来检...

    Oracle 集群心跳及其参数misscount/disktimeout/reboottime





      在Oracle RAC中,可以从多个层次,多个不同的机制来检测RAC的健康状况,即可以通过心跳机制以及一定的投票算法来隔离故障。如果检测到某节点失败,则存在故障的节点将会被逐出集群以避免故障节点破坏数据。本文主要描述了Oracle RAC下的几种心跳机制以及心跳参数的调整。

     

    一、OCSSD与CSS
        OCSSD是一个管理及提供Cluster Synchronization Services (CSS)服务的Linux或者Unix进程。使用Oracle用户来运行该进程并提供节点成员管理功能,一旦该进程失败,将导致节点重启。CSS服务提供2种心跳机制,一种为网络心跳,一种为磁盘心跳。两种心跳都有最大延时,网络心跳的延时叫MC(Misscount), 磁盘心跳延时叫作IOT (I/O Timeout)。 这2个参数都以秒为单位,缺省时情况下Misscount < Disktimeout。下面分别描述这2种心跳机制。

     

    二、网络心跳
        故名思义即是通过私有网络来检测节点的状态。如果私有网络硬件、软件导致集群节点间私有网络在一定时间内无法进行正常通信,由此而导致脑裂。由于集群环境中的存储为共享存储,因此此时必须要将故障节点从 集群隔离出来,以避免数据灾难。关于这个网络心跳的具体动作描述如下:
        Every one second, a sending thread in the cssd sends a network tcp heartbeat to itself and all nodes. The receiving thread of the ocssd.bin receives the heartbeat. 
        If the package network is dropped or has error, the error correction mechanism on tcp would retransmit the package.  
        Oracle does not retransmit.  From the ocssd.log, you will see a WARNING message about missing of heartbeat if a node does not receive a heartbeat from another node for 15 seconds (50% of miscount).  Another warning is reported in ocssd.log if the same node is missing for 22 seconds (75% of miscount)..another warning continues from the same node for 27 seconds (90% miscount).  When the heartbeat is missing 100% ..30 seconds miscount, the node is evicted
     
       这个网络心跳的延迟称之为misscount,可以通过crsctl 工具查询及修改。
       [grid@Linux-01 ~]$ crsctl get css misscount
       CRS-4678: Successful get misscount 30 for Cluster Synchronization Services.
     
       上面的查询结果表明,如果集群各节点间内联网络延迟大于30s,Oracle认为节点间发生了脑裂,需要将故障节点逐出集群。
       如何寻找故障节点,Oracle则通过投票算法来决定,下面是一个算法描述示例,描述参考大话Oracle RAC。
       集群中各个节点需要心跳机制来通报彼此的"健康状态",假设每收到一个节点的"通报"代表一票。对于三个节点的集群,正常运行时,每个节点都会有3票。当结点A心跳出现故障但节点A还在运行,这时整个集群就会分裂成2个小的partition。 节点A是一个,剩下的2个是一个。 这是必须剔除一个partition才能保障集群的健康运行。 对于这3个节点的集群, A 心跳出现问题后, B 和 C 是一个partion,有2票, A只有1票。 按照投票算法, B 和C 组成的集群获得控制权, A 被剔除。如果只有2个节点,投票算法就失效了。 因为每个节点上都只有1票。 这时就需要引入第三个设备:Quorum Device. Quorum Device 通常采用的是共享磁盘,这个磁盘也叫作Quorum disk。 这个Quorum Disk 也代表一票。 当2个结点的心跳出现问题时, 2个节点同时去争取Quorum Disk 这一票, 最早到达的请求被最先满足。故最先获得Quorum Disk的节点就获得2票。另一个节点就会被剔除。
     
       节点一旦被隔离之后,在11gR2之前通常是重启故障节点。而在11gR2中,ClusterWare会首先尝试关闭该节点的所有资源,尝试对集群中失败的组建进行清理,即重启失败的组件。如果清理失败的组件未成功,为了强制清理,则再对节点进行重启。

     

    三、磁盘心跳
       A thread in ocssd.bin updates the voting disk every second.
       If  a node does not update the voting disks for 200 seconds, it's evicted. 
       However, the ocssd.bin on the local node has the logic that it will bring down the node if it has an I/O error more than majority of the voting disks. Also there is a CRS reconfiguration is happening when misscount is 27 second and the local node is rebooted. As a result, you rarely see an eviction due to failure of the voting disk on 10.2.0.4 (this is more common in 10.2.0.1)) because the ocssd.bin will abort the node before it get evicted by another node if writing to the voting disk is the problem.
       如上所述,每个节点会每一秒钟更新一次表决磁盘。共享的表决磁盘用于检查磁盘心跳。如果ocssd进程更新表决磁盘的时间超过200s,即disktimeout设定的值,Oracle会认为该表决磁盘脱机,同时在Clusterware的告警日志中生成表决磁盘脱机记录。如果当前节点表决磁盘脱机的个数小于在线表决磁盘的个数,该节点能够幸存,如果脱机表决磁盘的个数大于或等于在线表决磁盘的个数,则clusterware认为磁盘心跳出现问题,故障节点会被逐出集群,执行自动修复过程。比如有3个表决磁盘,节点A有表决磁盘出现了脱机,此时脱机磁盘(1个)<在线磁盘(2),clusterware会在告警日志中生成脱机记录,但不采取任何行动。如果当前节点有2个或2个以上表决磁盘脱机,此时脱机磁盘(2个)>在线磁盘(1个),那节点A被踢出集群。

     

    四、RebootTime参数
        注意这个RebootTime参数,也很重要,缺省情况下为3s。该参数表示的含义是节点被踢出之后,节点开始重启允许的最大时间。通过CRSCTL工具可以看到当前reboottime的默认时间。
     [root@rhel1 bin]# ./crsctl get css reboottime   
     CRS-4678: Successful get reboottime 3 for Cluster Synchronization Services.  
    从上面的执行结果可以看出,当前节点被踢出集群之后允许开始重启的最大时间是3秒。

        Default 3 seconds -the amount of time allowed for a node to complete a reboot 
        after the CSS daemon has been evicted.
        crsctl get css reboottime
        #Author : Leshami
        #Blog   :  http://blog.csdn.net/leshami


     

    五、心跳参数的调整  
     1) 10.2.0.2 to 11.1.0.7版本的修改方法
        a) Shut down CRS on all but one node. For exact steps use note 309542.1
        b) Execute crsctl as root to modify the misscount:
           $CRS_HOME/bin/crsctl set css misscount     #### where is the maximum private network latency in seconds
           $CRS_HOME/bin/crsctl set css reboottime [-force]  #### ( is seconds)
           $CRS_HOME/bin/crsctl set css disktimeout [-force] #### ( is seconds)
        c) Reboot the node where adjustment was made
        d) Start all other nodes which was shutdown in step 1
        e) Execute crsctl as root to confirm the change:
           $CRS_HOME/bin/crsctl get css misscount
           $CRS_HOME/bin/crsctl get css reboottime 
           $CRS_HOME/bin/crsctl get css disktimeout


     2) 11gR2的修改方法
         With 11gR2, these settings can be changed online without taking any node down:

        a) Execute crsctl as root to modify the misscount:
           $CRS_HOME/bin/crsctl set css misscount     #### where is the maximum private network latency in seconds
           $CRS_HOME/bin/crsctl set css reboottime [-force]  #### ( is seconds)
           $CRS_HOME/bin/crsctl set css disktimeout [-force] #### ( is seconds)
        b) Execute crsctl as root to confirm the change:
           $CRS_HOME/bin/crsctl get css misscount
           $CRS_HOME/bin/crsctl get css reboottime 
           $CRS_HOME/bin/crsctl get css disktimeout





    About Me

    ...............................................................................................................................

    ● 本文整理自网络http://blog.csdn.net/leshami/article/details/39001623

    ● 本文在itpub(http://blog.itpub.net/26736162)、博客园(http://www.cnblogs.com/lhrbest)和个人微信公众号(xiaomaimiaolhr)上有同步更新

    ● 本文itpub地址:http://blog.itpub.net/26736162/abstract/1/

    ● 本文博客园地址:http://www.cnblogs.com/lhrbest

    ● 本文pdf版及小麦苗云盘地址:http://blog.itpub.net/26736162/viewspace-1624453/

    ● 数据库笔试面试题库及解答:http://blog.itpub.net/26736162/viewspace-2134706/

    ● QQ群:230161599     微信群:私聊

    ● 联系我请加QQ好友(646634621),注明添加缘由

    ● 于 2017-05-09 09:00 ~ 2017-05-30 22:00 在魔都完成

    ● 文章内容来源于小麦苗的学习笔记,部分整理自网络,若有侵权或不当之处还请谅解

    ● 版权所有,欢迎分享本文,转载请保留出处

    ...............................................................................................................................

    拿起手机使用微信客户端扫描下边的左边图片来关注小麦苗的微信公众号:xiaomaimiaolhr,扫描右边的二维码加入小麦苗的QQ群,学习最实用的数据库技术。

    ico_mailme_02.png
    DBA笔试面试讲解
    欢迎与我联系

    来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/26736162/viewspace-2139636/,如需转载,请注明出处,否则将追究法律责任。

    展开全文
  • Oracle RAC中,可以从多个层次,多个不同的机制来检测RAC的健康状况,即可以通过心跳机制以及一定的投票算法来隔离故障。如果检测到某节点失败,则存在故障的节点将会被逐出集群以避免故障节点破坏数据。本文主要...

        在Oracle RAC中,可以从多个层次,多个不同的机制来检测RAC的健康状况,即可以通过心跳机制以及一定的投票算法来隔离故障。如果检测到某节点失败,则存在故障的节点将会被逐出集群以避免故障节点破坏数据。本文主要描述了Oracle RAC下的几种心跳机制以及心跳参数的调整。

     

    一、OCSSD与CSS
        OCSSD是一个管理及提供Cluster Synchronization Services (CSS)服务的Linux或者Unix进程。使用Oracle用户来运行该进程并提供节点成员管理功能,一旦该进程失败,将导致节点重启。CSS服务提供2种心跳机制,一种为网络心跳,一种为磁盘心跳。两种心跳都有最大延时,网络心跳的延时叫MC(Misscount), 磁盘心跳延时叫作IOT (I/O Timeout)。 这2个参数都以秒为单位,缺省时情况下Misscount < Disktimeout。下面分别描述这2种心跳机制。

     

    二、网络心跳
        故名思义即是通过私有网络来检测节点的状态。如果私有网络硬件、软件导致集群节点间私有网络在一定时间内无法进行正常通信,由此而导致脑裂。由于集群环境中的存储为共享存储,因此此时必须要将故障节点从 集群隔离出来,以避免数据灾难。关于这个网络心跳的具体动作描述如下:
        Every one second, a sending thread in the cssd sends a network tcp heartbeat to itself and all nodes. The receiving thread of the ocssd.bin receives the heartbeat.
        If the package network is dropped or has error, the error correction mechanism on tcp would retransmit the package. 
        Oracle does not retransmit.  From the ocssd.log, you will see a WARNING message about missing of heartbeat if a node does not receive a heartbeat from another node for 15 seconds (50% of miscount).  Another warning is reported in ocssd.log if the same node is missing for 22 seconds (75% of miscount)..another warning continues from the same node for 27 seconds (90% miscount).  When the heartbeat is missing 100% ..30 seconds miscount, the node is evicted
     
       这个网络心跳的延迟称之为misscount,可以通过crsctl 工具查询及修改。
       [grid@Linux-01 ~]$ crsctl get css misscount
       CRS-4678: Successful get misscount 30 for Cluster Synchronization Services.
     
       上面的查询结果表明,如果集群各节点间内联网络延迟大于30s,Oracle认为节点间发生了脑裂,需要将故障节点逐出集群。
       如何寻找故障节点,Oracle则通过投票算法来决定,下面是一个算法描述示例,描述参考大话Oracle RAC。
       集群中各个节点需要心跳机制来通报彼此的"健康状态",假设每收到一个节点的"通报"代表一票。对于三个节点的集群,正常运行时,每个节点都会有3票。当结点A心跳出现故障但节点A还在运行,这时整个集群就会分裂成2个小的partition。 节点A是一个,剩下的2个是一个。 这是必须剔除一个partition才能保障集群的健康运行。 对于这3个节点的集群, A 心跳出现问题后, B 和 C 是一个partion,有2票, A只有1票。 按照投票算法, B 和C 组成的集群获得控制权, A 被剔除。如果只有2个节点,投票算法就失效了。 因为每个节点上都只有1票。 这时就需要引入第三个设备:Quorum Device. Quorum Device 通常采用的是共享磁盘,这个磁盘也叫作Quorum disk。 这个Quorum Disk 也代表一票。 当2个结点的心跳出现问题时, 2个节点同时去争取Quorum Disk 这一票, 最早到达的请求被最先满足。故最先获得Quorum Disk的节点就获得2票。另一个节点就会被剔除。
     
       节点一旦被隔离之后,在11gR2之前通常是重启故障节点。而在11gR2中,ClusterWare会首先尝试关闭该节点的所有资源,尝试对集群中失败的组建进行清理,即重启失败的组件。如果清理失败的组件未成功,为了强制清理,则再对节点进行重启。

     

    三、磁盘心跳
       A thread in ocssd.bin updates the voting disk every second.
       If  a node does not update the voting disks for 200 seconds, it's evicted.
       However, the ocssd.bin on the local node has the logic that it will bring down the node if it has an I/O error more than majority of the voting disks. Also there is a CRS reconfiguration is happening when misscount is 27 second and the local node is rebooted. As a result, you rarely see an eviction due to failure of the voting disk on 10.2.0.4 (this is more common in 10.2.0.1)) because the ocssd.bin will abort the node before it get evicted by another node if writing to the voting disk is the problem.
       如上所述,每个节点会每一秒钟更新一次表决磁盘。共享的表决磁盘用于检查磁盘心跳。如果ocssd进程更新表决磁盘的时间超过200s,即disktimeout设定的值,Oracle会认为该表决磁盘脱机,同时在Clusterware的告警日志中生成表决磁盘脱机记录。如果当前节点表决磁盘脱机的个数小于在线表决磁盘的个数,该节点能够幸存,如果脱机表决磁盘的个数大于或等于在线表决磁盘的个数,则clusterware认为磁盘心跳出现问题,故障节点会被逐出集群,执行自动修复过程。比如有3个表决磁盘,节点A有表决磁盘出现了脱机,此时脱机磁盘(1个)<在线磁盘(2),clusterware会在告警日志中生成脱机记录,但不采取任何行动。如果当前节点有2个或2个以上表决磁盘脱机,此时脱机磁盘(2个)>在线磁盘(1个),那节点A被踢出集群。

     

    四、RebootTime参数
        注意这个RebootTime参数,也很重要,缺省情况下为3s。
        Default 3 seconds -the amount of time allowed for a node to complete a reboot
        after the CSS daemon has been evicted.
        crsctl get css reboottime
        #Author : Leshami
        #Blog   :
    http://blog.csdn.net/leshami

     

    五、心跳参数的调整  
     1) 10.2.0.2 to 11.1.0.7版本的修改方法
        a) Shut down CRS on all but one node. For exact steps use note 309542.1
        b) Execute crsctl as root to modify the misscount:
           $CRS_HOME/bin/crsctl set css misscount <n>    #### where <n> is the maximum private network latency in seconds
           $CRS_HOME/bin/crsctl set css reboottime <r> [-force]  #### (<r> is seconds)
           $CRS_HOME/bin/crsctl set css disktimeout <d> [-force] #### (<d> is seconds)
        c) Reboot the node where adjustment was made
        d) Start all other nodes which was shutdown in step 1
        e) Execute crsctl as root to confirm the change:
           $CRS_HOME/bin/crsctl get css misscount
           $CRS_HOME/bin/crsctl get css reboottime
           $CRS_HOME/bin/crsctl get css disktimeout

     

     2) 11gR2的修改方法
         With 11gR2, these settings can be changed online without taking any node down:

        a) Execute crsctl as root to modify the misscount:
           $CRS_HOME/bin/crsctl set css misscount <n>    #### where <n> is the maximum private network latency in seconds
           $CRS_HOME/bin/crsctl set css reboottime <r> [-force]  #### (<r> is seconds)
           $CRS_HOME/bin/crsctl set css disktimeout <d> [-force] #### (<d> is seconds)
        b) Execute crsctl as root to confirm the change:
           $CRS_HOME/bin/crsctl get css misscount
           $CRS_HOME/bin/crsctl get css reboottime
           $CRS_HOME/bin/crsctl get css disktimeout

     

    鹏城DBA总群

    展开全文
  • 发送线程clssnmSendingThread,该线程每秒钟向集群钟所有节点发送心跳信息。 分析线程clssnmPollingThread,该线程会分析收到的网络信息(私有),如果发现某一个或节点出现丢失网络心跳(超过misscount值)就会通知集群...

    ORACLE 11.2版本以上,集群心跳汇总图表如下:

    脑裂处理原则:

    1 节点数多的子集群存活。

    2 如果分裂的相同,则包含最小编号节点的子集群存活。

    可以通过以下命令,查询ocssd.bin的线程信息:

    pstack -p  PID<ocssd.bin>

    <1>  丢失网络心跳

    网络心跳主要由以下occd.bin线程:

    1 发送线程clssnmSendingThread,该线程每秒钟向集群钟所有节点发送心跳信息。

    2 分析线程clssnmPollingThread,该线程会分析收到的网络信息(私有),如果发现某一个或节点出现丢失网络心跳(超过misscount值)就会通知集群进行重新配置。

    3 重新配置现场clssnmRcfgMgrTheead该进程负责集群重新配置。

    4 派遣线程clssnmClusterListener负责从远端节点接受信息,根据信息类型发送给相关线程进行处理。

    <1.1> 丢失网络心跳,重新配置步骤

    1 当集群一个节点连续一段时间 (超过集群的misscount) 丢失网络心跳之后,分析线程决定发起重新配置集群。

    2 集群发起重新配置的节点为RM节点,这个节点通常为节点编号最小的,想集群其他节点发送重新配置消息,所有收到此消息的节点会回复该消息,并通知RM节点自己的状态。

    3 RM节点基于每个节点进行投票并检查是否有脑裂会发生。

    4 对于脑裂检查,RM节点会检查网络心跳无法.

    5 RM节点向表决盘的kill block中写入 "有毒信息",需要重启的节点在访问表决盘时读取到"有毒“信息时,完成对本节点的重启。如果RM节点发现某些节点已经离开集群,那么也会发生重新配置。

    6 RM节点修改集群列表(主要是在表决盘中),重新配置完成。

     

    在节点2 直接使用ifdown命令关闭唯一的私有网卡,节点1开始出现diskping相关日志。节点2被驱逐,将私网网卡ifup后,数据库启动正常。

    <2>  磁盘心跳

    磁盘心跳主要目的就是当集群发生时,帮助制定脑裂的解决方案 。

    Oracle集群的每一个节点 每秒钟都会像集群的所有表决盘注册本地节点的磁盘心跳信息,(也就是说vf中的信息是相同的),同时也将自己能够联系到的集群中的其他节点信息写入表决盘。

    一旦发生脑裂问题,css重新配置线程就可以通过表决盘中的信息了解集群节点之间的连通性,而决定集群分裂成几个子集群,以及每个子集群包含节点情况和每个节点的状态。

    磁盘心跳主要包含以下线程:

    1 磁盘心跳线程,(clssnmvDiskPingThread):该线程负责向集群的表决盘中发送 磁盘心跳信息,同时还负责读取表决盘中kill block的信息,以确定本节点是否需要重新启动。--发生脑裂时,才启动。

    展开全文
  •  在Oracle RAC中,能够从多个层次,多个不同的机制来检測RAC的健康...本文主要描写叙述了Oracle RAC下的几种心跳机制以及心跳參数的调整。 一、OCSSD与CSS OCSSD是一个管理及提供Cluster Synchronization Se...
  • Oracle RAC集群三种心跳机制

    千次阅读 2020-09-18 15:52:04
    例如一个4节点的集群集群的每一个节点每一秒钟都会向集群中的其他三个几点发送网络心跳信息,也就是说每个节点每一秒钟也会收到集群中其他节点发送的网络心跳。既然节点间互相发送网络心跳,就需要有一种机制来...
  • ORACLE集群概念和原理(二) Oracle集群概念和原理 Oracle的三种高可用集群方案 1 RAC(Real Application Clusters)   多个Oracle服务器组成一个共享的Cache,而这些Oracle服务器共享一个基于网络的存储。这...
  • Oracle RAC中,可以从多个层次,多个不同的机制来检测RAC的健康状况,即可以通过心跳机制以及一定的投票算法来隔离故障。如果检在Oracle RAC中,可以从多个层次,多个不同的机制来检测RAC的健康状况,即可以通过...
  • Oracle集群件组件

    2014-04-28 11:11:26
    Oracle集群件由"集群就绪服务"(CRS)使用“Oracle集群注册表”(OCR)和表决磁盘进行管理,OCR记录和维持集群及节点成员资格信息,表决磁盘在通信故障时充当一个仲裁者(tiebreaker)。在集群运行期间,来自所有...
  • Oracle集群概念和原理 RAC概述 RAC 集成集群件管理 RAC 的体系结构 RAC 的结构组成和机制 RAC 后台进程 RAC 共享存储 RAC 数据库和单实例数据库的区别 参考文献 相关文章 ORACLE集群概念和原理(二) ...
  • ORACLE集群概念和原理 转载:https://www.cnblogs.com/baiboy/p/orc2.html#_label1 目录 集群概念介绍(一) ORACLE集群概念和原理(二) RAC 工作原理和相关组件(三) 缓存融合技术(四) RAC 特殊...
  • ORACLE集群概念和原理(二) RAC 工作原理和相关组件(三) 缓存融合技术(四) RAC 特殊问题和实战经验(五) ORACLE 11 G版本2 RAC在LINUX上使用NFS安装前准备(六) ORACLE ENTERPRISE LINUX 5.7下DATABASE ...
  • ( 1 ) ocssd.log ( 10gR2 版本) ERROR : Internal Error Information: Category: 1234 ...对于11.2.0.2及以上版本的集群, 由于新特性reboot less restart的引人Oracle 会重新启动GI 而不会直接重启节点。
  • PowerHA/HACMP中的磁盘心跳

    千次阅读 2011-06-18 17:35:00
    HACMP/PowerHA的磁盘心跳使用磁盘作为集群内部通讯的工具, 传统的磁盘心跳每个磁盘只能作为2个节点之间的心跳, 集群为2个节点时, 需要1个磁盘心跳, 扩展到n(n>2)个节点后, 集群至少需要n个磁盘心跳, 这样n个节点可以...
  • Oracle 集群】ORACLE DATABASE 11G RAC 知识图文详细教程之ORACLE集群概念和原理(二) 阅读目录 目录Oracle集群概念和原理RAC概述RAC 集成集群件管理RAC 的体系结构RAC 的结构组成和机制RAC 后台进程...
  • ORACLE集群概念和原理(二) 概述:写下本文档的初衷和动力,来源于上篇的《oracle基本操作手册》。oracle基本操作手册是作者研一假期对oracle基础知识学习的汇总。然后形成体系的总结,一则进行回顾复习,另则...
  • 资源名称:Oracle RAC核心技术详解内容简介:《Oracle RAC核心技术详解》共包含13章,一部分:第1章~第9章,包含了对集群管理软件的详细介绍,读者可以在这部分找到关于11gGI和10gCRS核心技术的详细介绍,以及集群的...
  • Oracle 11g共享存储双机热备配置手册本文介绍 通过ServHA Cluster配置Oracle共享磁盘阵列双机容错集群。主要步骤:一、防火墙配置。二、安装Oracle 11g。三、配置监听器。四、配置Oracle 11g实例。五、修改Oracle 11...
  • ORACLE集群概念和原理

    千次阅读 2017-09-05 09:31:06
    Oracle集群概念和原理 Oracle的三种高可用集群方案 1 RAC(Real Application Clusters)   多个Oracle服务器组成一个共享的Cache,而这些Oracle服务器共享一个基于网络的存储。这个系统可以容忍单机/...
  • Oracle集群高可用 - RAC

    千次阅读 2020-11-30 18:06:26
    掌握Oracle数据库集群高可用的原理和技能,具备管理数据库集群的能力。
  • ORACLE DATABASE 11G RAC 知识图文详细教程之ORACLE集群概念和原理(二)
  • oracle 集群学习

    2015-03-16 21:30:00
    双机热备份方式的集群完全通过操作系统的cluster软件来实现,在同一个时刻,只有一台机器对数据库作操作,当这台机器发生故障以后,由操作系统cluster将所有资源切换到两外一个节点,防止单节点数据库故障。...
  • 集群概念介绍 集群术语须知 服务硬件:指提供计算服务的硬件,比如 PC 机、PC 服务器。 服务实体:服务实体通常指服务软体和服务硬体。 节点(node):运行 Heartbeat 进程的一个独立主机称为节点,节点是 HA ...
  • HA/HACMP中的磁盘心跳

    千次阅读 2016-03-29 13:45:07
    HACMP/PowerHA的磁盘心跳使用磁盘作为集群内部通讯的工具, 传统的磁盘心跳每个磁盘只能作为2个节点之间的心跳, 集群为2个节点时, 需要1个磁盘心跳, 扩展到n(n>2)个节点后, 集群至少需要n个磁盘心跳, 这样n个节点可以...
  • 服务器集群――双机热备 基于Windows 2003系统的Oracle集群 转载请注明原文:http://blog.csdn.net/xl_xunzhao/archive/2008/11/30/3413369.aspx1. A、B同时开 修改主机名、host文件 添加网卡 设置内网卡、外...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 5,684
精华内容 2,273
关键字:

oracle集群磁盘心跳