加入收藏 | 设为首页 | 会员中心 | 我要投稿 网站开发网_安阳站长网 (https://www.0372zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 移动 > 正文

征文:四大要点管理维护双机热备系统

发布时间:2016-10-30 02:23:36 所属栏目:移动 来源:谷和启 于网管,系统运行维护等工
导读:副标题#e# 【专稿】本人在省信息中心负责电子政务技术支持与运行管理,为了保证政务外网WEB系统、公务员考试网上申报、在线访谈等一些关键业务的稳定运行,我们采用了多台双机热备系统。 理解双机热备,必须要认清这样几点: 1.对于一台服务器而言,坏的可

二、定期查询HACMP的运行状态
    我们需要定期地查询HACMP 双机系统的状态,在双机系统的运行当中,我们经常需要知道双机系统的当前状态,才有可能对双机系统出现的异常情况进行恢复处理,才能保证双机系统的高可用性和高容错性。查询HACMP 双机系统的状态只需以root 用户进入需要查询的节点进行下列操作:

    首先检查HACMP 双机软件在该节点是否已启动命令如下。
    # lssrc -g cluster

    若是系统显示出下面类似的信息则说明HACMP 双机软件已正常启动。
    Subsystem Group PID Status
    clstrmgr cluster 22500 active
    clsmuxpd cluster 23674 active
    clinfo cluster 28674 active

    在已确认双机软件HACMP 正常启动的情况下在命令行执行下述命令来察看双机系统的当前状态。
    # /usr/sbin/cluster/clstat -a

    HACMP运行时只去检测网卡、网络和节点是否发生故障,并作出相应的转移、接管行为。对于其他故障,那么HACMP缺省不作任何动作。对于双机热备时出现硬盘控制卡和应用故障处理方法,一般是结合AIX基本功能和HACMP提供的一些机制,如Error  Notification Facility, clinfo API 等,同样可以实现对故障的监控并采取相应措施。

    如果用户的应用有kernel call调用,或以root身份来启动等,一旦应用发生故障,很容易导致AIX操作系统down掉,发生死机。这时实际上等于节点故障,HACMP会采取相应接管措施。如果只是应用自身死掉,AIX仍正常运行,HACMP最多利用Error Notification Facility来提供监控功能,对应用本身不采取任何动作。

    但如果应用中调用了AIX的SRC (System Resource Controller)机制所提供的API接口,就可以使应用在down掉后自动重新启动。除了SRC提供API接口外,HACMP中的clinfo也提供这样的API。clinfo是cluster Information daemon,它负责维护整个cluster的状态的信息,clinfo API允许应用程序利用这些状态信息来采取相应行动。

(编辑:网站开发网_安阳站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!