订阅云计算RSS CSDN首页> 云计算

介绍篇——Linux集群节点管理器与无单点故障

发表于2009-06-17 13:30| 次阅读| 来源51CTO| 0 条评论| 作者

摘要:《Linux企业集群》讲解如何在一个计算机网络中用有限的资源部署计算机,以及安装自由软件让计算机象一台服务器那样一起运行。本文具体讲解了Linux集群节点管理器与无单点故障。

集群节点管理器

集群外的服务器也可以做许多其他的事情,如:

为运行在集群内的应用程序充当许可证服务器
充当中心用户账号数据库
为所有集群节点提供其他服务如DNS和邮件
监视集群的健康状况

再说一次,运行在集群外服务器上的应用程序应该不需要修改以支持集群内的节点,也就是说,应用程序为客户端提供服务,集群节点不需要知道。
这些功能可以与一个高可用服务器对组成到一起,我们称之为集群节点管理器,集群节点管理器控制用户账号数据库(使用NIS或LDAP来为所有节点分配用户账号[5]),集群节点管理器监视集群的健康状况(使用Mon和Ganglia软件包,它们将在第4部分讨论),它还可以是一个中心打印假脱机程序(使用LPRng),集群节点管理器还可以使用传统的客户/服务器模式为集群提供许多其他服务,如发送传真。

Webmin和OSCAR软件包两者都有方法分配用户账号给所有集群节点,而不需要NIS或LDAP,但是这些方法仍然可以使用集群节点管理器作为中心用户账号数据库。

第17章末尾包括了对Hylfax的一个简短讨论。

无单点故障

我们可以通过讨论任何关键任务系统的基本需求来进一步描述企业集群架构:它必需无单点故障。

企业集群总是有下面的特性:集群内的任何计算机或集群正常操作依赖的任何计算机,可以在不重启全部集群的情况下被重新启动。

重启集群依赖的服务器而不影响集群的一个方法是为集群内的所有服务器建立高可用服务器对,我们的集群简图就应该重新画成下面的样子了,如图3所示。


  
图3:无单点故障的企业集群 

这张图显示了两个负载调度器,两个打印服务器和两个共享存储设备服务于四个集群节点。

在本书的第二部分中,我们将学习如何用Heartbeat软件包建立高可用服务器对,第三部分描述如何建立高可用负载调度器和高可用集群节点管理器。(回想前面的讨论,集群节点管理器可用是为集群提供打印服务的打印服务器)

注意:当然,一个集群节点可能意外停机,也可能不能再执行它的工作,如果真发生了这种事情,负载调度器应该智能地从集群中移除失效的集群节点,并给系统管理员发送一个警报信息,集群节点应该相互独立,这样它旁边的节点可以分配更多的工作,剩下的节点也不会因为失效节点受到任何影响。

小结

我已经介绍了术语集群的定义,我将在全书中理解如何建立一个集群作为逻辑模式使用它,我在这个介绍中提供的内容(Linux企业集群的四个基本属性)是本书的基本思想,在我介绍完实现这些思想的方法后,我将用最后一章提供一个对实现这些思想的物理模式介绍来结束本书,如果你想学习关于物理模式的知识,你可以跳过前面的章节直接阅读最后一章,或者,如果你只想创建一个集群并运行,你可以从第二部分开始阅读,如果你没有任何Linux经验,你可能应该从第一部分开始阅读,并阅读关于GNU/Linux操作系统基本组件的知识。

0
0
介绍篇——Linux集群节点管理器与无单点故障