操作系统集群的工作方式

HCL Domino®使用的集群方式称为应用程序集群 Domino®。 是一种应用程序,它不仅监控集群,还基于用户设置的参数确定应该发生故障转移和工作负载均衡的时间。另一种形式的集群是操作系统集群。在这种形式的集群中,操作系统监控集群并确定应该发生故障转移的时间。发生故障转移时,故障转移到的服务器(称作节点)将接管有故障的节点的资源,访问有故障的节点正在访问的存储空间,并运行有故障的节点正在运行的应用程序。

有两种运行操作系统集群的基本方法,即主动-被动和主动-主动。在主动-被动集群中,被动节点不运行自己的应用程序,而是等待在主动节点出现故障时接管有故障的节点。在主动-主动集群中,所有节点都运行自己的应用程序,但也可以在集群中的其他节点出现故障时接管有故障的节点。此外,可以将操作系统集群配置为仅当存在硬件故障时进行故障转移,也可以将其配置为当存在硬件故障或软件失败时进行故障转移。

因为 Domino® 使用的是应用程序集群,所以本部分不详细介绍操作系统集群使用的各种方法和配置。但由于可以在几种操作系统集群(包括 High Availability Cluster Multi-Processing (HACMP) 和 Microsoft 集群服务器 (MSCS) 中运行 Domino®,因此本部分描述了有关操作系统集群的基本信息。

注: 有关将操作系统集群软件配置为在 Domino® 中运行的信息,请参阅操作系统集群附带的文档。

操作系统集群提供的故障转移对用户是透明的。因为接收节点接管了有故障的节点的资源,所以用户可以看到与原始服务器相同的服务器名称和相同的网络地址。与多数操作系统集群不同的是,Domino® 集群执行智能故障转移。某台服务器出现故障时,Domino® 将检查它的集群高速高速缓存以查找集群中最可用的服务器。Domino® 还使您可以主动地控制工作负载均衡,这一点操作系统集群可能无法提供。此外,Domino® 集群还使您可以设置运行不同操作系统的服务器集群,而操作系统集群则要求所有节点都运行相同的操作系统。

要在主动-主动集群中运行 Domino®,必须使用节点上的 Domino® 分区服务器。这样做不仅可以使每个节点能够接管另一个节点的任务,并且同时还可以维护自己的任务。

要使用主动-主动配置,必须确保发生故障转移时每个节点都可以处理另一个节点的负载。

同时使用操作系统集群和 Domino® 集群的优点

同时使用操作系统集群和 Domino® 集群时,在 Domino® 集群中不能进行故障转移的事件可以在操作系统集群中进行故障转移。下面是几个示例:
注: 鉴于以上几种功能,设置与 Domino® 集群一起运行的主动-被动操作系统集群的确是一个好办法。
  • 大多数 Domino® 代理都不会进行故障转移,因此,Domino® 集群中的服务器发生故障转移时,正在运行的代理将不能继续在新服务器上运行。如果将这些代理配置成在特定服务器上运行,则 Domino® 发生故障转移后,它们将不能在其他服务器上运行。但是,在操作系统集群中,发生故障转移后使用的是相同的服务器名称。因此,这些代理可以在此服务器上运行。在操作系统集群中,如果代理按日程安排正在运行时发生了故障转移,那么,代理会在下一次安排运行时重新启动。
  • 如果有使用硬编码服务器名称的应用程序,当这些应用程序故障转移到其他 Domino® 服务器时,它们将不能运行。但是,在操作系统集群中进行故障转移之后,这些应用程序仍会运行,因为服务器名称仍然相同。
  • 如果用户正在编辑文档时服务器发生了故障,则用户无法在 Domino® 集群中保存此文档。用户必须将此文档粘贴到新服务器上的副本中。但是,在操作系统集群中,用户可以保存服务器发生故障时他们正在编辑的文档。
  • 管理进程不会在 Domino® 中进行故障转移。因此,为管理服务器设置操作系统集群会非常有用。