随锐旗下互动传媒:

IBM TotalStorage Continuous Availability for Windows解决方案

http://www.weaseek.com  2006年10月13日 00:00:00   来源:搜讯网 发表评论

IBM TotalStorage Continuous Availability for Windows是软件、服务,也是存储解决方案,其设计目的是使客户能为Microsoft® Windows®操作系统上运行的应用程序提供高可用性及高容灾性。IBM TotalStorage Continuous Availability for Windows是高可用性的Tier 7 DR 解决方案。按照其设计,它允许 Microsoft Cluster Server 配置中的服务器驻留在不同的位置,且每个位置都有服务器和磁盘存储。若其中任一位置因灾难而丢失,则其设计可将应用程序处理故障转移到其他站点上,以降低对用户和应用程序处理环境的干扰。

IBM CAW for Microsoft Cluster Server 简介

IBM TotalStorage Continuous Availabilit y for Windows是软件、服务,也是存储解决方案,其设计目的是使客户能为Microsoft® Windows®操作系统上运行的应用程序提供高可用性及高容灾性。IBM TotalStorage Continuous Availability for Windows是高可用性的Tier 7 DR 解决方案。按照其设计,它允许 Microsoft Cluster Server 配置中的服务器驻留在不同的位置,且每个位置都有服务器和磁盘存储。若其中任一位置因灾难而丢失,则其设计可将应用程序处理故障转移到其他站点上,以降低对用户和应用程序处理环境的干扰。

Microsoft Cluster Server 的这类实现被称为分布式集群,这是因为单个服务器处理器或节点驻留在不同的位置。

每个站点都有处理器和磁盘存储。对一个位置的磁盘文件进行的更改将被复制到远程站点上。如果磁盘子系统或处理器在主站点上出现故障,或整个站点崩溃,则恢复站点将利用在该站点上持续更新的数据备份,自动重启应用程序。

该解决方案的组件有:运行 Windows操作系统的 Microsoft Cluster Server实现、提供磁盘存储的IBM TotalStorage 磁盘子系统、IBM Metro Mirror(同步点对点远程复制,PPRC)高级功能,以创建及更新远程磁盘副本,另外还有 IBM TotalStorage Continuous Availability for Windows 软件、通道扩展硬件以及为适应环境而实现与定制该解决方案的服务。

CAW的好处

IBM TotalStorage Continuous Availability for Windows 解决方案的设计目的是:

允许集群服务器和镜像存储在地理上被分隔为300 km及以上的距离,以便为 Windows 环境提供容灾特性。

结合服务器应用程序的高可用性以及文件和数据的灾难恢复功能。

支持2-8个节点的集群。

为应对计划外宕机提供发自动化站点故障转移和故障恢复功能。

为主、从站点上的计划外宕机提供自动化站点故障转移和故障恢复功能,如磁盘或服务器维护或代码更新。

使用常见的Microsoft Cluster Server接口。

CAW 解决的业务需求

在当今的随需应变业务环境中,用户需要维护那些访问其应用程序和数据的方法。服务器故障、存储子系统故障、网络及互连故障都能使业务流程中断。这类故障的恢复要花几小时、几天甚至更长时间。除了“普通”故障外,当今的业务还会面临因自然灾难、停电及人为事故造成的宕机。这些解决方案就是为提供高可用性和灾难恢复功能而设计的,通过增加集群节点和存储之间的分隔距离,提供改进的故障确定和两个存储子系统间的数据镜像,避免了由这些故障引起的宕机。使用IBM TotalStorage Continuous Availability for Windows,可方便地测试灾难恢复准备状况。此外,还支持为升级软件或硬件而按计划宕机。

CAW 的功能

按照IBM TotalStorage Continuous Availability for Windows的设计,它允许集群资源在两个站点之间进行故障转移。这些站点之间最远可相隔300 km。CAW支持主动/主动集群及主动/被动集群。即,两个站点上的每个节点都可主动运行应用程序,或一个站点作为主动的主站点,而另一个作为被动的从站点。当发生磁盘故障时,该解决方案使恢复站点服务器挂接磁盘卷的副本,并重启服务器应用程序。该解决方案提供了有关站点故障转移和恢复的信息消息。

CAW 中的多节点支持

IBM TotalStorage Continuous Availability for Windows目前支持由多达8个节点组成的集群。这允许集群外扩和上扩。对多节点集群的支持还允许以层次结构的方式移动应用程序,这使应用程序在故障转移到远程站点之前,可在站点内进行故障转移。

CAW最多支持两个远程站点上的所有节点组合(1x1、2x2、3x4、1x7、2x6、3x5、4x4等)。

为简单起见,本文档中的图仅演示了由两个节点组成的集群。

应用程序兼容性

IBM TotalStorage Continuous Availability for Windows使用标准的Microsoft Cluster Service接口,因此默认情况下,兼容MSCS的应用程序也与CAW兼容。使用这一解决方案,无须对支持MSCS的应用程序进行任何定制。

配置

图 1

产品模块

图 2

CAW for MSCS软件包由三个软件模块组成:

IBM CAW (PPRC) Cluster Resource DLL 和 Extension DLL

IBM SDD Server Service

IBM CAW Failover Service (IBM Geo Service).

这三个模块必须在集群中的每个节点上进行安装。后文将详述安装要求。

CAW Cluster Resource DLL和Extension DLL

Resource DLL和Extension DLL 管理 CAW 集群资源(IBM_PPRC)。MSCS 将Online、Offline、IsAlive 和 LooksAlive 等命令发送给CAW Resource DLL,在其中监控Metro Mirror 磁盘镜像的健康状况。CAW Resource DLL 在提出手动移动请求或在故障转移时,改变 METRO MIRROR 磁盘镜像的方向,由此可在站点之间移动物理磁盘集群资源,这从本质上交换了Source和Target卷的角色。IBM_PPRC 资源的所有管理都是通过 MSCS Administrator GUI完成的。

SDD Server Service

SDD Service 为基于多光纤通道主机的适配器(HBA)提供了多路径支持。

CAW Failover Service (IBM Geo Service)

CAW Failover Service 执行许多功能,以帮助确定 METRO MIRROR 链接的健康状况,并将quorum资源从一个集群节点移动到另一个节点上。

故障场景

下面几节将描述不同故障场景下的集群操作,当 Continuous Availability for Windows 运行时,这会影响站点故障转移。

服务器故障

图 3

其余节点通过仲裁获得 quorum 资源,且发生了故障转移,这逆转了受影响磁盘的 Metro Mirror 关系。

在修复故障服务器时,根据用户定义的组故障恢复策略,资源可故障恢复到首选所有者。

存储子系统故障

图 4

如前文所述,ESS 拥有内部数据保护机制,其是为帮助保护数据完整性而设计的。

当整个 ESS 发生故障时,MSCS 的 IsAlive 功能也将在该站点上发生故障,且 METRO MIRROR 链接状态将变为 METRO MIRROR_Down。

该站点上发生 ESS 故障的集群节点,将使其资源离线

根据 PPRC_Fault 模式,在运行 ESS 的站点上,集群节点通过故障恢复 Quorum 磁盘及数据磁盘的 METRO MIRROR 镜像方向,而使资源处于在线状态。

在修复 ESS 及重建 METRO MIRROR 时,根据用户设置(Microsoft Cluster Service 故障转移组故障恢复策略),资源可故障恢复到其首选所有者。

整体网络通信故障(私有及公共网络)

图 5

标准 MSCS 操作:

当私有和公共网络均发生故障时,集群节点将启动 quorum 资源仲裁流程,此时所有的集群节点都试图保留 quorum 资源。“赢得”quorum 资源仲裁的集群节点将使所有资源处于在线状态,其余集群节点将启动休眠周期,然后按照预定计划唤醒并重试发送心跳信号。

IBM CAW for MSCS 操作:

基本行为相同,拥有 quorum 的节点将保持在线状态。

CAW 确定另一站点上的节点是否已准备好,以防止磁盘失窃,这甚至无须使用经 Volume Replication 链接进行通信的网络服务,同时其他服务器仍在运行。

城域镜像链接故障

图 6

METRO MIRROR 通信故障表示站间镜像未发生。

如 METRO MIRROR 通信出现故障,但集群节点仍能通信,则根据用户选择的设置(PPRC_Fault_Mode);

FAILSTOP – 两个站点上的集群服务和应用程序都关闭。

NO_NEW_ONLINES – 拥有 quorum 的节点保持在线,其他节点和资源关闭。

FAILOVER –拥有 quorum 的节点保持在线,其他节点关闭,所有资源执行故障转移。(默认)

NO_MOVES –两个节点均保持在线,不允许转移。

CAW PPRC_Fault_Mode 设置可通过 IBM CAW Config 实用工具访问。

由于 ESS 的内部数据保护机制(RAID、集群、METRO MIRROR 排队),故障响应可由用户设置,这些机制可帮助提供站点上的数据完整性。磁盘卷直至 METRO MIRROR 通信被手动重建,且这些卷已被同步化,此时从站点上的磁盘卷才可变为在线状态。

单点故障或整体通信故障

图 7

在灾难性故障期间,如站点上的集群节点和存储均发生故障,甚至在整体通信故障(私有和公共网络、METRO MIRROR链接)期间,服务器故障场景将被执行;

FAILSTOP – 两个站点上的集群服务和应用程序均关闭。

NO_NEW_ONLINES –拥有 quorum 的节点保持在线,其他节点和资源关闭。

FAILOVER –拥有 quorum 的节点保持在线,其他节点关闭,所有资源执行故障转移。(默认)

NO_MOVES – 在此场景下与 NO_NEW_ONLINES 类似。

PPRC_Fault_Mode 故障转移选项

FAILSTOP – 两边均关闭。

NO_NEW_ONLINES –拥有 quorum 的节点保持在线,其他节点和资源关闭。

FAILOVER –拥有 quorum 的节点保持在线,其他节点关闭,所有资源执行故障转移。(默认)

NO_MOVES – 两个节点均保持在线,不允许转移。

CAW for MSCS 安装要求

IBM CAW for MSCS 是服务约定解决方案,其中 IBM Storage Services 将与您的 IT 部门一起配置 CAW,以适应您的独特业务环境的需要。

软件

IBM TotalStorage Continuous Availability for Windows Software Package

Microsoft Windows 2003 Advanced Server 或 Microsoft Windows 2003 Datacenter Server

IBM TotalStorage Command Line Interface

IBM Subsystem Device Driver (SDD) v1.6.0.5 或更高版本

IBM Subsystem Device Driver Service (SDDSRV)

硬件

通过卷复制链接的两个 IBM TotalStorage 子系统

DS8000

DS6000

DS4000

SAN Volume Controller (v1.2 或 v2.1)

ESS 800(microcode version 2.4 或更高版本)

ESS F20(microcode version 2.4 或更高版本)

两台企业类服务器。即 IBM eServerTM xSeries® 365 或 IBM eServer xSeries 445 服务器

网络

连接 IBM 存储子系统的集群节点

管理技能

Microsoft Windows Disk Management

Microsoft Windows 2003 Cluster Service Administration

IBM TotalStorage Storage Subsystem Administration

IBM TotalStorage Advanced Function METRO MIRROR Administration

IBM TotalStorage Storage Subsystem Command Line Interface

认证

Microsoft Hardware Compatibility 清单包含 Cluster/Geographic 产品目录。已通过 Microsoft Cluster Service Geographic Certification Tests 测试的 CAW 配置将被列在该目录下。该清单可在以下地址找到:http://www.microsoft.com/whdc/hcl/search.mspx。

附录

有关 IBM ESS 的更多信息:

http://www.storage.ibm.com/disk/ess/index.html

有关 IBM TotalStorage DS8000 的更多信息,请访问:

http://www.redbooks.ibm.com/abstracts/sg246452.html?Open

有关 IBM TotalStorage DS6000 的更多信息,请访问:

http://www.redbooks.ibm.com/abstracts/sg246471.html?Open

有关 IBM TotalStorage SAN Volume Controller 的更多信息,请访问:

http://www.redbooks.ibm.com/abstracts/sg246423.html?Open

有关 ESS Advanced Function METRO MIRROR 的更多信息,请访问:

http://publib-b.boulder.ibm.com/Redbooks.nsf/5193609f3941e9cf85256bc300724cfc/4f7e4d8493fac60c88256d4900814188?OpenDocument

有关 MSCS 的更多信息,请访问:

http://www.microsoft.com/windowsserver2003/technologies/clustering/default.mspx

© Copyright IBM Corporation 2004

IBM Systems and Technology Group

Route 100

Somers, NY 10589

在美国印刷

2004年4月

保留所有权利

如无IBM公司的书面授权,本文档的任何部分均不得以任何形式复制或传播。

关于IBM未来方向或意图的声明仅代表IBM的发展目标,如有变更或被取消,怒不另行通知。在最初出版时,已经检查了产品数据的准确性。产品数据如有更改,恕不另行通知。本信息可能包含技术错误或排版错误。IBM可能随时对产品和/或程序做出改进和/或变更,恕不另行通知。本文档中对IBM产品、程序或服务的引用,不代表IBM试图使它们可用于所有IBM运营或做生意的国家。对本文档中IBM程序产品的任何引用不声明或暗示只可以使用该程序产品。不侵犯IBM知识产权的任何功能上等效的程序都可以替代使用。评估或验证任何非IBM产品、程序或服务的运行是用户的责任。

IBM、IBM徽标、eServer徽标、Enterprise Storage Server、xSeries、TotalStorage是国际商业机器公司在美国和/或其他国家的商标或注册商标。

UNIX是The Open Group在美国和其他国家的注册商标。

Microsoft、Windows和Windows NT是Microsoft公司在美国和/或其他国家的注册商标。

其他公司、产品或服务名称可能是其他公司的商标或服务标志。

[责任编辑:]热门关键词:

相关文章

发表评论

  • 昵 称:
  • 匿名发表

>>更多评论

  • · 您将承担一切因您的行为、言论而直接或间接导致的民事或刑事法律责任
  • · 留言板管理人员有权保留或删除其管辖留言中的任意内容
  • · Weaseek.Com提醒:不要进行人身攻击。谢谢配合。