Octopus服务器日常管理及故障处理
一、日常关闭和启动服务
服务器开关机顺序:
先关闭主服务器,再关闭备份服务器;
先启动备份服务器,再启动主服务器 , 而对于主域和备份域服务器请先登录到主域控制器 (PDC Server) 。
2 、网络镜像恢复
在您日常关闭服务器并重新正常启动后,请按如下步骤实现主副服务器的重新同步镜像:
( 1 )启动 Octopus Server Service ;
缺省为自动启动,即 Start as Logon 。
通过 attach 主服务器,可以实现本地和远程启动或关闭该服务。
( 2 )在备份服务器上运行 Octopus HA+
点击桌面快捷键“ Octopus ”或开始 - 程序 -Octopus ,运行 VC++ 应用程序 :Octopus.EXE
Attach 备份服务器 (Legatont1)
( 4 ) Attach 主服务器 (Legatont2)
( 5 )网络导向和数据库镜像
已经设置为自动启动( Auto Start Service ),无须人工干预。
注意 : 系统已配置好 , 请勿随意修改。
二、重新做镜像同步
//! 注意
如果您的 MS SQL Server 数据库或镜像磁盘在备份系统未运行的时候,没有做任何的修改,如:增加、删除记录和文件的操作,系统默认为两台服务器启动后立即同步, 您无须再做镜像同步 。
如果您觉得有必要对数据库或应用系统进行重新同步,可以采用如下的方法进行重新同步:
镜像同步的实现方法:
选中需要镜像同步的系统文件或磁盘卷,点击“ Sync —— Spec ”快捷图标,选择“ Sync Now ”,选择不中断,开始镜像。未同步之前,天平图标是倾斜的,同步完成后,系统会显示以下的类似信息:
the specified sync 1 is completed
选择 OK ,结束。
问题的处理
大数据库的镜像
一般情况下, OCTOPUS HA+ 处理大数据库镜像的能力是很强的,正常的数据库(无论大小数据库)镜像速度为 100—400M/min 。
有时,有些证券营业部备份服务器的硬盘卷( Volume Set )和主服务器的设置或数据传输速率差别较大,或者由于主副服务器硬盘空间太小,在进行大数据库的镜像时,由于数据的读写失败( I/O error ),容易造成数据镜像中断和数据丢失。
镜像异常中断处理
数据库镜像异常中断后, OCTOPUS 将给用户提供各种错误信息,用户选择 OK 或者 Defer (沿后)之后,镜像将跳过该文件或数据库继续进行,请将发生错误的镜像文件和数据库复制到备份服务器。
第四章 系统维护
OCTOPUS 软件为用户提供了完整的系统维护功能,很多非系统性的错误, OCTOPUS 具有自动维护的功能,如:块文件的解锁( Unblock File Failed )、远程进程调用失败( PRC not Availiable )等;对于系统本身的错误, OCTOPUS 将给提供详细的信息提示,用户可以根据它迅速的作出判断和解决。
OCTOPUS 和 Windows NT 具有最佳的切合程度,其返回的信息有很多来自 NT 内核反馈信息, OCTOPUS 在读取该信息后进行分析再提示用户,另外一部分信息则由 OCTOPUS 在系统检测过程中发出。 OCTOPUS 的软件信息可以在四个地方找到:
1 ) Windows NT Event Log
2 ) SNMP Event Log
3 ) Octopus Client ‘ s Windows
4 ) POP-up Windows , Which appear over the Octopus Client ‘ s interface
从 OCTOPUS 用户界面中我们可以看到以下的信息提示灯:
Sites 服务器工作站站点信息
Files 镜像文件、卷的信息
Sync 卷和文件同步信息
Mirroring 镜像进程信息
Forwarding 网络的导向信息
Disk Space 磁盘空间信息
Message 系统信息提示
如果出现带红色标记的应用错误,请您即向您的产品提供商获得帮助,或通过网络站点获得快速的帮助。
第五章 灾难恢复过程
在系统被切换之后,备份服务器替代主服务器已经运行了一段时间后,建议采用以下的切回方法,以保证系统不因反镜像而丢失数据。
此过程请注意务必先与您的产品经销商联系,他们将为你提供十分详细的操作说明。
以下是“切回”的操作方式之一:
首先备份已切换为主服务器的备机上的 SQL server 和交易数据库(为系统最新的数据) , 备份的内容请参考第二章有关内容。
在不连接网线( LAN )的情况下,以 WINNT 的方式,将修复后的主服务器名称改为备份服务器名称,将控制面板 -- 网络 -- 协议 --TCP/IP 属性的 IP 地址改为备份服务器的 IP 地址;
注:此步一般不必采用 Octopus HA+ 中的 take over 功能;
连接网络, attach 主服务器(原先为备份服务器),在 clustering 项选 source, 重建 Octopus 系统的 data directory, 做镜像同步,使被切换为主机的副机上的增量数据被传输到原先的主服务器;
拔掉任何一台服务器的网线,断开网络, attach 主服务器(原先为备份服务器),在 Clustering 项选中 revert to ,将备 份 服 务 器 名 字 切 换 回 原 来的状态。 Machine name 项为 Legatont1 ;
将第 2 项中用 Windows NT 方式将主服务器名称恢复为原来的主服务器名;
连接网络,将 Octopus 恢复到原来的镜像同步状态,完成 切换回 操作。