|
针对本次项目需要达到的技术服务要求,并结合自身的特点,华际系统特制定以下服务、技术支持及培训方案:
一 、服务对象
以贵方提供的保修设备清单为准。
二 、服务期限
我方提供每周7天,每天24小时的全天候不间断服务,全年无休假。
服务时间和期限按照合同规定具体时间确定。
三 、服务方式
我方承担此次保修服务方式为风险式保修服务。
主要是平时的定期预防性维护和设备出现故障后的紧急维护、操作系统软件故障的解决、升级及其他相关技术支持服务等。
四 、服务费用
合同签订后,我方承担含维修维护服务的人工费用、更换备件的费用、相关技术支持及培训在内的一切费用。
如我方保修服务成本超过双方商定价格,超出部分也全部由我方承担。
五 、服务内容
1)设立24小时技术支持热线,免费提供技术咨询;
2)免费提供移机安装等技术服务;
3)免费提供相应的技术咨询和技术培训;
4)定期(每个月一次)预防性软硬件巡检和快捷的系统故障响应支持服务;
5)提供软硬件设备的安装、调试;系统调整(移机、升级、切换)到场支持;设备配置变更和调整;设备联接;系统和设备的微码升级;提供系统集成方面的技术支持;按需求提供各种软硬件解决方案;
6)免费提供业务系统的维护,包括设备的硬件系统、AIX操作系统、HACMP热备份系统、ORACLE数据库、CICS中间件等方面的故障诊断及排除、性能调优等,以保证其稳定运行;
7)备件的及时供应,设备出现故障后及时维修恢复;
8)硬件设备预防性检查维护,保障系统和相关外设的稳定运行;
9)在系统升级、年终结算等对系统要求较高的重要时段,提供现场值班服务,以满足客户在系统升级、年终结算等对系统设备稳定运行的较高要求;
10)进行技术交流和反馈,填写维护记录,并定期提供客户设备维护技术档案,以提高客户技术人员的日常维护水平和对问题的解决能力;
11)对客户系统运行提供合理化建议;
12)根据用户环境,进行应急方案演练,协助用户建立所有硬件及相关系统软件各种故障的恢复流程及紧急措施;
13)帮助客户订购设备消耗材料。
六 、24小时服务热线支持
提供全年(包括节假日)7×24小时热线电话支持服务:
技术副总: 13802585752
技术总监: 13316869018
地区/项目负责人:13922886963
北京中心技术支持:010-88091100(工作时间)
深圳总公司技术支持:0755-82078899(工作时间)
长沙办事处技术支持:0731-4417266(工作时间)
西安办事处技术支持:029-87979960(工作时间)
沈阳办事处技术支持:024-22511141(工作时间)
成都办事处技术支持:028-86402607(工作时间)
广州办事处技术支持:020-38860651(工作时间)
福州办事处技术支持:0591-87807111(工作时间)
武汉办事处技术支持:027-82740476(工作时间)
南京办事处技术支持:025-84400508(工作时间)
其它分支机构联络方法另文提供。
或在非工作时间直接拨打服务工程师的移动电话。
七 、主动式服务(定期预防性维护及系统性能调整)
1 、定期预防性维护
预防性维护服务也即定期为贵方的设备提供主动服务,针对本次项目,我方将每个月为贵方的保修设备进行一次预防性维护以下是具体执行计划:
1)整体维护方案
·根据设备情况组成专门项目小组,技术副总挂帅,技术总监负责。
·热线技术支持及到场服务。
·主机系统及外设按期进行全面维护。
·建立客户档案,填写设备维修记录(模板请见《方案书附件3》)。
·工程师定期走访,解决系统隐患,解答客户技术疑难。
·按期提交服务维护报告,根据具体情况提交专题报告。
· 根据客户的需求和具体情况,组织免费的技术培训,帮助客户提高自身的技术实力。
·技术总监、技术经理与总经理将进行不定期业务拜访,收集服务意见与反馈,可根据客户的具体需求随时更新服务方案,提高服务质量。
2)定期维护服务流程
· 我方每个月派经验丰富的工程师到客户设备现场进行预防性维护,查看设备、系统及数据库是否运行良好。
·电话预约
· 向客户工程师了解运行情况
· 工程师到现场维护
·填写维护技术报告
·向甲方工程师提交维护报告签字确认
· 技术报告归档
·对于主机系统,我方工程师将每个月做一次预防性维护。
· 对相关输入/输出设备(I/O),我方工程师将每个月做一次预防性维护。
·我方工程师每个月到贵方现场,或电话指导贵方工程师,对贵方的系统检查系统异常记录。
· 根据贵方需要的时间点,提供上述预防性巡检服务。
·在有必要时,我方工程师将及时为贵方系统做微码升级与工程改良。
· 我方工程师将为贵方的系统提供PTF安装服务。
·我方工程师将会经常性主动拨打电话给客户工程师,与技术人员进行交流,及时了解客户设备的运行情况。
3)预防性维护内容
① 硬件日常维护内容
· 硬件
·检查主机前面操作板LCD显示,如有系统错误代码显示,需尽快处理。
·检查机器后面的电源风扇、各设备的电源指示灯是否正常。
·检查各设备、控制卡的状态指示灯是否正常,。
· 设备的电缆连接是否正常。
·机房环境
·机房环境温度的检测。
·机房电源状况的检测。
· 针对检查结果提供预防性维护报告。
· 设备清洁
·对相关设备进行清洁卫生工作,保持良好的运行状态。
② 系统软件日常维护内容
· 操作系统
·系统错误日志
errpt >/tmp/err.summary
errpt -a > /tmp/err.detail
·文件系统检查、清理
使用 df 命令查看文件系统使用情况。对于不断增长的文件系统,如这些文件系统的使用率达到90%,则要考虑清理。以下是操作系统使用的临时文件,当所在的文件系统需要清理时,应该清空文件内容(不要删除文件)。
/smit.log
/smit.script
/var/spool/rwho/*
/var/spool/mail/*
/var/adm/sulog
/var/adm/wtmp
/etc/utmp
/etc/security/failedlogin
·PagingSpace 检查
使用lsps ?Cs命令,如果PagingSpace的使用率高于80%时,应考虑增大页空间大小。
·设备状态检查
lsdev -C
·网络检查
ping <hostname or IP address>
netstat -in
ifconfig -a
·磁盘阵列检查
使用diag命令检查7133阵列盘块的状态(good 工作正常, reserved 盘块被另一个系统使用 )查看7133阵列及盘块的指示灯的状态,阵列前面的琥珀色的灯亮,表示阵列有错。盘块的ready灯不亮表示故障,慢闪(亮2秒、灭2秒)表示有一路ssa
link断;check灯亮表示故障。
·外设检查
各网卡或SCSI卡的检测;磁盘驱动器的读写检测;磁带机的读写检测。
·系统运行性能检查
使用vmstat命令 (如: vmstat 3 100)观察系统CPU、内存、交换页的使用情况;若%USR加%SYS的和经常高于80%时,应考虑增加CPU的处理能力及内存大小。
使用iostat 命令 (如:iostat 3 100)观察硬盘使用情况,若硬盘的平均访问率(%tm_act)经常高于70%,应考虑硬盘的均衡负载、硬盘碎片整理。
· 高级检查
HD certificate/Advanced diag/ EC level update
·PTF的分发
·如果IBM已有发布,并且贵方需要,每半年提供一次cumulative PTF补丁程序。
·针对特别的授权软件在应用中的某个问题,随时提供IBM已发布的修正性PTF。
·AIX版本升级安装
·对AIX版本升级的计划和准备向贵方提出建议。
·安装新版本的AIX,并进行测试及确定其基本功能。
·HACMP软件的配置和安装
·安装HACMP软件
·配置网络
每台机至少需要两个网卡
配置/.rhost文件
配置/etc/hosts文件
·分别配置两台机心跳线
·配置 HA Topology(选择一台机配置)
配置Cluster
配置Node
配置Adapter
同步HA Topology
·配置HA Resource Group(选择一台机配置)
定义"Resource Group"
定义"Application Server"
配置"Resource Groups"
· 测试配置
模拟主机故障,备机接管(硬切换)
模拟备机启动HACMP并直接接管资源
· 数据库技术支持咨询服务
· 提供INFORMIX、SYBASE、ORACLE、DB2数据库的软件安装、参数配置、运行调试及性能调整。
·提供INFORMIX、SYBASE、ORACLE、DB2数据库的操作和管理方案。
·提供INFORMIX、SYBASE、ORACLE、DB2数据库的建档和备份建议。
· 提供INFORMIX、SYBASE、ORACLE、DB2数据库的数据移植和软件升级服务。
·提供INFORMIX、SYBASE、ORACLE、DB2数据库在AIX环境和HACMP双机热备份方式下的运转和操作方案。
·提供INFORMIX、SYBASE、ORACLE、DB2数据库在AIX环境下资源分配和数据空间扩充支持。
·提供INFORMIX、SYBASE、ORACLE、DB2数据库管理员(DBA)级的技术培训。
·CICS中间件等方面的故障诊断及排除、性能调优等
4)巡检记录
每次例行检查之后,工程师会就客户运行系统情况填写《RS/6000系统检查表》。格式详见本方案书附件4。
2 、性能诊断
我方将每个月提供一次系统运行性能诊断,按计划由专家定期对主机系统性能进行诊断,根据结果调整系统参数,使系统始终在最佳状态下运行,对可能出现的问题提供科学预测,并采取必要的预防和补救措施,防患于未然。具体的系统性能调整计划如下:
·调节CPU性能
操作命令为:sar 、vmstat,ps.
·调节内存使用
操作命令为:vmstat,ps,lsps.
·调整磁盘I/O性能
使用文件系统df,lsvg.lspv,iostat进行操作。
·调整网络性能
操作命令为:netstat,no.
八 、故障维修服务流程
针对贵方具体系统环境协助贵方技术人员制定应急计划和方案。
进行整机替换应急方案实施等服务。
1 、紧急服务流程
根据在系统运行维护中遇到的技术问题所划分的等级,我方制定了不同的服务流程,以便当贵方因设备或系统故障或紧急问题需要我方提供技术支持时,我方将根据不同的故障级别启动不同的服务流程。
·I级:属于普通问题;其具体现象为:系统技术功能、安装或配置咨询,或其他显然不影响业务的预约服务。
·首先我方工程师通过电话对问题进行初步了解,并报告技术总监;
·了解后,对问题进行诊断;
·通过电话解答用户工程师的咨询问题,协助用户工程师进行安装或配置;
·若问题无法通过电话解决,则与用户预约时间进行现场解决,或根据用户的需要进行处理;
·填写故障技术报告进行记录,以便日后双方归档。
·II级:属于较严重问题;其具体现象为:出现系统报错或警告,但系统能继续运行且性能不受影响。
·首先我方工程师通过电话对问题进行了解,获取报错或故障信息,并报告技术总监;
·同时,对问题进行初步诊断分析;
·通过电话对指导用户工程师监控系统运行,保障正常生产;
·同时携带可能损坏的相关部件立即赶至故障现场,确定故障原因;
· 排除故障,或更换相关部件;
· 填写故障技术报告进行记录,以便日后双方归档。
·III级:属于严重问题;其具体现象为:出现部分部件失效、系统性能下降但能正常运行,不影响正常业务运作。
·首先我方工程师通过电话对问题进行初步了解,获取相关信息,并报告技术总监和技术副总;
· 通过电话对指导用户工程师监控系统运行,保障正常生产;
· 同时携带可能损坏的相关部件立即赶至故障现场,确定故障原因;
·排除故障,或更换相关部件;
·与用户工程师交流,对故障问题进行跟踪;
·填写故障技术报告进行记录,双方归档。
·IV级:属于紧急问题;其具体现象为:系统崩溃导致业务停止、数据丢失。
·我方工程师接到呼叫,尽快赶到故障现场,同时汇报技术总监与公司总经理室。
·同时,技术总监与后备工程师根据接到的故障现象,携带可能损坏的相关部件也赶至故障现场。
·在故障现场进行问题诊断分析。
·进行故障排除,或更换有故障的配件。
·恢复故障设备系统运行。
·协助恢复应用、恢复数据,以使业务系统在尽可能短的时间内恢复运行。
· 故障处理汇报及预防措施实施。
·填写故障技术报告进行记录,双方归档。
|