IT运维服务方案
一、服务内容
1.1 服务目标
运行维护服务包括,信息系统相关的主机设备、操作系统、数据库和存储设备及其他信息系统的运行维护与安全防范服务,保证用户现有的信息系统的正常运行,降低整体管理成本,提高网络信息系统的整体服务水平。同时根据日常维护的数据和记录,提供用户信息系统的整体建设规划和建议,更好的为用户的信息化发展提供有力的保障。
用户信息系统的组成主要可分为两类:硬件设备和软件系统。硬件设备包括网络设备、安全设备、主机设备、存储设备等;软件设备可分为操作系统软件、典型应用软件(如:数据库软件、中间件软件等)、业务应用软件等。
通过运行维护服务的有效管理来提升用户信息系统的服务效率,协调各业务应用系统的内部运作,改善网络信息系统部门与业务部门的沟通,提高服务质量。结合用户现有的环境、组织结构、 IT资源和管理流程的特点,从流程、人员和技术三方面来规划用户的网络信息系统的结构。将用户的运行目标、业务需求与IT服务的相协调一致。
信息系统服务的目标是,对用户现有的信息系统基础资源进行监控和管理,及时掌握网络信息系统资源现状和配置信息,反映信息系统资源的可用性情况和健康状况,创建一个可知可控的 IT环境,从而保证用户信息系统的各类业务应用系统的可靠、高效、持续、安全运行。
服务项目范围覆盖的信息系统资源以下方面的关键状态及参数指标:
运行状态、故障情况
配置信息
可用性情况及健康状况性能指标
统计运维数椐、提供信息系统管理和工作报告、归纳总结并提供用户想了解的数椐报告
1.2 信息资产统计服务
此项服务为基本服务,包含在运行维护服务中,帮助我们对用户现有的信息资产情况进行了解,更好的提供系统的运行维护服务。
服务内容包括:
硬件设备型号、数量、版本等信息统计记录
软件产品型号、版本和补丁等信息统计记录
网络结构、网络路由、网络 IP地址统计记录
综合布线系统结构图的绘制
其它附属设备的统计记录
硬件设备清单统计
1.3 网络、安全系统运维服务
从网络的连通性、网络的性能、网络的监控管理三个方面实现对网络系统的运维管理。网络、安全系统基本服务内容:
(1)用户现场技术人员值守
根据用户的需求提供长期的用户现场技术人员值守服务,保证网络的实时连通和可用,保障接入交换机、汇聚交换机和核心交换机的正常运转。
现场值守的技术人员每天记录网络交换机的端口是否可以正常使用,网络的转发和路由是否正常进行,交换机的性能检测,进行整体网络性能评估,针对网络的利用率进行优化并提出网络扩容和优化的建议。
现场值守人员还进行安全设备的日常运行状态的监控,对各种安全设备的日志检查,对重点事件进行记录,对安全事件的产生原因进行判断和解决,及时发现问题,防患于未然。
同时能够对设备的运行数据进行记录,形成报表进行统计分析,便于进行网络系统的分析和故障的提前预知。具体记录的数据包括:
配置数据
性能数据
故障数据
(2)现场巡检服务
现场巡检服务是对客户的设备及网络进行全面检查的服务项目,通过该服务可使客户获得设备运行的第一手资料,最大可能地发现存在的隐患,保障设备稳定运行。
同时,将有针对性地提出预警及解决建议,使客户能够提早预防,最大限度降低运营风险。
巡检包括的内容如下:
(3)网络运行分析与管理服务
网络运行分析与管理服务是指工程师通过对网络运行状况、网络问题进行周期性检查、分析后,为客户提出指导性建议的一种综合性高级服务,其内容包括:
(4)重要时刻专人值守服务
保证重要时刻设备稳定运行对客户成功尤为关键,因此,可对客户提供重要时刻的专人现场值守支持,包括政府客户的重大会议期间、金融客户的年终结算日、运营商客户的生产网重大割接或其它任何客户认为可能对其业务运营产生重大影响的时刻。
如需专人值守,客户需至少提前 3周与授权服务商客户服务经理联系。对每位合约客户,授权服务商均需按事先合同约定提供专人值守服务。客户如需超出合同约定范围的更多值守支持,需额外支付相应人力和差旅费用。
1.4 主机、存储系统运维服务
主机、存储系统的运维服务包括:主机、存储设备的日常监控,设备的运行状态监控,故障处理,操作系统维护,补丁升级等内容。
主机存储系统基本服务内容:
现场值守人员可进行监控管理的内容包括:
CPU 性能管理;
内存使用情况管理;
硬盘利用情况管理;
系统进程管理;
主机性能管理;
实时监控主机电源、风扇的使用情况及主机机箱内部温度;
监控主机硬盘运行状态;
监控主机网卡、阵列卡等硬件状态;
监控主机 HA运行状况;
主机系统文件系统管理;
监控存储交换机设备状态、端口状态、传输速度;
监控备份服务进程、备份情况(起止时间、是否成功、出错告警);
监控记录磁盘阵列、磁带库等存储硬件故障提示和告警,并及时解决故障问题;
对存储的性能(如高速缓存、光纤通道等)进行监控。
1.5 数据库系统运维服务
数据库运行维护服务是包括主动数据库性能管理,数据库的主动性能管理对系统运维非常重要。通过主动式性能管理可了解数据库的日常运行状态,识别数据库的性能问题发生在什么地方,有针对性地进行性能优化。同时,密切注意数据库系统的变化,主动地预防可能发生的问题。
数据库运行维护服务还包括快速发现、诊断和解决性能问题,在出现问题时,及时找出性能瓶颈,解决数据库性能问题,维护高效的应用系统。
数据库运行维护服务,主要工作是使用技术手段来达到管理的目标,以系统最终的运行维护为目标,提高用户的工作效率。
具体数据库运行维护监控的基本服务内容包括:
1.6 中间件运维服务
中间件管理是指对 BEA Weblogic、MQ等中间件的日常维护管理和监控工作,提高对中间件平台事件的分析解决能力,确保中间件平台持续稳定运行。中间件监控指标包括配置信息管理、故障监控、性能监控。
执行线程:监控 WebLogic配置执行线程的空闲数量。
JVM内存:JVM内存曲线正常,能够及时的进行内存空间回收。JDBC连接池:连接池的初始容量和最大容量应该设置为相等,并且至少等于执行线程的数量,以避免在运行过程中创建数据库连接所带来的性能消耗。
检查 WEBLOG日志文件是否有异常报错
如果有 WEBLOG集群配置,需要检查集群的配置是否正常。
二、运维服务流程
建议用户采用的服务方式为两种:一种为技术人员现场值守,另一种是定期巡检结合故障现场服务。
技术人员现场值守运行维护服务的基本操作流程如下图所示:
定期巡检结合故障现场运行维护服务的基本操作流程如下图所示:
三、服务管理制度规范
3.1 服务时间
(1) 接收服务请求和咨询:在5*8 小时工作时间内设置由专人值守的热线电话,接听内部的服务请求,并记录服务台事件处理结果。
(2) 在非工作时间设置有专人7*24 小时接听的移动电话热线,用于解决内部的技术问题以及接听7*24 小时机房监控人员的机房突发情况汇报。
(3) 服务响应时间:
技术支持人员在解决故障时,会最大限度保护好数据,做好故障恢复的文档,力争恢复到故障点前的业务状态。
对于 “系统瘫痪,业务系统不能运转”的故障级别,如果不能于12小时内解决故障,将在16小时内提出应急方案,确保业务系统的运行。故障解决后24小时内,提交故障处理报告。说明故障种类、故障原因、故障解决中使用的方法及故障损失等情况。
3.2 行为规范
(1)遵守用户的各项规章制度,严格按照用户相应的规章制度办事。
(2)与用户运行维护体系其他部门和环节协同工作,密切配合,共同开展技术支持工作。
(3)出现疑难技术、业务问题和重大紧急情况时,及时向负责人报告。
(4)现场技术支持时要精神饱满,穿着得体,谈吐文明,举止庄重。接听电话时要文明礼貌,语言清晰明了,语气和善。
(5)遵守保密原则。对被支持单位的网络、主机、系统软件、应用软件等的密码、核心参数、业务数据等负有保密责任,不得随意复制和传播。
3.3 现场服务支持规范
运维服务人员要做到耐心、细心、热心的服务。工作要做到事事有记录、事事有反馈、重大问题及时汇报。严格遵守工作作息时间,严格按照服务工作流程操作。
(1)现场支持工程师应着装整洁、言行礼貌大方,技术专业,操作熟练、严谨、规范;现场支持时必须遵守用户单位的相关规章制度。
(2)现场支持工程师在进行现场支持工作时必须在保证数据和系统安全的前提下开展工作。
(3)现场支持时出现暂时无法解决的故障或其他新的故障时,应告知用户并及时上报负责人,寻找其他解决途径。
(4)故障解决后,现场支持工程师要详细记录问题的发生时间、地点、提出人和问题描述,并形成书面文档,必要时应向用户介绍故障出现的原因及预防方法和解决技巧。
3.4 问题记录规范
根据使用人员提出问题的类别,将问题分为咨询类问题和系统缺陷类问题二类:咨询类问题是指通过服务热线或现场解疑等方式能够当场解决用户提出的问题,具有问题解答直接、快速和实时的特点,该问题到现场支持人员处即可中止,对于该类问题的记录可使用咨询类问题记录模版进行记录。系统缺陷类问题是指使用人员提出的问题涉及到系统相应环节的确认修改,需要经过逐级提交、诊断、确认、处理和回复等环节,处理解决需要项目组的分析确认,问题有解决方案后,将解决方案反馈给用户。具体提交流程如下:
(1)问题提交。应用信息系统的用户发现属于系统缺陷类的问题时,填写系统缺陷类问题提交单,提交服务支持中心。
(2)问题分析。服务中心接到用户提交的问题单,要组织相应人员对问题单中描述的问题进行分析研判,确定问题的类型(技术问题、业务问题或者操作问题)。
属于技术问题,提交服务中心技术人员对存在的问题提出具体的处理意见和建议;属于业务问题,提交服务中心业务人员进行处理;属于操作问题,可安排相关人员对问题提出人进行解释,并将系统缺陷类问题提交单转为系统咨询类问题提交单。
(3)问题确认、解决。服务中心的技术人员和业务人员收到系统缺陷类问题提交单后,对提交的问题进行归类汇总和分析、确认。
可以解决的,明确问题解决的具体处理建议和措施,经主管领导签字同意后,交实施人员进行解决方案的实施。服务人员确认是否解决,并将解决方法附在系统缺陷类问题提交单上反馈给问题提出人员。
(4)问题上报。服务人员收到经业务或技术人员确认的系统缺陷类问题提交单后,上报服务中心。
(5)问题回复。服务中心根据提交问题的进行分析,制定解决方案并进行实施的解决,同时做好变更记录。将解决方案汇总后及时向问题提交单位或问题交办单位作出回复,并将分析过程和问题产生原因一并提交。
四、应急服务响应措施
针对项目制定了详尽的设计、应急处理预案,整个流程严谨而有序。但是,在服务维护过程中,意外情况将难以完全避免。
下面,我们将对项目实施的突发风险进行详细分析,并且针对各类突发事件,设计了相应的预防与解决措施,同时提供了完整的应急处理流程。
4.1 应急基本流程
维护服务应急处理流程
4.2 预防措施
针对上门服务过程中可能遇到的各种各样的风险,针对一些可能出现的情况,制定了一系列预防处理措施,举例如下:
4.3 突发事件应急策略
系统运维应急方案是对中断或严重影响业务的故障,如宕机、数据丢失、业务中断等,进行快速响应和处理,在最短时间内恢复业务系统,将损失降到最低。
在系统维护过程中,突发事件的出现将是很难完全避免的,针对这种情况,设计了完善的突发事件应急策略。
系统巡检人员要定期规范检查各硬件设备的运转情况和应用软件运行情况,同时做好日常的数据增量备份和定期全备份。
对发现的问题在报各级负责人的同时,要协调相关资源分析问题根源,确定解决方案和临时解决措施,避免造成更大的影响。问题得到稳定或彻底解决后,要形成问题汇报,避免以后类似重大紧急情况的发生。
对发现的问题在报负责人的同时,要协调相关资源分析问题根源,确定解决方案和临时解决措施,避免造成更大的影响。问题得到稳定或彻底解决后,要形成问题汇报,避免以后类似重大紧急情况的发生。
当获悉出现突发事件时,技术支持人员可以立即从知识库中获取相应的应急策略,并综合用户方的具体情况,给出相关解决方案,然后在第一时间以电话、邮件支持或现场服务的方式帮助用户解决问题,尽最大努力减小突发事件对用户日常应用的影响。
机房整体搬迁服务方案
1、项目分析
1.1 搬迁项目背景
随着自身业务的不断发展,现有IDC机房已无法满足承载着主要业务系统的IT软硬件的增长需求。需要将现有IT系统硬件搬迁至具有较高资源扩展性的IDC机房,以满足业务的快速发展。
机房整体搬迁对服务支持标准、故障排除时间和业务恢复时间有严格要求 ,需要做好所有应用系统的备份与恢复、存储数据的同步与迁移、应用系统在新旧机房的协同运行、设备的分拆与组装、设备的搬迁与应急环境的搭建等工作,同时提供数据、硬件、系统软件和数据库核心软件等层面技术支持。
1.2 搬迁项目要求
硬件技术要求
(1)搬迁设备勘察、评测、论证、处理等;搬迁设备检查及故障诊断处理、搬迁设备标签、应急预案的提交、验收方案及验收文档报告的提交;
(2)协助客户做好新旧机房现场协调管理和新旧机房搬迁全局管理;协助客户协调好甲乙方、厂商、集成商、服务商等的关系;搬迁过程中各类标签的张贴、设备下架、包装、运输至新机房、设备上架、上电;各类最终标签的张贴;配合应用系统调试;搬迁设备搬迁过程中的保修费用(软硬件);为了在承诺的工期内完成搬迁工作而提供的小型机、服务器等设备的备机、备件;为保证数据安全而提供的数据备份与恢复。
(3)设备拆卸、包装、运输、安装,及设备运输安全保证和数据安全保证;
软件技术规范
确保客户指定计算机设备在规定的时间内系统和数据库等软件启动正常并对外提供正常服务。
确保设备全部硬件完好搬迁到指定位置,并确保客户明确的设备在规定的时间内加电、系统启动和数据库等软件启动正常并对外提供正常服务。
其他相关特殊要求
1、要求供应商承诺:
(1)要求施工的工程,承诺提供最优惠价格。
(2)要求供应商承诺,为客户施工项目,如果使用过程中,发现施工缺陷或隐患,进行免费维修、保修工作。
(3)要求供应商承诺,如因未按施工方案执行,给客户造成损失的,应按损失金额向我行进行赔偿。
2、供应商承诺满足客户技术、服务、商务等相关条款要求时,不附加任何前提条件或特殊说明。
2、搬迁方案
2.1 搬迁思路
在机房系统搬迁过程中,因业务系统及数据极其重要,数据的完好和业务系统的正常运行需要得到保证。业务系统需7*24小时运行,本次搬迁过程中,需要保证尽量减少业务系统的停止时间。
在本项目中,用户提出在 ______________________________ 应急环境,待搬迁前,将位于 ___________________ IDC机房内运行的业务系统切换至 _____________ 应急环境中运行。此种方式的优势如下:
优势:
1、确保业务的连续性和可用性;
2、搬迁过程中不影响业务的正常使用;
龙瞻信息建议采用“先准备应急环境,后整体搬迁”的方式实现机房搬迁的顺利进行。同时辅助各个职能的工程师现场实施并配合各项工作来完成整个数据中心的搬迁工作。搬迁整体工作,包含整个搬迁的设备系统的(冷备)备用系统搭建、系统割接、设备下架,物流及到新机房后的上架,整体调测等过程。
基于我们前期对用户业务及设备的调研分析上,我们根据业务的重要性及设备间的相互关联,将需要搬迁的设备按照用户当前的实际应用系统来划分。在详细的前期资料收集和调研后负责制定每一个系统的详细规划、设计、准备、及实施工作。通过分阶段划分搬迁目标的方式完成整个系统的搬迁工作。
我们通过制定严格文档管理制度,来协助完成搬迁信息的整理和分发。在搬迁前期清点阶段,对各个机柜等做好严格标记,依照设计部门的设计,进行机柜的整体搬迁。搬迁后测试方案来保证搬迁的顺利完成。
在搬迁完成后,确保搬迁设备在前期规划指定位置,保证所有系统无损。一旦发生故障,通过现场设备进行快速修复;若涉及切换到应急系统的需考虑二次迁移,修复原系统设备后,在合适的时间进行停机割接和数据的回切,实现系统顺利重新运行在原系统环境中,最终完成该系统的搬迁工作。
2.2 项目阶段性规划
鉴于数据中心迁移项目搬迁的复杂性以及所涉及的人员、部门、设备多样性,整个搬迁项目的规划及实施时间非常紧凑。
根据不同时期的工作重点,我们将搬迁项目划分为三个阶段:Ⅰ.评估与建模阶段、Ⅱ.详细设计阶段、Ⅲ.实施阶段。
第一阶段为搬迁的评估与建模,主要对用户的设备 / 业务现状进行调研分析,及用户新数据中心的需求进行收集整理。 通过编制现有 IT 系统拓扑逻辑详图,理清现有系统中所有硬件、软件、系统、应用等信息及其相互间的关联,确保所有相关信息完整地显示出来。同时,根据用户新数据中心的使用规划,编制新机房系统拓扑逻辑详图。进行初步设计、规划、以及评估,为搬迁做好准备。
第二阶段将进行详细方案地设计,并制定预演方案及风险准备计划。 根据现有 IT 系统拓扑逻辑详图,通过与用户 IT 、网络、业务部门及设备运输物流商等各方面的充分的沟通,划分设备搬迁的具体批次及方法,分别制定详细的搬迁方案及相应的应急修复方案。
本阶段的目标是:双方确认的详细的搬迁 / 预演 / 灾难恢复方案及执行计划。
第三阶段即进行搬迁的实施及管理。根据第二阶段设计的详细方案,各小组开始做搬迁前的各项准备工作,进行搬迁后系统的测试及检验。
2.3 搬迁前期准备工作
龙瞻信息为每个搬迁项目提供有效的搬迁前咨询服务,我们通过细致的调研和有效的沟通,为数据中心的迁移研究可行的方案。搬迁前全面调研和需求分析对于搬迁方案的合理性起着关键作用,以下是主要的调研内容:
搬迁设备现场勘察、访谈并确认需搬迁系统及设备;
新数据中心基础设施调研确认满足现有及将来可能增加的设备各类需求;
设备物理位置变动调研;设备新机房新位置可行性规划;
系统变更需求调研;业务地址变更需求;
系统配置信息收集;如系统硬件配置, HA 配置等;
应用系统信息收集;收集各类业务系统信息;
应用系统关联性分析是成功搬迁,降低停机时间的最关键所在;
数据风险、安全分析;对数据的安全性进行有效的分析;
物流条件和资源调研;熟悉搬迁路线,提前发现可能影响物流的问题。
通过前期沟通及调研,通过调研准备,获取最详细的老机房位置图。其中包含设备位置、设备配置信息、系统业务信息、管理人员等相关资料统计,作为搬迁的基础数据。在新机房,建议设备位置规划保持和原有机房保持一致,降低上下架所消耗的时间,可以提高搬迁的效率。
2.4 搬迁前数据备份
数据可以说是企业的生命,所以搬迁的重中之重就是要确保数据万无一失,要做到数据的绝对安全的最好办法就是在搬迁前进行一次全面的数据备份,以保证数据的可用性和完整性。
通过严格的备份策略来保障备份数据的有效性,具体备份计划在项目开始调研后完善。
系统、数据备份需求调研
备份方案测试
备份实施
必要的备份恢复
2.4.1 系统数据备份方式
我们通过合理的系统数据备份方式实现数据备份。
IBM 小型机技术保障方案
通过 AIX 的 mksysb 工具,实现对 AIX 操作系统的备份,可以制作成可引导的磁带,在根盘 OS 损坏时进行磁带引导恢复。
通过 AIX 的 LVM 镜像管理软件,制作根盘 AIX 的 OS 镜像,在搬迁前同时做好既有根盘 LV 的镜像健全检查。确保系统环境运行正常。
Linux /Windows 系统的技术保障方案
Linux 、 windows 等 x86 平台的系统备份有多种实现方式,我们推荐通过 TrueImage 或 Ghost 实现备份,应急恢复使用。
Ghost 备份
针对 PC 上 Linux 和 Windows ,我们使用 Ghost 工具进行全盘映像备份,具体方法举例如下:
接下来需要利用 Ghost 制作 .GHO 映像文件,进行系统备份
新增一块硬盘挂接在 PC Server 上,前者作为第二硬盘,用于存放映像文件。启动机器,用 DOS 盘引导后,运行 Ghost (建议使用 8.3 版本),选择 Local → Partion → To Image ,再分别指定源分区和映像文件所在盘与文件名(如 Unix . GHO ),选定 " 高压缩比 " 并确认后, Ghost 开始工作。
True Image 备份
通过网络备份到提前准备的 ftp Server 或者 windows 共享上面,具体方法举例如下:
用做好的 True Image 光盘启动机器,选择 AcronisTure Image Server(Full version)
然后在 Tools->Options 里面配置 True Image 识别到的网卡,配置上该机的原有 IP 地址。然后选择 Backup
然后,根据提示对整块盘进行备份
备份文件可以存放在远端的 windows 共享目录中, FTP 中,或者 USB 硬盘等上面。本备份在搬迁当天停止应用后进行,这样可以连同非系统数据一起备份;
2.4.2 备份数据量估算
我们有完善的方式来估算需备份的数据。根据系统备份,进行完全备份的数据量计算如下:
PC服务器数据量:
假设平均按100 GB/ 台(含操作系统、应用程序、数据库)等,合计数据量为 30 * 100 GB= 3T B;这部分数据可以通过刻盘或复制到存储备机保存。
设备搬迁过程中的主要备份为系统数据备份。
其它的数据库数据或大容量数据备份需求,可通过原有的备份环境进行备份或者 采用大容量移动介质 。另外 一种方式是 通过应急系统,实现对系统数据的备份。
2.4.3 备份时间安排
我们将安排充足的技术人员进行同时操作,我们将按照合理估算,预计完成所有备份的时间在一般8-10小时以内。在安排搬迁进度时,我们将充分考虑到进度安排,对搬迁技术人员进行合理的任务分配。
由于要保证备份数据的完整性,因此备份工作特别是数据库的备份必须要等到用户正式停止应用后方能进行。为了节约搬迁时间,各个主机的操作系统备份可以在搬迁正式实施之前就开始准备,但是前提是注意不影响生产系统的正常运行。
2.5 应急方案
数据中心搬迁会存在的一定的风险,为保证搬迁的按计划顺利进行,龙瞻信息对每次搬迁都准备了相关的应急措施,以备搬迁过程中出现问题能尽快解决,尽量缩短由于突发事件引起的系统中断。根据用户普遍存在多平台、多层次的业务环境的情况,因此我们在搬迁过程中需要针对基础架构中每个层面 / 平台做出对应的应急处理方案,以确保搬迁过程的顺利进行。
2.5.1 搬迁风险分析
一、 项目风险管理概述
每个项目都会面临各种各样的风险,有偶发的、人为的、内部的、外部的原因,为此,对项目进行风险评估,以采取相应措施来降低可能出现的风险是项目管理必不可少的过程。
综合机房搬迁项目的设计和实施是一个高风险的项目,这些不利的风险存在于整个项目中,并往往会给项目的推进和项目的成功带来负面影响。风险一旦发生,它的影响是多方面的,如导致项目的最终功能无法满足用户的需要、项目费用超出预算、项目计划拖延或被迫取消等,其最终体现为客户满意度的降低。因此,在项目实施过程中,要确保及时获得项目进程中所需的各种信息,及时预见、报警和防范工程实施中可能出现的各种风险,从而保证最小程度的差误损失。识别风险、评估风险并采取措施应对风险即风险管理有着十分重要的意义。
二、 项目风险管理步骤
项目的风险是多方面的。为此,项目风险管理主要有以下几个步骤:风险识别、定性 / 定量风险分析、风险应对计划编制及风险监控。
风险识别 (Risk Identification)
风险识别是指识别并记录可能对项目造成不利影响的因素。风险识别不是一次性的工作,而需要更多系统的、横向的思维。几乎所有关于项目的计划与信息都可能作为风险识别的依据,如项目进度及成本计划、工作分解结构、项目组织结构、项目范围、类似项目的历史信息等。
风险分析 (Risk Analysis)
其次,通过风险识别过程所识别出的潜在风险数量很多,但这些潜在的风险对项目的影响是各不相同的。 “风险分析”即通过分析、比较、评估等各种方式,对确定各风险的重要性,对风险排序并评估其对项目可能后果,从而使项目实施人员可以将主要精力集中于为数不多的主要风险上,从而使项目的整体风险得到有效的控制。
风险应对 (Risk response)
最常采用的应对威胁的几种措施是:规避、减轻、转移、接受。
风险监控 (Risk monitoring)
风险监控主要包括以下任务:
在项目进行过程中跟踪已识别风险、监控残余风险并识别新风险。
保证风险应对计划的执行并评估风险应对计划执行效果。
对突发的风险或 “接受”的风险采取适当的权变措施。
三、 项目总体风险评估及防范计划
下面,我们从整个项目的角度,从沟通、技术方案、时间、项目范围及项目实施不同层面进行分析,看本项目可能存在的风险,及我们的防范计划。
序号 | 工程实施风险 | 严重程度 | 可能性 | 应对措施 |
---|---|---|---|---|
1 | 项目涉及机房内全部信息系统搬迁,工程实施内容多 | 高 | 高 | 1.制定详细、精确的搬迁方案; |
2 . 尽可能多配置有经验的实施人员,并尽可能并行实施; | ||||
3.严格的项目管理及进度控制。 | ||||
2 | 从实施方案制定到搬迁实施,; | 高 | 高 | 1.制定实施方案时对现状的梳理要完整、准确 |
2.配置变更必须及时通知搬迁项目管理小组; | ||||
3. 搬迁前必须对 “搬迁单元”进行再次检查、确认。 | ||||
3 | 数据中心搬迁项目包括新数据中心网络建设、服务器、网络、存储、外设的拆卸、安装和搬运技术方案复杂 | 高 | 高 | 1.专业咨询服务商进行详细方案设计,合理划分搬迁单元和搬迁任务; |
2.专业搬迁服务公司实施搬迁工作; | ||||
3.设备厂商提供现场支持、保障 | ||||
4 | 原有业务切换到应急环境失败 | 高 | 高 | 依据 风险预估方案 紧急 实施 业务 回滚到 原有IT 环境 . |
5 | 搬迁过程中设备或系统故障 | 中 | 高 | 1.搬迁过程中通过系统备份 |
2.搭建应急系统平台,搬迁前进行系统切换后再进行搬迁原系统平台 | ||||
6 | 搬迁过程中设备损毁 | 高 | 低 | 1.制定详细的安全防范措施,尤其是针对没有冗余的设备 |
2.要求相关设备厂商和系统厂商提供现场支持,并确保备品、备件的库存及快速响应能力 | ||||
3.选择有经验和资质的物流公司 | ||||
4.选择合适的合作伙伴签订紧急供货及安装服务协议 | ||||
5.购买保险 | ||||
7 | 搬迁导致数据破坏 | 高 | 低 | 1.制定搬迁前的数据保护方案及紧急恢复预案 |
2.测试、验证数据保护与恢复预案 | ||||
3.搬迁前严格按照预案进行数据保护,并验证保护的有效性 | ||||
8 | 外围用户无法访问搬迁后的业务应用 | 高 | 中 | 1.准确、完整的《应用关联关系》分析 |
2.详细的用户访问路线分析,与网络部门确定、测试网络是否满足相关要求。 | ||||
9 | 搬迁遭遇不可抗力暂停,周期延长 | 高 | 低 | 制定搬迁策略、搬迁单元时要考虑此因素,避免对业务带来严重影响。 |
10 | 业务部门不能及时或无法配合搬迁后的业务验证、测试工作。 | 高 | 低 | 1.完善的计划 |
2.领导小组协调、安排 | ||||
11 | 搬迁后可能带来外围用户访问的变更要求 | 中 | 低 | 在制定搬迁方案中需要考虑可能对外围用户的变更要求,并提出相应计划。 |
12 | 搬迁过程导致的业务中断时间超出计划中断时间 | 中~高 | 高 | 制定应急预案(主要是通报、沟通方面) |
13 | 设备长时间运行,搬迁可能导致无法启动 | 高 | 高 |
1.通过断电重新启动区分工作界面 2.准备足够的现场备件,确保搬迁后一旦设备故障,可以快速修复 |
14 | 业务系统主机设备故障 | 高 | 高 |
1.通过租赁设备搭建备用主机应急搬迁 2.通过现场备件快速修复 |
15 | 物流公司工具不够、搬迁线路搬迁困难 | 高 | 高 |
1.采用专业精密设备物流公司提供搬迁服务 2.通过前期调研,提前制定物流线路,携带足够搬迁专业工具 3.对于大型设备,准备叉车等起重设备,必要时动用吊车实现搬迁 |
2.5.2 应急环境建设
为防止搬迁后系统由于各种不可预料的原因导致系统无法启动,需要恢复的情况下,针对各主要主机系统备份工作的有效实施可以确保应用在搬迁后失败后能够有效地恢复。对于可能存在的一些小型数据库,我们同样考虑到恢复的需求。
此次搬迁所涉及到的业务系统为 7*24 小时运行,停机时间较短,为了简化搬迁过程的同时,实现对系统最大的保护是我们的目标。我们通过将数据库备份恢复到应急环境中的主机的方式,搬迁前将业务系统切换至应急系统运行,待运行稳定后,再实施生产环境的停机搬迁工作。
由于我们提供的设备为单机,因此涉及数据库双机到单机的恢复,以及正式搬迁前数据库归档日志的追加注册恢复过程,该恢复过程可以通过当前部署的备份环境异机恢复方式进行恢复,在搭建应急系统的过程实现了对当前备份系统数据验证测试。
应急数据库系统平台搭建完毕,需要在搬迁前进行变化数据的追加,确保数据一致。
2.5.3 灾难恢复组织和职责
客户 应结合其日常组织机构的具体情况建立处理灾难的应急预案组织机构,并明确其职责。其中一些人可负责两种或多种职责,一些职位可由多人担任(应急预案中应明确他们的替代顺序)。
应急预案中的组织机构应由 客户 的管理、业务、技术和行政后勤等人员组成,分为应急指挥小组、应急响应组、灾难恢复组。
我们将作为应急响应组成员与客户一同加入应急预案流程执行灾难发生情况下的应急环境切换流程及相关操作。
未来设立客户应急响应中心的组织机构设置和职责定义如下:
组织机构 | 人员构成 | 主要职责 |
---|---|---|
应急指挥组 | 客户 高层领导 | 审核并批准应急预案; 组织应急预案的测试和演练;批准应急预案的执行。 |
应急响应组 | 维保服务厂 、客户 IT 部门 | 提出灾难恢复策略和等级; 制定应急预案的各种策略、流程。 |
灾难恢复组 | 客户 IT 部门 维保服务厂商 | 容灾中心日常管理; 容灾系统运行和维护; 应急预案的培训和演练; 维护和管理应急预案; 灾难发生后信息系统和业务功能的恢复; 灾难发生后的外部协作。 |
2.5.4 响应时间和方式
● 电话支持 : 我们的 客服中心接到客户故障申告后,在10 分钟之内安排责任工程师提供电话支持服务,解答客户疑问并指导客户现场操作方法。
● 远程接入支持 : 我们 在进行电话支持服务的同时,得到客户许可后通过远程接入方式登录客户网络,诊断并解决故障,并在 3 个工作日内向客户提交《故障诊断报告》。
● 现场支持 :当电话或远程接入支持都无法解决问题,经双方确认需要现场支持时, 我们 将指派专职工程师并在规定的时间抵达客户现场提供支持服务。现场服务包括人力、硬件部件和维护材料,通过现场硬件部件测试、备件更换、系统软件相关问题处理,使得系统恢复至正常状态,更换下来的部件应属龙瞻信息所有。现场硬件系统支持完成后的 2 个工作日内将向客户提交《现场服务报告》。
● 备件支持 :发生紧迫故障时, 我们 将提供与故障可能涉及到的所有相关备件,并提供主要备件的冗余(比如同时携带 2 块甚至多块控制器),避免备件发生现场 DOA (到货即损)的情况而拖延故障的修复时间。
● 不间断服务 : 我们的工程师 到达现场后即开始进行不间断服务,直至您的设备能够重新运行。如需额外的部件或资源,立即通知后方支持资源,在最快的时间里调用所需部件,直至恢复系统,工程师才离开现场。
2.5.5 搬迁计划
客户 资产清点 如下 : (需现成勘测)
服务器 :
序号 | 设备型号 | 设备配置 |
---|---|---|
1 | ||
2 | ||
3 | ||
4 | ||
5 | ||
6 | ||
7 | ||
8 | ||
9 | ||
10 | ||
11 | ||
12 | ||
13 | ||
14 | ||
15 | ||
16 | ||
17 | ||
18 | ||
19 | ||
20 | ||
21 | ||
22 | ||
23 | ||
24 | ||
25 | ||
26 | ||
27 | ||
28 | ||
29 | ||
30 | ||
31 | ||
32 | ||
33 | ||
34 | ||
35 | ||
36 | ||
37 | ||
38 | ||
39 | ||
40 | ||
41 | ||
42 | ||
43 | ||
44 | ||
45 | ||
46 | ||
47 | ||
48 | ||
49 | ||
50 | ||
51 | ||
52 |
名称 | 型号 | 数量 | 配置 |
---|---|---|---|
防火墙 | |||
交换机 |
针对此次客户计算中心机房的设备搬迁项目,龙瞻信息制定了如下的搬迁时间规划:
客户计算中心机房 搬迁项目时间规划 | |||||||||
---|---|---|---|---|---|---|---|---|---|
编号 | 工作内容 | 规划日期 | 持续时间( H ) | 责任人 | 配合方 | 后续影响 | 影响程度 | 确认人 | 备注 |
1 | 机房环境调研 | 4 | 龙瞻信息 | 客户 | 确认搬迁操作难度 | 低 | |||
2 | 设备信息统计 | 3 | 龙瞻信息 | 客户 | 综合布线正确性 | 高 | |||
3 | 设备配置统计 | 8 | 龙瞻信息 | 客户 | 备件准备及工程师配比 | 中 | |||
4 | 设备线缆统计 | 10 | 龙瞻信息 | 客户 | 新机放线缆准备 | 中 | |||
5 | 设备迁入机房位置确认 | 6 | 龙瞻信息 | 客户 | 线缆到位准备及实施 | 中 | |||
6 | 设备旧机房位置对应表 | 3 | 龙瞻信息 | 客户 | 批次搬迁设备的操作准确性 | 中 | |||
7 | 设备新机房位置对应表 | 3 | 龙瞻信息 | 客户 | 设备新机放的操作准确性 | 中 | |||
8 | 设备线缆标签制作 | 6 | 龙瞻信息 | 客户 | 设备线缆恢复效率及准确性 | 低 | |||
9 | 设备线缆标签核对及粘贴 | 10 | 龙瞻信息 | 客户 | 设备线缆恢复效率及准确性 | 低 | |||
10 | 应急 网络环境 搭建 及测试 | 客户 | 搬迁 是否实施 | 高 | |||||
11 | 数据备份或迁移 | 客户 | 搬迁开始时间 | 高 | |||||
12 | 备份有效性测试 | 客户 | 搬迁正式开始时间 | 高 | |||||
13 | 设备搬迁确认 | 客户 | 龙瞻信息 | 无 | 低 | ||||
14 | 第一批次搬迁正式实施 | 36 | 高 | ||||||
14.1 | 设备应用停止 | 0.3 | 客户 | 备份时效 | 中 | ||||
14.2 | 数据备份或迁移 | 8 | 客户 | 物理搬迁是否确认实施 | 高 | ||||
14.3 | 数据有效性确认 | 1 | 客户 | 物理搬迁是否确认实施 | 高 | ||||
14.4 | 系统停机 | 0.5 | 龙瞻信息 | 客户 | 低 | ||||
14.5 | 设备下电 | 0.5 | 龙瞻信息 | 客户 | 低 | ||||
14.6 | 设备下架 | 6 | 龙瞻信息 | 客户 | 设 备安全性及完成时间 | 低 | |||
14.7 | 设备包装及运输 | 5 | 龙瞻信息 | 客户 | 设备安全性及完成时间 | 中 | |||
14.8 | 设备拆包及上架 | 8 | 龙瞻信息 | 客户 | 设备安全性及完成时间 | 中 | |||
14.9 | 设备加电及系统启动 | 1 | 龙瞻信息 | 客户 | 应用能否按时上线 | 高 | |||
14.10 | 系统及应用检测 | 1 | 龙瞻信息 | 客户 | 应用能否按时上线 | 高 | |||
14.11 | 故障修复(若有) | 2 | 龙瞻信息 | 客户 | 应用能否按时上线 | 高 | |||
14.12 | 应用上线 | 1 | 客户 | 高 | |||||
14.13 | 设备观察期 | 8 | 客户 | 应用是否正常 | 中 |
2.5.6 搬迁进度管理和控制
根据搬迁步骤初步规划,龙瞻信息将根据对用户系统的进一步调研,将对整个搬迁项目的工程进度制定更详细的安排,落实责任方和配合方,并设计每个步骤所需的时间,便于对搬迁工程的进度加以管理和控制。
以下为针对此次搬迁进度管理和控制表:
工作内容 | 项目启动第一个工作日 | 第二工作日 | 第三工作日 | 第四工作日 | 第五工作日 | 第六工作日 | 第七工作日 | 第八工作日 | ||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
AM | PM | AM | PM | AM | PM | AM | PM | AM | PM | AM | PM | AM | PM | AM | PM | |
机房环境调研 | ||||||||||||||||
设备信息统计 | ||||||||||||||||
设备配置统计 | ||||||||||||||||
设备线缆统计 | ||||||||||||||||
设备迁入机房位置确认 | ||||||||||||||||
设备旧机房位置对应表 | ||||||||||||||||
设备新机房位置对应表 | ||||||||||||||||
设备线缆标签制作 | ||||||||||||||||
设备线缆标签核对及粘贴 | ||||||||||||||||
测试环境设备到货 | ||||||||||||||||
网络环境测试 | ||||||||||||||||
数据备份或迁移 | ||||||||||||||||
备份有效性测试 | ||||||||||||||||
设备搬迁确认 | ||||||||||||||||
第一批次搬迁正式实施 | ||||||||||||||||
设备观察期 |
2.5.7 搬迁后保障服务
我们承诺:
此次搬迁后所有系统的运行状况与搬迁前完全一致。
在搬迁中产生的所有损坏设备,我司将提供维修服务(硬件及操作系统)。
我们拥有一支具备跨平台技术支持能力、丰富的 IT设备维护服务经验的工程师组成的高水平的技术支持与售后服务团队,随时向用户提供最新的有关先进技术,以使用户的应用系统得到搬迁运维保障。
公司针对本项目的售后服务体制建立在以下三个层面:
√ 7*24小时技术响应:7*24小时客户服务中心,用户可通过800电话或传真、电子邮件等任何形式报修;
√ 现场服务:到达客户现场,解决客户的设备问题;
√ 远程服务:由专职的技术人员负责,通过远程登录等方式解决客户的疑难问题;
注释:具体的后续服务内容由双方共同协商约定。
2.5.8 工具及材料准备
物理搬迁过程中,搬迁物流过程中需要有足够的工具保障工程师操作使用。
序号 | 工具名称 | 工具用途 | 数量 |
---|---|---|---|
1 | 防静电台垫 | 摆放设备 | 待定 |
2 | 防静电毛刷 | 清洁设备 | 待定 |
3 | 全套组合螺丝刀具 | 拆装设备 | 待定 |
4 | 手电筒 | 查看环境 | 待定 |
5 | 普通螺丝刀 | 拆装设备 | 待定 |
6 | 防静电手腕带 | 防静电 | 待定 |
7 | 防静电手套 | 防静电 | 待定 |
8 | 防静电镊子 | 防静电 | 待定 |
2.5.9 文明施工组织措施
信息机房 施工是有风险的,不可预见的事情也很多 ,搬迁项目由于涉及设备移动,线缆更改,出故障的概率更大 。但是,措施严密、责任心强即主观客观同时努力,就可以避免许多事故的发生。
严格办理进局施工通知单,按照甲方要求签字盖章、日期明确、不得私用其他单位或其他工程的进局施工通知单,禁止在施工通知单上随意改变内容。
工作人员进入通信机房(含设备间)施工时,需佩戴胸卡(或进局施工证),同时填写《出入机房登记表》,严格遵守局方的各项规章制度。
进入机房完成工作后,及时归还钥匙并做好登记。
落实安全责任,指定安全负责人或配备安全员。
确保竣工资料及时、准确,健全竣工资料交接签收制度;严格按照甲方要求时限完成工程的验收及结算。
施工现场的安全用电,严格执行用电操作规定,由持上岗证的专业电工管理和操作。
施工现场严禁吸烟、堆放易燃、易爆物品;施工现场整洁,做到文明施工、日干日清消除火灾隐患。
对工程中设备加电、割接及隐蔽工程,要高度重视提高工程质量保证施工安全。在制作各种设备数据、割接工作时,做好施工前的准备工作,制定周密的施工方案,分析施工风险,并包含失败倒回措施。
施工人员严禁在机房内吸烟和大声喧哗,杜绝一切有损本公司形象的举止、行为,不接触与施工无关的设施。完工后做好善后工作。
在线路施工时,要采取措施注意保护相邻的、原有的、尤其是光缆、电缆和通信设备的安全。
施工人员进入机房以及人、手孔内施工,要遵守安全操作规程,严禁吸烟,防止人身和通信设备事故发生。工毕,要清理现场,做好卫生,做到文明生产,文明施工。
施工人员要遵纪守法,遵守主业和局内各项规章制度,同时遵守交通法规,严禁酒后驾车,确保安全生产。
出现问题要及时组织解决并向上级主管部门报告。
2.5.10 零散设备包装
根据产品的不同规格订购不同尺寸的纸箱,包装要求:
1)纸箱底部需要使用3张5公分厚的海绵
2)箱体四周各使用1张5公分厚的海绵
3)顶部使用1张5公分厚的海绵,所有配件装在1个塑料袋内
4)服务器及配件装入箱内后使用海棉填实,直到所有内物不会晃动为止
2.5.11 货物标签
制作货物标签。标签上应该有货物的型号,始发地位置和目的地的位置。共有 2份,一份贴在货物上,另一份贴在货物外包装上。
2.5.12 设备运输方案
1)机柜装车前需要车厢底部铺设防震材料,然后用卡车的尾板将货物送到车厢内,再用绑带固定。
打包完成的设备装托盘,然后用液压车和卡车的尾板将货物送到车厢内。
1)所有包装材料和托盘必须在正式操作前先运至始发地的暂放点,车辆的进入时间必须按照目的地所规定时间段。
2)所有车辆,驾驶员必须有经验,能确保车内货物在运输途中不出现破损。
3)每部车装载完毕后,对所运车辆进行加封,并填写装车清单。装车清单上需注明所运货物的总数、托盘数、封志号、司机签名。
4)车辆行驶过程中严格控制速度,保证车速不高于40公里每小时。
1) 当货车抵达目的地后接货人员须按 “装车清单”的内容进行核对,并签收。
2)机柜卸车后,拆除包装,然后推到指定地点。
1)运输工具,平板车和液压车。
2)车厢内固定货物的工具,绑带。
1) 货物运输车辆。使用封闭厢式货车运输货物,自带尾板,便于货物的起重。
2) 备份运输车辆。为了预防在途中运输车辆发生故障无法行驶,因此安排备份运输车辆待命。
3 )维修车辆。为了预防在途中运输车辆发生故障造成暂时不能行驶,安排维修车辆待命。
4 )工作人员的交通车辆。安排运输车辆将工作人员送到操作现场。操作完成后,将工作人员从操作现场带走。
5 )后勤保障的车辆。
2.5.13 保险事宜
我们为用户购买运输保险,保证 客户IT设备在运输当中 因未知因素带来的损失降低到最低。
1)设备在搬迁之前,需关机掉电;设备运输到位后,需进行必要的加电开机测试。开关机过程中,可能因为设备电气性能老化引起硬件故障。龙瞻信息负责更换损坏部件或整机。
2)用户可对重要设备、以及部分其他设备购买开关机保险。
2.5.14 搬迁完成测试验收
在搬迁完成后,我们对每套上线系统进行详细检查,确认无硬件故障,硬件搬迁成功验收签字。
在涉及数据的搬迁方案中,在最后系统调试完全成功后,我们认为搬迁项目完全成功。
电源的测试,测量电源是否符合该设备的要求;
设备上电后,检查操作系统是否运行正常;
操作系统运行后,检查相应系统硬件是否工作正常;
主机请查看相关网卡是否运行正常,使用 ping 网关的方式来确定网卡是否正常运行;
主机请查看相关 HBA 卡是否运行正常,查看相关连接设备的方式来确定 HBA 卡是否正常运行;
数据库,请测试相关数据库是否正常启动,运行相关 sql 程序检查数据库运行正常;
应用,请测试相关应用的是否正常启动,运行相关程序检查数据库运行正常;
当下述任一事项先发生,即视为本项目验收完成:
1. 完成工作说明书中所描述的服务内容,并通过主机系统测试。
2. 系统上线或系统投入使用。
存储设备系统搬迁的测试主要包括以下内容:
存储设备上架加电
存储设备系统日志无故障
主机访问存储正常
带库设备,测试相关带库设备是否正常运行;
当下述任一事项先发生,即视为本项目验收完成:
1. 完成工作说明书中所描述的服务内容,并通过主机系统测试。
2. 系统上线或系统投入使用。
网络核心系统搬迁的测试主要包括以下内容:
网络设备硬件测试,包括防火墙 交换机 外观及加电测试及软 / 硬件配置确认,以及核心交换机路由器外观及加电测试及软 / 硬件配置确认。
网络连通性测试,包括基本路由测试和服务器连通性测试。
网络冗余性测试,包括防火墙 / 交换机的电源备份测试,防火墙的冗余线路测试,防火墙冗余测试和交换机冗余测试。
当下述任一事项先发生,即视为本项目验收完成:
1. 完成工作说明书中所描述的服务内容,并通过网络系统测试。
2. 系统上线或系统投入使用。
启动数据库
检查数据库运行是否异常
检查数据库日志信息是否异常
检查数据库与应用的连接
抓取数据库运行报告
1. 完成工作说明书中所描述的服务内容,并通过数据库系统测试。
2. 系统上线或系统投入使用。
启动业务系统
检查应用运行是否正常
检查应用日志是否错误
检查应用与数据库连接是否正常
前端系统进行正常业务操作测试
正常业务操作压力测试
1. 完成工作说明书中所描述的服务内容,并通过数据库系统测试。
2. 系统上线或系统投入使用。
2.6 搬迁后恢复工作
设备搬迁到迁入机房后,龙瞻信息负责所有设备的联调工作,主要包括以下内容:
2.6.1 系统到位重组
系统设备到迁入机房后,从运输工具上搬下,进入迁入机房,并摆放到指定的位置,进行系统重组工作,注意事项:
l 操作人员有专业化水平,搬运途中注意安全;
l 卸下后设备存放在过渡区(室温、湿度接近机房内环境),待全部卸下工作完成后,统一拆封;
l 拆封后清点设备数量,如有遗失立即展开寻找工作,并同时联系硬件厂商寻找替代备件;
l 拆封后设备至少在过渡区摆放10分钟;
2.6.2 系统信息复原
系统设备重组完成之后,龙瞻信息分别对各个子系统进行复位,包括主机、存储、网络等系统组件的复原,并核对启动后的系统信息是否与搬迁前一致,当出现差异时,龙瞻信息的主机工程师、网络工程师将相互配合,按用户要求对设备进行复原调整。
2.7 施工组织
2.7.1 项目实施组织
在项目实施期间,我们采用项目经理 AB 角制度,统筹安排整个搬迁项目的实施过程。同时将在以下具有高级工程师资质的人员中,挑选具有过多次大型搬迁服务经验的工程师担当现场项目经理,负责现场具体搬迁事宜。参与工程师有各项原厂认证。
2.7.2 项目分工界面
在搬迁过程中,需要做一个较好的工作界面的划分,确保后期维保的正常延续。
本次项目涉及的其他单位包括:新机房设计单位、客户方、各系统软件开发商、布线施工单位等。在搬迁过程中,由我公司进行整个搬迁工作的项目管理,各参与单位必须紧密配合,密切协作。在搬迁过程中,各参与单位的工作界面界定如下:
1. 搬迁筹备阶段
龙瞻信息负责进行设备的系统搬迁信息整理和方案设计工作。完成方案设计,并完成搬迁所需的灾备系统环境的建设等。
2. 搬迁过程
1) 系统搬迁前,系统的健康检查由我公司、设备维保服务提供方和客户方共同进行,并经三方共同签字确认;
2) 由龙瞻信息在搬迁前协助搭建应急系统基础环境,环境完毕后开始筹备系统的搬迁工作
3) 搬迁设备的标签工作,由我公司完成,布线施工单位协助,将在搬迁前完成,提高搬迁过程中的效率
4) 搬迁设备的下电、拆卸、上电等工作均由龙瞻信息负责完成。
3. 搬迁设备上电后
1) 设备搬迁后的健康检查由我公司、设备维保服务提供方和客户方共同进行,并经三方共同签字确认;该部分搬迁过程中产生的设备损坏导致的维修费用均由我公司承担
2) 协助完成搬迁割接后,租赁设备的重新利用,基础环境准备工作
3) 对于无保设备,在设备搬迁过程中因各种原因导致故障所需备件及原厂应急服务费用由我公司承担。
3、搬迁服务交付物
搬迁项目耗时巨大,巨大的工作量体现在对现有系统的分析统计等过程,我们在此过程中通过文档来实现对搬迁过程的控制和确认。在搬迁项目后,我们将提交以下文档作为搬迁项目的服务交付物。
<<XX 项目搬迁方案 >>
<<XX 项目搬迁应急预案 >>
<<XX 项目备品备机清单表 >>
<<XX 项目布线标签规范 >>
<<XX 项目实施方案 >>
<<XX 搬迁项目调研表 >>
<<XX 项目搬迁计划表 >>
<<XX 项目搬迁机房环境确认表 >>
<<XX 搬迁项目设备统计 >>
<<XX 搬迁项目组成员信息表 >>
<<XX 项目组通讯录 >>
<<XX 项目会议纪要 >>
<<XX 搬迁项目设备验收表 >>
<<XX 搬迁项目验收报告 >>
<<XX 搬迁项目总结报告 >> 等
XXX数据中心机房工程运维管理制度要求解决方案
项目编号:ZNC(J)
转载:中能测(北京)科技发展有限公司
1、机房工程的管理技术制度与要求
管理是为了实现预期的目标进行的协调活动。为确保机房安全运转、工作有序开展、设备正常使用,机房需要制定管理规章制度。
机房管理就是对制定的规章制度执行、检查和改进。执行就是按照制定的规章制度去实施;检查就是将执行的过程或结果与规章制度进行对比,总结出经验,找出差距;改进是通过检查总结出的经验,将经验转变为长效机制或新的规定,针对检查发现的问题进行纠正,制定纠正、预防措施。
随着云计算的发展,机房规模急剧扩大(大、中型机房通常是指面积数千至数万平方米)、机房数量不断增加,由小规模、封闭式、单一功能向大规模、开放式、多功能方向发展,机房管理更为重要。机房管理水平的高低也直接影响着机房的使用率和使用寿命,机房管理应引起机房管理人员的高度重视。
1.1 机房管理科长和管理人员的岗位职责
机房管理科长岗位职责
机房管理科长(组长、主管领导或经理)是中心领导管理好机房日常运维工作的得力助手和参谋。机房管理是管理科长日常工作的全职岗位,对于机房管理科长来说,机房管理是为了使机房设备正常运转,保障机房有良好的运行环境和工作环境。机房管理科长的岗位职责要重点注意如下内容:
1)严格制度。机房管理是一项看得见、摸得着的实际工作,面对诸多因素和关系,必须“严”字当头。机房日常管理应根据实际需要,抓常规管理。建立、健全计算机机房的各项规章制度是机房管理工作的前提。制定相应的机房管理制度,使日常管理工作做到有章可循,有据可依。
2)严格管理。作为部门领导一定要有从严管理的指导思想,要严格管理、严格要求,并使这种严格思想贯彻落实到管理工作的全过程,在实际工作中要常讲、常查,要不怕得罪人,必要时还要制定各种奖惩措施。
3)做好日常运维和巡检工作,包括配电、空调、消防等设施的检查工作。
4)不断学习。机房管理牵涉面广,事务又多,是一项专业性强、“繁”、“杂”、“难”、“累”的工作,具有一定的不可预见性,且不同程度地存在技术难度。目前国内许多报刊杂志包括互联网络中,有关机房管理的介绍层出不穷,机房管理科长需要有责任心和不断学习的进取心。机房管理科长除了要掌握丰富的计算机软硬件知识和具有较强的动手能力外,还需要掌握一定的设备管理技巧,学习各种设备如配电系统、地线系统、空调、防火设备、UPS等的正确操作方法,从而杜绝因操作不当造成的人为事故。不断学习,总结经验,取长补短,才能做好机房管理工作。
5)做好机房的防火、防盗及供电系统、空调系统、通风系统的安全和日常养护工作,提高安全意识。定期检查安全设施情况,并做好记录,发现问题立即整改。
6)定期检修,重视完善。机房以及有关设备也有老化、更新、修复等问题,除进行日常的检修外,还应对机房建设时存在的缺陷,机件的磨损、老化,紧固件的松动,装修变形等问题定期检修、更改或完善。坚持每年定期对机房整修一次,即检测安全防火设备、检修空调设备、除尘、玻璃隔断调整加固、照明设备检修、安全防盗、协调相关设备维修人员进行维修,安排好相关维修工作。
7)对于发生的故障与事故及时逐级上报,并做协调工作,做好故障与事故的记录工作,做好问题的分析和跟进处理工作。
8)完善电气系统设备技术档案和资料,建立相关管理制度、操作规程、应急预案等。
9)在制度化管理上下功夫,组织、指导、制定年度工作计划和各种操作规程、管理规定、岗位职责和安全责任制等,并监督落实,以实现科学、有序、安全的管理。
10)机房不能出现事故,加强巡视巡检。要管理好机房不是一件容易的事情在条件许可的情况下,应建立经济合理的易损件、易耗件的备用库,保证及时更换,定期更换。对设备的运行情况进行分析,制定预防和常用解决方案,从而保证机房的正常运转。
11)严格机房钥匙管理,机房钥匙只允许管理人员配带。
机房管理科长的“三心”
1、责任心
责任心主要有如下内容:
(1)安全管理
机房安全是第一位的,可以说是机房管理体系的灵魂。威胁机房安全的因素主要有火灾、设备故障、病毒。机房安全管理就是告诉人们,在进行机房管理的同时,通过采用计划、组织、技术等手段,依据机房、环境因素的运动规律,采取控制措施,预防事故的发生。
(2)六个坚持
六个坚持是指:
1)坚持管机房同时管安全;
2)坚持按操作规程管理机房;
3)坚持预防为主;
4)坚持全员管理;
5)坚持设备维护;
6)坚持日常巡检工作。
(3)四不放过
四不放过是指在调查处理机房事故时:
1)必须坚持事故原因分析不清不放过;
2)员工及事故责任人受不到教育不放过;
3)事故隐患不整改不放过;
4)事故责任人不处理不放过。
(4)文明管理
文明管理是指在管理时:
1)具有文明的措施(机房的各项规章制度);
2)建立管理组织,明确岗位职责,健全管理制度(培训教育、检查、奖惩、卫生等专项管理制度);
3)进行现场管理。
2、学习心
科长的大部分时间是做机房管理的实际工作。他要不断地学习各种设备的正确操作方法和管理方法,管理的思维方式与知识结构要紧跟时代的步伐,并在技术上与项目一起成长。只有这样才能让科长提高领导能力,在管理工作中伸展自如、张弛有度。
3、宽容心
科长要有宽容的心态,特别是对比较年轻的员工。现在的员工都比较年轻,没有社会的阅历,自我为中心的意识强、自尊心强,有时候会做出一些过分的行为。当员工做了错事或工作中出现差错时,不要谴责,不要去追究责任。作为科长,应该多花一些精力去关心员工,多给予理解,做到“宰相肚里能撑船”,了解事情的起因,避免将来再犯错。
年轻员工有自己的长处和短处,要经常表扬他的长处,求同存异,具有一颗宽容的心。
管理人员岗位职责
机房日常运行、维护是管理人员的全职工作岗位。管理人员的岗位职责需要重点注意如下内容:
1)负责机房电气系统的运行、维护、保养、管理工作。
2)认真贯彻落实岗位责任制,遵守各项规章制度,严格执行操作规程和员工守则。严格执行机房值班制度,做好值班记录;严格执行机房设备使用登记制度,做好设备登记工作。
3)熟悉设备操作规程,熟悉仪器仪表使用方法。熟悉、掌握设备的原理、布置、控制、设备性能、使用状况及运维操作。维护工作应遵循设备故障与维修的操作步骤、基本原则和维修方法进行。机房应备有设备所用的各种零配件,供维修使用。
4)服从领导的调度和工作安排,按时、按质、按量地完成任务,不擅自离岗和串岗,禁止在上班时间炒股、浏览无关新闻、网上游戏、看在线电影、听音乐等。
5)努力学习,不断提高思想素质和业务技术水平,全面熟悉管辖范围内的各种操作规程,提高工作效率、质量。
6)认真填写原始记录,分析设备运行情况,并掌握其规律,发现问题及时解决,准确无误地填制各种报表和表格。
7)勤巡查,发现问题及时向管理科长汇报,听取指示。
8)参与并协助设备的维护和保养工作。设备发生故障及时组织检修,发现隐患及时组织处理,做好技术把关工作,保证所管辖系统设备处于优良的技术状态。做到“三干净”(设备干净、机房干净、工作场地干净)、“四不漏”(不漏电、不漏油、不漏气、不漏水)、“五良好”(使用性能良好、密封良好、润滑良好、紧固良好、调整良好)。
9)发扬主人翁精神,开动脑筋,大胆提出合理化建议。
10)做好本班设备的年月检修保养计划和备品备件计划,报主管审核。
1.2 机房内管理的内容
制定机房管理的规章制度
建立健全计算机机房各项规章制度是做好机房管理的关键。在机房日常管理工作中应根据系统的具体情况、工作性质,制定出一套完善的机房管理规章制度,以保证机房正常运行。规章制度用来规范机房的管理,是机房管理的标准。规章制度要通过日常工作中对它的执行来体现和完善。机房管理制度一般包括:管理科长岗位负责制、技术管理岗位职责、中心机房管理制度、安全运行管理制度、计算机病毒防范管理制度、安全管理制度、故障机维修登记制度、机房违章处理制度、机房巡检制度等。有了章法,机房管理就有了依据,严格管理的指导思想也能落在实处。
大、中型机房的日常维护工作管理的内容
大、中型机房的日常维护工作的管理要重点注意如下内容:
1)保持机房整洁卫生,管理人员负责日常维护及机房卫生工作,做到一天一小扫,一周一大扫,保持机房清洁干净,防尘防潮,防止鼠虫进入。
2)不准在机房内会客,谢绝外单位人员进入机房,禁止聊天、喧哗、吃零食、抽烟、乱扔杂物等,保持机房整洁安静。
3)严禁携带易燃、易爆及强磁性物品进入机房。
4)设备一般不得用于私事,严禁在设备的计算机终端上玩游戏,禁止装入其他无关的软件或将计算机挪作他用。
5)日常检测,包括对设备运作情况及系统应用情况的检测。
①设备运行情况检测:
》每日分8次(每3小时)定时进行主要网络设备的检测。做好每日网络巡查与服务器运行情况记录。
》每日对外网服务器日志进行分析,对长时间扫描的IP做好记录,并采取跟踪,一旦发现问题及时处理,把隐患消灭在萌芽状态。
》定期运用系统的网络监视器、网管软件,对网络漏洞进行自我扫描检测,进行分析,做好相应记录。
②系统应用情况检测:
》对应用软件要每天进行检测,及时升级,特别是防毒软件的升级。
》各种应用功能配置参数进行修改时必须与值班人员一同进行,并登记记录。新增加功能必须经过主管领导签字同意。
6)如发现机器故障应及时向主管及上级领导报告,并负责计算机及外设的日常维护与排除故障,处理不了的问题应立即向有关单位联系解决。遇到紧急情况不要慌张,切忌手忙脚乱。在遇到三包范围内的故障时,应及时催促公司上门或将机器送公司维修。
7)机房计算机只供机房工作人员使用。未经组长同意,任何人不准随意删改和增加系统文件,不得将机房内资料、工具等物品带出机房。
8)机房内的一切公用物品(包括低值易耗品、软件及资料)未经许可一律不得私自挪用和外借。外单位需借出设备及物品,应有单位证明和经手人签名的借条,经主管领导批准后,机房工作负责人才能开具放行条。未经主管领导同意,不准自行复制系统内所有的软件和数据或将其赠送、转借给外单位人员。
9)经常检查网络和各设备运行情况,发现问题及时解决,并向主管领导报告。
10)其他人员需使用机房内设备应征得管理人员许可,并报经主管同意后方可进入机房。
11)对机房内网络与设备的运行、应用、维护、查看等情况,建立档案,做好系统日志。要对发生的故障(隐患)以及排除故障情况做好详细记录;值班人员必须认真、如实、详细填写《机房日志》等各种登记簿,详细记录来人、事件、处理经过等,以备后查。定时做好中心服务器的日志和存档工作,任何人不得删除运行记录的文档,否则追究责任。如机房发现意外和紧急情况要及时报告,对重大事故要注意保护好现场。
12)要统一管理机房内的设备,计算机及其相关设备的驱动程序、保修卡等随机文件与资料要保存完整。要明确专人负责计算机文档、信息化等资料的保管,要做到资料齐全,存放安全。
13)机房内的交换机和服务器是公司办公自动化的关键设备,任何人不得自行配置或更改系统参数。
14)各客户机应及时做好自身数据的保存工作,不得擅自更改系统及网络设置。如确有工作需要应报至办公室,由办公室指派专人进行,并记录在案。
15)要做好机房的安全工作,对服务器的各种账号、密码严格保密。对网络运行做好监控、做好记录。
16)要及时做好各服务器系统的补丁修正与升级工作。
17)管理人员要有较强的病毒防范意识,要定期对病毒库进行检测,并做好病毒库系统的定时升级工作。发现病毒应及时处理,并做好记录。
18)未经许可,不得在各服务器上安装新软件。如确实工作需要安装,要经过有关领导批准。
19)应及时做好数据的备份工作,保证在系统发生故障时,数据能够快速、安全地恢复。所有备份数据不得更改,并要求做到本地和异地双备份保存。
20)机房内所有设备应妥善保管,任何人不得擅自开关、移动或者使用机房中的任何设备,如有此方面的需要,需有主管领导的批示。
大、中型机房的日常安全管理的内容的内容
大、中型机房的日常安全管理,要重点注意如下 10点内容:
1.出入机房管理的内容
1)严禁非机房工作人员进入机房,特殊情况需经中心负责人批准,并认真填写登记表后方可进入。严禁非工作人员上机操作。进入机房人员应遵守机房管理制度。
2)进入机房人员不得携带任何易燃、易爆、腐蚀性、强电磁、辐射性、流体物质等对设备正常运行构成威胁的物品。严禁将其他与机房工作无关的物品带入机房。
3)若管理人员申请调走,报告经单位批准前,重大的管理工作提前交接,把密码、钥匙、注意的问题等交接给单位指定人员。
2.机房防火管理的内容
机房是重点防火单位,应做好防火工作。机房工作人员必须严格遵守各项操作规程。拆装设备时必需断电,不允许带电作业;维修设备时必须先切断设备电源,再行维修;禁止使用汽油、酒精等易燃易爆品清洗带电设备;严禁在机房内吸烟和使用加热器具。
防火管理的重点是气体灭火系统能否发挥正常作用。对气体灭火系统维护管理要注意如下 4点内容:
1)气体灭火系统应由经过专门培训,并经考核合格的人负责定期检查和维护。
2)应做好对气体灭火系统的定期检查,并做好记录。检查中发现的问题应及时处理。
3)每月应对系统进行一次检查,发现问题应及时处置,检查内容及要求如下:
》对全部系统组件进行外观检查,系统组件应无碰撞变形及其他机械性损伤,表面应无锈蚀,保护漆层应完好,铭牌应清晰,手动操作装置的保护罩、铅封和安全标志应完整。
》全部系统组件的安装位置不得有其他物件阻挡或妨碍其正常工作。
》驱动控制盘面板上的指示灯应正常,各开关位置应正确,各接线应无松动现象。
》火灾探测器表面应保持清洁,应无任何会干扰或影响火灾探测器探测性能的擦伤、油渍及油漆。
》储存容器上的压力表,其指针应在正常的范围内。
》设备可否移位。
》设备工作是否正常。
4)每年应对系统进行两次全面检查,检查内容和要求除按月检查的内容外,还应符合如下要求:
①防护区的开口情况、防护区的用途及可燃物的种类、数量、分布情况,应符合设计规定。防护区外的疏散通道应保持畅通。
②储存容器的固定支架,应无松动现象。
③灭火剂输送管路与喷嘴的连接、灭火剂输送管路本身的连接应安装牢固。
④灭火剂输送管路及电气管路的固定支架应无松动现象。
⑤高压软管应无变形、裂纹及老化。
⑥各喷嘴孔口,应无杂物堵塞。
⑦对每个防护区进行一次模拟自动启动试验。
⑧手动控制、手动/自动切换、紧急停止操作、备用灭火剂储存容器切换操作应正常。
⑨探测设备运行情况检查:主要检查连接线路及探测器灵敏性。
⑩控制设备运行情况检查:
》控制器接受火灾信号情况(包括探测、急启、急停、反馈)。
》控制器接受故障信号情况(包括探测、急启、急停、反馈、主备电、阀线)。
》控制器联动性能及各个被联动器件的性能。
》记录并分析控制器储存信息。
[11]建立灭火系统使用档案,对使用、检查、维修与试验做详细记录。
3.机房用电安全管理的内容
1)机房人员应学习常规的用电安全操作和知识,了解机房内部的供电、用电设施的操作规程,注意用电安全,无触电隐患,注意节约用电。
2)机房应安排有专业资质的电工定期检查供电、用电设备、设施。
3)机房内不得乱拉乱接电线、电源,应选用安全、有保证的供电、用电器材。
4)在真正接通设备电源之前必须先检查线路、接头是否安全连接以及设备是否已经就绪、人员是否已经具备安全保护。
5)严禁随意对设备断电、更改设备供电线路;严禁随意串接、并接、搭接各种供电线路。
6)如发现用电安全隐患,应立即采取措施解决,不能解决的必须及时向相关负责人员提出解决。
7)禁止在无人看管下在机房中使用高温、炽热、产生火花的用电设备。
8)在使用功率超过特定瓦数的用电设备前,必须得到机房管理人员批准,并在保证线路保险的基础上使用。
9)在外部供电系统停电时,机房工作人员应全力配合完成停电应急工作。
4.设备安全管理的内容
机房设备要保持清洁、卫生,定期打扫,不定期对机房内设备进行检查,发现故障及时检修,并要登记、报告。因违章作业造成事故损失的,要按责任事故处理。设备安全管理的具体内容如下:
1)机房人员必须熟知机房内设备的基本安全操作和规则。
2)定期检查、整理硬件物理连接线路,定期检查硬件运作状态(如设备指示灯、仪表),从而及时了解硬件运作状态。
3)禁止随意搬动设备、随意在设备上进行安装、拆卸硬件或随意更改设备连线,禁止随意进行硬件复位。
4)路由器、交换机和服务器以及通信设备是网络的关键设备,不得自行配置或更换,更不能挪作他用。要定期检查是否规范,经有关领导同意后再变更。
5)网管人员应做好网络安全工作,服务器、各种核心设备等的各种重要账号严格保密,规范管理。监控网络上的数据流,从中检测出攻击的行为并给予响应和处理。做好操作系统的补丁修正工作。
6)禁止在正式运行的服务器上进行试验性质的配置操作,需要对服务器进行配置,应在其他可进行试验的机器上调试通过并确认可行后,才能对服务器进行准确的配置。
7)不允许任何人在服务器、交换设备等核心设备上进行与工作范围无关的任何操作。未经机房管理人员允许,更不允许他人操作机房内部的设备,对于核心服务器和设备的调整配置,更需要小组人员的共同同意后才能进行。
8)对会影响到全局的硬件设备的更改、调试等操作应预先发布通知,并且应有充分的时间、方案、人员准备,才能进行硬件设备的更改。
9)对重大设备配置的更改,必须首先形成方案文件,经过讨论确认可行后,由具备资格的技术人员进行更改和调整,并应做好详细的更改和操作记录。对设备进行更改、升级、配置等操作之前,应对更改、升级、配置所带来的负面后果做好充分的准备,必要时需要先准备好后备配件和应急措施。
10)网管人员统一管理计算机及其相关设备,完整保存计算机及其相关设备的驱动程序、保修卡及重要随机文件。
11)值班人员必须密切监视中心设备运行状况以及各网点运行情况,确保安全、高效运行。
12)未经负责人批准,不得在中心机房设备上编写、修改、更换各类软件系统及更改设备参数配置。各类软件系统的维护、增删、配置的更改,各类硬件设备的添加、更换必须经负责人书面批准后方可进行;必须按规定进行详细登记和记录,对各类软件、现场资料、档案整理存档。
13)健全中心全部设备固定资产账目,机房内所有设备、仪器、仪表等物品要妥善保管。管理人员每学期核对一次,做到账、物相符。
14)机房内的一切公用物品(包括低值易耗品、软件及资料)未经许可一律不得私自挪用和外借。外单位需借出设备及物品,应有单位证明和经手人签名的借条,经主管领导批准后,机房工作负责人才能开具放行条。
5.计算机病毒防范管理的内容
1)对新购进的计算机及设备,为防止原始计算机病毒的侵害,要组织专业人员检查后方可安装运行;软盘、光盘等移动媒体,以及外来的系统和软件、下载软件等要先进行计算机病毒检查,确认无计算机病毒后才可以使用;严禁使用未经清查的、来历不明的软盘、光盘等。
2)要定期进行计算机病毒检查,系统中的程序要定期进行比较测试和检查。要安装防计算机病毒软件,并定期或及时(随时)更新(升级)计算机病毒防范产品的版本;要使用国家规定的、具有计算机使用系统安全专用产品销售许可证的防计算机病毒产品。
3)跟踪计算机病毒发展的最新动态,及时了解计算机病毒,特别是有严重破坏力的计算机病毒的爆发日期或爆发条件,在一些破坏性较大的计算机病毒发作日期前,要及时在网上发布通知。
4)禁止任何人利用本单位计算机下载、复制、观看和传播各类与工作无关的视频文件。
5)禁止任何人利用本单位计算机查看、复制互联网上与工作无关的信息。
6)严禁使用盗版软件,特别是盗版的杀毒软件,严禁在工作计算机上安装、运行各类游戏软件。
7)外来人员携带来的各种可以在计算机上运行的文件及软件等数字信息,未经同意,禁止复制到本单位计算机内。如遇特殊情况,必须由相应的信息管理部门人员使用最新版本的反病毒软件检测通过后,方可使用,检测人员及时做好来访和检测记录,以备查看。
8)服务器要尽量做到专机专用,特别是具有读写权限、身份确认功能的认证服务器一定要专用;对共享的网络文件服务器,应特别加以维护,控制读写权限,不在服务器上运行无关软件和程序。
9)随时注意计算机的各种异常现象,一旦发现,应立即用查毒软件仔细检查。
10)服务器要定期进行计算机病毒检查,系统中的程序要定期进行比较测试和分析;特别是邮件服务器。发现病毒立即处理并通知上级管理人员。
11)一旦发现中心服务器有被侵入及恶意攻击的记录,应及时采取措施遏止并向主管领导报告;一旦发生计算机病毒疫情,要启动应急计划,采取应急措施,将损失降到最小。
12)发现或受到“计算机病毒”攻击后的管理措施:
》当出现计算机病毒传染迹象时,立即隔离被感染的系统和网络,并进行处理,不应带“毒”继续运行;
》发现计算机病毒后,一般应利用防杀计算机病毒软件清除文件中的计算机病毒;杀毒完成后,重启计算机,再次用防杀计算机病毒软件检查系统中是否还存在计算机病毒,并确定被感染破坏的数据是否确实完全恢复;
》如果破坏程度比较严重,或感染的是重要数据文件,则自己不要盲目修复,而要请计算机病毒防范的专业人员处理,即使是计算机专业人员也要慎重;
》对于杀毒软件无法杀除的计算机病毒,应将计算机病毒样本送交有关部门,以供详细分析。
》若发现网上有色情及政治敏感内容,及时报告有关部门处理。
13)单位应定期与不定期对制度的执行情况进行检查,督促各项制度的落实,并作为人员考核的依据。
6.防雷管理的内容
1)防雷装置应当每年检测一次,对爆炸和火灾危险环境场所的防雷装置应当每半年检测一次。
2)防雷装置投入使用后,应建立管理制度,指定专人负责,做好防雷装置的日常维护工作。发现防雷装置存在隐患时,应当及时采取措施进行处理。对防雷装置的设计、安装、隐蔽工程图纸资料、年检测试记录等,均应及时归档,妥善保管。
3)每年雷雨季节前应对接地系统进行检查和维护。主要检查连接处是否紧固、接触是否良好、接地引下线有无锈蚀、接地体附近地面有无异常,如果发现问题应及时处理。
4)接地网的接地电阻宜每年采用数字式接地电阻测量仪进行一次测量。
5)每年雷雨季节前应对运行中的防雷元器件进行一次检测,雷雨季节中要加强外观巡视,发现异常应及时处理。
6)当发生雷击事故后,应及时调查分析原因和雷害损失,提出改进防护措施。
设备遭受雷击后应对损坏情况进行调查分析,调查分析内容主要包括:
》各种电气绝缘部分有无击穿闪络的痕迹,有无烧焦气味,设备元件损坏部位,设备的电气参数变化情况;
》各种防雷元件损坏情况,参数变化情况。
》安装了雷电测量装置的,应记录测量数据,计算出雷电流幅值。
》了解雷害事故地点附近的情况,分析附近地质、地形和周围环境特点及当时的气象情况。
》保留雷击损坏部件,必要时对现场进行拍照或录像,做好各种记录。
》根据上述调查情况,组织有关专家分析,写出调查分析报告及改进措施。
7.软件安全管理的内容
1)必须定期检查软件的运行状况,进行数据和软件日志备份。
2)禁止在正式运行的服务器上进行试验性质的软件调试,禁止在服务器上随意安装软件。需要对服务器进行配置,必须在其他可进行试验的机器上调试通过并确认可行后,才能对服务器进行准确的配置。
3)对会影响到全局的软件更改、调试等操作应先发布通知,并且应有充分的时间、方案、人员准备,才能进行软件配置的更改。
4)对重大软件配置的更改,应先形成方案文件,经过讨论确认可行后,由具备资格的技术人员进行更改,并应做好详细的更改和操作记录。对软件进行更改、升级、配置等操作之前,应对更改、升级、配置所带来的负面后果做好充分的准备,必要时需要先备份原有软件系统和落实好应急措施。
①制定周详的事前预防策略,具体如下:
》对信息传递途径进行控制,实现通信设备和存储设备的控制;
》通过网络接入保护,实现外来计算机的接入局域网限制;
》安装严密的报警系统,对非法接入进行及时报警提示;
》制定周详的互联网信息传递阻断策略,对非法信息传递进行阻断。
②对泄密行为进行事中记录和控制,具体如下:
》对泄密行为及时启动控制和报警系统;
》对泄密过程进行屏幕记录,方便现场查看,事后录像回放;
》详尽的电子文档操作痕迹记录,包括访问、创建、复制、改名、删除、打印等操作;
》集中审查终端共享,防止共享泄密行为。
③详尽的日志信息,提高事后追查的准确率,具体如下:
》进行电子文档操作及屏幕记录,便于信息泄密事后追查;
》对互联网信息传递进行记录,便于信息泄密事后追查;
》对系统用户进行日志审计,实现系统安全管理。
5)不允许任何人员在服务器等核心设备上进行与工作范围无关的软件调试和操作。未经机房管理人员允许,不能带领、指示他人进入机房和对网络及软件环境进行更改和操作。
6)系统管理员对业务系统进行数据整理、故障恢复等操作,必须有其上级授权。
7)系统管理员不得使用他人操作代码进行业务操作。
8)系统管理员调离岗位,上级管理员(或相关负责人)应及时注销其代码并生成新的系统管理员代码。
9)对数据实施严格的安全与保密管理,防止系统数据的非法生成、变更等,严格按照专业备份要求管理。机房管理人员应恪守保密制度,不得擅自泄露中心各种信息资料与数据,也要注意与外方合作工作时各种信息资料与数据的保密。
10)为确保数据的安全保密,对单位及内部人员送交的数据及处理后的数据都必须按有关规定履行交接登记手续。
8.机房资料、文档和数据安全管理的内容
1)资料、文档、数据等必须有效组织、整理和归档备案。
2)禁止任何人员将机房内的资料、文档、数据、配置参数等信息擅自以任何形式提供给其他无关人员或向外随意传播。
3)对于牵涉网络安全、数据安全的重要信息、密码、资料、文档等必须妥善存放。外来工作人员的确需要翻阅文档、资料或者查询相关数据的,应由机房相关负责人代为查阅,并只能向其提供与其当前工作内容相关的数据或资料。
4)重要资料、文档、数据应采取对应的技术手段进行加密、存储和备份。对于加密的数据应保证其可还原性,防止遗失重要数据。
5)服务器、路由器等重要设备的超级用户密码由指定专人(不参与系统开发和维护的人员)设置和管理,并由密码设置人员将密码装入密码信封,在骑缝处加盖个人名章或签字后交给密码管理人员存档并登记。如遇特殊情况需要启用封存的密码,必须经过相关部门负责人同意,由密码使用人员向密码管理人员索取,使用完毕后,须立即更改并封存,同时在“密码管理登记簿”中登记。
6)系统维护用户的密码应至少由两人共同设置、保管和使用。密码应定期修改,间隔时间不得超过一个月,如发现或怀疑密码遗失或泄漏应立即修改,并在相应登记簿记录用户名、修改时间、修改人等内容。
7)机房内使用的文献、书籍和文具不允许私自带出。
8)存放备份数据的介质必须具有明确的标识。备份数据必须异地存放,并明确落实异地备份数据的管理职责。
9)注意计算机重要信息资料和数据存储介质的存放、运输安全和保密管理,保证存储介质的物理安全。
10)任何非应用性业务数据的使用及存放数据的设备或介质的调拨、转让、废弃或销毁必须严格按照程序进行逐级审批,以保证备份数据安全完整。
11)数据恢复前,必须对原环境的数据进行备份,防止有用数据的丢失。数据恢复过程中要严格按照数据恢复手册执行,出现问题时由技术部门进行现场技术支持。数据恢复后,必须进行验证、确认,确保数据恢复的完整性和可用性。
12)数据清理前必须对数据进行备份,在确认备份正确后方可进行清理操作。
13)需要长期保存的数据,数据管理部门需与相关部门制定转存方案,根据转存方案和查询使用方法要在介质有效期内进行转存,防止存储介质过期失效,通过有效的查询、使用方法保证数据的完整性和可用性。转存的数据必须有详细的文档记录。
14)管理部门应对报废设备中存有的程序、数据资料进行备份后清除,并妥善处理废弃无用的资料和介质,防止泄密。
15)重要文件资料既要建立、保存文字资料,同时还要建立保存磁盘文件资料。
9.电源及UPS管理的内容
1)机房内的电源开关、电源插座要明确标出控制的设备。
2)在电源配电盘附近张贴电源系统图。
3)不得随便改变线路和变动开关。
4)保持适宜的环境温度。影响蓄电池寿命的重要因素是环境温度,一般电池生产厂家要求的最佳环境温度是在20~25℃之间。虽然温度的升高对电池放电能力有所提高,但付出的代价却是电池的寿命大大缩短。据试验测定,环境温度一旦超过25℃,每升高10℃,电池的寿命就要缩短一半。
5)UPS电源在正常使用的情况下,主机的维护工作很少,主要是防尘和定期除尘。大量灰尘会造成器件散热不好。一般每季度应彻底清洁一次。其次就是在除尘时,检查各连接件和插接件有无松动和接触不牢的情况。
6)熟悉UPS的工作原理和操作规程。
7)需经常检查的项目有:
》清洁并检测电池两端电压、温度;
》连接处有无松动,腐蚀现象;
》电池外观是否完好,有无壳变形和渗漏;
》极柱、安全阀周围是否有酸雾逸出;
》主机设备是否正常。
8)对UPS的工作异常情况要做好记录,并及时联系有关单位进行处理。
9)UPS应妥善保养,除了电池自动检测外,每3个月放电一次。
10.空调管理的内容
1)本着正确使用、安全管理、专人负责、中低运行、节约用电的原则,切实保障空调的有效使用和管理。网络中心机房为保证设备良好的工作环境,应保持合适的机房温度和湿度,机房温度应保持在23℃~26℃,机房湿度应低于70%。
2)巡视监控。当值管理员每隔2小时巡视一次中央空调机组,巡视部位包括中央空调主机、冷却塔、控制柜(箱)及管路、闸阀等附件。巡视监控的主要内容如下:
》检查线电压(正常380 V,不能超额定值的±10%)。
》检查三相电流(三相是否平衡,是否超额定值)。
》检查气压(正常500 mmH2O)。
》检查高压(<12 kgf/cm2)。
》检查低压(> kgf/cm2)。
》冷却水进水温度(正常<32℃)。
》冷冻水出水温度(正常6℃~8℃)。
》检查中央空调主机运转是否有异常振动或噪音。
》检查冷却塔风机运转是否平稳、冷却塔水位是否正常。》检查管道、闸阀是否有渗漏,冷冻保温层是否完好。
》检查控制柜(箱)鉴别元器件运作是否正常,有无异常噪音或气味。
巡视过程中如发现上述情况有不正常时,当值管理员应及时采取措施予以解决,处理不了的问题应及时详细地向上级汇报。整改时,应严格遵守《中央空调维修保养标准作业规程》。
3)中央空调机房管理具体内容如下:
》非值班人员不准进入中央空调机房,若需要进入,须经工程部主管同意,并在值班人员的陪同下方可进入中央空调机房。
》中央空调机房内严禁存放易燃、易爆等危险品。
》中央空调机房内应备齐消防器材、防毒用品,并应放置在方便、显眼处。中央空调机房内严禁吸烟。
》每班打扫一次中央空调机房的卫生,每周清洁一次中央空调机房内的设备设施,做到地面、天花板、门窗、墙壁、设备设施表面无积尘、无油渍、无锈蚀、无污物,表面油漆完好,整洁光亮。
》中央空调机房内应当通风良好,光线足够,门窗开启灵活。
》中央空调机房应当做到随时上锁,钥匙由当值班管理员保管,当值管理员不得私自配钥匙。
》接班人员应准时接班,接班人员应认真听取交班人员交代,并查看《中央空调运行日记》,检查工具、物品是否齐全,确认无误后在《中央空调运行日记》表上签名。
》对于中央空调的运行情况,当值管理员应及时、完整、规范、清晰地记录在《中央空调运行日记》表内,并于每月的2日之前把上一个月的记录整理成册后存档,并报一份到后勤管理处,保存期为2年。
4)定期进行日常巡视,确保空调系统的正常运行。
5)定期进行一次室外机的清理,防止因散热不良造成空调的工作异常。
6)每年进行一次全面检修。
机房巡检的要求
机房巡检是机房管理的重要组成部分。机房巡检人员在系统巡检计划的指导下完成巡检作业。巡检对象主要是针对机房中比较重要、比较关键的设备。目的是及时查找、发现信息系统设备隐患,排除故障。机房巡检的设备不同、使用环境不同、季节不同,巡检的周期和频次也有所不同,如表 8-1所示。
巡检时需带巡检内容的常备工具,做到眼见、耳听、鼻闻、手摸、工具检查,加强对巡检设备关键内容的巡检力度,防患于未然。
机房巡检必须要有记录,巡检记录直接关联到巡检的效果。管理人员利用巡检能够掌握机房运行情况,能更好地对数据进行客观的统计、研究,为领导作出迅速、准确的判断和决策提供科学依据。巡检记录的覆盖面要全面,操作性要强。
巡检记录应在巡检期间填写,以记录时间为准,不得事后补填或超前记录。巡检记录及时填写电子版以供做周汇报时附加;纸介质的巡检记录表必须妥善归档保存。
机房巡检的具体内容
供配电巡检的具体内容
供配电巡检具体内容如表 8-2所示。
给排水巡检的具体内容
给排水巡检具体内容如表 8-3所示。
空调系统巡检的具体内容
空调系统巡检具体内容如表 8-4所示。
消防巡检的具体内容
消防巡检具体内容如表 8-5所示。
网络设备巡检的具体内容
网络设备巡检分工作状态巡查和网络设备具体内容的巡检。
1.网络主要设备工作状态巡查
为保证网络正常运行,需要每日分三次定期进行网络主要设备(服务器、路由器、交换机、防火墙、磁盘阵列)的工作状态巡查。做好每日网络设备主要巡查和巡查记录。
网络主要设备工作状态巡查记录如表 8-6所示。
2.网络设备巡检具体内容
每日分三次定期进行网络主要设备(服务器、路由器、交换机、防火墙、磁盘阵列)的具体内容巡检。巡检具体内容如表 8-7所
机房环境巡检的具体内容
机房环境巡检具体内容如表 8-8所示。
照明巡检的具体内容
照明巡检具体内容如表 8-9所示。
防雷巡检的具体内容
防雷巡检具体内容如表 8-10所示。
机房巡检的台账内容
台账原是指摆放在台上供人翻阅的账簿,故名台账。台账是明细记录表,为了加强某方面的管理、更加详细地了解某方面的信息而设置的一种辅助账簿,没有固定的格式,没有固定的账页,可根据实际需要自行设计,尽量详细,以全面反映某方面的信息。
机房巡检台账如表 8-11所示。
机房参观管理
新一代的机房,普通人很难进入,为了让更多的人了解新一代的机房,同时也进一步提高员工的爱岗敬业意识,更好地宣传公司形象、发展公司新业务,机房安排外来人员参观。
机房安排外来人员参观要注意如下 7点:
1)外来人员参观机房,须有公司指定人员陪同。
2)计算机处理秘密事务时,不得接待参观人员或靠近观看。
3)操作人员按公司陪同人员要求可以在计算机演示、咨询;对参观人员不合理要求,陪同人员应婉拒,操作人员不得擅自操作。
4)经同意,参观人员可以实地操作计算机,但须有公司人员的认可,不得调阅公司机密文件。
5)参观人员不得拥挤、喧哗,应听从陪同人员安排。
6)参观结束后,操作人员应整理如常。
7)参观机房要填写登记审批表,机房维护人员负责登记、监督工作,确认无误后方可进入。参观机房登记审批表如表8-12所示。
弱电系统调试方案
本项目位于酒店建筑面积4.8万平方米,地上41层(含设备层和机房层),地下3层 。地下一层以酒店办公为主, 1-2层为酒店服务为主,3层以商业服务为主,28-39楼为酒店客房.酒店客房数量为275间。
本工程弱电电系统 分为:
1、 闭路电视监控系统
2、 保安报警系统
3、 电子巡更系统
4、 门禁管理系统
5、 无线对讲系统
6、 无线网络系统
7、 综合布线系统
8、客房智能控制系统
9、智能照明系统
10、楼宇设备自控系统
11、计算机网络系统
12、电梯五方对讲系统
13、AV音视频系统
14、机房系统
15、不间断电源系统
16、卫星及有线电视系统 。
1.2.1 调试前准备
(一) 资料准备
(1)明确设备参数、系统工作参数;
(2)设计时提前考虑设备检修空间要求;
( 3)设计图纸中充分考虑设置调试必需的检修物件;
(4)专业间图纸、参数配合到位。
(二) 系统检查
(1) 检查 系统安装完毕,并按国家标准完成各个分部工程验收;
(2 )检查调试作业空间:调试前的检查工作应到位,对于检修困难的部位应及时整改,以免耽误调试作业进度;对调试全程检查,审核测试数据,避免因设备检修困难而导致的调试漏项、数据作假问题;
(3 )系统启动前排除所有安全隐患。
(三) 技术交底
(1 )调试技术交底:对调试作业人员讲解系统构成,调试目标,调试方法;
(2 )调试阶段成品保护要求:明确交叉作业成品保护要求,强调施工班组、工人的保护责任;
(3 )调试安全交底:向作业人员培训调试阶段的安全保护措施要求、事故应急预案执行要求;
(4 )现场实操考核:对于关键调试作业要求工人在调试小组、施工班组长的监督下考核实操能力,合格人员方能上岗。
1.2.2 过程监管与 缺陷整改
(1 )对调试人员合理分工,按区域、工作内容固定作业人员,提高效率、规范做法;
(2 )按照调试方案要求监督分包工人的调试过程,整理测试记录图表;
(3 )按计划控制进度,罗列影响调试进行的外部因素,并督促解决;
(4 )邀请业主、监理、物业管理公司参与调试工作,见证调试过程 ;
本项目消防安防控制中心、网络机房、有线电视机房设于酒店地下一层,,音控室位于酒店 4层。项目主要设置 闭路电视监控系统、保安报警系统、巡更系统、门禁系统、无线对讲系统、无线网络系统、综合布线系统、客房智能控制系统、智能照明系统 、楼宇设备自控系统、计算机网络系统、 电梯五方对讲系统、AV 音视频系统、机房系统、不间断电源系统、卫星及有线电视系统。
2.1.1 视频监控系统简介
本工程视频安防监控系统采用网络线路、后端数字化处理系统,总控室设在主体地下一层消防控制中心。系统采用高清晰度全彩色系列摄像机,本工程包含室内彩色小半球摄像机、彩色枪式摄像机、智能一体化高速球、磁盘阵列、解码器、服务器等组成。
2.1.2 门禁系统简介
门禁就是出入口控制,在人进出重要通道的时候,进行适当级别的权限鉴别,以区分是否能通过的一种管理手段。一般可以通过卡片、指纹、来识别来人的身份,也代表来人的权限。门禁系统主要分不联网门禁、 485 联网门禁、 TCP/IP 门禁、和门禁系统。
2.1.3 安全技术防范系统简介
无线对讲系统具有机动灵活,操作简便,语音传递快捷,使用经济之特点,是实现生产调度自动化和管理现代化的基础手段。建设楼宇内无线对讲系统对于安全保卫,设备维护,物业管理等各项管理工作将带来极大的便利。可实现高效、及时的处理各种事件,使最大限度地减少可能造成的损失。无线对讲系统是一个独立的以放射式的双频双向自动重复方式通讯系统,解决通讯范围或建筑结构等因素引起的通讯信号不稳定、通讯信号无法覆盖等问题,便于在何时何地精准使用于联络:如保安、工程、操作及服务的工作人员,可在管理场所内非固定的位置执行职责。
2.1.4 综合布线系统简介
本工程采用分散式网络布线,系统中服务器、放置在中心机房,而各子系统的线口引到各子系统所在的楼层。它的优点是系统可扩充性好,系统配置比较灵活,节省材料和费用。用户使用的末端网络端口分布到各楼栋、楼层、房间。末端采用网线与面板模块连接方式,前端配线间内采用模块化配线架连接。
2.1.5 楼宇自控系统简介
本工程楼宇设备自控系统主要是对建筑物的变配电设备、应急备用电源设备、蓄电池、不间断电源设备等监视、测量和照明设备的监控,是给排水系统的给排水设备、饮水设备及污水处理设备等运行、工作状态的监视、测量与控制,对空调系统的冷热源设备、空调设备、通风设备及环境监测设备等运行工况的监视、测量与控制 ,通过DDC实现对建筑物内上述机电设备的监控与管理,可以节约能源和人力资源,向用户创造更舒适安全的环境。
序号 | 仪表名称 | 关键参数 | 数量 |
---|---|---|---|
1 | 工程宝 | 视频制式显示;视频信号强度分析测量; PTZ云台控制功能 | 2 |
2 | 数字式万用表 | 可测量电流、电压、电阻、音频电平、电容量、电感量。 | 2 |
3 | 钳形电流表 | 钳子直径 0.5cm 内,建议选择较细的表钳 | 2 |
4 | 场强仪 | 双频道电平测量、斜率测量; C/N 测量、 V/A 测量;数字电视信号平均功率测量 | 1 |
(1) 调试前准备
① 收集设计图纸,包括设计说明、系统图、平面图、深化设计图纸、设计变更资料、工程技术规范、甲方要求等,充分了解设计意图;
② 设计参数和系统全貌;
③ 收集设备产品使用说明书,了解各个设备的性能和使用方法;
④ 整理各个设备的报验资料;
⑤ 理解视频监控系统的实现原理和系统构架。
(2) 单机调试检查
① 检查摄像机的安装位置是否符合业主要求;
② 检查摄像机监控角度是否满足监控范围(粗调);
③ 检查摄像机安装是否牢固、外观无瑕疵;
④ 检查摄像机水晶头是压接牢固,无松动,错线;
⑤ 检查摄像机电源线、控制线与端子之间是否压实,接触良好;
⑥ 检查摄像机电源线正负极是否正确;
⑦ 检查检查摄像机监控角度是否满足监控范围(细调);
⑧ 检查电源变压设备的接线形式,正负极是否正确,摄像机编号是否和接线图一直,编号是否清晰
⑨ 复核前端摄像机的用电参数;
⑩ 复核变压设备的用电参数;
⑪ 复核强电箱的各个回路负荷是否满足要求。
(3) 单机调试
① 先分批、分区单独测试摄像机,单独测试完成后,再进行全部摄像机供电测试;
② 在进行分批、分区测试时,应保证一箱一人,待前端摄像机供电稳定后,切断电源,方可进行下个分区的供电测试;
③ 测试时机房需留专人值守,时刻向前端测试人员汇报摄像机返回机房图像,以供前端测试人员判断测试效果;
④ 测试时如发生异常情况,应立刻切断电源,具体排查问题,以免损坏设备。
⑤ 配合物业部门完成前端摄像机的监控范围调试;
⑥ 在监视器上标识出各个前端摄像机的中文位置。
6.4.2 门禁系统调试
(1) 调试前准备
① 收集设计图纸,包括设计说明、系统图、平面图、深化设计图纸、设计变更资料、工程技术规范、甲方要求等,充分了解设计意图;
② 设计参数和系统全貌;
③ 收集设备产品使用说明书,了解各个设备的性能和使用方法;
④ 整理各个设备的报验资料;
⑤ 理解门禁系统的设置原则、实现原理、系统构架。
(2) 调试前检查
① 检查读卡器、开门按钮的安装高度是否满足要求;
② 检查电磁锁或电控锁安装位置是否正确;
③ 检查设备电源线、控制线与端子之间是否压实,接触良好;
④ 检查设备电源线正负极是否正确;
⑤ 检查电源变压设备的接线形式,正负极是否正确,摄像机编号是否和接线图一直,编号是否清晰
⑥ 检查变压设备切断保护措施,是否为一箱一闸;
⑦ 检查强电箱的接线是否正确,是否为一箱一闸;
⑧ 复核前端摄像机的用电参数;
⑨ 复核变压设备的用电参数;
⑩ 复核强电箱的各个回路负荷是否满足要求。
(3) 设备调试
① 先分批、分区单独测试门禁,单独测试完成后,再进行全部门禁供电测试;
② 在进行分批、分区测试时,应保证一箱一人,待前端设备供电稳定后,切断电源,方可进行下个分区的供电测试;
③ 测试时如发生异常情况,应立刻切断电源,具体排查问题,以免损坏设备。
6.4.3 无线对讲系统调试
(1) 调试前准备
① 收集设计图纸,包括设计说明、系统图、平面图、深化设计图纸、设计变更资料、工程技术规范、甲方要求等,充分了解设计意图;
② 设计参数和系统全貌;
③ 收集设备产品使用说明书,了解各个设备的性能和使用方法;
④ 整理各个设备的报验资料;
⑤ 理解无线对讲系统的设置原则、实现原理、系统构架。
(2) 调试前检查
① 检查天线的安装高度是否满足要求;
② 检查天线的安装位置是否正确;
③ 检查设备线缆与端子之间是否压实,接触良好;
④ 复核前端设备与端子之间是否压实,接触良好;
⑤ 复核控制模块与机房设备的控制线缆是否接触良好;
⑥ 检查各个设备接地是否牢固;
⑦ 检查强电箱接线和接线图是否一致,容量是否满足设备负荷;
⑧ 检查各个设备电源线外皮有无磨损,坏皮现象,电源线是否绑扎牢固;
(3) 系统测试
① 开启系统内的所有设备;
② 逐层测试用户使用范围内的通话质量,要求 90% 以上无盲区,并根据语音标准进行打分;
③ 将测试记录至专用表格。
6.4.4 无线 AP 系统调试
调试前检查
④ 检查 AP终端是否完整安装;
⑤ 检查天线的安装位置是否正确;
⑥ 检查设备线缆与接头之间是否压实,接触良好;
⑦ 复核前端水晶头否压实,接触良好;
⑧ 复核控制模块与机房设备的控制线缆是否接触良好;
⑨ 检查各个设备接地是否牢固;
⑩ 检查和确认外网和网关接入是否调通;
⑪ 需要和酒店管理方确认下VLAN划分;
(4) 系统调试
① 开启系统内的所有设备;
② 配置每台 AP终端的地址
③ 配置调整交换机信息;
④ 将调试记录至专用表格。
6.4.5 综合布线系统调试
(1) 调试前准备
① 收集设计图纸,包括设计说明、系统图、平面图、深化设计图纸、设计变更资料、工程技术规范、甲方要求等,充分了解设计意图;
② 设计参数和系统全貌;
③ 收集设备产品使用说明书,了解各个设备的性能和使用方法;
(2) 调试前检查
① 检查光纤接插软线中的连接器端面是否装配有合适的保护盖帽;
② 抽检光纤接插软线中光纤的类型标记是否符合设计要求;
③ 检查光纤插座的连接器型号、数量、位置是否符合设计要求;
④ 检查光缆的弯曲半径是否满足至少为光缆外径15倍的要求;
⑤ 采用红外通光笔对光纤通断进行抽测。
(3) 系统测试
① 对网管进行检测确保全网各段工作正常;
② 按设备清单进行连通性测试;
③ 人为制造故障,网管应能及时显示故障,故障恢复后网络应能及时恢复工作;
④ 人为制造容错点后网管应能显示故障,并自动排除故障。
6.4.6 客房控制系统调试
1、系统调试步骤
( 1) 调试前准备工作;
(2)按照设计和布局要求检查设备的安装和线缆连接情况;
(3)对所有设备进行通电前的检查测试;
( 4)对各个设备单独进行通电运行检查测试;
( 5)将所有相关设备配合使用,进行系统整体的调试并填写调试记录;
( 6)所有系统都完成基本的调试后,配合其它客控相关系统进行整个系统设备及相关服务项目的总体联合调试。
4 系统调试准备工作
由于本工程客控系统房间数量较多,调试计划根据客控系统的特点,我们在整个调试过程中实行分房型、分楼层、分区域进行,并注重调试的系统协调性,尽可能将设备及附件的单体检测与试验、能独立进行的系统检验试验安排在系统调试前进行,以保证客控系统总体联合调试,缩短完工时间,并满足调试的质量要求。在调试安排上,先进行分房型、分楼层、分区域并行调试,区域调试好后再进行联合调试
5 、 灯光控制系统硬件通电测试
灯控模块通电测试:
灯控模块上电后,灯具会亮起,如有跳闸,则灯控线路有短路情况。 l
开关模块通电测试。如上电后不亮,则灯具接线不良,或者灯具坏,或者模 l
块损坏。
调光模块通电测试。如上电后不亮,则灯具接线不良,或者灯具坏,或者模 l
块损坏。
开关面板 LED通电亮灭情况。l
客控箱内线路通电测试: 插座线路检查,如上电后跳闸,需检查插座线路有无短路情况。
客控箱内主模块上电测试,如果灯控模块灯具在主模块上电后,灭掉为 线路故障。
查看客控箱内主模块以及电源等指示灯亮灭情况,以排查客控箱内故障。 l 正常情况,如灯控模块灯具无反应,则线路有问题,或者模块有问题。
5.4.2 空调末端控制系统硬件通电测试
空调控制 DDC通电测试,指示灯显示正确
空调面板控制风机通电测试
空调面板各控制功能通电测试。 l
面板显示,指示功能良好。 l
高中低速度,以及调结温度等功能良好。 l
5.5 客控系统整体调试方案
客控系统的调试可分几个步骤调试:
客房房间单独调试,功能确定性调试。
客房房间区域调试;多于一个房间以上的区域调试。
客房房间一整层楼层联体调试。
(1) 调试前准备
① 图纸的检查:调试前必须提供下列图纸和资料作为BAS调试的依据。①BAS系统图、监控点数表、各子系统原理图、接线图(端子图)、施工设计图。②BAS设备的产品使用说明、技术资料、安装调试要领书。③本工程合同规定的其他图纸和技术资料。
② 保证基本软件编程、组态、系统各单元的逻辑与地址的设定基本完成,包括图形制作、网络各结点的名称、地址与代号等。
③ 设备外观和安装状况的检查:需要按图纸和供应商提供产品说明书,核对BAS设备(包括现场的传感器、变送器、阀门、执行机构、控制盘等)型号、规格、数量、产地等主要技术数据、设备主要部分的尺寸、安装位置、设备外表有无变形和缺陷等;印刷电路板质量检查:有无变形,接插件是否灵活、接触可靠、焊点均应光滑发亮、不能有腐蚀现象、无剥落和老化现象、不允许用外接线;设备柜内外配线检查:应无缺损、断线、配线标记是否完善;设备的各种接地应符合图纸的要求,联结牢固、接触良好、无松动现象、无裸露导电部分;设备外部联线的检查。BAS的设备、各类传感器、变送器、阀门、执行机构、控制盘、通讯接口必须全部按图纸的相关要求在现场安装就位。BAS的系统设备与外围设备及其他系统的外部联线,应施工图、系统接线图、监控点数表相符。如有变动,应在竣工图上按实际改正,并附有变更资料和依据。外部联线核对时,应从端子上拆下来,使用校线器或万用表,确保外部联线、线路端子编号、选用电缆线的型号规格按图纸要求一一对应,并核对电控柜中与BA相关的二次回路电气图,严防强电电源串入BAS设备。按图纸、监控点数表、接口界面的要求检查DI点逻辑值,DO点动作值输出信号范围,AI点量程范围,AO点动作值或者输出信号范围以及通讯接口的数据格式、通讯协议等是否符合图纸和各子系统之间相互约定的技术要求。
④ 调试环境条件的检查:本系统的调试环境、工业卫生要求(温度、湿度、防静电、电磁干扰等),需要符合设备使用说明书规定,如无规定要满足如下条件;主控设备宜设置在防静电的场所内,现场控制设备和线路敷设应避开电磁干扰源与干扰源线路垂直交叉或采取干扰措施。环境湿度:10-85%相对湿度,并无结露现象。环境温度:0-40℃。
⑤ 电源检查:保证系统供电电源和接地的检查合格。
(2) 数字输入测试
① 信号电平的检查: ①干接点输入:按设备说明书和设计要求确认其逻辑值;②脉冲或累加信号:按设备说明书和实际要求确认其发生脉冲数与接收脉冲数一致,并符合设备说明书规定的最小频率、最小脉冲宽度、最大频率、最大峰值电压、最大脉冲宽度。③电压或电流信号(有源与无源),按设备说明书和设计的要求进行确认;
② 动作实验:要按照上述不同信号的要求,用程序方式或手动方式对全部测点进行测试;
③ 特殊功能检查:按本工程规定的功能进行检查,如用于安保系统的数字量信号输入,正常、报警、线路、开路、线路短路的检测等。
(3) 数字输出测试
① 信号电平的检查: ①继电器开关量的输出 ON/OFF ,按设备说明书和设计要求确认其输出的规定的电压、电流范围和允许工作容量。 ②输出电压或电流开关特性检查,其电压或电流输出,必须符合设备使用书和设计要求;
② 动作试验:用程序方式或手动方式测试全部数字量输出,并记录其测试数值和观察受控设备的电气控制开关工作状态是否正常,如果受控单体受电试运行成厂,则可以在受控设备正常受电情况下观察起受控设备运行是否正常;
③ 特殊功能检查:按本工程规定的功能进行检查,如按设计要求进行三态(快、慢、停)和间歇控制(1秒、5秒、10秒)等的检查。
(4) 模拟量输入测试
① 输入信号的检查:按设备说明书和设计要求确认其有源或无源的模拟量输入的类型、量程(容量)设定值(设计值)是否符合,通常的传感器可按如下顺序进行检查和测试;
② 运行实验:用程序方式或受控方式对全部的AI测试点逐点进行扫描测试并记录各测点的数值,保证其值是否于实际情况一致;
③ 模拟量输入精度测试:使用程序和手动方式测试其每一测试点在其量程范围内读取三个测点,全量程的(10%、50%、90%),其测试精度要达到该设备使用说明书规定的要求;
④ 特殊功能检查:按设计要求进行检查。
(5) 模拟量输出测试
① 按设备使用说明书和设计要求确定其模拟量输出的类型、量程容量)与设定值(设计值)是否符合,常用的各种驱动器可按如下顺序进行检查与测试。各种风门、电动阀门驱动器的检查与测试;
② 按产品说明书的要求确认该设备的电源、电压、频率、温、湿度是否与实际相符;
③ 确认各种驱动器的内外部连接线是否正确;
④ 手动检查:首先将驱动器切换至手动档,然后转动手动摇柄,检查驱动器的行程是否在0-100%范围内;
⑤ 在确认手动检查正确后,在现场按产品说明书要求,模拟其输入信号或者从DDC输出AO信号,确认其驱动器动作正常;
⑥ 动作试验:用程序或受控方式对全部的AO测试点逐点进行扫描测试,记录各测点的数值;
⑦ 特殊功能检查:按本工程规定的功能进行检查,如保持输出功能,事故安全功能等。
(6) DDC功能测试
① 运行可靠性测试:检测受控设备设定的监控程序、测试其受控设备的运行记录和状态。关闭中央监控主机、数据网关(包括主机至DDC之间的通讯设备),确认系统全部DDC及受控设备运行正常,重新开机后抽检部分DDC设备中受控设备的运行记录和状态,同时确认系统框图及其他图形均能自动恢复。关闭DDC电源后,确认DDC及受控设备运行正常,重新受电后确认DDC能自动受控设备的运行记录和状态并予以恢复。DDC抗干扰测试:将一台干扰源设备(例如冲击电钻)接于DDC同一电源,干扰设备开机后,观察DDC设备及其受控设备运行参数和状态运行是否正常;
② DDC软件主要功能及其实时性测试:按产品说明书和调试大纲的要求进行测试;
③ DDC点对点控制:在DDC侧用笔记本电脑或现场检测器,或者在中央控制机侧手控一台被控设备,测定其被控设备运行状态返回信号的时间应满足系统的设计要求;
④ 在现场模拟一个报警信号,测定在CRT图面和触发蜂鸣器发出报警信号的时间必须满足系统设计要求;
⑤ 将测试记录至《楼宇自控系统 DDC箱调试记录表》。
3.1 系统概述
本工程 AV系统包括公共区域背景音乐、大宴会厅、小宴会厅、会议室、新娘房等音视频系统
3.2 调试方法和步骤
3.2.1 扩音系统的调试
( 1)开通调试前准备
系统开通是为了检查系统安装的质量,系统开通前必须首先确认各类设备本身不存在质量问题后方可进行系统开通。
检查各类设备的型号及安装位置是否符合设计要求。
检查各类设备标注的电源电压与电源电压是否相符。