医院信息系统网络运维工作
(一)网络运维工作界定
网络运维就是维护网络安全和网络通畅使之正常运转,但它又不仅局限于网络设备中的路由器、交换机、防火墙,还包括服务器、存储设备、机房动力系统、空调系统等网络相关设备或系统的运行维护,以及通过对网络和相关设备的部署,保证网络运行能够满足应用系统的需求变化。[8]
最初的网络运维只是简单地对底层网络设备进行管理,使网络能够正常高效地运行。随着信息系统的日益成熟和复杂,业务系统设计环节逐渐增多,单一的网络运维不足以满足系统管理的需求,需要落实如何保障业务系统各个环节,降低运行成本,提高突发事件的应对能力,提高服务质量和效率,保证业务系统的正常运行。
ITIL所强调的核心思想是应该从客户(业务)而不是IT服务提供方(技术)的角度理解IT服务需求。换句话说,就是在提供IT服务的过程中,首先考虑的是业务需求方,而不是技术决定需求。业务管理者以自己习惯的思维方式处理IT问题,通过业务管理模块深入了解IT基础构架支持业务流程的程度;以及IT服务管理在实现端到端IT服务过程中的作用,从而有助于更好地处理业务管理者与服务提供者之间的关系。因此,IT服务管理的国际标准是ITIL,此标准独立于任何厂商,与任何组织、业务性质无关,只是总结IT服务管理领域最重要的实践部分。它是IT服务管理实践的合理抽象化,仅明确地指出了应该做什么,不说明如何做。当具体实施ITIL时,就可以把标准具体化,而实现的方法需要自己建立。
在做网络运维工作时,应按照ITIL的思想,结合网络运维的实际情况,制定按照ITIL理念建立的网络运维方法。
(二)医院信息系统网络运维的主要内容
医院的网络管理系统不但要对网络设备,包括路由器、交换机、安全设备(防火墙等)、服务器、PC等进行管理,通过一些技术指标和阈值的应用来监控网络的运行状况,而且还要采用融合技术,整合现有的各种设备的监控软件,实现统一管理平台。通过整合,对于业务中不同角色所需内容通过仪表盘等技术方式实现,让领导和相关业务部门能够参与到管理中去;通过可视化的监控与管理,拉近业务管理者与服务提供者之间的距离。一方面让IT系统运行情况一目了然,大大降低了技术门槛;另一方面,能使IT运维的流程更加标准化、自动化与规范化。但ITIL的实现和优秀的网络管理系统的建设,不是一朝一夕就可以实现的,其建设过程需要持续不断投资与整合,而随之要面对的是随着系统建设而带来的大量具体工作。
(1)网络运维制度。网络运维制度的建立与执行,完善的网络运维制度,通过梳理运维流程,在保证运维质量的同时,才能兼顾运维的效率。后期网络管理系统的建立,也是以自身网络运维制度建立的流程为基础的。而不打折扣的执行,是实现网络运维质量与效率的前提,如硬件的周期性巡检,设备运行参数监测,运维、值班与交接班记录的填写等。
(2)主动运维。做好网络运维,要主动出击,才能化被动为主动,掌控全局。网络运维管理在现实中,往往运维人员配置不多,但承担的工作量却巨大。因此,最大限度地利用现有设备的管理工具,通过智能化告警,在故障发生时或状态异常时,通过语音、短消息、邮件等多种方式主动通知管理人员,即使运维人员不在工作现场,也能通过远程登录客户端的方式,在任何能够与系统管理主机连通的地方,直接进行管理。这样就可以最大限度地降低巡查的密度,以减少人力资源成本。
(3)网络结构调整。在运维过程中,除了应对突发事件进行分析处理之外,运维的另一项任务就是对网络的结构和部署进行及时调整,以保证网络运行能够满足应用系统不断增长的需要。因此,运维当中的数据统计十分必要,这将作为系统建设与阈值标准的基础。
(4)设备巡检。①设备巡检频率。硬件的周期性巡检,涉及网络运维的全部设备。不是所有的设备部件都可以通过监控软件来实现远程监控,而且不排除监测指标项的遗漏与差错,因此,硬件的周期性巡检十分必要。对于重要的网络设备,建议实施一天一次的巡检频率;对于一般网络设备,建议实施一月一次的巡检频率;对于周边网络设备,建议实施一季度一次的巡检频率。②设备巡检工具。完善设备管理工具,可以全面监控设备的运行状态,在保证网络运维质量的前提下,可以极大地降低运维强度,减少人力资源的投入。③周期性巡检的内容。应涉及设备外观指示灯的状态、外周运行环境参数、设备物理位置等。而这些内容是否正常,需要根据设备自身特点和正常运行状态,记录上述标准参数。设备运行参数监测,有了设备管理工具的帮助,就可以远程监测设备的运行状态,甚至通过关键参数阈值的设置,对设备的运行状态进行自动预警或报警。减少硬件现场巡查,但并不意味着可减少或者避免进行设备运行状态的监测。因为运行维护的核心就是设备的正常运转,自动化智能化程度再高,也需要人工的干预与补充。因此,每天至少一次的设备运行参数监测,就显得十分必要了。监测内容不仅包括设备运转状态、性能参数,还涉及应用软件的运行情况及在线任务的成功与否等。这些重点关注的内容,也可作为日后监测软件参数阈值的设定的依据,甚至成为系统更新、参数选型的数据基础。
(5)运维、值班与交接班记录。运维、值班与交接班记录是网络运维中日常工作的基础。系统中存在的问题和业务管理者的需求,都可以通过分析上述记录得到较为全面、客观的数据。因此,重视记录的规范化、结构化,都会为今后的统计分析提供便利。
(6)资产管理。资源资产的管理,管理IT系统中的资源资产情况,也是网络运维中的一环。这些资源资产可以是有形的物理存在,也可以是无形的软件组成,其信息要准确地与财务部门的固定资产系统数据一致。