随着云计算技术的蓬勃发展,各行各业信息化程度不断提高,日常运维在IT部门工作中所占的比重越来越大。常言道,三分建设,七分运维。高效、精准、体系化的运维工作可以最大限度地将已有IT资源的承载能力发挥到极致,保障业务的正常运行。为了更好地帮助企业建立完善的运维体系,一体化运维中心的理念和相应产品应运而生。本文将以电力行业为例,从电力公司业务架构的角度出发,阐述新华三一体化运维中心在电力行业IT部门运维工作中发挥的重要作用。
何谓一体化运维中心
ITIL定义了运维的三要素:人、流程和技术工具。从技术工具的角度看,一套运维体系需要有软件平台来承载,基于这套软件平台打造的“运维中心”需将人、流程和技术三要素融为一体,从而达到保障业务正常运行的目的,于是又有了“一体化运维中心”的概念。目前市面上各厂商都推出了一体化运维中心,但设计和实现大不相同。新华三一体化运维中心遵循了ITIL的基础理念,从逻辑上可以分为四部分:监控平台、自动化平台、流程平台以及CMDB配置管理数据库。
● 监控平台
监控平台负责统一监测数据中心软硬件资源的运行状态、告警等信息,并能从业务视角对监控数据进行整合和梳理,将IT资源的运行与业务的健康、繁忙状况精确对应,帮助运维人员快速发现问题、定位问题。
● 自动化平台
自动化平台是运维自动化工具的整合,包括自动巡检、操作系统与虚拟化平台的自动部署、脚本的自动执行与编排等,可以将运维人员从重复的低技术含量工作中解放出来,极大地提升运维工作效率。
● 流程平台
流程平台是承载运维标准化流程工作的软件平台,涉及的业务包括事件管理、问题管理、变更发布管理、值班管理、知识库管理等,起到规范运维流程、量化运维考核、传递运维经验的作用。
● 配置管理数据库CMDB
CMDB是一体化运维中心的核心所在。一方面,CMDB全方位记录IT资产属性信息,形成运维团队的“台账”系统;更深一层,CMDB基于资产的属性信息,梳理并维护资源之间的关系网络。一个全面、实时、精准的CMDB可以支撑所有运维工作的正常运转,为运维团队提供分析和决策依据。
总的来说,新华三一体化运维中心是一个内涵丰富的软件系统,各模块之间数据相互拉通,有机融为一体,为客户打造完整的运维体系。
一体化运维中心在电力行业的应用
电力行业的网络分为信息网、通信网以及调度网:信息网和通信网承载了电力公司的办公、销售运营业务以及各电力公司之间的VPN通信等,运维主体一般是该省级电力公司直属的信通公司;调度网相对独立,负责电力在电厂、变电站之间的调度传输,可理解为电力行业的生产网,其IT建设运维由自动化处负责。
● 一体化运维中心应用于信通公司
电力行业的信通公司同时负责信息网和通信网的运维。其中通信网主要由路由器等网络设备组成,负责对网络设备进行监控,组成和功能相对简单,因此本文不再赘述。
而电力信息网规模大,软硬件资源的数量和种类非常多。以华北某省级电力公司为例,其信息网软硬件资源数量可达上万。为了运维这张网络,其信通公司采用“面向告警”的运维模式:信通公司设置监控部门,通过监控平台24小时对各种IT资源的运行状态进行监控,当发现“重要”级别以上的告警时,立即通知运检部门相关责任人;运检部门负责维修排障,人员规模一般上百,其中半数以上为厂商驻场工程师。运检工程师通过监控平台了解详细告警信息并及时处理;待处理完毕后,监控平台上的告警恢复,监控部门认定该工单结束。
该省级电力公司采用新华三一体化运维中心产品,在信息网和通信网中实时监控了7000余个资源点位,包括各种品牌的网络设备、服务器、存储、操作系统、数据库、中间件等,为电力信息网的正常运行保驾护航。
● 一体化运维中心应用于调度网
作为电力公司的生产业务网,调度网的建设和运维复杂度要超过信息网和通信网。按照业务的不同,调度网一般分为一、二、三区:一区二区为生产大区,主要承载调度监控类业务、调度规划类业务、安全校验类业务等生产业务,通过防火墙相连;三区为管理大区,承载日常管理类业务(统称OMS系统)。
调度网中有两个重要平台:D5000平台和OMS平台。D5000平台涵盖了生产区和管理区业务系统之间的数据总线、服务总线,以及支撑这些业务系统的国产数据库、操作系统、中间件等IT资源,承载了调度网中所有的业务应用,其监控模块可以对承载的业务系统进行监控;OMS系统是省调管理类业务的总称,包含了自动化处日常工作需要的所有管理应用,如资产信息库、工单流程等。
单纯从功能来看,D5000、OMS系统与一体化运维中心有重叠,一体化运维中心似乎只能作为硬件监控的工具、D5000的数据来源之一。但通过新华三一体化运维中心在某省调中心的实践来看,结果并非如此——即使存在D5000与OMS系统,一体化运维中心依然发挥着不可替代的作用。一体化运维中心的定位是IT资源层面的统一运维平台+智能分析辅助决策工具,而D5000的监控能力更多地体现在对业务应用本身的监控上,对于IT资源层面的监控能力较弱,尤其缺乏对网络、存储等资源的监控;OMS系统中虽然有资产信息库和流程平台,但需要手动录入资产信息和事件工单,流程与监控脱节,自动化程度略有欠缺。
某省调中心使用新华三一体化运维中心实现IT资源层面的集中监控(采用技术手段实现监控数据跨区传输),并通过业务视角梳理了业务卡片,与D5000承载的业务应用一一对应,起到了提前预防的效果,当业务应用尚可使用,但对应的卡片健康度、繁忙度出现异常时,提前介入和解决问题;同时,通过CMDB为运维人员提供智能辅助决策依据,经过定制开发实现了CMDB、流程平台与OMS系统对应模块的数据互通,大大增强了OMS的实时性和自动化能力;该省调中心还创新性地将ITIL运维体系引入运维工作,通过建立D5000平台、OMS平台和一体化运维中心三足鼎立而又融汇贯通的运维格局,大大提升了运维水平。
结束语
电力行业是关乎国计民生的重大行业,其运维工作随着IT信息化的不断发展而变得越发重要。而且在电力系统的“十三五”规划中,也明确提出了对一体化运维平台建设的指导意见,未来一体化运维中心必将成为推动电力行业IT水平发展的关键力量!