企业运维系统建立初探(3)
2017-06-24 01:00
导读:(四)运维系统的组成 在一般的运维系统中,需要一个大房间,在大房间中分成以下几个部分,每个部分都扮演相应的角色: 第一层:大屏幕分别显示有
(四)运维系统的组成
在一般的运维系统中,需要一个大房间,在大房间中分成以下几个部分,每个部分都扮演相应的角色:
第一层:大屏幕分别显示有,基于业务的视图,基于IT基础架构的视图,基于网络的视图,当故障出现时能够以特定的颜色显示出来,同时可以显示一些公司需要直观显示的数据。
第二层:服务台(Help Desk),主要提供:
●接受客户的请求
●提供客户使用上的题目咨询
●提供客户业务咨询
●记录并跟踪故障和客户意见
●根据知识库,尽快解决题目
●及时通知客户其请求确当前状况和最新进展
●根据服务级别协议,初步评估请求,经历解决它们或安排给一线工程师解决
●对客户的故障从提出到验证及终止的整个过程进行治理
●协调一线工程师和值班工程师
第三层:一线支持工程师
●根据提供的监控界面迅速定位题目并解决
●对于临时的解决办法,还要把故障提交给题目处理流程
●根据服务级别,在题目未能及时解决时及时把题目提交给值班经理
第四层:值班经理个人
●协调技术专家,根据服务协议的时间要求,解决题目
●协调供给商,根据维护协议要求,解决题目
(五)运维系统的功能设计
基于ITIL设计理念,我们把ECC的实时监控部分设计成层次架构,如下图:
1. 事件采集层
在最基本的层次上,需要从被治理的IT基础设施中获取广泛的,实时的数据,能够从网络、系统和应用层中捕捉、汇聚并处理大量数据的能力,我们通常称之为事件治理。
(转载自http://zw.NSEaC.com科教作文网) 事件治理是整个面向服务治理系统的核心,在数据采集阶段(包括网络、系统和应用层)采集的信息,只有经过事件治理服务器,转变为同一的格式,再流进智能化的治理层,实现事件的相关性分析。
数据采集层是整个治理系统进行信息处理和智能化分析的基础,因此需要充分获得正确、实时、完整的治理数据。在数据采集层,应该进行原始数据的过滤、分类、分级等预处理操纵,从中提炼出重要的治理信息。数据采集层获取信息的实时和正确性,以及对原始信息的预处理能力,将在很大程度上影响整个治理系统的治理能力和效率。
2.事件处理层
数据收集仅仅是实现业务和通讯及IT基础框架治理的基础,需求最简单的先决条件。实现真正的基础框架智能化意味着能够从整个基础框架产生的大量数据中,通过采用一系列先进的过滤,事件压缩,关联和诊断的技术进行处理,抽取治理职员需要关注的重要信息。好的基础框架监控治理系统能够将网络以至IT系统的专业化知识融进在治理系统中,根据基础框架层各组成资源的特点,从原始的治理数据中智能分析系统的真实状况,判定资源实际的运行状态,分析故障发生的根源并提出解决建议,使运维职员解决题目更加正确和有效。一般包含以下功能:
(1)事件的存储
将运行维护数据与历史数据分开存储, 以确保治理的效率. 一般治理信息需要保存6个月甚至更长的数据, 以进行统计分析和存档, 而在日常运行治理中, 一般只需要查看最近一周甚至更短的信息, 一般采用运行数据与实时数据分开存储, 运行数据采用高速的内存数据库保证事件处理的实时性, 历史数据采用稳定的关系型数据库保证事件存储的可靠性和容量,这种结构使事件的处理更加公道。
(转载自http://zw.nseac.coM科教作文网)
(2)事件压缩
IT资源事件中有很多重复事件, 尤其在系统组件不稳定时, 有可能会产生事件风暴。过多的事件会使治理员的桌面上罗列大量事件条目,治理员无法获取真正需要关注的重要事件,因此对重复事件进行合并使事件条目清楚, 帮助治理员快速找到需要处理的故障是非常重要的。重复事件压缩就是这样的一个过程: 通过将从下层数据源所报告的相似事件加以汇总,合并成一条事件,该事件的内容包含了该事件重复的次数以及发生的起止时间。