在建设监测体系时,特别要注意“工具”和“人”之间的协调关系,过于迷信工具的作用或者过于依赖人的操作对于整体的IT运维管理体系建设都是有害的。
配置管理及CMDB
配置管理指识别和确认系统的配置项(CI),记录和报告配置项状态和变更请求,检验配置项的正确性和完整性等活动构成的服务管理流程。配置管理使得IT部门可以管理数字化校园中各个基础部件的整个生命周期,从采购、使用到报废,包括软硬件配置信息,它主要有三部分工作:登记组成服务的资产信息;登记这些资产之间的关系;确保配置管理信息库中的各类相关信息能够得以及时更新。
CMDB(配置管理数据库)指包含每个配置项及配置项之间重要关系的详细资料的数据库。从业务角度来看,它不仅实现对数字化校园各个IT部件信息的跟踪,而且能够深入了解各个流程配置信息,并对配置信息进行共享。实际上,它就是一张IT部门的业务视图,反映数字化校园运行环境,当出现问题时,就可以到里面去找,会很清楚地知道这会影响什么,会关联什么,以及关联的原因。如果实际中有这个业务视图的话,会大大提高工作效率。从运营的发展目标来看,因为要强调精准性和效率,所以必须要建立CMDB。
事故管理
事故(Incident)是任何不符合标准操作且已经引起或可能引起服务中断和服务质量下降的事件。事故管理的作用是快速有效地响应最终用户,使它们能够迅速恢复工作,以减小对最终用户的影响,它包括故障管理,通过服务台接线员以及二线技术人员的工作,迅速解决客户的故障。主要包含以下活动:
1.检测和记录
事件通过系统管理软件检测出来或用户打电话进来,或通过Web,所有事件记录进系统中;
2.判断并分派
确定是事故,服务请求还是申述。如果是服务请求,依照服务请求流程;如果是申述,依照申述流程,如不是,进行事故的影响、收集信息等(定制checklist),尝试解决问题;
3.判断是否已解决
确定问题是否已解决,如解决,由服务台确认,如非,继续诊断,必要时转由二线进行支持解决等;
4.调查和诊断
二线支持人员利用自身技能和相关工具,力图在规定的时间内提出解决方案,尝试解决事件;
5.服务台确认
对事件的解决方案进行确认,如未解决,根据情况采取相应动作;
6.结束
如果确认已解决,关闭记录,更新文档;必要时进行回顾;
7.定期产生报表
事故支持人员将根据管理要求定期产生相关报表。
阅读推荐
相关文章