通过IT事件全生命周期管理方法,满足企业IT运维流程管理的需求

4747 594 2023-07-10

本站部分文章、图片属于网络上可搜索到的公开信息,均用于学习和交流用途,不能代表睿象云的观点、立场或意见。我们接受网民的监督,如发现任何违法内容或侵犯了您的权益,请第一时间联系小编邮箱jiasou666@gmail.com 处理。

本文讲了通过IT事件全生命周期管理方法,满足企业IT运维流程管理的需求。

进入数字化时代,IT架构面临的复杂性越来越高,业务连续性管理这项IT最基本的工作,也成为了很多行业或企业IT运维的最核心任务;业务连续性管理是一个持续不断提升的过程,围绕“快速发现事件→快速响应事件→快速定位与处理事件→减少事件发生”的事件生命周期闭环,结合一体化运维平台,是提高业务连续性保障水平的一种好思路。

01. IT运维的趋势与挑战

当前,各行各业正如火如荼持续推进自身业务和管理模式的数字化转型。数字化转型在提升客户体验、加快业务创新交付、为运营提能增效方面确实可以为企业带来重要价值;但与此同时,企业数字化转型给IT运维带来极大挑战,数字化转型推动新技术、新场景的快速迭代,让运维面临的复杂度、不确定性因素加大,企业业务连续性面临更大挑战和不确定性。

image.png

ITIL将IT服务管理分为十个核心流程和一项管理职能。这十个核心流程分别是服务级别管理、IT服务财务管理、能力管理、IT服务持续性管理、可用性管理、配置管理、变更管理、发布管理、事件管理、问题管理,一项管理职能是服务台。

ITIL V3中把事件定义为“任何可被发现或辨别的事情,此类事情对于基础设施的管理或IT服务的交付有重要意义,以及有助于评估可能导致服务出现的偏差。” 与ITIL V3相比,ITIL 4给出的定义更清晰,事件(Incident)是指服务的意外中断或服务质量的降低。

在ITIL中,IT事件管理是IT基础架构管理策略的一部分,包括监控、调查、上报和响应IT平台上发生的事件。在ITIL 事件管理生命周期中,ITIL 提供了一个七步流程来处理事件:

步骤一:事件识别

这是服务台第一次意识到问题的时候。用户可能会检测到与用户体验相关的事件,并提出投诉。另一方面,技术事故通常是在日常监控中发现的。

步骤二:事件记录

一旦确定了事件,服务台就应该将其记录下来。他们通常会要求确定事件的人的姓名、发现的日期和时间以及对错误的描述。然后服务台将进行事件分类。这是一种确定问题类型的方法。事件分类有两个目标:使服务台能够查找任何趋势,并通知事件优先级。事件优先级是确定解决方案紧迫性的过程。这通常被定义为“高”、“中”或“低”,并基于受影响用户的数量和事件造成的破坏程度。

步骤三:事故调查与诊断

这是解决事件的第一步。受影响的用户与服务台的一名成员讨论该事件,以查看是否有立即解决的方法,或者他们是否可以快速识别问题。如果服务台的假设成功,则问题已解决,可以直接跳到步骤 5。但是,如果没有立即修复,事件将需要进入下一阶段。

步骤四:事件分配或升级

由于需要进一步工作,服务台会将事件分配给现场技术人员或经过认证的支持人员,他们将寻找解决方法,然后调查事件原因。

步骤五:事件解决

顾名思义,此步骤涉及服务台确认事件已解决。

步骤六:事件结束

此时,事件被视为已结束,流程结束。

步骤七:用户满意度调查

组织可能会要求用户在问题解决后完成一份简短的问卷,以确定他们是否对服务交付感到满意。这是识别事件管理过程中任何问题的好方法,例如无用的服务台员工或不满意的解决方案。同时,压倒性的积极反馈是提高员工士气的好方法,它可以帮助识别在工作中表现出色的团队成员。

将上述事件生命周期的七步流程抽象为快速发现事件、快速响应事件、快速定位与处理事件,但这些环节偏事件发生后的事后应对处理环节,可以再补充偏事前的减少事件发生环节,形成完整的事件生命周期如下图,下文主要围绕下图事件生命周期展开解析如何提升业务连续性。

image.png

IT资产全生命周期运维监管中面临的难题

IT资产全生命周期运维监管中面临的三大难题,一是IT资产管理混乱;二是资产生命周期难以掌控;三是机房硬件资产监管困难;具体便现在以下方面。

首先,IT资产管理混乱。对于数万、数十万的IT资产,手工维护的方式工作量巨大、效率也低,容易出现台账记录丢失、更新不及时、无法追踪变更等问题;不同的资产管理员,对同一个IT资产的台账记录,也可能出现不一致。

其次,资产生命周期难以掌控。IT资产从采购到最终的报废,要经历多个生命阶段,每一个生命阶段,管理员都需要记录设备的状态,如设备被谁领用、领用日期、设备迁移到哪里、放置在哪个机房等,由于人员的流动、设备的更新换代,IT资产的变更领用、迁移也非常频繁,如果无法及时更新台账,将会出现管理混乱、出现问题无法追踪的情况。

最后,机房硬件资产监控困难。机房设备通常有服务器、存储设备、网络设备、安全设备等,它们承载着企业的核心系统、关键数据、保障企业信息技术的安全,是IT资产的重中之重。但机房通常远离办公区,当机房设备出现故障或异常出入机房时,无法第一时间发现,这样便存在重大的安全隐患。

因此如何将现有资源最优化分配,成为资产管理者最关注的问题之一,也直接影响IT部门甚至企业的运营成本。

02IT资产全生命周期运维监管方案

睿象云IT资产全生命周期运维监管方案,通过资产管理模块将资产实物与运维数据库一一对应,将为用户提供更加便捷高效资产生命周期管理,资产跟踪、维护和统计分析。方案通过全栈合一的智和网管平台,将资产与运维结合,动态感知纳入监控的资产运行状态,并对资产运行情况进行分析,通过状态数据采集分析,预估资产将面临的风险,驱动资产维护保养。

建立IT资产台账

通过自定义多级资产分类,细化资产类别,并基于资产模板字段扩展功能,为不同分类的资产设置个性化模板,实现资产分类管控,提高资产精细管理程度。通过灵活的自定义能力,为不同类别的资产建立对应的台账,关注其核心资产信息。

image.png

IT资产从采购一直到报废,要经历多个生命周期。分析IT资产的生命周期,实行IT资产全生命周期管理,从资产入库、领用、变更、维修、调拨、到报废处置,资产每一步操作均实现完整记录,支持追溯,通过平台实现资产整个生命周期的全流程闭环管理,使得IT资产每一次生命周期变更,都有流程可依、都有迹可循,从而实现全面的IT资产监管。

通过可视化及智能监控运维技术,建立IT资产可视化监管体系,将机房、数据中心、员工手中的可联网的IT资产,纳入智和网管平台进行统一监控运维,并将运维数据和IT资产数据进行一一对应,用户在资产管理中随时掌握资产状态。

image.png

多维度资产报表分析

提供资产数据专业分析能力,基于资产分类、资产状态、使用部门、负责人、维保信息、最新入库资产等维度对资产进行统计,生成资产报表。

一物一码,高效盘点

每个资产对应唯一的二维码标签,直接扫码快速识别资产信息,二维码信息涵盖资产详情及监控信息,资产生命周期和实时告警、性能信息全面把握

image.png

通过实施睿象云IT资产全生命周期运维监管方案,提升资产管理合规性,资产拥有更高可见性,依托监控运维,结合告警能力,实时掌控资产情况,为资产调用、更新提供依据。

  随着经济全球化的发展趋势,信息系统慢慢渗入到企业中,IT系统已从传统的后台支持转向可以直接推动新业务的深入开展。软件业中的技术服务部门,不仅仅要对内部IT操作做好标准化管理,还要对用户和项目做好技术服务。为软件企业提供完整的运维解决方案,不仅仅能满足对用户售前售中售后问题标准化管理,而且能满足企业IT运维流程管理的需求。

目前许多软件厂商在售前、售中和售后服务管理方面都存在以下问题:

  1、技术性服务事务处理多,依赖纸面工单记录和派送,信息的传递缓慢,总服务台不能及时掌握问题解决项目进度;

  2、偶有丢失工单的状况,导致用户问题解决不及时,被消费者投诉;

  3、用户和技术工程师单线联系,有些技术工程师以客户服务为借口外出,服务过程无法精益化管理,团队工作效率极低;

  4、工程项目人员做了许多事情,但他们的价值却并没有体现出来;

  5、过于依赖于技术工程师的个人技能,而人员流动性大,无法积淀团队经验。其结果是,一些技术工程师离开公司,甚至于一起把用户带走。

鉴于以上所述问题,为其量身打造了一整套详细的解决方案:

  利用统一运维管控平台,建立统一的总服务台,统一响应用户要求,并统筹安排任务工单。

  开放多渠道接入,邮件、电话、用户门户网站提交问题,自动生成工作单到总服务台等候安排,避免漏单。

  服务人员通过系统掌握每个技术工程师的工单数量、每一个工单的解决项目进度、解决的用户及其存在的问题。针对工程项目现场遇到的难题,通过工单及时反馈给总服务台,总服务台安排二线人员加入工作单,快速协作解决用户问题。由于技术工程师的错误操作,避免了部分技术工程师在技术上不能独立解决疑难问题,或因技术工程师误操作而导致的风险,提高了团队的整体工作效率。

  利用微信、钉钉等第三方工具实时接收发送工单,技术工程师可以随时反馈自己的解决项目进度,与总服务台保持密切联系。而且,通过该系统,用户可以及时掌握到问题处理过程,还可以随时补充反馈问题,或对技术工程师解决工作单的状况做好评估。

  工作单通过知识库系统自动匹配相似案例的解决方案,为自己的操作提供参考。自身已成功解决的典型问题,也可通过工单解决方案,自动归纳生成知识文章,发布到知识库,供其他同事参考,尽量减少对技术工程师个人的依赖,这样,即使有人员流动,也不会产生太大的影响。

  通过配置统一运维管控平台,实现企业信息化运维,全面提高IT运维服务的质量、工作效率和客户满意度,具体体现在以下几个方面:

  1、建立总服务台后,避免单线联系的问题,出现在用户面前永远是一个团队,让用户感觉很专业。

  2、多渠道自动查询,邮件自动生成工单,电话自动生成工单,用户自行提交工单,总服务台工作压力大大降低。

  3、总服务台人员统筹安排,掌握每个技术工程师的状况,轻重缓急一目了然。

  4、用户提交的每一个问题,都记录在案,并及时掌握技术工程师的解决项目进度及后续安排,避免因沟通不良而导致满意度降低。

  5、技术工程师通过移动端接收工作单并反馈项目进度,方便快捷,不会因为复杂的流程导致工作效率下降。

  6、通过知识库和第二线的支持,快速解决用户问题,大大提高工作效率,降低实施风险。并随着解决工单的积淀,自动积淀形成企业的知识库,是服务团队的宝贵财富。

  技术工程师的服务数量、服务质量、顾客满意度,通过报告能清楚地呈现出来,管理者可以及时调整团队,不断提升客户满意度。 

上文就是小编为大家整理的通过IT事件全生命周期管理方法,满足企业IT运维流程管理的需求。

国内(北京、上海、广州、深圳、成都、重庆、杭州、西安、武汉、苏州、郑州、南京、天津、长沙、东莞、宁波、佛山、合肥、青岛)睿象云智能运维平台软件分析、比较及推荐。

上一篇:波音737 MAX 上的告警风暴
下一篇:分享Zabbix实现电话告警通知的配置方法
相关文章

 发表评论

暂时没有评论,来抢沙发吧~