睿象云智能告警平台的分派策略
1387
2022-09-25
睿象云针对告警风暴预警解决办法及流程
系统在短时间内产生大量的告警信息就会造成告警风暴,对于复杂的系统来说,哪怕了一个小小的问题都可能引发告警风暴。睿象云智能告警平台可以接入多个监控平台,通过对数据进行标准化处理,自动去重压缩等方式,将告警信息分派通知到用户。下面我们就来介绍睿象云针对告警风暴预警解决办法及流程。
睿象云针对告警风暴预警解决办法及流程:
睿象云智能告警平台的告警抑制和压缩可以有效避免告警风暴出现,同时告警风暴预警功能可以让相关负责人及时发现异常数量的告警。
智能告警管理平台适应不同行业、不同规模、不同运维水平公司的各种告警需求,平台支持多维度降噪,帮助您在不遗漏重要告警前提下,快速减少告警。
1、自动去重压缩
全量告警推送到CA平台后,CA平台会自动基于时间序列,将相同的事件/告警压缩。不同监控工具去重压缩机制有细微差异:根据 eventId(事件ID)和告警对象,去除重复告警。
事件ID不为空:系统中有未关闭的告警,若事件ID相同,则自动合并告警;
事件ID为空:系统中有未关闭的告警,若告警对象响应,则自动合并告警。
2、规则压缩
去重后的告警,会按照压缩规则,将相似、同源(同一设备不同类型的信息)告警再次进行压缩。一共分为两种压缩机制。分别是:算法告警抑制与自定义压缩规则降噪。
3、算法降噪
睿象云历经多年的历练,积累各行各业数亿条原始告警,积累大量告警专业特色词库,数百万条告警人工标注,多种人工智能算法,多年模型在线训练和迭代,为算法降噪打下坚实基础。
告警风暴预警功能:
运维监控工具/平台产生异常时,会在短时间内产生异常数量的告警,如果未能及时发现,可能会影响到整体的业务流程,所以引入了风暴预警的功能,用户可以在风暴预警的功能中,设置指定时间段内,产生告警的数量阀值,当告警数量超过阀值时,就会通知到相关负责人。
在复杂的运维工作中,如何将告警有效的管理是运维工作中关键而重要的一步,有效的告警管理可以将大大提高运维人员的工作效率。睿象云智能告警平台快速接入各类事件,通过人工智能算法自动发现、诊断、修复IT系统运行事故,并能帮助企业形成最佳事件管理流程,让业务运行更加安全可靠。
发表评论
暂时没有评论,来抢沙发吧~