睿象云智能告警平台的分派策略
937
2022-09-25
企业云服务运维怎样才能做到抑制告警风暴?
随着企业IT业务的云化,以及应用运行环境的复杂化,系统架构的微服务化,对运维工作的要求也越来越精细化。在这样复杂的环境中,数据间都是紧密联系的,其中一个指标发生了变化,就可能引发一系统的告警连锁反应,也就是造成告警风暴。当告警风暴产生时,对于运维人员来说是很大的考验,面对成千上万的告警信息,很容易就会遗漏重要的消息。那么,企业云服务运维怎样才能做到抑制告警风暴?下面我们就来介绍。
企业云服务运维怎样才能做到抑制告警风暴?
睿象云智能告警平台 Cloud Alert 适应不同行业、不同规模、不同运维水平公司的各种告警需求,平台支持多维度告警压缩合并与降噪,帮助您在不遗漏重要告警前提下,快速减少告警。
1、自研机器学习算法
基于IT运维行业的海量告警数据,自研基于注意力机制的深度学习算法,提供更加精准的文本聚合能力。
2、多种智能化场景
包含事件和告警的分类、聚类、异常发现等多种人工智能场景。
3、事中实时降噪
在告警风暴来临之时,通过去重、规则压缩和人工智能算法,实时抑制告警风暴,极大的降低告警通知的数量。
4、事后回溯分析
根据告警内容自动进行分类、聚类,帮助运维人员大幅降低告警分析的数据量,从而缩短故障恢复时间。
当您在应用上启用智能降噪/压缩时,有海量告警推送到睿象云智能告警管理平台CA时,智能降噪算法/压缩规则会合并相似告警,来帮助使用者专注于重要的告警。启用后,第一条告警将会在平台上创建一条新告警(时间窗口智能降噪除外),后续告警会通过底层算法/规则匹配判断应当将哪些告警合并至现有告警中。
总结:
一个高效的压缩与降噪方式,能够有效的抑制告警风暴,并且能够减少大部分的成本。睿象云智能告警平台 Cloud Alert通过自动去重压缩、规则压缩、算法智能降噪三种方式来去重降噪,减少重复的告警信息,抑制告警风暴。
发表评论
暂时没有评论,来抢沙发吧~