睿象云针对告警风暴预警解决办法及流程

网友投稿 1387 2022-09-25

本站部分文章、图片属于网络上可搜索到的公开信息,均用于学习和交流用途,不能代表睿象云的观点、立场或意见。我们接受网民的监督,如发现任何违法内容或侵犯了您的权益,请第一时间联系小编邮箱jiasou666@gmail.com 处理。

睿象云针对告警风暴预警解决办法及流程

系统在短时间内产生大量的告警信息就会造成告警风暴,对于复杂的系统来说,哪怕了一个小小的问题都可能引发告警风暴。睿象云智能告警平台可以接入多个监控平台,通过对数据进行标准化处理,自动去重压缩等方式,将告警信息分派通知到用户。下面我们就来介绍睿象云针对告警风暴预警解决办法及流程。

睿象云针对告警风暴预警解决办法及流程:

睿象云智能告警平台的告警抑制和压缩可以有效避免告警风暴出现,同时告警风暴预警功能可以让相关负责人及时发现异常数量的告警。

智能告警管理平台适应不同行业、不同规模、不同运维水平公司的各种告警需求,平台支持多维度降噪,帮助您在不遗漏重要告警前提下,快速减少告警。

1、自动去重压缩

全量告警推送到CA平台后,CA平台会自动基于时间序列,将相同的事件/告警压缩。不同监控工具去重压缩机制有细微差异:根据 eventId(事件ID)和告警对象,去除重复告警。

事件ID不为空:系统中有未关闭的告警,若事件ID相同,则自动合并告警;

事件ID为空:系统中有未关闭的告警,若告警对象响应,则自动合并告警。

2、规则压缩

去重后的告警,会按照压缩规则,将相似、同源(同一设备不同类型的信息)告警再次进行压缩。一共分为两种压缩机制。分别是:算法告警抑制与自定义压缩规则降噪。

3、算法降噪

睿象云历经多年的历练,积累各行各业数亿条原始告警,积累大量告警专业特色词库,数百万条告警人工标注,多种人工智能算法,多年模型在线训练和迭代,为算法降噪打下坚实基础。

告警风暴预警功能:

运维监控工具/平台产生异常时,会在短时间内产生异常数量的告警,如果未能及时发现,可能会影响到整体的业务流程,所以引入了风暴预警的功能,用户可以在风暴预警的功能中,设置指定时间段内,产生告警的数量阀值,当告警数量超过阀值时,就会通知到相关负责人。

在复杂的运维工作中,如何将告警有效的管理是运维工作中关键而重要的一步,有效的告警管理可以将大大提高运维人员的工作效率。睿象云智能告警平台快速接入各类事件,通过人工智能算法自动发现、诊断、修复IT系统运行事故,并能帮助企业形成最佳事件管理流程,让业务运行更加安全可靠。

上一篇:衡量企业应用数据库性能的6大指标(衡量企业应用数据库性能的6大指标是什么)
下一篇:为什么目前 IT 领域需要 DevOps 战略
相关文章

 发表评论

暂时没有评论,来抢沙发吧~