跳转至

智能降噪/压缩


为什么要使用智能降噪/压缩

运维监控工具/平台,一般是通过配置固定阈值,达到阈值后自动触发/生成告警。如网络中断、闪断;系统升级更新;设备多监控内容多等情况下,更会产生海量告警。以下为告警管理常见问题:

  • 故障期间,告警风暴,手机/邮箱会被海量告警淹没;

  • 运维人员很难从海量告警从筛选出重要告警,容易忽略重要告警;

  • 固定阈值控制,频繁误报、漏报告警;


智能降噪/压缩能做什么

当您在应用上启用智能降噪/压缩时,有海量告警推送到 睿象云智能告警管理平台CA 时,智能降噪算法/压缩规则会合并相似告警,来帮助使用者专注于重要的告警。 启用后,第一条告警将会在平台上创建一条新告警(时间窗口智能降噪除外),后续告警会通过底层算法/规则匹配判断应当将哪些告警合并至现有告警中。


CA 智能降噪/压缩机制

睿象云智能告警管理平台CA,适应不同行业、不同规模、不同运维水平公司的各种告警需求,平台支持多维度告警压缩合并与降噪,帮助您在不遗漏重要告警前提下,快速减少告警。

CA 实现告警降噪根据降噪程度不同,分为四种方式:

自动去重压缩

全量告警推送到 CA 平台后,CA 平台会自动基于时间序列,将相同的事件/告警压缩。不同监控工具去重压缩机制有细微差异:根据 eventId(事件 ID)和告警标题,去除重复告警。

  • 事件 ID 不为空:系统中有未关闭的告警,若事件 ID 相同,则自动合并告警;

  • 事件 ID 为空:系统中有未关闭的告警,若告警标题相同,则自动合并告警。

自定义压缩

在告警发生时,通过匹配用户配置的自定义压缩条件来进行压缩。有关更多信息,请查看我们关于自定义压缩 的文章。

时间窗口智能降噪

在指定时间范围内对所有警报进行压缩,在时间范围结束时再进行通知。有关更多信息,请查看我们关于时间窗口智能降噪 的文章。

实时智能降噪

智能算法根据标题/内容、主机信息等智能的将后续发生的相似告警压缩至您仍未关闭的告警中,能够大幅度减少告警噪音。有关更多信息,请查看我们关于实时智能降噪 的文章。


算法降噪

CA 历经 4 年的历练,积累各行各业 2 亿条原始告警,积累 3GB 告警专业特色词库,230 万条告警人工标注,20 种人工智能算法,2 年模型在线训练和迭代,为算法降噪打下坚实基础。算法降噪分为 2 个步骤:

  1. 仿阅读智能算法:

  2. 告警全文本预处理:基于 CA 打造的告警专业特色词/停用词库,数据字典,人工标注信息等,对告警全文本分词处理等;

  3. 基于 CA 内置的分类等算法,对告警进行自动标注分类信息。

  4. 高聚合智能算法:

  5. 告警全文本预处理:与算法智能分类预处理一致,无需重复处理;

  6. 基于 CA 内置聚类等算法,提取告警关键特征信息,对告警进行算法聚类降噪,将关键特征信息与聚类结果关联。

CA 算法降噪最高降噪比 99.9%,下附聚类效果截图:

进入路径:告警 -> 智能降噪按钮,即可进入智能降噪界面。未来将支持更多降噪算法,根据您的告警规模、告警特征自行选择降噪算法。

Top50 主机聚合分类

新增告警 Top50 主机聚合分类,将用户团队中告警根据主机类型进行聚类出前 50 种,帮助用户分析告警关键信息。

进入路径:告警 ->智能降噪 ->Top50主机聚合分类

智能降噪/压缩持续优化中, 欢迎联系我们了解更多

常见问题

降噪是干嘛用的?

监控平台会有告警风暴的情况,亦或是有无效告警的情况,可以通过【降噪】的功能实现避免告警告警风暴,以及减少无效告警通知的情况。

降噪能针对多个应用么?

一个降噪规则可以选择多个应用,同样,一个应用也可以选择多个降噪。

如何知道是哪个降噪在当前应用生效

在配置规则时会设置该规则的优先级,涉及到当前应用的规则优先级最高(最小)的生效。

时间窗口智能降噪和实时智能降噪的区别是什么

时间窗口智能降噪是先压缩指定时间内的告警,再进行分派通知。
实时智能降噪是第一时间就通知,后产生相同告警会被压缩在主告警中。
详细的区别可以查看我们关于时间窗口智能降噪实时智能降噪 的文章。

降噪中的分派策略,我如果选择了指定分派,还会走我已经设置好的分派策略么?

不会,选择了指定分派,符合了告警的压缩的条件,就会按照指定的分派人进行通知;若果想要告警走已经设置好的分派策略,请选择自动分派。

风暴预警是干什么的?

当产生告警风暴的时候,往往会产生大批量的重复性告警,这样重复性高的告警,就可以进行压缩;风暴预警可以设置告警的压缩阀值,告警压缩条数一旦达到了设置的阀值,就会再次提醒,提醒用户有告警风暴产生,请及时关注。

风暴预警的通知方式是什么?

会通过电话和短信通知到分派人。