升级日记|2021-8-31告警实时智能降噪、根因定位双升级!更精准!
作者:admin 发布时间:2022-01-25 阅读:
次
Hi,Cloud Alert 的小伙伴们:
告警风暴和根因定位相信是很多运维小伙伴的工作中最大的困扰和难点,这次,我们的智能告警平台又升级了!快来试试,这一次就让告警风暴“乖乖站好”。
本次的新功能,请往下看~
在日常运维监控的过程中,告警的发生无法避免,但是如果可以在告警发生的过程中,就可以获得关键指标变动的实时反馈,一方面提升故障修复效率,另一方面避免业务损失。但对于运维团队来说,单纯依靠人工的方式很难在指标异常时立即发现问题的根因。面对不同监控工具产生的数以万计的告警,去分析、甄别优先级,需要成吨的工作量去完成深度分析,来找到引起告警的原因。
本次升级中,通过【智能降噪】菜单中压缩方式中的【实时智能降噪】模块,可以通过勾选的方式,按需选择是否优先通过告警信息中的【主机】和【级别】进行定向压缩了;同时也可以按照告警内容的【模板匹配】或【完全匹配】的方式进行压,从而实现面面俱到的实时告警降噪。
原有的【根因定位】会通过系统已有的算法自动对告警信息进行分类,升级后,用户可以针对单条告警信息,按照自身系统属性,自定义告警类别。
在【告警】列表内的每条告警信息中,增加了去重/压缩数量的展现。即,
去重量表示:通过相同的 event id 进行压缩的告警数量;
压缩量表示:通过已经设置好的智能降噪规则自动合并的告警数量。
升级后,集成工具和告警信息改为左右结构。用户可直接根据应用类别进行筛选,查看该应用下的告警信息。
新增【综合分析】:包含今日事件量、今日告警量、今日主告警量、过去7天压缩比、过去7天MTTR、过去7天MTTA、过去7天所有事件、过去7天主告警;
新增【告警级别分析】:包含今日、过去7天、过去15天、过去30天;
新增【告警状态分析】:包含今日、过去7天、过去15天、过去30天。