告警管理是什么?如何快速实现告警管理

北野 725 2022-10-27

本站部分文章、图片属于网络上可搜索到的公开信息,均用于学习和交流用途,不能代表睿象云的观点、立场或意见。我们接受网民的监督,如发现任何违法内容或侵犯了您的权益,请第一时间联系小编邮箱jiasou666@gmail.com 处理。
本文关于告警管理是什么?如何快速实现告警管理

将CMDB系统与Prometheus连接,实现批量部署配置文件,批量管理告警信息等

架构

用户操作场景

实例属主

关注点:出问题了么?哪里出问题了?是什么问题?

1.收到告警后,能通过页面针对不合理的阈值进行单个
批量修改,在告警消息上能针对
单个阈值进行修改。
2.对应用进行分组,并针对该组制定告警规则。
3.告警发送通道的自助式配置。
4.维护窗口进行告警的单个
批量静默。

监控人员

关注点:直观知道出问题了么?哪里出问题了?通知给谁?是否已解决?

1.告警大屏上展示告警的关键信息,如应用、IP、维护者、重要性。
2.告警数据的分析,哪些应用或实例告警频率高。
3.告警的个例、批量修改,修改的记录有留痕。

管理人员

关注点:监控点是否全覆盖、告警阈值是否设置合理、是否有告警、告警有无及时处理;

哪里问题多?什么问题?。

平台建设者

关注点:告警平台稳定性,操作简易性,不漏发消息,消息准时发出。

1.平台下发数据是否正常,涉及规则、应用实例是否按既定规则推送。
2.规则变更后的生效时间,目前15分钟。
3.告警发生差异,触发阈值的告警数及送达告警数。
4.告警消息轨迹及时延,从产生告警及送达对应的通道。

功能

1.针对硬件、网络、系统、应用(部分业务)四类采集器进行自助式告警规则、告警模板、应用分组配置。
2.自助式进行告警规则启用、禁用、静默。
3.告警大盘展现,不同级别不同颜色。
4.告警通知:钉钉@到人,接入电话、短信告警。
5.简化告警模板。
6.告警渠道管理。
7.支持用户订阅告警消息。
8.支持延迟通知设置。
9.行为日志记录:规则变更、阈值变更、静默变更。
10.告警消息上点击操作数据能同步到后端并处理。

如何快速实现告警管理

当下IT运维人员的一大问题,就是对于大量的告警难以进行精准的通知,以及无法在大批量的告警中快速的定位到问题的所在,再加上时不时出现的告警风暴,加大了告警处理的难度,这就需要一款完善的告警管理平台来针对告警的统一化管理。

睿象云智能告警平台Cloud Alert(简称CA)快速接入各类事件,通过人工智能算法自动发现、诊断、修复IT系统运行事故,并能帮助企业形成最佳事件管理流程,让业务运行更加安全可靠。

CA中包含着如下几大功能:

应用集成:将多平台告警进行统一化管理

分派策略:将指定告警精准化分派给相应人员

通知策略:包含电话、短信告警、APP、微信、邮件等多样化通知方式

压缩规则:算法智能降噪与自定义压缩,减少告警的重复性,避免告警风暴

排班管理:满足企业内部成员排班需求

团队管理:针对成员的管理和分组的设定

智能降噪:高聚合智能降噪和仿阅读智能降噪,帮助用户在事后分析告警

新奇事件:快速定位今日与本周的告警事件,以及对事件的分析

授权管理:针对已购买授权的管理

告警的主要流程如下:

上述就是小编为大家整理的告警管理是什么?如何快速实现告警管理

国内(北京、上海、广州、深圳、成都、重庆、杭州、西安、武汉、苏州、郑州、南京、天津、长沙、东莞、宁波、佛山、合肥、青岛)睿象云智能运维平台分析、比较及推荐


上一篇:这个feature文件对应了我们前面人工测试的测试计划
下一篇:代码当然还是很有用的,浏览一下代码,查看一些具体的代码段
相关文章

 发表评论

暂时没有评论,来抢沙发吧~