睿象云智能告警平台的分派策略
1447
2022-10-27
IT运维人员不可能时候盯着服务器,所以系统发生故障时候一般都会发出告警的,这样运维人员才能及时处理,保障服务器正常运行。那你知道运维告警方式有哪些?哪个工具好用?
运维告警方式有哪些?哪个工具好用?
目前运维告警方式比较多,比如手机短信、电子邮件、微信、企业微信、钉钉、电话等等。其具体相关功能如下:
1、监控数据获取
支持多种监控数据获取方式:支持从公有云厂商/私有云平台通过API获取监控数据,也支持通过Agent获取监控数据,同时也对接了如SNMP等第三方监控平台API对资源的监控数据进行获取。
2、监控指标
覆盖支持了几乎所有的监控指标,包括CPU、内存、磁盘、进程、网络流量等20多项监控指标。
3、采样频率
以高达15次/秒的数据采样频率进行监控数据采集,并且支持长达30天的监控数据存储。
4、告警手段
支持手机短信、电子邮件、微信/企业微信、钉钉等多种实时告警手段,且不仅仅止步于告警事件的通知,还提供了进一步的告警处理能力,运维工程师可直接通过移动终端即可对故障进行处理。
【知识拓展】:告警级别简单划分
告警级别分为紧急,重要,次要,提示四种级别,其中告警规则的告警级别由用户设置,用户可根据自己业务及告警规则设置合理告警级别,四种级别简单说明如下:
紧急告警:告警规则对应资源发生紧急故障,影响业务视为紧急告警。
重要告警:告警规则对应资源存在影响业务的问题,此问题相对较严重,有可能会阻碍资源的正常使用。
次要告警:告警规则对应资源存在相对不太严重点问题,此问题不会阻碍资源的正常使用。
提示告警:告警规则对应资源存在潜在的错误可能影响到业务。
运维告警管理怎么做
当下IT运维人员的一大头疼事,便是复杂而凌乱的告警,无法将告警信息进行灵活分类,通知给不同的人,这样就加大了运维人员对告警信息的判断难度,进而无法快速的的定位到根因,也就无法快速的解决问题。
睿象云智能告警平台Cloud Alert(简称CA)快速接入各类事件,通过人工智能算法自动发现、诊断、修复IT系统运行事故,并能帮助企业形成最佳事件管理流程,让业务运行更加安全可靠;
灵活的分派策略:
在CA的分派策略当中,用户可以根据不同的应用,选定不同的筛选条件,将条件相结合,让指定的告警通知到特定的人;例如:在zabbix应用中,用户可以选择告警级别、告警内容、主机、服务、告警对象、hostgroups、applications等筛选条件,将告警条件相结合,使得告警通知到的人。用户也可以选择将告警通知到组、排班、钉钉、企业微信等协作通知方式;为了防止重要的告警遗漏,CA平台也推出了分派升级策略,当告警在用户指定的时间内未被认领或关闭时,会通知到第二负责人,同样的也可以设置第三、第四负责人,以此类推。
上述就是小编为大家整理的运维告警方式有哪些?运维告警管理怎么做
国内(北京、上海、广州、深圳、成都、重庆、杭州、西安、武汉、苏州、郑州、南京、天津、长沙、东莞、宁波、佛山、合肥、青岛)睿象云智能运维平台分析、比较及推荐
发表评论
暂时没有评论,来抢沙发吧~