系统迭代:如何监控和保证系统稳定性?

网友投稿 717 2022-09-13

本站部分文章、图片属于网络上可搜索到的公开信息,均用于学习和交流用途,不能代表睿象云的观点、立场或意见。我们接受网民的监督,如发现任何违法内容或侵犯了您的权益,请第一时间联系小编邮箱jiasou666@gmail.com 处理。

系统迭代:如何监控和保证系统稳定性?

1. Apdex 值

计算公式:Apdex=( 满意样本 + 可容忍样本/2 )/ 样本总数

从图中可以看出,系统在早上 6 点 40 分时的 Apdex 值为 0,说明用户在访问网站时满意度为 0,也就是无法访问网站,系统很可能在这时出现了假死或者宕机现象。

从图中可以看出,在出现假死之前,系统 Apdex 值有波动。可以研究波动时段的其他性能指标,寻找产生这些现象的真正原因。

2. 报警策略

报警策略分两种:[1.性能报警;2.错误报警]

1. 性能报警

性能报警以用户设置的 Apdex 阀值为报警触发条件,如图:

从图中可以看到报警的规则分为:[1.警示阀值;2.警报阀值]两种。当满足「警示阀值」时,会提醒用户系统出现性能问题;当满足「警报阀值」值时,会通知用户系统性能已有严重问题,应立即查看原因,处理故障。

2. 错误报警

错误报警以用户设置的平均错误率为报警触发条件,如图:

从图中可以看到,错误报警也分为「警示阀值」和「警报阀值」两种。当满足「警示阀值」时,会提醒用户系统出现错误;当满足「警报阀值」时,会通知用户系统有严重故障问题,需要立即处理。

除了以上这些,我们还有[1.分配策略2.管理用户3.通知方式]供用户自定义配置

1. 分配策略:

可以自定义分配需要监控的应用程序,如图:

2. 管理用户

管理需要通知的相关负责人,如图:

3. 通知方式

设置报警的的通知方式,如图:

上一篇:如何用 Parse 和 Swift 搭建一个像 Instagram 那样的应用?(如何用手机开关空调)
下一篇:如何选择一款好的 APM 工具?(如何选择一款好的猫粮)
相关文章

 发表评论

暂时没有评论,来抢沙发吧~