AIOps自动化运维功能和特点介绍(智能运维:从0搭建大规模分布式AIOps系统)

网友投稿 806 2022-09-24

本站部分文章、图片属于网络上可搜索到的公开信息,均用于学习和交流用途,不能代表睿象云的观点、立场或意见。我们接受网民的监督,如发现任何违法内容或侵犯了您的权益,请第一时间联系小编邮箱jiasou666@gmail.com 处理。

AIOps自动化运维功能和特点介绍(智能运维:从0搭建大规模分布式AIOps系统)

AIOps自动化运维平台将大数据和机器学习功能相结合,通过收集和分析IT系统不断生成的不同种类的数据,来支持主要的IT运营功能。AIOps自动化运维平台能够同时使用多个数据源、多种数据收集方法,以及多种分析和表示技术。

AIOps自动化运维平台应具备的功能或特点:

1、数据收集

从本质上讲,AIOps平台需要能够从各种来源收集信息,包括物理基础设施组件、服务和应用程序。在部署AIOps平台时,必须能够使用现有的监控工具以及新技术。

2、数据聚合

AIOps解决方案需要能够聚合来自 IT 基础设施监控 (ITIM)、网络性能监控和诊断 (NPMD)、数字体验监控 (DEM) 和应用程序性能监控 (APM) 的数据。

3、数据丰富

数据聚合是第一步,但要实现真正的价值,还需要一个能够丰富所收集数据的AIOps工具。历史数据(例如日志和事件)提供追溯视图,并且可以通过应用元数据和标签来丰富索引,从而为索引中的搜索提供上下文。

通过将数据点与时间戳叠加,可以丰富实时数据(例如性能和遥测信息),用于生成有用的时间序列信息。再次使用该信息时,可以添加合适的标签,带来更多的价值。

4、分析见解

AIOps平台提供的核心价值在于洞察力。AIOps平台应该有提供跨系统追踪和关联分析,有效进行故障的根因分析。一个好用的AIOps平台的关键特性是提供告警消噪(包括告警抑制、告警收敛等),消除误报或冗余事件,捕获超出静态阈值的异常,实现单/多指标异常检测,根据机器学习结果,预测未来事件,防止潜在的故障,这为平台提供主动、合理的解决问题建议提供了基础。

5、自动化

自动化为 IT 运营管理带来了效率和有效性。AIOps平台应该能够直接或通过集成启动解决问题的动作。优秀的自动化功能可提高敏捷性,并减少意外出现的流程错误,并提升服务可用性。

6、易用性

基于云的AIOps平台可以通过允许 IT 团队以一种安全的、分布式的方式解决跨多个站点和多个客户的问题。AIOps平台提供了监控数据通道,使其他工具更容易访问收集的信息,促进跨团队的协作。

上一篇:智能运维(运维自动化)哪家强?
下一篇:国内AIOps智能运维平台有哪些?(it智能运维平台能够提供哪些运维功能)
相关文章

 发表评论

暂时没有评论,来抢沙发吧~