aiops数据中心能效(数据中心 能效)

来源网友投稿 730 2023-02-03

本站部分文章、图片属于网络上可搜索到的公开信息,均用于学习和交流用途,不能代表睿象云的观点、立场或意见。我们接受网民的监督,如发现任何违法内容或侵犯了您的权益,请第一时间联系小编邮箱jiasou666@gmail.com 处理。
本篇文章给大家谈谈aiops数据中心能效,以及数据中心 能效对应的知识点,希望对各位有所帮助,不要忘了收藏本站喔。 今天给各位分享aiops数据中心能效的知识,其中也会对数据中心 能效进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!

本文目录一览:

什么是AIOps?怎么促进业务提升?

智能运维的概念是Gartner在2016年率先提出,当初的英文全称为Algorithmic IT Operations,意指基于算法的IT运维。随着人工智能技术的发展,2018年Gartner将其英文全称更改为Artificial Intelligence for IT Operations,表明人工智能在IT运维领域的应用。至今短短六年,其概念还在不断融入新的认知。
当前IT运维难度增加,依靠人力堆积的传统方式运维已经无法满足数字化时代对IT运维的要求,借助更先进工具和技术手段成为应对这些挑战的必然选择。数据中心面临着从制度和流程为主驱动的时代,快速向数据与算法为主驱动的智能运维时代迈进。智能运维,已然成为迎接挑战不可或缺的科技力量和解决方案。
AIOps(Artficial Intelligence for Operations),是一种将大数据、人工智能或机器学习技术赋能传统IT运维管理的平台(技术)。AIOps智能运维可以将全栈式的运维数据进行集中化管理,不同数据领域也可以进行智能算法根因定位。其次它可以从业务场景进行跟踪,了解交易路径,对于数据进行智能分析与预测。所以智能运维是一种全新的数字化运维能力,可以配合企业的数字化转型,保障企业的业务应用能够安全稳定且高效的运行。

华为AIOps使能服务加速新基建运维智能化转型

人工智能经历了六十多年的浮浮沉沉,随着计算算力的进步,算法的创新和互联网发展下的海量数据积累,人工智能技术未来十年将焕发出新的活力,成为最具有冲击力的 科技 发展趋势之一。

在HUAWEI CONNECT 2020期间,华为基于对电信领域的深刻理解和多年经验沉淀,带来了《AIOps使能服务》的分享,旨在结合电信领域应用场景,使能网络达到自动、自愈、自优和自治的自动驾驶网络,提升整个网络的效率,降低OPEX。

AIOps成为电信网络运维智能化转型趋势

随着“5G 新基建”的加速实施,数字经济发展迎来新的动能。不仅推动投资消费的快速成长,还将驱动各行业的数字化转型升级。随之而来的是网络问题复杂化与业务质量高要求的挑战,运维能力的演进成为电信网络能否持续发挥效能的关键因素。

电信网络运维作业正面临问题发现被动(75% 问题由用户发现),故障根因定位难(90% 时间用于问题定位)的业务挑战。同时,各专业运维支撑系统功能也面临开发周期长,闭环流程自动化程度低的技术瓶颈。因此,运营商期望引入AI实现智能运维,做到主动维护和故障自愈。

在运维支撑系统的演进方向上,AIOps(运用AI及大数据技术解决运维问题)已经成为电信行业运维智能化转型的趋势和共识:构建AIOps平台能力,支撑不同运维场景应用。在未来五年内,电信行业市场的运维系统和平台将加速AI能力的升级,成为电信领域AI应用的核心场景,投资占比达到60%。

因此,AIOps已经成为电信网络运维智能化转型趋势。通过构建电信领域AIOps平台能力,快速实现智能运维升级。

华为AIOps助力网络提升可靠性及使能智能化运维

按照自动驾驶网络的等级定义,运维的智能化目标是要实现全域、全流程的预测性运维,自动监控、定位、自愈。

华为AIOps使能服务作为自动驾驶网络AI引擎NAIE的核心能力,基于AI平台,提供了一系列的电信领域AIOps原子能力以及组合编排能力,使能网络管控析单元、智能运维解决方案等运维系统,最终帮助运营商打破原有的烟囱式建设方式,将各专业运维系统的应用与AI能力解耦,采用分层的服务化架构对接共享数据中心,集中提供AIOps能力,适配运维场景应用百花齐放的需求。

如下是华为AIOps使能服务预组合编排好的服务,可开箱即用:

kpi异常检测服务, 快速智能识别海量kpi/kqi的异常情况,广泛应用在网络性能和质量监控场景;

故障识别与根因定位服务, 根据海量告警结合对应网络拓扑和传播知识,实时识别故障及根因网元及告警,可自动学习知识规律,保证持续优化,可广泛应用在各种网络场景;

日志异常检测服务, 实现日志的自动分类和统计规律发掘,实时监控出系统的异常行为和相关日志,可广泛应用在IT及电信网络场景;

硬盘异常预测, 可智能预测短期内(14天)的硬盘故障,以采取规避预防措施,以免对业务产生影响,广泛支持主流厂商的HDD及SSD型号。

细数华为AIOps使能服务四大核心竞争力

提供丰富的AIOps原子能力: AIOps的原子能力覆盖运维全流程,包括预测、检测,定位、执行。原子能力库支持流量预测,故障预测,KPI异常检测,日志异常检测,CHR异常检测,异常关联分析,事件聚合,根因定位等20+原子能力。

作为电信领域的AIOps使能服务,具备两个核心特点:一是基于华为电信领域的经验,原子能力将AI算法与电信领域行业知识融合,预制了默认的电信领域模型参数,同时支持现网运行态的调优,解决当前通用算法模型在具体行业落地效果差的难题。目前,已经在现网得到了规模验证。

另一个是AIOps原子能力采用标准化模型规范,统一数据输入,参数配置,结果输出等接口。为AIOps单点原子能力到灵活的组合串接提供了基础。

组合编排与DevOps能力: 通过组合编排功能,使用者可选择业务场景所需的AIOps原子能力,通过可视化方式完成流程串接,并进行业务泛化参数配置,包括数据接入方式,模型参数,内置电信领域泛化参数,事件通知方式、可视化Dashboard等配置。上述能力支持可视化编排或接口调用方式实现。此外,基于NAIE平台训练服务,AIOps的原子能力库支持使用者根据实际业务需求开展算法模型的创新与开发,不断扩展AIOps能力。NAIE的生态服务也提供专业的人员培训赋能。

支持电信领域数据对接: 支持KPI、告警、日志、xDR等电信领域主流运维数据。支持Kafka,数据库,文件系统,Restful等电信运维系统的主流数据对接方式。AIOps使能服务提供通用的数据源对接和标准化数据治理组件,通过配置项快速建立与运维系统的数据源连接,通过SDK将不同的数据类型和格式治理成标准化的AIOps原子能力输入集,用于模型训练和推理。

场景组合服务: 围绕运维全流程(发现、分析、处理)提供预制典型场景组合应用,快速接入运维流程。

综上所述,华为AIOps使能服务作为智能运维AI能力引擎,融合AI的技术优势与华为在电信领域的专业优势,为运维系统的智能化演进提供AIOps平台能力支持,助力到各专业运维系统的应用快速上线,让运维专家专注场景应用设计和业务目标达成。

华为AIOps助力运营商及企业网络打造最佳实践

在KPI异常检测方面,电信网络中,通过KPI来预测和检测网络问题是最普遍的场景。通过AI算法基于 历史 数据自动生成每个KPI的动态门限,避免传统静态门限带来的误报和漏报。

华为NAIE融合了电信领域的运维业务特点,提供单指标/多指标检测,异常原因关联分析,模型的自学习调优等关键能力。目前已经用在核心网,无线,数通等不同业务领域。国内某运营商采用了核心网KPI异常检测服务以后,实现提前5小时识别异常并主动预警,降低了业务损失。

在告警根因定位方面,发现异常或者故障之后的定位是运维流程中的难点,如何准确的将多维度的异常、告警等事件进行汇聚,减少故障噪声,准确定位到具体原因?这些工作目前主要依赖专家经验或者手工分析,而且受限于分析算力和知识信息,效果并不好。

华为NAIE AIOps通过AI算法与业务的融合,支持多类异常/告警等事件的智能故障定位,自动实现时间,拓扑和故障传播图等维度的事件汇聚和根因定位。目前已经应用到无线接入网等业务领域,经过实际验证,无效上站减少60%,根因识别准确率85%+,运维效率整体提升15%。

写在最后,电信领域AIOps落地的关键是需要将行业知识与AI技术融合。网络运维系统的AIOps能力构建的趋势是业务与能力解耦,做到AIOps能力的复用、拉通,支持,适配运维场景应用百花齐放和快速上线迭代的需求。

因此,AIOps使能服务作为智能运维AI能力引擎,融合AI的技术优势与华为在电信领域的专业优势,为运维系统的智能化演进提供AIOps平台能力支持,助力到各专业运维系统的应用快速上线,让运维专家专注场景应用设计和业务目标达成。目前,华为AIOps使能服务已经在无线,核心网,数通等网络域得到了广泛的应用。

智能运维服务都有哪些功能以及效果呢?

智能运维是一种全新的数字化运维能力,且是企业数字化转型的必备能力。智能运维的本质是提升运维数据的认知能力,它在提升运维数据治理能力、优化企业业务数字化风险、降低运维人力成本和提升运维在业务侧的影响力方面都有本质的提升。

智能运维,又称AIOps(Artficial Intelligence for Operations),是一种将大数据、人工智能或机器学习技术赋能传统IT运维管理的平台(技术)。

比如以我们公司的夏洛克AIOps智慧运营平台为例。它能以全局运营视角解读IT运维,在AI算法平台的支撑下实现包括精准告警、异常检测、根因定位和容量分析等场景,助力企业数字化业务高效、稳定和顺畅运行。

运维数据治理。通过高性能实时处理的数据平台广泛采集、处理和分析数字化业务运行过程中的多样化运维数据,包括告警、指标、日志、配置以及运维工单等类别,不仅提升了运维大数据的治理能力,优化了数据质量,而且为进一步激活运维数据的价值打下了良好基础;

业务数字化风险。使运维人员不仅提升了历史运维数据的分析能力并且能够对实时数据进行异常检测和问题预判,有效降低数字化业务的运行风险,提升可用性、稳定性;

运维人力成本。使真正意义上的跨域根因定位成为可能,降低对专业运维人员经验技能的依赖,迅速缩短故障排查时间并有效降低人力成本;

业务侧影响力。以业务视角利用多元化数据提高运营分析和决策能力,比如端到端的分析业务交易状态,提供给业务、客服部门及时反馈和决策支持依据,充分增强业务影响力;

智能运维发展正如火如荼,Gartner预见其为下一代运维,认为到2022年将有近50%的企业用户部署智能运维。虽然目前不少企业已经在积极投入建设,也还有一些企业处在迷茫阶段,尽早布局才能在数字化时代不会被淘汰。

限‌电对于数‌据中心产业影响挺大的,有什么好的节能办法吗? 路坦力超融合对这方面有用吗?

数据中心作为经济社会运行不可或缺的关键基础设施,是公认的高耗电行业。

据前瞻产业研究院分析,过去十年间,我国数据中心整体用电量以每年超过 10% 的速度递增,其耗电量在 2020 年突破 2000 亿千瓦时,约占全社会用电量的 2.71%,2014-2020 年,数据中心耗电量占比逐年升高。数据中心供电结构中,火电占比超过 70%,会产生相对大量的温室气体和其他污染物。

PUE (Power Usage Effectiveness,电能利用效率) 是衡量数据中心能源使用效率的重要指标。PUE 越接近于 1,代表数据中心对于电能的利用越有效率。截至 2019 年年底,全国超大型数据中心平均 PUE 为 1.46,大型数据中心平均 PUE 为 1.55。这与《关于加快构建全国一体化大数据中心协同创新体系的指导意见》建议的 1.3 以下相比,尚有一段距离。

可见,限‌电对于数‌据中心产业影响挺大的。顺应碳中和发展趋势,逐步降低碳排放,是数据中心亟需做出的改变。

数据中心降碳,可双管齐下

数据中心如何才能提升能源效率,为降碳做出贡献?主流的数据中心降碳举措可分为 IT 和 非 IT 基础设施两个方面。

非 IT 基础设施方面,常见的有数据中心选址靠近绿色清洁能源、尽量使用可再生能源、采用液冷技术取代风扇散热、数据中心余热回收再利用等等。这其中最为有效的不外乎在数据中心乃至公司运营范围内 100% 使用可再生能源,但这绝非易事——苹果用了 5 年时间才实现公司运营范围内 100% 可再生能源利用。

而在 IT 基础设施方面,企业可立即采用诸多举措来提升能源效率:通过分布式和虚拟化技术将“僵尸”服务器连接起来,最大程度减少 IT 设备空闲;实现服务器和存储的虚拟化与池化,从而大幅提升硬件利用率;通过采用更高能效的芯片产品,结合芯片的自适应电源管理功能来有效管理芯片用电,等等。

其中,虚拟化和超融合基础设施 (HCI) 有望引领数据中心能效的提升。

虚拟化已十分普遍,超融合基础设施也在近年来逐渐成为主流。作为一种融合的、统一的 IT 基础架构,超融合包含了数据中心常见的元素:计算、存储、网络以及管理工具。超融合以软件为中心,结合 x86 或 ARM 架构的硬件替代传统架构中的专用硬件,从而解决传统架构中管理复杂、难以扩展等问题。

相比传统架构,超融合将架构由三层缩减至两层,不仅可以大幅度节省机房空间,还能进一步整合计算资源,从而提升机房能效。超融合架构自带计算虚拟化和分布式存储,取代了传统物理环境和传统虚拟环境,对数据中心降碳的影响显著。


经过通用场景下的对比计算,从传统物理环境到传统虚拟环境,仅是虚拟化这一层即可带来 20%-80% 的节能;而从传统虚拟环境进一步过渡到超融合架构,通过将分布式存储融合到计算侧,可再带来高达 31% 的能耗节省。以下为计算详情(以下为理论值,不同负载情况下物理服务器能耗会有有所不同,不同服务器也会表现不同,同时不考虑交换机等因素)。

计算虚拟化:节能 20%-80%,虚拟化程度越高越节能

计算虚拟化是从 IT 基础设施层面提升能效的关键。它实现了 IT 基础设施从物理架构到虚拟化的跃升,减少物理服务器的数量、增加 IT 资源的利用率,让数据中心得以使用更少的基础设施即可运行更大的工作负载。IDC 报告指出,数据中心中计算、存储、网络层虚拟化程度越高,所带来的碳影响就越小。

以 4 台物理服务器搭配 1 台存储系统的配置为例,通过用虚拟化取代原有的物理机,能实现约为 20% 到 80% 的能耗节省(取决于虚拟机部署的密度)。

传统物理环境 vs. 传统虚拟环境


(以 4 台物理服务器搭配 1 台存储系统为例)

如图所示,此场景中两种架构的最大差异在于对计算资源的利用率不同:在相同的硬件条件下,计算资源的利用率越高,能获得的节能优势就越大。虚拟化架构通过高度利用 CPU 资源(此场景预设的 CPU 超分比例为 1:4,通常属于中到重度计算需求使用),可将平均每计算核心耗能降低约 74%。

在实际使用场景中,虚拟机部署密度的不同,也会带来不同的节能效果:

高密度虚拟机场景下(1 : 20,1 台物理服务器支撑 20 台虚拟机),平均每台服务器(虚拟机)耗能为 321 W/Hr,相比物理服务器降低约 80%;

低密度虚拟机场景下(1:5,1 台物理服务器支撑 5 台虚拟机),平均每台服务器(虚拟机)耗能 1284 W/Hr,相比物理服务器降低约 20%。

若进一步将 CPU 超分比例提高,物理环境和虚拟环境的耗能差距将会更大。

存储与计算节点融合部署:再节能约 31%

超融合基础设施将计算与存储服务模块融合部署在同一物理服务器(物理节点),完全舍弃了传统集中存储的需求,能够在虚拟化降低能耗的基础上,进一步为数据中心节能。

以相同的硬件配置为例(4 台物理服务器搭配 1 台存储系统),超融合架构通过去除传统集中存储硬件,可将平均每计算核心耗能再降低约 31%。

传统虚拟环境 vs. 超融合

(以 4 台物理服务器搭配 1 台存储系统为例)

请点击输入图片描述

以上场景所设定的硬件配置为 4 台物理服务器搭配 1 台存储系统,若单纯增加物理服务器的数量而存储系统保持不变,则两种架构的能耗会趋于接近。不过,计算资源(物理服务器)的增加,通常意味着对存储资源(性能与容量)的需求也会随之提升,所以从实际部署的场景来看,传统虚拟化架构的计算资源增加与相应的存储资源提升,整体的能耗与超融合架构相比仍存在不小的差距。

关于aiops数据中心能效和数据中心 能效的介绍到此就结束了,不知道你从中找到你需要的信息了吗 ?如果你还想了解更多这方面的信息,记得收藏关注本站。 aiops数据中心能效的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于数据中心 能效、aiops数据中心能效的信息别忘了在本站进行查找喔。
上一篇:包含安全事件通知函的词条
下一篇:aiops数据中心(eop数据中心)
相关文章

 发表评论

暂时没有评论,来抢沙发吧~