根因分析告警聚类（根因分析算法）

来源网友投稿 880 2023-03-21

本站部分文章、图片属于网络上可搜索到的公开信息，均用于学习和交流用途，不能代表睿象云的观点、立场或意见。我们接受网民的监督，如发现任何违法内容或侵犯了您的权益，请第一时间联系小编邮箱jiasou666@gmail.com 处理。

本篇文章给大家谈谈根因分析告警聚类，以及根因分析算法对应的知识点，希望对各位有所帮助，不要忘了收藏本站喔。今天给各位分享根因分析告警聚类的知识，其中也会对根因分析算法进行解释，如果能碰巧解决你现在面临的问题，别忘了关注本站，现在开始吧！

本文目录一览：

1、根因分析法是什么？
2、轻松搞定根因分析 -- “5WHY”分析法其实很简单
3、数据挖掘中分类分析和聚类分析的区别
4、数据挖掘中分类与聚类区别与关系
5、相比传统运维工具，AIOps的优势在哪里
6、聚类分析和因子分析的区别

根因分析法是什么？

根因分析是一项结构化的问题处理法，用以逐步找出问题的根本原因并加以解决，而不是仅仅关注问题的表征。

所谓根本原因，就是导致我们所关注的问题发生的最基本的原因。因为引起问题的原因通常有很多，物理条件、人为因素、系统行为、或者流程因素等等，通过科学分析，有可能发现不止一个根源性原因。

分析要领：

1、提问为什么会发生当前情况，并对可能的答案进行记录。

根本原因分析法的目的就是要努力找出问题的作用因素，并对所有的原因进行分析。这种方法通过反复问一个为什么，能够把问题逐渐引向深入，直到你发现根本原因。

2、找到根本原因后，就要评估改变根本原因的最佳方法，从而从根本上解决问题。

这是另一个独立的过程，一般被称之为改正和预防。当我们在寻找根本原因的时候，必须要记住对每一个已找出的原因也要进行评估，给出改正的办法，因为这样做也将有助于整体改善和提高。

以上内容参考：百度百科-根本原因分析

轻松搞定根因分析 -- “5WHY”分析法其实很简单

所谓“5WHY”分析法，又称“5问法”，就是连续反复使用5次“为什么”方式自问，以打破砂锅问到底方式寻找问题的根本原因的方法。“5WHY”不限定必须或只做5次为什么的提问，以找到问题根因为准，也许是3次，也许是10几次都有可能。一般经验而言，反复提出5次为什么基本就可以寻找到问题的根因。
“5WHY”分析法是根据事实分析找到问题根源，给出治本对策的一个过程。“为什么”的追问的越深入，发掘的原因就越逼近真实根本的原因。

整体的“5WHY”的基本思考方法如下：

最近发现大家知道使用5why分析法进行根因分析，但是经常出现找到的原因并非根因，那么相应的制定的再发防止对策也是无效的。究其原因就是虽然知道“5WHY”的方法但是却不会运用或者运用的方法不正确，导致不能够找到问题真正的根因。那么该如何做呢？接下来介绍一下具体的分析过程注意事项。

一般而言，“5WHY”从三个层面来实施：

一、为什么会发生？从“制造”的角度。

二、为什么没有发现？从“检验”的角度。

三、为什么没有从系统上预防事故？从“体系”或“流程”的角度。

每个层面连续5次或N次的询问，得出最终结论。只有以上三个层面的问题都探寻出来，才能发现根本问题，并寻求解决。那么如何做才能确保根因分析的正确和成功呢？

站在组织级视角来寻求改善组织体系/流程和系统性问题。这是最基本的立场。通常情况下，很多人站在个人的立场和视角进行问题分析，往往只能找到比较表层的原因，不能找到管理层面，体系架构以及组织级层面的问题。

确保根因分析成功的3个关键视点：

〇[为什么]要从个人转向组织/体系/系统层面。

〇[为什么]要从主观意识转向具体行动。

〇[为什么]的主语设定成“我们”。

1）整理问题点，并根据事实进行分析。

正确的把握现象是非常重要。

分析质量取决于对深究分析之前的当前情况的把握程度。

没有通过确认现场就判断出问题的原因是站不住脚的，是没有道理的。

想象要以能够可见而简单易懂的形式记录保留下来。(图文影像最好)

2）找出所有的要因，事先不要考虑是否真的针对这些要因采取对策！

有很多原因是不是显而易见的，要将这些要因都可见化的描述出来。

3）采用复眼分析，也就是说相关的人员都要参与进来。

不要仅仅根据个人假设或猜测来决定！

如果是通过某个人主观性先入为主的来判断分析，那么将对策偏离了方向也不会被发现。

问题发生后要尽早的让当事人参与进来进行分析。

4）不要试图进行“责任转嫁”，通过原因分析将责任转移到外部环境和己方以外的其他方面上是比较严重的问题。

对于[为什么分析]要严谨[责任转嫁]！首先，应该考虑不受外部环境影响的工作机制！但是，如果外部环境真的是“根因”的话，那么就要分析改进它。[责任转嫁]的思维的结局→最终原因总是[别人不好]。

5）最初的“为什么1”，要从问题现象的根本的原因开始分析。

导致问题现象必然发生的直接行动，现象/事件/事态/实物因素等要记录下来。（“我忘了忘了”不好）

订购数量有误！→为什么？我在订单上写了错误的号码。

漏水！ →为什么？某处必须有空隙（洞）。

注）『为什么1』在开始时会影响『为什么2』以后的分析，因此这非常重要。

6）对于“为什么1”，要将“发生要因”和“流出要因”两个方面进行分析。

“引起问题现象发生的直接原因”和“没有发现错误导致问题流出的直接原因”都分别记录下来。

7）“现象”或“为什么”的句子以简短扼要的“〇〇〇做了〇〇〇”的形式记录下来。

比较重要的是如果有主人公的话，那么要明确是『谁』。

8）准确地掌握现象，不要粗略的表述，建议采用5W1H方法明确的表述

如何捕捉现象（如何写）非常重要，5W1H方法描述。

词语含义很重要，不要有模糊含义的词语。

9）根因分析完成后，一定要从最后一个“为什么”反向的追溯到“问题的现象”，确认反向逻辑在理论上也是正确的。

原因分析时的逻辑是“发生了〇〇〇→为什么？→因为〇〇〇”，而反向验证的逻辑是“因为〇〇〇〇，所以〇〇〇”。

10）不要遗漏并行关系的要因。

“存在单一的线性的原因引起问题的发生”几乎很少或者是不可能的。相反的，往往是“多个原因相互共同作用”才引起问题的发生。要对问题发生的“必要条件”和“充分条件”进行检查是否遗漏并推进分析。

11）要持续的追问“为什么”，直到出现能够制定预防复发措施的原因为止。

最后一个原因必须是确保可靠和有效的能够被解决的因素。

12）只写出被认为与正常情况不一致（异常）的客观差异事实。

例如：“因为非常的忙”这样的描述不是异常描述，如是“工作负荷达到150%以上的情况已经持续一周时间了”这样的描述，就是一个基于和正常情况进行比较得出的明确的客观的异常情况。

13）避免追究面向人的心理方面的原因。

人心里方面的因素是不容易被管理和制定相应的管理制度的。

避免追求心理方面，才能够将“为什么”指向可用于确保预防复发措施的设备和管理机制等方面的原因。

14）不要是使用“〇〇〇不好/很坏”或“〇〇〇不充分”这样的句子来描述问题。

要能够明确的将与标准或正常情况进行对比出的异常情况的客观事实描述出来。

比如“材料不好”这是一个主管判断不是事实，如果具体地说“材料的耐热温度低”就比较具体和客观了。

15）在进行关于事物的性质・状态进行分析时，事物比较的对象/基准以及发生频度等情况要明确化并尽可能量化。

事物的大小，长度，高度等要素在分析表述时，要有对比的基准，以及引发问题发生的条件要明确出来。例如“温度比设定的温度高了5度”等。

16）在分析由于人为错误的原因导致的问题时，不仅仅关注当事者本人的问题，也应将思考方向指向“工作机制/输入信息/周围相关人/管理・监督者”等。

17）通过“现场”、“现物”、“现实”(3现主义)来尽早确认分析出的“根因”是否是真正的原因。

在分析的过程中，如果能验证“根因”是否正确，那么要尽快的在发生现场或现物中进行确认，通过进行听证、分解调查、测量、再现实验等手段尽快验证。

18）不仅要考虑发生事件本身的永久性对策，还要考虑到同类型类似的横向问题，扩大视野分析是否存在上层系统和机制的问题，并思考系统性预防措施。

所谓5why分析法，又称“5问法”，就是连续反复使用5次“为什么”方式自问，以打破砂锅问到底方式寻找问题的根本原因的方法。5why不限定必须或只做5次为什么的提问，以找到问题根因为准，也许是3次，也许是10几次都有可能。一般经验而言，反复提出5次为什么基本就可以寻找到问题的根因。

根因分析告警聚类（根因分析算法）

数据挖掘中分类分析和聚类分析的区别

简单地说，分类(Categorization or Classification)就是按照某种标准给对象贴标签(label)，再根据标签来区分归类。聚类是指事先没有“标签”而通过某种成团分析找出事物之间存在聚集性原因的过程。

分类分析和聚类分析，分别是挖掘中分析这两种方法（分类和聚类）的方法，比如分类分析的内容有分析在此样本情况下能够被分类的程度，并且依据此分析重新分布数据，使得数据更容易被分析，相关技术有多类判别分析、主成分分析。聚类分析指类似的能够衡量一个聚类方法的方法。小弟拙见，也是数据挖掘初学者。

关于数据挖掘的相关学习，推荐CDA数据师的相关课程，课程内容兼顾培养解决数据挖掘流程问题的横向能力以及解决数据挖掘算法问题的纵向能力。要求学生具备从数据治理根源出发的思维，通过数字化工作方法来探查业务问题，通过近因分析、宏观根因分析等手段，再选择业务流程优化工具还是算法工具，而非“遇到问题调算法包”。真正理解商业思维，项目思维，能够遇到问题解决问题。点击预约免费试听课

数据挖掘中分类与聚类区别与关系

一个是有规则进行根因分析告警聚类，一个是无规则进行。分类是根据规则进行根因分析告警聚类的根因分析告警聚类，可以根据新根因分析告警聚类的已有类别数据修正分类规则，不断提高其分类准确性。聚类是纯粹的根据已有数据进行系统把数据聚类，有可能聚类出来的没有实际意义。

分类是数据挖掘中的一项非常重要的任务，从机器学习的观点，分类技术是一种有指导的学习，即每个训练样本的数据对象已经有类标识，通过学习可以形成表达数据对象与类标识间对应的知识。从这个意义上说，数据挖掘的目标就是根据样本数据形成的类知识并对源数据进行分类，进而也可以预测未来数据的归类。与分类技术不同，在机器学习中，聚类是一种无指导学习。聚类是在预先不知道欲划分类的情况下，根据信息相似度原则进行信息聚类的一种方法。聚类的目的是使得属于同类别的对象之间的差别尽可能的小，而不同类别上的对象的差别尽可能的大。通过聚类，人们能够识别密集的和稀疏的区域，因而发现全局的分布模式，以及数据属性之间的有趣的关系。

想更多了解数据分类与聚类区别，推荐上CDA数据分析师的课程。课程内容兼顾培养解决数据挖掘流程问题的横向能力以及解决数据挖掘算法问题的纵向能力。要求学生具备从数据治理根源出发的思维，通过数字化工作方法来探查业务问题，通过近因分析、宏观根因分析等手段，再选择业务流程优化工具还是算法工具，而非“遇到问题调算法包”。真正理解商业思维，项目思维，能够遇到问题解决问题。点击预约免费试听课

相比传统运维工具，AIOps的优势在哪里

所谓的AIOps根因分析告警聚类，简单理解就是基于自动化运维，将AI和运维很好的结合起来。

AIOps的落地在多方面直击传统运维的痛点，AI算法承担起分析海量运维数据的重任，能够自动、准确地发现和定位问题，从决策层面提高运营效率，为企业运营和运维工作在成本、质量和效率方面的优化提供了重要支持。

可见，AIOps 在企业中的作用正在进一步放大。但事实上，很多企业对于AIOps 能解决什么问题并不清晰，今天我们就以博睿数据的AIOps 的三大场景和算法说起。

博睿数据的AIOps 实践

作为中国领先的智能可观测平台，在AIOps实践方面，多年来博睿数据积极拥抱人工智能、机器学习等新技术变革的浪潮，并基于AI和机器学习技术，自主研发了“数据接入、处理、存储与分析技术”核心技术体系，全面布局智能基线、异常检测、智能告警、关联分析、根因分析等丰富且广泛的智能运维功能，并将AIOps能力融入端到端全栈监控产品线，可为传统企业提供强大的数据处理、存储和分析的软件工具，帮助客户整合各类IT运维监控数据，实现数据的统一存储和关联分析，打破数据孤岛，构建统一的IT运维管理平台，让企业的IT运维更加智能化、自动化。

在此基础上，博睿数据还依托完整的IT运维监控能力，利用大数据和机器学习技术持续构建先进的智能运维监控产品，2021年先后推出了搭载了AI能力的新一代APM产品Server7.0和新版的统一智能运维平台Dataview，不断落地智能异常检测、根因分析、故障预测等场景。基于人工智能的能力实现运维监控场景的信息整合、特征关联和业务洞察，帮助企业确保数字化业务平稳运行，并保障良好的数字化体验。

目前，博睿数据在AIOps 技术方面主要落地了三大场景。即智能基线预测、异常检测及告警收敛。

随着企业业务规模扩大，云原生与微服务的兴起，企业IT架构复杂性呈现指数级增长。而传统的IT运维手段面临故障发生后，查找故障原因困难，故障平均修复时间周期长，已无法满足新的运维要求。因此运用人工智能赋能运维，去取代缓慢易错的人力决策，快速给出运维决策建议，降低问题的影响并提前预警问题就成为了必然。AIOps作为目前运维发展的最高阶目标，未来将会赋能运维带给用户全新的体验。

但需要注意的是，当前智能运维的很多产品和项目在企业侧落地效果并不理想，究其原因可归类为三点：一是数据采集与AI平台割裂，多源数据之间的关联关系缺失导致AI平台缺乏高质量的数据，进而导致模型训练效果不佳根因分析告警聚类；二是数据采集以metric和log为主，导致应用场景较窄且存在数据孤岛问题根因分析告警聚类；三是AI平台能力尚有提升空间。当前落地的场景多以异常检测与智能告警为主，未来需要进一步提升根因分析与故障预测的能力。

因此，未来企业首先要建设一体化监控运维平台，一体化是智能化的基础。基于一体化监控运维平台采集的高质量的可观测数据数据以及数据之间的关联关系，进一步将AIOps的能力落地到一体化监控运维平台中，从而实现问题精准定位与见解能力。

此外，在实际应用中，依据信通院的相关调查，其受访企业中只有不足20%的企业具有智能化监控和运维决策能力，超过70%的企业在应用系统出现故障的10分钟内一筹莫展。

各行业的数字化转型正在改变这一现状，不仅互联网企业，更多传统企业的数字化转型为智能运维开拓了更广阔的市场，智能运维有着巨大的发展空间，这也是博睿数据等行业领先企业发力的大好时机。

提升创新能力，推广智能运维不仅是相关服务商自身发展的要求，也是提升我国企业应用管理和运维水平的使命。

中国企业数字化转型加速，无论是前端的应用服务迭代更新，还是后端IT运维架构的复杂度提升，都在加速培育智能运维的成长。

聚类分析和因子分析的区别

聚类分析是无监督分类，就是只有自变量（指标）数据，没有（表示类别的）因变量数据，就可以根据指标数据的距离或相似性进行归类，而且归为多少类也是不确定的，取决于数据本身和分类效果的度量指标。常见的聚类分析算法有层次聚类，K均值聚类，高斯混合聚类，还有基于密度的DBSCAN聚类。

判别分析是有监督分类，就是既有自变量（指标）数据，又有（表示类别的）因变量数据，根据已知类别的样本所提供的信息，总结出分类的规律性，并建立好判别公式和判别准则，这样有了新样本，就能据此判断其所属类别。除了通常的距离判别（相当于KNN），贝叶斯判别（朴素贝叶斯），Fisher判别，其它机器学习中的分类算法，比如决策树，支持向量机，神经网络等也都是判别分析算法。关于根因分析告警聚类和根因分析算法的介绍到此就结束了，不知道你从中找到你需要的信息了吗？如果你还想了解更多这方面的信息，记得收藏关注本站。根因分析告警聚类的介绍就聊到这里吧，感谢你花时间阅读本站内容，更多关于根因分析算法、根因分析告警聚类的信息别忘了在本站进行查找喔。

标签：告警工作运行方法检测

暂时没有评论，来抢沙发吧~

根因分析告警聚类（根因分析算法）

根因分析法是什么？

轻松搞定根因分析 -- “5WHY”分析法其实很简单

数据挖掘中分类分析和聚类分析的区别

数据挖掘中分类与聚类区别与关系

相比传统运维工具，AIOps的优势在哪里

聚类分析和因子分析的区别

实时警报通知：微信告警通知的重要性解析

告警通知变得轻松便捷——微信告警接口指南

睿象云智能告警平台的分派策略

根因分析 告警聚类（根因分析 算法）

根因分析法是什么？

轻松搞定根因分析 -- “5WHY”分析法其实很简单

数据挖掘中分类分析和聚类分析的区别

数据挖掘中分类与聚类区别与关系

相比传统运维工具，AIOps的优势在哪里

聚类分析和因子分析的区别

实时警报通知：微信告警通知的重要性解析

告警通知变得轻松便捷——微信告警接口指南

睿象云智能告警平台的分派策略

根因分析告警聚类（根因分析算法）