跳转至

tag 使用指南

Cloud Insight 用 tag 来使用户迅速查询要监控的服务器和指标。如果你想发现环境中存在的问题,那么必须要确定范围缩小范围,那么就需要的分配和过滤服务器或指标,而这就是 tag 所能够实现的。


如何配置 tag

目前有两个主要的方法来配置 tag:

  • 在配置文件中
  • 在前端界面中

使用配置文件配置 tag

Cloud Insight 是通过修改 YAML 配置文件进行配置的。您可以在配置文件中给整个服务器定义 tag ,也可以是某个组件。无论在哪种情况下,都会在那个等级上有 tag 字典的列表 。您在服务区上所配置的所有 tag 将应用于该服务器上的每一个组件。

key:value 格式的字典有2个不同的功能等价形式:

tags: firsttag, secondtag, third tag

tags:
  - firsttag
  - secondtag
  - thirdtag

在配置文件中也都可以看到这两种形式,当然配置时要注意遵循 YAML 格式

每一个 tag 都可以是你喜欢的任何东西,但如果你的 tag 很关键(高度可读),那最好用标准方式标记:key:value。key 可以代表角色,或功能,或区域,或应用程序,该 value 是该角色、功能、区域或应用程序的实例。下面是一些很棒的 tag 例子:

region:east
region:nw
application:database
database:primary
role:sobotka

当你开始使用 tag 将指标和服务器进行过滤和重建群组时,采样 key:value 格式就会感觉到其魅力所在了。

前端界面配置 tag

你可以在平台概览页面对所有平台设置 tag,在平台标签处点击编辑标签即可。


怎么使用 tag

上面具体列出了怎么在服务器和组件上配置 tag,那具体怎么通过聚合分组筛选来使用 tag,目前可以在以下方面使用 tag:

  • 平台分组
  • 仪表盘配置
  • Hostmap
  • 报警策略
  • 事件流

仪表盘

仪表盘进行聚合分组功能时就是依赖 tag 来进行的,如下图显示的是有 os:ubuntu 这个 tag 的服务器的 system.disk.free 的平均值。

报警策略

设置报警条件时直接用 tag 进行设置,无需一一添加服务器,将要监控的服务器的统一 tag 放上去,下图的报警策略就是:有 os:ubuntu tag 的服务器 system.mem.used 总和在5分钟内至少有一次大于等于 7G 就触发报警。

Hostmap

在 hostmap 里面通过添加不同 key 来对服务器进行分组过滤,这样如果某个服务器某个组件有问题,你可以在分完组的界面里直接看到,确定是数据库问题还是 DNS 问题,而且即使是混合云依旧可以这样放在统一界面进行展示。

更多功能正在开发中,例如设置 API tag


5分钟,开启你的跨云监控之旅 (`⌄´ )