跳转至

ZooKeeper

ZooKeeper 是一个分布式的,开源的分布式应用程序协调服务,是 Hadoop 和 Hbase 的重要组件。它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、名字服务、分布式同步、组服务等。

Cloud Insight 收集 ZooKeeper 管理的服务之间连接响应问题,可视化 ZooKeeper 性能以及和其它应用搭配时性能变化影响。


性能指标

Cloud Insight 采集 Zookeeper 以下性能指标:

指标 单位 具体含义
zookeeper.bytes_received 接收的字节数
zookeeper.bytes_sent 发送的字节数
zookeeper.connections connections 客户端连接总数
zookeeper.latency.avg milliseconds 服务器响应客户端请求花费的平均时间
zookeeper.latency.max milliseconds 服务器响应客户端请求花费的最大时间
zookeeper.latency.min milliseconds 服务器响应客户端请求花费的最小时间
zookeeper.nodes nodes znode 的数量
zookeeper.outstanding_requests requests 超出服务器处理能力的排队请求数量
zookeeper.packets_received packets/second 接收的数据包数量
zookeeper.packets_sent packets/second 发送的数据包数量
zookeeper.timeouts occurrences Cloud Insight Agent 尝试收集统计信息时的超时速率
zookeeper.zxid.count zookeeper 事务 id,它是选举过程中能否成为 leader 的关键因素,它决定当前 Server 要将自己这一票投给谁(也就是我在选举过程中的 value,这只是其中一个,还有 id)
zookeeper.zxid.epoch 主要用于描述 leader 是否已经改变,每一个 Server 中启动都会有一个 epoch,初始值为 0,当开始新的一次选举时 epoch 加 1,选举完成时 epoch 加 1

配置 ZooKeeper 监控

编辑配置文件

编辑配置文件 conf.d/zk.yaml,使 Cloud Insight Agent 可以与 ZooKeeper 通信。

init_config:

instances:
  - host: localhost
    port: 2181
    timeout: 3

重启 Agent

重启 Cloud Insight Agent,使配置生效。

您也可以通过查看 Agent Info 信息,来验证配置是否成功。当出现以下信息,则代表安装成功。

若 Agent Info 指令执行不成功,尝试在 root 权限下执行该指令。

Checks
======

[...]

zk
--
  - instance #0 [OK]
  - Collected 8 metrics & 0 events

有关 Agent Info 信息的查看,请访问帮助中心,查看 Cloud Insight Agent 常用操作


5分钟,开启你的跨云监控之旅 (`⌄´ )


常见问题