本节讲解采集和看图相关的常见问题
Q1:监控指标已发送到服务端,但最终看不到图
此情况一般是数据格式不正确,或者数据并没有上报到服务端,假设发送的指标为 n9e.points.in
- 首先看下transfer和tsdb模块是否有 n9e.points.in 的错误日志
登陆到transfer部署的机器,执行tail -f /home/n9e/logs/transfer/WARNING.log|grep n9e.points.in
登陆到tsdb部署的机器,执行tail -f /home/n9e/logs/tsdb/WARNING.log|grep n9e.points.in
- 如果没有报错信息,再次确认监控指标是否上报到了服务端,修改transfer的日志等级为 DEBUG
执行tail -f /home/n9e/logs/transfer/DEBUG.log|grep n9e.points.in
如果没有日志出现,说明没有并没有上报到服务端,排查发送端的问题
Q2:监控插件放到指定目录了,但最终看不到图
- 一般遇到这种问题都是插件执行失败了,比如插件没有可执行权限,或者插件上报的数据格式不正确,可以登陆到有问题的机器,查看 /home/n9e/logs/collector/ERROR.log 有没有插件相关的错误日志,如有,解决之。如果没有错误日志,按照Q1思路排查
Q3:自己写程序,按照数据规范向collector或者transfer上报数据,但看不到图
- 首先将程序的request body和resp body 都打印出来,查看 resp 中 err 不为空说明上报格式有问题,request body为空说明没有上报数据
- 如果上报正常,按照Q1思路排查
Q4:配置了日志、进程或者端口采集,但看不到相关监控图
- 查看采集策略是否已经下发到目标机器的collector
curl 目标机器IP:2058/api/collector/stra
- 如果可以查到配置的采集,tail -f /home/n9e/logs/collector/ERROR.log 查看是否有错误日志
- 有报错则按照日志提示去处理,如果没有报错,按照Q1思路排查