书栈网 · BookStack 本次搜索耗时 0.018 秒,为您找到 53523 个相关结果.
  • 采集器

    Categraf Telegraf Datadog-Agent Grafana-Agent Falcon-Plugin
  • 集群监控

    集群聚合 用户手册 用户需求 Cluster monitor配置 策略配置 集群聚合 集群监控的本质是一个聚合功能。 单台机器的监控指标难以反应整个集群的情况,我们需要把整个集群的机器(体现为某个HostGroup下的机器)综合起来看。比如所有机器的qps加和才是整个集群的qps,所有机器的request_fail数量 ÷ 所有机器的req...
  • 采集器

    概述 Categraf Datadog-agent Falcon插件 Grafana-agent Telegraf
  • 绘图相关

    绘图链路常见问题 如何清除过期索引 Dashboard索引缺失、查询不到endpoint或counter Dashboard图表曲线为空 Dashboard图表曲线有断点 Graph绘图数据高可用 如何确定某个counter对应的rrd文件 Graph调试 Transfer调试 设置绘图数据的存储周期 绘图链路常见问题 如何清...
  • Heartbeat Server

    HBS(Heartbeat Server) 设计初衷 源码安装 部署说明 配置说明 进程管理 验证 补充 视频教程 HBS(Heartbeat Server) 心跳服务器,公司所有agent都会连到HBS,每分钟发一次心跳请求。 设计初衷 Portal的数据库中有一个host表,维护了公司所有机器的信息,比如hostname、i...
  • 告警屏蔽

    告警屏蔽 告警屏蔽 告警屏蔽除了可以屏蔽机器之外,还可以做更细粒度的屏蔽策略,比如可以指定监控指标,可以指定某个标签 相比Open-Falcon只能屏蔽机器,夜莺的告警屏蔽做得粒度更灵活,可以配置某个机器的某个指标,甚至可以配置某个机器的某个指标的某个特定tag。 告警屏蔽的配置是依托服务树的,这里纯粹只是为了管理方便,比如某个机器挂在服务树的sr...
  • 采集器

    Categraf Telegraf Datadog-Agent Grafana-Agent Falcon-Plugin
  • 采集器

    Categraf Datadog-agent Falcon插件 Grafana-agent Telegraf
  • Graph扩容二三事

    前言 本文面向对象 方案原理 方案缺陷 扩容前,我们做了哪些准备 补全自监控 功能测试 压力测试 扩容过程 分批扩容 扩容过程观察的指标 如何确保扩容完成 需注意的点 总结 附:扩容中的指标变化情况 前言 监控系统是整个运维环节,乃至整个产品生命周期中最重要的一环。而Open-Falcon是目前业界做的最开放、最好用的互...
  • GPU使用率监控

    GPU使用率监控 简介 基本概念 使用流程 GPU使用率监控 简介 Xiaomi Cloud-ML底层使用kubernetes+docker调度资源,GPU分配的粒度是个 ,不存在GPU共享的情况。当前集群的服务器都是4卡 机型,编号从0到3 。GPU使用率每分钟 抓取一次,推送到falcon上。 基本概念 Cloud-ML对用户的任...