• Prometheus 2.0 迁移指南
    • " level="2">标志
    • " level="2">Alertmanager 服务发现
    • " level="2">记录规则和告警规则
    • " level="2">存储
    • promQL
    • " level="2">杂项
      • " level="3">非 root 用户运行 Prometheus
      • " level="3">Prometheus 生命周期

    Prometheus 2.0 迁移指南

    秉承我们稳定性承诺,Prometheus 2.0 版本包含许多向后不兼容的更改。本文档提供了从 Prometheus 1.8 迁移到 Prometheus 2.0 的指南。

    标志

    Prometheus 命令行标志的格式已经更改。现在所有标志不再使用单破折号,而是使用双破折号。通用标志(--config.file, --web.listen-address--web.external-url)仍然相同,但除此之外,几乎所有与存储的标志都已删除。

    一些值的注意的标志已被删除:

    • -alertmanager.url 在 Prometheus 2.0 中,用于静态配置 Alertmanager 的 URL 命令行标志已被删除。现在必须通过服务发现来发现 Alertmanager。请参阅 Alertmanager 服务发现
    • -log.format 在 Prometheus 2.0 中,日志只能流式传输到标准输出。
    • -query.staleness-delta已重命名为--query.lookback-delta;Prometheus 2.0 引入了一种新的处理陈旧性的机制,请参见陈旧性
    • -storage.local.* Prometheus 2.0 引入了新的存储引擎,因为与旧引擎有关的标志都已删除。有关新引擎的信息,请参阅存储部分。
    • -storage.remote.* Prometheus 2.0 删除了已经废弃的远程存储标志。如果指定了它们将无法启动。要写入 InfluxDB, Graphite 或 OpenTSDB 远程存储,请使用相关的存储适配器。

    Alertmanager 服务发现

    Prometheus 1.4 中引入了 Alertmanager 服务发现机制,这使得 Prometheus 可以使用与采集数据相同的机制来动态发现 Alertmanager 副本。在 Prometheus 2.0,静态 Alertmanager 配置的命令行标志已删除,因此命令行标志./prometheus -alertmanager.url=http://alertmanager:9093/将与prometheus.yml配置文件中改为:

    1. alerting:
    2. alertmanagers:
    3. - static_configs:
    4. - targets:
    5. - alertmanager:9093

    您还可以在 alertmanager 配置中使用所有常规的 Prometheus 服务发现集成组件和标签重新标记过程。该代码片段指示 Prometheus 在default名称空间中搜索标签为name: alertmanager且具有非空端口的 Kubernetes pods.

    1. alerting:
    2. alertmanagers:
    3. - kubernetes_sd_configs:
    4. - role: pod
    5. tls_config:
    6. ca_file: /var/run/secrets/kubernetes.io/serviceaccount/ca.crt
    7. bearer_token_file: /var/run/secrets/kubernetes.io/serviceaccount/token
    8. relabel_configs:
    9. - source_labels: [__meta_kubernetes_pod_label_name]
    10. regex: alertmanager
    11. action: keep
    12. - source_labels: [__meta_kubernetes_namespace]
    13. regex: default
    14. action: keep
    15. - source_labels: [__meta_kubernetes_pod_container_port_number]
    16. regex:
    17. action: drop

    记录规则和告警规则

    告警规则和记录规则的配置格式已更改为 YAML。旧的格式的记录规则和告警规则示例:

    1. job:request_duration_seconds:histogram_quantile99 =
    2. histogram_quantile(0.99, sum(rate(request_duration_seconds_bucket[1m])) by (le, job))
    3. ALERT FrontendRequestLatency
    4. IF job:request_duration_seconds:histogram_quantile99{job="frontend"} > 0.1
    5. FOR 5m
    6. ANNOTATIONS {
    7. summary = "High frontend request latency",
    8. }

    将被修改为如下格式:

    1. groups:
    2. - name: example.rules
    3. rules:
    4. - record: job:request_duration_seconds:histogram_quantile99
    5. expr: histogram_quantile(0.99, sum(rate(request_duration_seconds_bucket[1m]))
    6. BY (le, job))
    7. - alert: FrontendRequestLatency
    8. expr: job:request_duration_seconds:histogram_quantile99{job="frontend"} > 0.1
    9. for: 5m
    10. annotations:
    11. summary: High frontend request latency

    为了帮助更改,promtool工具提供了一种自动转换规则的方法。给定一个.rules文件,它将输出新格式的.rules.yml。如:

    1. $ promtool update rules example.rules

    请注意,您需要使用 2.0 版而非 1.8 版的 promtool。

    存储

    Prometheus 2.0 中的数据格式已完全更改,并与 1.8 版本不向后兼容。为了保留对历史监控数据的访问权限,我们建议您运行一个没有采集数据的 1.8.1 版本以上的 Prometheus 实例与 2.0 版本的 Prometheus 实例并行运行,并让新服务通过远程读取协议从旧服务读取现有数据。

    您的 1.8 版本的 Prometheus 实例应使用以下标志和仅包含external_labels设置(如果有)的配置文件启动:

    1. $ ./prometheus-1.8.1.linux-amd64/prometheus -web.listen-address ":9094" -config.file old.yml

    然后可以使用以下标志(在同一台计算机上)启动 Prometheus 2.0 实例:

    1. $ ./prometheus-2.0.0.linux-amd64/prometheus --config.file prometheus.yml

    除了完整的已存在的配置外,prometheus.yml还包含以下部分:

    1. remote_read:
    2. - url: "http://localhost:9094/api/v1/read"

    promQL

    以下功能已从 promQL 中删除:

    • drop_common_labels函数 - 应该使用without聚合修饰符
    • keep_common聚合修饰符 - 应该是用by修饰符
    • count_scalar函数 - absent()函数或在操作中正确传播标签可以更好地处理用例

    有关更多详细信息,请参见 issue #3060

    杂项

    非 root 用户运行 Prometheus

    Prometheus Docker 镜像现在构建为非 root 用户运行 Prometheus。如果您希望 Prometheus UI/API 在低端口号(如 80 端口)上监听,则需要重写它。对于 Kubernetes,您可以使用如下 YAML:

    1. apiVersion: v1
    2. kind: Pod
    3. metadata:
    4. name: security-context-demo-2
    5. spec:
    6. securityContext:
    7. runAsUser: 0
    8. ...

    更多详细信息,详见为 Pod 或容器配置安全上下文

    如果使用 Docker,将使用如下代码:

    1. docker run -u root -p 80:80 prom/prometheus:v2.0.0-rc.2 --web.listen-address :80

    Prometheus 生命周期

    如果您使用 Prometheus /-/reload HTTP 端点在更改时自动重载 Prometheus 配置,出于安全原因在 Prometheus 2.0 默认禁用这些端点。要启用它们,设置--web.enable-lifecycl标志。