使用 crictl 对 Kubernetes 节点进行调试

特性状态: Kubernetes v1.11 [stable]

crictl 是 CRI 兼容的容器运行时命令行接口。 你可以使用它来检查和调试 Kubernetes 节点上的容器运行时和应用程序。 crictl 和它的源代码在 cri-tools 代码库。

准备开始

crictl 需要带有 CRI 运行时的 Linux 操作系统。

安装 crictl

你可以从 cri-tools 发布页面 下载一个压缩的 crictl 归档文件,用于几种不同的架构。 下载与你的 kubernetes 版本相对应的版本。 提取它并将其移动到系统路径上的某个位置,例如 /usr/local/bin/

一般用法

crictl 命令有几个子命令和运行时参数。 有关详细信息,请使用 crictl helpcrictl <subcommand> help 获取帮助信息。

你可以用以下方法之一来为 crictl 设置端点:

  • 设置参数 --runtime-endpoint--image-endpoint
  • 设置环境变量 CONTAINER_RUNTIME_ENDPOINTIMAGE_SERVICE_ENDPOINT
  • 在配置文件 --config=/etc/crictl.yaml 中设置端点。 要设置不同的文件,可以在运行 crictl 时使用 --config=PATH_TO_FILE 标志。

说明:

如果你不设置端点,crictl 将尝试连接到已知端点的列表,这可能会影响性能。

你还可以在连接到服务器并启用或禁用调试时指定超时值,方法是在配置文件中指定 timeoutdebug 值,或者使用 --timeout--debug 命令行参数。

要查看或编辑当前配置,请查看或编辑 /etc/crictl.yaml 的内容。 例如,使用 containerd 容器运行时的配置会类似于这样:

  1. runtime-endpoint: unix:///var/run/containerd/containerd.sock
  2. image-endpoint: unix:///var/run/containerd/containerd.sock
  3. timeout: 10
  4. debug: true

要进一步了解 crictl,参阅 crictl 文档

crictl 命令示例

警告:

如果使用 crictl 在正在运行的 Kubernetes 集群上创建 Pod 沙盒或容器, kubelet 最终将删除它们。 crictl 不是一个通用的工作流工具,而是一个对调试有用的工具。

打印 Pod 清单

打印所有 Pod 的清单:

  1. crictl pods

输出类似于:

  1. POD ID CREATED STATE NAME NAMESPACE ATTEMPT
  2. 926f1b5a1d33a About a minute ago Ready sh-84d7dcf559-4r2gq default 0
  3. 4dccb216c4adb About a minute ago Ready nginx-65899c769f-wv2gp default 0
  4. a86316e96fa89 17 hours ago Ready kube-proxy-gblk4 kube-system 0
  5. 919630b8f81f1 17 hours ago Ready nvidia-device-plugin-zgbbv kube-system 0

根据名称打印 Pod 清单:

  1. crictl pods --name nginx-65899c769f-wv2gp

输出类似于这样:

  1. POD ID CREATED STATE NAME NAMESPACE ATTEMPT
  2. 4dccb216c4adb 2 minutes ago Ready nginx-65899c769f-wv2gp default 0

根据标签打印 Pod 清单:

  1. crictl pods --label run=nginx

输出类似于这样:

  1. POD ID CREATED STATE NAME NAMESPACE ATTEMPT
  2. 4dccb216c4adb 2 minutes ago Ready nginx-65899c769f-wv2gp default 0

打印镜像清单

打印所有镜像清单:

  1. crictl images

输出类似于这样:

  1. IMAGE TAG IMAGE ID SIZE
  2. busybox latest 8c811b4aec35f 1.15MB
  3. k8s-gcrio.azureedge.net/hyperkube-amd64 v1.10.3 e179bbfe5d238 665MB
  4. k8s-gcrio.azureedge.net/pause-amd64 3.1 da86e6ba6ca19 742kB
  5. nginx latest cd5239a0906a6 109MB

根据仓库打印镜像清单:

  1. crictl images nginx

输出类似于这样:

  1. IMAGE TAG IMAGE ID SIZE
  2. nginx latest cd5239a0906a6 109MB

只打印镜像 ID:

  1. crictl images -q

输出类似于这样:

  1. sha256:8c811b4aec35f259572d0f79207bc0678df4c736eeec50bc9fec37ed936a472a
  2. sha256:e179bbfe5d238de6069f3b03fccbecc3fb4f2019af741bfff1233c4d7b2970c5
  3. sha256:da86e6ba6ca197bf6bc5e9d900febd906b133eaa4750e6bed647b0fbe50ed43e
  4. sha256:cd5239a0906a6ccf0562354852fae04bc5b52d72a2aff9a871ddb6bd57553569

打印容器清单

打印所有容器清单:

  1. crictl ps -a

输出类似于这样:

  1. CONTAINER ID IMAGE CREATED STATE NAME ATTEMPT
  2. 1f73f2d81bf98 busybox@sha256:141c253bc4c3fd0a201d32dc1f493bcf3fff003b6df416dea4f41046e0f37d47 7 minutes ago Running sh 1
  3. 9c5951df22c78 busybox@sha256:141c253bc4c3fd0a201d32dc1f493bcf3fff003b6df416dea4f41046e0f37d47 8 minutes ago Exited sh 0
  4. 87d3992f84f74 nginx@sha256:d0a8828cccb73397acb0073bf34f4d7d8aa315263f1e7806bf8c55d8ac139d5f 8 minutes ago Running nginx 0
  5. 1941fb4da154f k8s-gcrio.azureedge.net/hyperkube-amd64@sha256:00d814b1f7763f4ab5be80c58e98140dfc69df107f253d7fdd714b30a714260a 18 hours ago Running kube-proxy 0

打印正在运行的容器清单:

  1. crictl ps

输出类似于这样:

  1. CONTAINER ID IMAGE CREATED STATE NAME ATTEMPT
  2. 1f73f2d81bf98 busybox@sha256:141c253bc4c3fd0a201d32dc1f493bcf3fff003b6df416dea4f41046e0f37d47 6 minutes ago Running sh 1
  3. 87d3992f84f74 nginx@sha256:d0a8828cccb73397acb0073bf34f4d7d8aa315263f1e7806bf8c55d8ac139d5f 7 minutes ago Running nginx 0
  4. 1941fb4da154f k8s-gcrio.azureedge.net/hyperkube-amd64@sha256:00d814b1f7763f4ab5be80c58e98140dfc69df107f253d7fdd714b30a714260a 17 hours ago Running kube-proxy 0

在正在运行的容器上执行命令

  1. crictl exec -i -t 1f73f2d81bf98 ls

输出类似于这样:

  1. bin dev etc home proc root sys tmp usr var

获取容器日志

获取容器的所有日志:

  1. crictl logs 87d3992f84f74

输出类似于这样:

  1. 10.240.0.96 - - [06/Jun/2018:02:45:49 +0000] "GET / HTTP/1.1" 200 612 "-" "curl/7.47.0" "-"
  2. 10.240.0.96 - - [06/Jun/2018:02:45:50 +0000] "GET / HTTP/1.1" 200 612 "-" "curl/7.47.0" "-"
  3. 10.240.0.96 - - [06/Jun/2018:02:45:51 +0000] "GET / HTTP/1.1" 200 612 "-" "curl/7.47.0" "-"

获取最近的 N 行日志:

  1. crictl logs --tail=1 87d3992f84f74

输出类似于这样:

  1. 10.240.0.96 - - [06/Jun/2018:02:45:51 +0000] "GET / HTTP/1.1" 200 612 "-" "curl/7.47.0" "-"

运行 Pod 沙盒

crictl 运行 Pod 沙盒对容器运行时排错很有帮助。 在运行的 Kubernetes 集群中,沙盒会随机地被 kubelet 停止和删除。

  1. 编写下面的 JSON 文件:

    1. {
    2. "metadata": {
    3. "name": "nginx-sandbox",
    4. "namespace": "default",
    5. "attempt": 1,
    6. "uid": "hdishd83djaidwnduwk28bcsb"
    7. },
    8. "log_directory": "/tmp",
    9. "linux": {
    10. }
    11. }
  2. 使用 crictl runp 命令应用 JSON 文件并运行沙盒。

    1. crictl runp pod-config.json

    返回了沙盒的 ID。

创建容器

crictl 创建容器对容器运行时排错很有帮助。 在运行的 Kubernetes 集群中,容器最终将被 kubelet 停止和删除。

  1. 拉取 busybox 镜像

    1. crictl pull busybox
    1. Image is up to date for busybox@sha256:141c253bc4c3fd0a201d32dc1f493bcf3fff003b6df416dea4f41046e0f37d47
  2. 创建 Pod 和容器的配置:

    Pod 配置

    1. {
    2. "metadata": {
    3. "name": "busybox-sandbox",
    4. "namespace": "default",
    5. "attempt": 1,
    6. "uid": "aewi4aeThua7ooShohbo1phoj"
    7. },
    8. "log_directory": "/tmp",
    9. "linux": {
    10. }
    11. }

    容器配置

    1. {
    2. "metadata": {
    3. "name": "busybox"
    4. },
    5. "image":{
    6. "image": "busybox"
    7. },
    8. "command": [
    9. "top"
    10. ],
    11. "log_path":"busybox.log",
    12. "linux": {
    13. }
    14. }
  3. 创建容器,传递先前创建的 Pod 的 ID、容器配置文件和 Pod 配置文件。返回容器的 ID。

    1. crictl create f84dd361f8dc51518ed291fbadd6db537b0496536c1d2d6c05ff943ce8c9a54f container-config.json pod-config.json
  4. 查询所有容器并确认新创建的容器状态为 Created

    1. crictl ps -a

    输出类似于这样:

    1. CONTAINER ID IMAGE CREATED STATE NAME ATTEMPT
    2. 3e025dd50a72d busybox 32 seconds ago Created busybox 0

启动容器

要启动容器,要将容器 ID 传给 crictl start

  1. crictl start 3e025dd50a72d956c4f14881fbb5b1080c9275674e95fb67f965f6478a957d60

输出类似于这样:

  1. 3e025dd50a72d956c4f14881fbb5b1080c9275674e95fb67f965f6478a957d60

确认容器的状态为 Running

  1. crictl ps

输出类似于这样:

  1. CONTAINER ID IMAGE CREATED STATE NAME ATTEMPT
  2. 3e025dd50a72d busybox About a minute ago Running busybox 0

接下来