度量标准参考
了解 DC/OS 收集的度量标准
Mesosphere DC/OS 可自动为节点和容器收集基本系统度量标准(例如 CPU 和内存)。Mesosphere DC/OS 还收集关于不同类别度量标准的元数据。有关元数据度量的更多信息,请参阅 [维度](#Dimensions)。
请注意,自动收集的度量标准仅适用于提供端点统计信息的容器。例如,Docker 容器不提供用于 DC/OS 的网络连接数据,因此可用于 UCR 容器的网络连接度量标准不适用于 Docker 容器。
节点
CPU 和内存度量标准
度量标准 | 描述 |
---|---|
cpu.idle | CPU 空闲百分比。 |
cpu.system | 使用的系统百分比。 |
cpu.total | 使用 CPU 的百分比。 |
cpu.user | 用户使用的 CPU 百分比。 |
cpu.wait | 等待操作完成时的空闲百分比。 |
load.1min | 过去一分钟的负载平均值。 |
load.5min | 过去 5 分钟的负载平均值。 |
load.15min | 过去 15 分钟的负载平均值。 |
memory.buffers | 存储器缓冲区数量。 |
memory.cached | 缓存内存的数量。 |
memory.free | 按字节计的可用内存量。 |
memory.total | 按字节计的总内存。 |
process.count | 正在运行的进程数。 |
swap.free | 自由交换空间的大小。 |
swap.total | 总交换空间。 |
swap.used | 已用交换空间的大小。 |
system.uptime | 系统正常运行时间。 |
文件系统度量标准
度量标准 | 描述 |
---|---|
filesystem.capacity.free | 按字节计的可用容量大小。 |
filesystem.capacity.total | 按字节计的总容量。 |
filesystem.capacity.used | 按字节计的已用容量。 |
filesystem.inode.free | 按字节计的可用索引节点数。 |
filesystem.inode.total | 按字节计的总索引节点数。 |
filesystem.inode.used | 按字节计的已用索引节点数。 |
注意:标签路径
根据本地文件系统的挂载路径自动填充(例如,/
、/boot
等)。
网络接口度量标准
度量标准 | 描述 |
---|---|
network.in | 下载的字节数。 |
network.in.dropped | 丢失的已下载字节数。 |
network.in.errors | 错误下载的字节数。 |
network.in.packets | 下载的数据包数。 |
network.out | 上传的字节数。 |
network.out.dropped | 丢失的已上传字节数。 |
network.out.errors | 错误上传的字节数。 |
network.out.packets | 上传的数据包数。 |
注意:标签接口
根据网络接口的类型自动填充(例如,spartan
、d-dcos
、minuteman
等)。
进程
收集以下按进程的资源利用率度量标准。
度量标准 | 描述 |
---|---|
procstat.cpu_time_guest | CPU 运行客操作系统虚拟 CPU 的时间。 |
procstat.cpu_time_guest_nice | CPU 运行客操作系统虚拟 CPU 的时间,这是低优先级,可能会被其他进程中断。 |
procstat.cpu_time_idle | CPU 空闲的时间量。 |
procstat.cpu_time_iowait | CPU 等待 I/O 操作完成的时间量。 |
procstat.cpu_time_irq | CPU 服务于中断的时间量。 |
procstat.cpu_time_nice | CPU 在用户模式下具有低优先级进程的时间量,这很容易会被优先级较高的进程中断。 |
procstat.cpu_time_soft_irq | CPU 服务于软件中断的时间量。 |
procstat.cpu_time_steal | CPU 处于被盗时间的时间量,这是在虚拟化环境中花在其他操作系统上的时间。 |
procstat.cpu_time_system | CPU 处于系统模式的时间量。 |
procstat.cpu_time_user | CPU 处于用户模式的时间量。 |
procstat.cpu_usage | 进程在任何容量中处于活动状态的时间百分比。 |
procstat.involuntary_context_switches | 进程不自觉上下文切换的次数。 |
procstat.memory_data | 进程用于数据的内存量。 |
procstat.memory_locked | 进程已锁定的内存量。 |
procstat.memory_rss | 进程正在使用的实际内存量(驻留集)。 |
procstat.memory_stack | 进程正在使用的堆栈内存量。 |
procstat.memory_swap | 进程正在使用的交换内存量。 |
procstat.memory_vms | 进程正在使用的虚拟内存量。 |
procstat.nice_priority | 进程的良好状态优先级的当前使用率。 |
procstat.num_threads | 进程中线程的数量。 |
procstat.pid | 进程标识符 (ID)。 |
procstat.realtime_priority | 进程的实时优先级的当前使用率。 |
procstat.rlimit_cpu_time_hard | 进程上用于数据的内存的硬资源限制。 |
procstat.rlimit_cpu_time_soft | 进程上用于数据的内存的软资源限制。 |
procstat.rlimit_file_locks_hard | 进程的硬文件锁资源限制。 |
procstat.rlimit_file_locks_soft | 进程的软文件锁资源限制。 |
procstat.rlimit_memory_data_hard | 进程上用于数据的内存的硬资源限制。 |
procstat.rlimit_memory_data_soft | 进程上用于数据的内存的软资源限制。 |
procstat.rlimit_memory_locked_hard | 进程上用于锁定的内存的硬资源限制。 |
procstat.rlimit_memory_locked_soft | 进程上用于锁定的内存的软资源限制。 |
procstat.rlimit_memory_rss_hard | 进程上用于物理内存的硬资源限制。 |
procstat.rlimit_memory_rss_soft | 进程上用于物理内存的软资源限制。 |
procstat.rlimit_memory_stack_hard | 进程堆栈的硬资源限制。 |
procstat.rlimit_memory_stack_soft | 进程堆栈的软资源限制。 |
procstat.rlimit_memory_vms_hard | 进程上用于虚拟内存的硬资源限制。 |
procstat.rlimit_memory_vms_soft | 进程上用于虚拟内存的软资源限制。 |
procstat.rlimit_nice_priority_hard | 进程良好状态优先级值上限的硬资源限制。 |
procstat.rlimit_nice_priority_soft | 进程良好状态优先级值上限的软资源限制。 |
procstat.rlimit_num_fds_hard | 进程文件描述符的硬资源限制。 |
procstat.rlimit_num_fds_soft | 进程文件描述符的软资源限制。 |
procstat.rlimit_realtime_priority_hard | 进程实时优先级值上限的硬资源限制。 |
procstat.rlimit_realtime_priority_soft | 进程实时优先级值上限的软资源限制。 |
procstat.rlimit_signals_pending_hard | 待交付到进程的信号数量的硬资源限制。 |
procstat.rlimit_signals_pending_soft | 待交付到进程的信号数量的软资源限制。 |
procstat.signals_pending | 待进程处理的信号数。 |
procstat.voluntary_context_switches | 进程自觉上下文切换的次数。 |
来源:AWS DOCS - 使用 procstat 插件收集进程度量标准
容器
收集以下按容器的资源利用率度量标准。
CPU 使用率度量标准
度量标准 | 描述 |
---|---|
cpus.limit | 分配的 CPU 份额数量。 |
cpus.system_time_secs | 按秒计的内核模式下花费的总 CPU 时间。 |
cpus.throttled_time_secs | 按秒计的 CPU 被限制总时间。 |
cpus.user_time_sec s | 用户模式下花费的 CPU 总时间。 |
磁盘度量标准
度量标准 | 描述 |
---|---|
disk.limit_bytes | 按字节计的磁盘硬容量限制。 |
disk.used_bytes | 按字节计的已用硬容量。 |
内存度量标准
度量标准 | 描述 |
---|---|
mem.limit_bytes | 容器的硬内存限制。 |
mem.total_bytes | RAM 中进程的总内存(与交换时相反)。 |
网络度量标准
度量标准 | 描述 |
---|---|
net.rx.bytes | 接收的字节数。 |
net.rx.dropped | 接收时丢失的数据包数。 |
net.rx.errors | 接收时报告的错误数。 |
net.rx.packets | 接收的数据包数。 |
net.tx.bytes | 发送的字节数。 |
net.tx.dropped | 发送时丢失的数据包数。 |
net.tx.errors | 发送时报告的错误数。 |
net.tx.packets | 发送的数据包数。 |
维度
维度是指关于度量标准的元数据。下表列出了可用的维护和它们出现所在的实体。
维度 | 描述 | 实体 |
---|---|---|
mesos_id | 节点的 Mesos ID。 | 节点,容器 |
cluster_id | Mesos 群集的 ID。 | 节点,容器 |
container_id | 容器的 ID。 | 度量标准,容器 |
executor_name | 任务执行器的名称。 | 度量标准 |
framework_name | 框架名称。 | 容器 |
hostname | 节点的 IP 地址。 | 容器,节点 |
labels | 描述度量标准的键值对。 | 容器 |
task_name | 任务名称。 | 容器 |
请查看以下资源,获取有关度量标准的更多信息: