内存跟踪器
内存跟踪器(Memory Tracker)记录了 Doris BE 进程内存使用,包括查询、导入、Compaction、Schema Change 等任务生命周期中使用的内存,以及各项缓存,用于内存控制和分析。
SinceVersion 1.2.0
原理
系统中每个查询、导入等任务初始化时都会创建自己的 Memory Tracker,在执行过程中将 Memory Tracker 放入 TLS(Thread Local Storage)中,BE进程的每次内存申请和释放,都将在 Mem Hook 中消费 Memory Tracker,并最终汇总后展示。
详细设计实现可以参阅: https://cwiki.apache.org/confluence/display/DORIS/DSIP-002%3A+Refactor+memory+tracker+on+BE https://shimo.im/docs/DT6JXDRkdTvdyV3G
查看统计结果
实时的内存统计结果通过 Doris BE 的 Web 页面查看 http://ip:webserver\_port/mem\_tracker。(webserver\_port默认8040) 历史查询的内存统计结果可以查看fe/log/fe.audit.log
中每个查询的peakMemoryBytes
,或者在be/log/be.INFO
中搜索Deregister query/load memory tracker, queryId
查看单个BE上每个查询的内存峰值。
首页 /mem_tracker
- Type: 将 Doris BE 使用的内存分为如下几类
- process: 进程总内存,所有其他type的总和。
- global: 生命周期和进程相同的全局 Memory Tracker,例如各个Cache、Tablet Manager、Storage Engine等。
- query: 所有查询的内存总和。
- load: 所有导入的内存总和。
- tc/jemalloc_cache: 通用内存分配器 TCMalloc 或 Jemalloc 的缓存,在 http://ip:webserver\_port/memz 可以实时查看到内存分配器原始的profile。
- compaction、schema_change、consistency、batch_load、clone: 分别对应所有Compaction、Schema Change、Consistency、Batch Load、Clone任务的内存总和。
- Current Consumption(Bytes): 当前内存值,单位B。
- Current Consumption(Normalize): 当前内存值的 .G.M.K 格式化输出。
- Peak Consumption(Bytes): BE进程启动后的内存峰值,单位B,BE重启后重置。
- Peak Consumption(Normalize): BE进程启动后内存峰值的 .G.M.K 格式化输出,BE重启后重置。
Global Type /mem_tracker?type=global
- Label: Memory Tracker名称
- Parent Label: 用于表明两个 Memory Tracker 的父子关系,Child Tracker 记录的内存是 Parent Tracker 的子集,Parent 相同的不同 Tracker 记录的内存可能存在交集。
Orphan: 默认消费的 Tracker,没有单独指定 Tracker 的内存将默认记录到 Orphan,Orphan 中除了下述细分的 Child Tracker 外,还包括 BRPC 在内的一些不方便准确细分统计的内存。
- LoadChannelMgr: 所有导入的 Load Channel 阶段内存总和,用于将 Scan 后的数据写入到磁盘的 Segment 文件中,Orphan的子集。
- StorageEngine:,存储引擎加载数据目录过程中消耗的内存,Orphan的子集。
- SegCompaction: 所有 SegCompaction 任务的内存总和,Orphan的子集。
- SegmentMeta: memory use by segment meta data such as footer or index page,Orphan的子集。
- TabletManager: 存储引擎 get、add、delete Tablet 过程中消耗的内存,Orphan的子集。
- BufferAllocator: 仅用于非向量化Partitioned Agg过程中的内存复用,Orphan的子集。
DataPageCache: 用于缓存数据 Page,用于加速 Scan。
IndexPageCache: 用于缓存数据 Page 的索引,用于加速 Scan。
SegmentCache: 用于缓存已打开的 Segment,如索引信息。
DiskIO: 用于缓存 Disk IO 数据,仅在非向量化使用。
ChunkAllocator: 用于缓存2的幂大小的内存块,在应用层内存复用。
LastSuccessChannelCache: 用于缓存导入接收端的 LoadChannel。
DeleteBitmap AggCache: Gets aggregated delete_bitmap on rowset_id and version。
Query Type /mem_tracker?type=query
- Limit: 单个查询使用的内存上限,
show session variables
查看和修改exec_mem_limit
。 - Label: 单个查询的 Tracker 的 Label 命名规则为
Query#Id=xxx
。 - Parent Label: Parent 是
Query#Id=xxx
的 Tracker 记录查询不同算子执行过程使用的内存。
Load Type /mem_tracker?type=load
- Limit: 导入分为 Fragment Scan 和 Load Channel 写 Segment 到磁盘两个阶段。Scan 阶段的内存上限通过
show session variables
查看和修改load_mem_limit
;Segment 写磁盘阶段每个导入没有单独的内存上限,而是所有导入的总上限,对应 be.conf 中的load_process_max_memory_limit_percent
。 - Label: 单个导入 Scan 阶段 Tracker 的 Label 命名规则为
Load#Id=xxx
;单个导入 Segment 写磁盘阶段 Tracker 的 Label 命名规则为LoadChannel#senderIp=xxx#loadID=xxx
。 - Parent Label: Parent是
Load#Id=xxx
的 Tracker 记录导入 Scan 阶段不同算子执行过程使用的内存;Parent是LoadChannelMgrTrackerSet
的 Tracker 记录 Segment 写磁盘阶段每个中间数据结构 MemTable 的 Insert 和 Flush 磁盘过程使用的内存,用 Label 最后的loadID
关联 Segment 写磁盘阶段 Tracker。