设置控制组

背景信息

openGauss资源负载管理的核心是资源池,而配置资源池首先要在环境中实现控制组Cgroups的设置。更多Cgroups的原理介绍,请查看相关操作系统的产品手册。openGauss的控制组请参考查看控制组的信息

Class控制组为数据库业务运行所在的顶层控制组,集群部署时会自动生成默认子Class控制组“DefaultClass”。DefaultClass的Medium控制组会含有系统触发的作业在运行,该控制组不允许进行资源修改,且运行在该控制组上的作业不受资源管理的控制,所以推荐创建新的子Class及其Workload控制组来设置资源比例。

前提条件

已熟悉《工具参考》中“服务端工具 > gs_cgroup”章节和“服务端工具 > gs_ssh”章节的使用。

操作步骤

设置控制组 - 图1 说明:

  • 在openGauss中,需要在每个集群节点上执行控制组的创建、更新、删除操作,才能实现对整个集群资源的控制,所以下述步骤中都使用《工具参考》中“服务端工具 > gs_ssh”命令执行。

  • 控制组的命名要求如下:

    • 无论是子Class控制组还是Workload控制组,都不允许在名称中包含字符”:”。
    • 不可以创建同名的控制组。

创建子Class控制组和Workload控制组

  1. 以操作系统用户omm登录openGauss主节点。
  2. 创建名称为“class_a”和“class_b”的子Class控制组,CPU资源配额分别为Class的40%和20%。

    1. gs_ssh -c "gs_cgroup -c -S class_a -s 40"
    1. gs_ssh -c "gs_cgroup -c -S class_b -s 20"
  3. 创建子Class控制组“class_a”下名称为“workload_a1”和“workload_a2”的Workload控制组,CPU资源配额分别为“class_a”控制组的20%和60%。

    1. gs_ssh -c "gs_cgroup -c -S class_a -G workload_a1 -g 20 "
    1. gs_ssh -c "gs_cgroup -c -S class_a -G workload_a2 -g 60 "
  4. 创建子Class控制组“class_b”下名称为“workload_b1”和“workload_b2”的Workload控制组,CPU资源配额分别为“class_b”控制组的50%和40%。

    1. gs_ssh -c "gs_cgroup -c -S class_b -G workload_b1 -g 50 "
    1. gs_ssh -c "gs_cgroup -c -S class_b -G workload_b2 -g 40 "

更新控制组的资源配额

  1. 更新“class_a”控制组的CPU资源配额为30%。

    1. gs_ssh -c "gs_cgroup -u -S class_a -s 30"
  2. 更新“class_a”下的“workload_a1”的CPU资源配额为“class_a”的30%。

    1. gs_ssh -c "gs_cgroup -u -S class_a -G workload_a1 -g 30"

    设置控制组 - 图2 须知: 调整后的Workload控制组“workload_a1”占有的CPU资源不应大于其对应的子Class控制组“class_a”。并且,此名称不能是Timeshare Cgroup的默认名称,如“Low”、“Medium”、“High”或“Rush”。

删除控制组

  1. 删除控制组“class_a”。

    1. gs_ssh -c "gs_cgroup -d -S class_a"

    以上操作可以删除控制组“class_a”。

    设置控制组 - 图3 须知: root用户或者具有root访问权限的用户指定“-d” 和“-U username”删除普通用户“username”可访问的默认Cgroups。普通用户指定“-d”和“-S classname”可以删除已有的Class Cgroups。

查看控制组的信息

  1. 查看配置文件中控制组信息。

    1. gs_cgroup -p

    控制组配置信息

    1. gs_cgroup -p
    2. Top Group information is listed:
    3. GID: 0 Type: Top Percent(%): 1000( 50) Name: Root Cores: 0-47
    4. GID: 1 Type: Top Percent(%): 833( 83) Name: Gaussdb:omm Cores: 0-20
    5. GID: 2 Type: Top Percent(%): 333( 40) Name: Backend Cores: 0-20
    6. GID: 3 Type: Top Percent(%): 499( 60) Name: Class Cores: 0-20
    7. Backend Group information is listed:
    8. GID: 4 Type: BAKWD Name: DefaultBackend TopGID: 2 Percent(%): 266(80) Cores: 0-20
    9. GID: 5 Type: BAKWD Name: Vacuum TopGID: 2 Percent(%): 66(20) Cores: 0-20
    10. Class Group information is listed:
    11. GID: 20 Type: CLASS Name: DefaultClass TopGID: 3 Percent(%): 166(20) MaxLevel: 1 RemPCT: 100 Cores: 0-20
    12. GID: 21 Type: CLASS Name: class1 TopGID: 3 Percent(%): 332(40) MaxLevel: 2 RemPCT: 70 Cores: 0-20
    13. Workload Group information is listed:
    14. GID: 86 Type: DEFWD Name: grp1:2 ClsGID: 21 Percent(%): 99(30) WDLevel: 2 Quota(%): 30 Cores: 0-5
    15. Timeshare Group information is listed:
    16. GID: 724 Type: TSWD Name: Low Rate: 1
    17. GID: 725 Type: TSWD Name: Medium Rate: 2
    18. GID: 726 Type: TSWD Name: High Rate: 4
    19. GID: 727 Type: TSWD Name: Rush Rate: 8
    20. Group Exception information is listed:
    21. GID: 20 Type: EXCEPTION Class: DefaultClass
    22. PENALTY: QualificationTime=1800 CPUSkewPercent=30
    23. GID: 21 Type: EXCEPTION Class: class1
    24. PENALTY: AllCpuTime=100 QualificationTime=2400 CPUSkewPercent=90
    25. GID: 86 Type: EXCEPTION Group: class1:grp1:2
    26. ABORT: BlockTime=1200 ElapsedTime=2400

    上述示例查看到的控制组配置信息如表1所示。

    表 1 控制组配置信息

    GID

    类型

    名称

    Percent(%)信息

    特定信息

    0

    Top控制组

    Root

    1000代表总的系统资源为1000份。

    括号中的50代表IO资源的50%。

    openGauss不通过控制组对IO资源做控制,因此下面其他控制组信息中仅涉及CPU配额情况。

    -

    1

    Gaussdb:omm

    系统中只运行一套数据库程序,Gaussdb:omm控制组默认配额为833,数据库程序和非数据库程序的比值为(833:167=5:1)。

    -

    2

    Backend

    Backend和Class括号中的40和60,代表Backend占用Gaussdb:dbuser控制组40%的资源,Class占用Gaussdb:dbuser控制组60%的资源。

    -

    3

    Class

    -

    4

    Backend控制组

    DefaultBackend

    括号中的80和20代表DefaultBackend和Vacuum占用Backend控制组80%和20%的资源。

    TopGID:代表Top类型控制组中Backend组的GID,即2。

    5

    Vacuum

    20

    Class控制组

    DefaultClass

    DefaultClass和class1的20和40代表占Class控制组20%和40%的资源。因为当前只有两个Class组,所有它们按照20:40的比例分配Class控制组499的系统配额,则分别为166和332。

    • TopGID:代表DefaultClass和class1所属的上层控制(Top控制组中的Class组)的GID,即3。
    • MaxLevel:Class组当前含有的Workload组的最大层次,DefaultClass没有Workload Cgroup,其数值为1。
    • RemPCT:代表Class组分配Workload组后剩余的资源百分比。如class1中剩余的百分比为70。

    21

    class1

    86

    Workload控制组

    grp1:2

    (该名称由Workload Cgroup Name和其在class中的层级组成,它是class1的第一个Workload组,层级为2,每个Class组最多10层Workload Cgroup。)

    根据设置,其占class1的百分比为30,则为332*30%=99。

    • ClsGID:代表Workload控制组所属的上层控制组(class1控制组)的GID。
    • WDLevel:代表当前Workload Cgroup在对应的Class组所在的层次。

    724

    Timeshare控制组

    Low

    -

    Rate:代表Timeshare中的分配比例,Low最少为1,Rush最高为8。这四个Timeshare组的资源配比为Rush:High:Medium:Low=8:4:2:1

    725

    Medium

    -

    726

    High

    -

    727

    Rush

    -

  2. 查看操作系统中树形结构的控制组信息。

    执行如下命令可以查询控制组树形结构信息。

    1. gs_cgroup -P

    返回信息如下,其中shares代表操作系统中CPU资源的动态资源配额“cpu.shares”的数值,cpus代表操作系统中CPUSET资源的动态资源限额“cpuset.cpus”的数值,指的是该控制组能够使用的核数范围。

    1. Mount Information:
    2. cpu:/dev/cgroup/cpu
    3. blkio:/dev/cgroup/blkio
    4. cpuset:/dev/cgroup/cpuset
    5. cpuacct:/dev/cgroup/cpuacct
    6. Group Tree Information:
    7. - Gaussdb:wangrui (shares: 5120, cpus: 0-20, weight: 1000)
    8. - Backend (shares: 4096, cpus: 0-20, weight: 400)
    9. - Vacuum (shares: 2048, cpus: 0-20, weight: 200)
    10. - DefaultBackend (shares: 8192, cpus: 0-20, weight: 800)
    11. - Class (shares: 6144, cpus: 0-20, weight: 600)
    12. - class1 (shares: 4096, cpus: 0-20, weight: 400)
    13. - RemainWD:1 (shares: 1000, cpus: 0-20, weight: 100)
    14. - RemainWD:2 (shares: 7000, cpus: 0-20, weight: 700)
    15. - Timeshare (shares: 1024, cpus: 0-20, weight: 500)
    16. - Rush (shares: 8192, cpus: 0-20, weight: 800)
    17. - High (shares: 4096, cpus: 0-20, weight: 400)
    18. - Medium (shares: 2048, cpus: 0-20, weight: 200)
    19. - Low (shares: 1024, cpus: 0-20, weight: 100)
    20. - grp1:2 (shares: 3000, cpus: 0-5, weight: 300)
    21. - TopWD:1 (shares: 9000, cpus: 0-20, weight: 900)
    22. - DefaultClass (shares: 2048, cpus: 0-20, weight: 200)
    23. - RemainWD:1 (shares: 1000, cpus: 0-20, weight: 100)
    24. - Timeshare (shares: 1024, cpus: 0-20, weight: 500)
    25. - Rush (shares: 8192, cpus: 0-20, weight: 800)
    26. - High (shares: 4096, cpus: 0-20, weight: 400)
    27. - Medium (shares: 2048, cpus: 0-20, weight: 200)
    28. - Low (shares: 1024, cpus: 0-20, weight: 100)
    29. - TopWD:1 (shares: 9000, cpus: 0-20, weight: 900)
  3. 通过系统视图获取控制组配置信息。

    a.使用gsql连接数据库。

b.获取系统中所有控制组的配置信息。

  1. ```
  2. openGauss=# SELECT * FROM gs_all_control_group_info;
  3. ```