NODES剧本
使用 NODES
系列剧本将更多节点纳入Pigsty管理,将节点调整至配置描述的状态。
当您使用 infra.yml 在元节点上完成Pigsty的完整安装后,您可以进一步使用 nodes.yml 将更多节点添加至Pigsty中,或者使用 nodes-remove.yml 将节点从环境中移除。
剧本 | 功能 | 链接 |
---|---|---|
nodes | 节点置备,将节点纳入Pigsty管理,可用于后续数据库部署 | src |
nodes-remove | 节点移除,卸载节点DCS与监控,不再纳入Pigsty管理 | src |
nodes
nodes.yml 剧本将更多节点添加至Pigsty中。该剧本需要在 元节点 上发起,针对目标节点执行。
此剧本可以将目标机器节点调整至配置清单所描述的状态,安装Consul服务,并将其纳入Pigsty监控系统,并允许您在这些置备好的节点上进一步部署不同类型的数据库集群。
nodes.yml
剧本的行为由 节点配置 决定。在使用本地源的情况下,完整执行此剧本可能耗时1~3分钟,视机器配置而异。
./nodes.yml # 初始化所有清单中的节点(危险!)
./nodes.yml -l pg-test # 初始化在 pg-test 分组下的机器(推荐!)
./nodes.yml -l pg-meta,pg-test # 同时初始化pg-meta与pg-test两个集群中的节点
./nodes.yml -l 10.10.10.11 # 初始化10.10.10.11这台机器节点
此剧本包含的功能与任务如下:
- 生成节点身份参数
- 初始化节点
- 配置节点名称
- 配置节点静态DNS解析
- 配置节点动态DNS解析服务器
- 配置节点的Yum源
- 安装指定的RPM软件包
- 配置 numa/swap/firewall等特性
- 配置节点tuned调优模板
- 配置节点的快捷命令与环境变量
- 创建节点管理员并配置SSH
- 配置节点时区
- 配置节点NTP服务
- 在节点上初始化DCS服务:Consul 与 ETCD
- 抹除现有Consul
- 初始化当前节点的 Consul Agent或Server 服务
- 初始化节点监控组件并纳入Pigsty
- 在节点上安装 Node Exporter
- 将 Node Exporter 注册至元节点上的 Prometheus 中。
对于已有数据库运行的节点执行该剧本需要谨慎,使用不当存在误触发短暂数据库不可用的风险,因为初始化节点会抹除DCS Agent。
节点置备会配置节点的DCS服务(Consul Agent),因此在对运行有PostgreSQL数据库的节点运行此剧本时,请小心! dcs_clean 参数提供了避免误删的选项作为保险,允许以在初始化过程中,当检测到已有运行中DCS时自动中止或跳过高危操作,避免最坏情况发生。
尽管如此,在使用完整的
nodes.yml
剧本或其中关于dcs|consul
的部分时,请再三检查--tags|-t
与--limit|-l
参数是否正确。确保自己在正确的目标上执行正确的任务。
保护机制
Pigsty提供保护机制,避免误删运行中的Consul实例,包括了两个相关参数:
- dcs_safeguard:默认关闭,只要打开,在任意情况下该数据库实例不会被清理。
- dcs_clean:默认关闭,当打开时,初始化节点/nodes.yml 会抹除掉现有Consul实例(有可能影响PG主库写入)
当遇到现存实例时,nodes.yml 剧本会有以下行为表现:
dcs_safeguard / pg_clean | dcs_clean=true | dcs_clean=false |
---|---|---|
dcs_safeguard=true | 中止执行 | 中止执行 |
dcs_safeguard=false | 抹除实例 | 中止执行 |
当遇到现存实例时, nodes-remove.yml剧本会有以下行为表现:
dcs_safeguard / pg_clean | dcs_clean=true | dcs_clean=false |
---|---|---|
dcs_safeguard=true | 中止执行 | 中止执行 |
dcs_safeguard=false | 抹除实例 | 抹除实例 |
选择性执行
用户可以通过ansible的标签机制,选择性执行本剧本的一个子集。例如,如果只想执行节点监控部署的任务,则可以通过以下命令:
./nodes.yml --tags=node-monitor
一些常用的任务子集包括:
# play
./nodes.yml --tags=node-id # 打印节点身份参数:名称与集群
./nodes.yml --tags=node-init # 初始化节点,完成配置
./nodes.yml --tags=dcs-init # 在节点上初始化DCS服务:Consul
./nodes.yml --tags=node-monitor # 初始化节点监控组件并纳入Pigsty
# tasks
./nodes.yml --tags=node_name # 配置节点名称
./nodes.yml --tags=node_dns # 配置节点静态DNS解析
./nodes.yml --tags=node_resolv # 配置节点动态DNS解析服务器
./nodes.yml --tags=node_repo # 配置节点的Yum源
./nodes.yml --tags=node_pkgs # 安装指定的RPM软件包
./nodes.yml --tags=node_feature # 配置 numa/swap/firewall等特性
./nodes.yml --tags=node_tuned # 配置节点tuned调优模板
./nodes.yml --tags=node_profile # 配置节点的快捷命令与环境变量
./nodes.yml --tags=node_admin # 创建节点管理员并配置SSH
./nodes.yml --tags=node_timezone # 配置节点时区
./nodes.yml --tags=node_ntp # 配置节点NTP服务
./nodes.yml --tags=consul # 在节点上配置consul agent/server
./nodes.yml --tags=consul -e dcs_clean=clean # 在节点上强制抹除重新配置consul
./nodes.yml --tags=node_exporter # 在节点上配置 node_exporter 并注册
./nodes.yml --tags=node_deregister # 将节点监控从元节点上取消注册
./nodes.yml --tags=node_register # 将节点监控注册到元节点上
创建管理用户
管理用户是一个先有鸡还是先有蛋的问题。为了执行Ansible剧本,需要有一个管理用户。为了创建一个专用的管理用户,需要执行此Ansible剧本。
Pigsty推荐将管理用户的创建,权限配置与密钥分发放在虚拟机的Provisioning阶段完成,作为机器资源交付内容的一部分。对于生产环境来说,机器交付时应当已经配置有这样一个具有免密远程SSH登陆并执行免密sudo的用户。通常绝大多数云平台和运维体系都可以做到这一点。
如果您只能使用ssh密码和sudo密码,那么必须在所有剧本执行时添加额外的参数 --ask-pass|-k
与 --ask-become-pass|-K
,并在提示出现时输入ssh密码与sudo密码。您可以使用 nodes.yml
中创建管理员用户的功能,使用当前用户创建一个专用管理员用户,以下参数用于创建默认的管理员用户:
./nodes.yml -t node_admin -l <目标机器> --ask-pass --ask-become-pass
默认创建的管理员用户为 dba(uid=88)
,请不要使用 postgres
或 {{ dbsu }}
作为管理用户,请尽量避免直接使用 root
作为管理用户。
在沙箱环境中的默认用户 vagrant
默认已经配置有免密登陆和免密sudo,您可以从宿主机或沙箱元节点使用vagrant登陆所有的数据库节点。
例如:
./nodes.yml --limit <target_hosts> --tags node_admin -e ansible_user=<another_admin> --ask-pass --ask-become-pass
详情请参考:准备:管理用户置备
nodes-remove
nodes-remove.yml 剧本是 nodes剧本的反向操作,用于将节点从Pigsty中移除。
该剧本需要在 元节点 上发起,针对目标节点执行。
./nodes.yml # 移除所有节点(危险!)
./nodes.yml -l nodes-test # 移除 nodes-test 分组下的机器
./nodes.yml -l 10.10.10.11 # 移除 10.10.10.11这台机器节点
./nodes.yml -l 10.10.10.10 -e rm_dcs_servers=true # 如果节点为DCS Server,需要额外参数移除。
任务子集
# play
./nodes-remove.yml --tags=register # 移除节点注册信息
./nodes-remove.yml --tags=node-exporter # 移除节点指标收集器
./nodes-remove.yml --tags=promtail # 移除Promtail日志收集组件
./nodes-remove.yml --tags=consul # 移除Consul Agent服务
./nodes-remove.yml --tags=consul -e rm_dcs_servers=true # 移除Consul服务(包括Server!)
最后修改 2022-05-27: init commit (1e3e284)