Version: 2.1.4

模拟进程故障

本文主要介绍如何使用 Chaosd 模拟进程故障。该功能通过使用 kill 的 Golang 接口模拟进程被终止或暂停的场景,支持通过命令行模式或服务模式创建实验。

使用命令行模式创建实验

在创建进程故障实验前,可运行以下命令行查看 Chaosd 支持的进程故障类型:

  1. chaosd attack process -h

输出结果如下所示:

  1. Process attack related commands
  2. Usage:
  3. chaosd attack process [command]
  4. Available Commands:
  5. kill kill process, default signal 9
  6. stop stop process, this action will stop the process with SIGSTOP
  7. Flags:
  8. -h, --help help for process
  9. Global Flags:
  10. --log-level string the log level of chaosd, the value can be 'debug', 'info', 'warn' and 'error'
  11. Use "chaosd attack process [command] --help" for more information about a command.

目前 Chaosd 支持模拟进程被终止或暂停的故障。

使用命令行模式模拟进程被终止

模拟进程被终止命令

  1. chaosd attack process kill -h

输出结果如下所示:

  1. kill process, default signal 9
  2. Usage:
  3. chaosd attack process kill [flags]
  4. Flags:
  5. -h, --help help for kill
  6. -p, --process string The process name or the process ID
  7. -s, --signal int The signal number to send (default 9)
  8. Global Flags:
  9. --log-level string the log level of chaosd, the value can be 'debug', 'info', 'warn' and 'error'

模拟进程被终止相关配置说明

配置项配置缩写说明
processp需要注入故障的进程的名字或者进程的标识符string 类型,默认为 “”
signals所提供的进程信号值int 类型,默认为 9。目前只支持 SIGKILLSIGTERMSIGSTOP 三种信号值。

模拟进程被终止示例

  1. chaosd attack process kill -p python

输出结果如下所示:

  1. Attack process python successfully, uid: 10e633ac-0a37-41ba-8b4a-cd5ab92099f9
注意

只有 signalSIGSTOP 的实验支持被恢复。

使用命令行模式模拟进程被暂停

模拟进程被暂停命令

  1. chaosd attack process stop -h

输出结果如下所示:

  1. stop process, this action will stop the process with SIGSTOP
  2. Usage:
  3. chaosd attack process stop [flags]
  4. Flags:
  5. -h, --help help for stop
  6. -p, --process string The process name or the process ID
  7. Global Flags:
  8. --log-level string the log level of chaosd, the value can be 'debug', 'info', 'warn' and 'error'

模拟进程被暂停相关配置说明

配置项配置缩写说明
processp需要暂停的进程的名字或者进程的标识符string 类型,默认为 “”

模拟进程被暂停示例

  1. chaosd attack process stop -p python

输出结果如下所示:

  1. Attack process python successfully, uid: 9cb6b3be-4f5b-4ecb-ae05-51050fcd0010

使用服务模式创建实验

要使用服务模式创建实验,请进行以下操作:

  1. 以服务模式运行 Chaosd。

    1. chaosd server --port 31767
  2. 向 Chaosd 服务的路径 /api/attack/process 发送 POST HTTP 请求。

    1. curl -X POST 172.16.112.130:31767/api/attack/process -H "Content-Type:application/json" -d '{fault-configuration}'

在上述命令中,你需要按照故障类型在 fault-configuration 中进行配置。有关对应的配置参数,请参考下文中各个类型故障的相关参数说明和命令示例。

注意

在运行实验时,请注意保存实验的 UID 信息。当要结束 UID 对应的实验时,需要向 Chaosd 服务的路径 /api/attack/{uid} 发送 DELETE HTTP 请求。

使用服务模式模拟进程故障

进程故障相关参数说明

参数说明
process需要注入故障的进程的名字或者进程的标识符string 类型,默认为 “”
signal所提供的进程信号值int 类型,默认为 9

使用服务模式模拟进程故障示例

  1. curl -X POST 172.16.112.130:31767/api/attack/process -H "Content-Type:application/json" -d '{"process":"12345","signal":15}'

输出如下所示:

  1. {"status":200,"message":"attack successfully","uid":"c3c519bf-819a-4a7b-97fb-e3d0814481fa"}
注意

只有 signalSIGSTOP 的实验支持被恢复。