查看运行状态

运行 php start.php status
可以查看到WorkerMan的运行状态,类似如下:

  1. ---------------------------------------GLOBAL STATUS--------------------------------------------
  2. Workerman version:3.0.3 PHP version:5.3.29-1~dotdeb.0
  3. start time:2015-02-21 18:05:47 run 86 days 22 hours
  4. load average: 0, 0, 0
  5. 3 workers 10 processes
  6. worker_name exit_status exit_count
  7. TodpoleGateway 0 0
  8. TodpoleBusinessWorker 0 4
  9. TodpoleBusinessWorker 9 1
  10. WebServer 0 2
  11. ---------------------------------------PROCESS STATUS-------------------------------------------
  12. pid memory listening worker_name connections total_request send_fail throw_exception
  13. 936 2.15M Websocket://0.0.0.0:8585 TodpoleGateway 13 355 0 0
  14. 937 2.03M Websocket://0.0.0.0:8585 TodpoleGateway 5 181 0 0
  15. 938 2M Websocket://0.0.0.0:8585 TodpoleGateway 4 171 0 0
  16. 939 2.03M Websocket://0.0.0.0:8585 TodpoleGateway 5 177 0 0
  17. 948 2.15M none TodpoleBusinessWorker 4 32 0 0
  18. 949 2.16M none TodpoleBusinessWorker 4 54 0 0
  19. 953 2.16M none TodpoleBusinessWorker 4 50 0 0
  20. 957 2.15M none TodpoleBusinessWorker 4 53 0 0
  21. 954 1.84M http://0.0.0.0:8686 WebServer 0 61 0 0
  22. 955 1.84M http://0.0.0.0:8686 WebServer 1 59 0 0

说明

GLOBAL STATUS

从这以栏中我们可以看到

WorkerMan的版本version:3.0.3

启动时间2015-02-21 18:05:47,运行了run 86 days 22 hours

服务器负载 load average: 0, 0, 0

3 workers(3种进程,包括ChatGateway、ChatBusinessWorker、WebServer进程)

10 processes(共10个进程)

worker_name(worker进程名)

exit_status(worker进程退出状态码)

exit_count(该状态码的退出次数)

一般来说exit_status为0表示为正常退出,如果为其它值,代表进程是异常退出的,并产生一条类似WORKER EXIT UNEXPECTED错误信息,错误信息会记录到Worker::logFile指定的文件中。

常见的exit_status及其含义如下:

  • 0:表示正常退出,运行reload平滑重启后会出现值为0的退出码,是正常现象。注意在程序中调用exit或die也会导致退出码为0,并产生一条WORKER EXIT UNEXPECTED错误信息,workerman中不允许业务代码调用exit或者die语句。
  • 9:表示进程被SIGKILL信号杀死了。这个退出码主要发生在stop以及reload平滑重启时,导致这个退出码的原因是由于子进程没有在规定时间内响应主进程reload信号(例如mysql、curl等长时间阻塞等待或者业务死循环等),被主进程强制使用SIGKILL信号杀死。注意,当在linux命令行中使用kill命令发送SIGKILL信号给子进程也会导致这个退出码。
  • 65280:导致这个退出码的原因是业务代码有致命错误,例如调用了不存在的函数、语法错误等,具体错误信息会记录到Worker::logFile指定的文件中,也可以在php.inierror_log指定的文件中(如果有指定的话)找到。
  • 64000:导致这个退出码的原因是业务代码抛出了异常,但业务没有捕获这个异常,导致进程退出。如果workerman以debug方式运行时异常调用栈会打印到终端,daemon方式运行时异常调用栈会记录到Worker::stdoutFile指定的文件中。

PROCESS STATUS

pid:进程pid

memory:该进程当前占用内存(不包括php自身可执行文件的占用的内存)

listening:传输层协议及监听ip端口。如果不监听任何端口则显示none。参见Worker类构造函数

worker_name:该进程运行的服务服务名,见Worker类name属性

connections:该进程当前有多少个TCP连接对象实例。注意:每个客户端连接是一个TcpConnection连接对象实例,同时每个AsyncTcpConnection连接也是一个连接对象实例,所以connections的计数不一定与客户端连接数相等,例如GatewayWorker中Gateway进程的connections计数包含了客户端连接数和Gateway与Worker内部通讯连接数。

total_request:表示该进程从启动到现在一共接收了多少个请求。这里的请求数不仅包含客户端发来的请求,也包含Workerman内部通讯请求,例如GatewayWorker架构里Gateway与BusinessWorker之间的通讯请求。

send_fail:该进程向客户端发送数据失败次数,失败原因一般为客户端连接断开,此项不为0一般属于正常状态,参见手册常见问题send_fail原因

throw_exception:该进程内业务未捕获的异常数量

原理

status脚本运行后,主进程会向所有worker进程发送一个SIGUSR2信号,随后status脚本进入100毫秒的睡眠阶段,以便等待各个worker进程状态统计结果。这时空闲的worker进程收到SIGUSR2信号后会立刻向特定的磁盘文件写入自己的运行状态(连接数、请求数等等),而正在处理业务逻辑的worker进程,则会等待业务逻辑处理完毕才会去写入自己的状态信息。sleep100毫秒后,status脚本开始读取磁盘中的状态文件,并展示结果到控制台。

注意

status 时可能会发现显示的进程数量少于实际数量,原因是由于进程忙于处理业务(例如业务逻辑长时间阻塞在curl或者数据库请求上),导致worker进程无法及时(100毫秒内)响应status命令,来不及将自己的状态信息写入磁盘,status脚本自然统计不到对应worker的进程,也就无法及时展示在status结果中。

出现这种问题需要排查业务代码,看哪里导业务致长时间阻塞,并且评估阻塞耗时是否在预期内。