4.6 异常处理

PHP的异常处理与其它语言的类似,在程序中可以抛出、捕获一个异常,异常抛出必须只有定义在try{…}块中才可以被捕获,捕获以后将跳到catch块中进行处理,不再执行try中抛出异常之后的代码。

异常可以在任意位置抛出,然后将由最近的一个try所捕获,如果在当前执行空间没有进行捕获,那么将调用栈一直往上抛,比如在一个函数内部抛出一个异常,但是函数内没有进行try,而在函数调用的位置try了,那么就由调用处的catch捕获。

接下来我们从两个方面介绍下PHP异常处理的实现。

4.6.1 异常处理的编译

异常捕获及处理的语法:

  1. try{
  2. try statement;
  3. }catch(exception_class_1 $e){
  4. catch statement 1;
  5. }catch(exception_class_2 $e){
  6. catch statement 2;
  7. }finally{
  8. finally statement;
  9. }

try表示要捕获try statement中可能抛出的异常;catch是捕获到异常后的处理,可以定义多个,当try中抛出异常时会依次检查各个catch的异常类是否与抛出的匹配,如果匹配则有命中的那个catch块处理;finally为最后执行的代码,不管是否有异常抛出都会执行。

语法规则:

  1. statement:
  2. ...
  3. | T_TRY '{' inner_statement_list '}' catch_list finally_statement
  4. { $$ = zend_ast_create(ZEND_AST_TRY, $3, $5, $6); }
  5. ...
  6. ;
  7. catch_list:
  8. /* empty */
  9. { $$ = zend_ast_create_list(0, ZEND_AST_CATCH_LIST); }
  10. | catch_list T_CATCH '(' name T_VARIABLE ')' '{' inner_statement_list '}'
  11. { $$ = zend_ast_list_add($1, zend_ast_create(ZEND_AST_CATCH, $4, $5, $8)); }
  12. ;
  13. finally_statement:
  14. /* empty */ { $$ = NULL; }
  15. | T_FINALLY '{' inner_statement_list '}' { $$ = $3; }
  16. ;

从语法规则可以看出,try-catch-finally最终编译为一个ZEND_AST_TRY节点,包含三个子节点,分别是:try statement、catch list、finally statement,try statement、finally statement就是普通的ZEND_AST_STMT_LIST节点,catch list包含多个ZEND_AST_CATCH节点,每个节点有三个子节点:exception class、exception object及catch statement,最终生成的AST:

4.6 异常处理 - 图1

具体的编译过程如下:

  • (1) 向所属zend_op_array注册一个zend_try_catch_element结构,所有try都会注册一个这样的结构,与循环结构注册的zend_brk_cont_element类似,当前zend_op_array所有定义的异常保存在zend_op_array->try_catch_array数组中,这个结构用来记录try、catch以及finally开始的位置,具体结构:
    1. typedef struct _zend_try_catch_element {
    2. uint32_t try_op; //try开始的opcode位置
    3. uint32_t catch_op; //第1个catch块的opcode位置
    4. uint32_t finally_op; //finally开始的opcode位置
    5. uint32_t finally_end;//finally结束的opcode位置
    6. } zend_try_catch_element;
  • (2) 编译try statement,编译完以后如果定义了catch块则编译一条ZEND_JMP,此opcode的作用时当无异常抛出时跳过所有catch跳到finally或整个异常之外的,因为catch块是在try statement之后编译的,所以具体的跳转值目前还无法确定;

  • (3) 依次编译各个catch块,如果没有定义则跳过此步骤,每个catch编译时首先编译一条ZEND_CATCH,此opcode保存着此catch的exception class、exception object以及下一个catch块开始的位置,编译第1个catch时将此opcode的位置记录在zend_try_catch_element.catch_op上,接着编译catch statement,最后编译一条ZEND_JMP(最后一个catch不需要),此opcode的作用与步骤(2)的相同;

  • (4) 将步骤(2)、步骤(3)中ZEND_JMP跳转值设置为finally第1条opcode或异常定义之外的代码,如果没有定义finally则结束编译,否则编译finally块,首先编译一条ZEND_FAST_CALLZEND_JMP,接着编译finally statement,最后编译一条ZEND_FAST_RET

编译完以后的结构:

4.6 异常处理 - 图2

异常的抛出通过throw一个异常对象来实现,这个对象必须继承>自Exception类,抛出异常的语法:

  1. throw exception_object;

throw的编译比较简单,最终只编译为一条opcode:ZEND_THROW

4.6.2 异常的抛出与捕获

上一小节我们介绍了exception结构在编译阶段的处理,接下来我们再介绍下运行时exception的处理过程,这个过程相对比较复杂,整体的讲其处理流程整体如下:

  • (1) 检查抛出的是否是object,否则将导致error错误;
  • (2) 将EG(exception)设置为抛出的异常对象,同时将当前stack(即:zend_execute_data)接下来要执行的opcode设置为ZEND_HANDLE_EXCEPTION
  • (3) 执行ZEND_HANDLE_EXCEPTION,查找匹配的catch:
    • (3.1) 首先遍历当前zend_op_array下定义的所有异常捕获,即zend_op_array->try_catch_array数组,然后根据throw的位置、try开始的位置、catch开始的位置、finally开始的位置判断判断异常是否在try范围内,如果同时命中了多个try(即嵌套try的情况)则选择最后那个(也就是最里层的),遍历完以后如果命中了则进入步骤(3.2)处理,如果没有命中当前stack下任何try则进入步骤(4);
    • (3.2) 到这一步表示抛出的异常在当前zend_op_array下有try拦截(注意这里只是表示异常在try中抛出的,但是抛出的异常并一定能被catch),然后根据当前try块的zend_try_catch_element结构取出第一个catch的位置,将opcode设置为zend_try_catch_element.catch_op,跳到第一个catch块开始的位置执行,即:执行ZEND_CATCH
    • (3.3) 执行ZEND_CATCH,检查抛出的异常对象是否与当前catch的类型匹配,检查的过程为判断两个类是否存在父子关系,如果匹配则表示异常被成功捕获,将EG(exception)清空,如果没有则跳到下一个catch的位置重复步骤(3.3),如果到最后一个catch仍然没有命中则在这个catch的位置抛出一个异常(实际还是原来按个异常,只是将抛出的位置转移了当前catch的位置),然后回到步骤(3);
  • (4) 当前zend_op_array没能成功捕获异常,需要继续往上抛:回到调用位置,将接下来要执行的opcode设置为ZEND_HANDLE_EXCEPTION,比如函数中抛出了一个异常没有在函数中捕获,则跳到调用的位置继续捕获,回到步骤(3);如果到最终主脚本也没有被捕获则将结束执行并导致error错误。

4.6 异常处理 - 图3

这个过程最复杂的地方在于异常匹配、传递的过程,主要为ZEND_HANDLE_EXCEPTIONZEND_CATCH两条opcode之间的调用,当抛出一个异常时会终止后面opcode的执行,转向执行ZEND_HANDLE_EXCEPTION,根据异常抛出的位置定位到最近的一个try的catch位置,如果这个catch没有匹配则跳到下一个catch块,然后再次执行ZEND_HANDLE_EXCEPTION,如果到最后一个catch仍没有匹配则将异常抛出前位置EG(opline_before_exception)更新为最后一个catch的位置,再次执行ZEND_HANDLE_EXCEPTION,由于异常抛出的位置已经更新了所以不会再匹配上次检查过的那个catch,这个过程实际就是不断递归执行ZEND_HANDLE_EXCEPTIONZEND_CATCH;如果当前zend_op_array都无法捕获则将异常抛向上一个调用栈继续捕获,下面根据一个例子具体说明下:

  1. function my_func(){
  2. //...
  3. throw new Exception("This is a exception from my_func()");
  4. }
  5. try{
  6. my_func();
  7. }catch(ErrorException $e){
  8. echo "ErrorException";
  9. }catch(Exception $e){
  10. echo "Exception";
  11. }

my_func()中抛出了一个异常,首先在my_func()中抛出一个异常,然后在my_func()的zend_op_array中检查是不是能够捕获,发现没有,则回到调用的位置,再次检查,第1次匹配到catch(ErrorException $e),检查后发现并不匹配,然后跳到下一个catch块继续匹配,第2次匹配到catch(Exception $e),检查后发现命中,捕获成功。

4.6 异常处理 - 图4

上面的过程并没有提到finally的执行时机,首先要明确finally在哪些情况下会执行,命中catch的情况比较简单,即在catch statement执行完以后跳到finally执行,另外一种情况是如果一个异常在try中但没有命中任何catch那么其finally也是会被执行的,这种情况的finally实际是在步骤(3)中执行的,最后一个catch检查完以后会更新异常抛出位置:EG(opline_before_exception),然后会再次执行ZEND_HANDLE_EXCEPTION,再次检查时就会发现没有命中任何catch但命中finally了(因为异常位置更新了),这时候就会将异常对象保存在finally块中,然后执行finally,执行完再将异常对象还原继续捕获,下面看下步骤(3)的具体处理过程:

  1. static ZEND_OPCODE_HANDLER_RET ZEND_FASTCALL ZEND_HANDLE_EXCEPTION_SPEC_HANDLER(ZEND_OPCODE_HANDLER_ARGS)
  2. {
  3. //op_num为异常抛出的位置,根据异常抛出前最后一条opcode与第一条opcode计算得出
  4. uint32_t op_num = EG(opline_before_exception) - EX(func)->op_array.opcodes;
  5. uint32_t catch_op_num = 0, finally_op_num = 0, finally_op_end = 0;
  6. //查找异常是不是被try了:找最近的一层try
  7. for (i = 0; i < EX(func)->op_array.last_try_catch; i++) {
  8. if (EX(func)->op_array.try_catch_array[i].try_op > op_num) {
  9. //try在抛出之后
  10. break;
  11. }
  12. in_finally = 0;
  13. //异常抛出位置在try后且比第一个catch位置小,表明这个try有可能捕获异常
  14. if (op_num < EX(func)->op_array.try_catch_array[i].catch_op) {
  15. //第一个catch的位置
  16. catch_op_num = EX(func)->op_array.try_catch_array[i].catch_op;
  17. }
  18. //当前try有finally
  19. if (op_num < EX(func)->op_array.try_catch_array[i].finally_op) {
  20. finally_op_num = EX(func)->op_array.try_catch_array[i].finally_op;
  21. finally_op_end = EX(func)->op_array.try_catch_array[i].finally_end;
  22. }
  23. if (op_num >= EX(func)->op_array.try_catch_array[i].finally_op &&
  24. op_num < EX(func)->op_array.try_catch_array[i].finally_end) {
  25. finally_op_end = EX(func)->op_array.try_catch_array[i].finally_end;
  26. in_finally = 1;
  27. }
  28. }
  29. cleanup_unfinished_calls(execute_data, op_num);
  30. //异常命中了try但没有命中任何catch且那个try定义了finally:需要执行finally
  31. //catch_op_num >= finally_op_num是嵌套try的情况,因为finally是检查完所有catch、更新异常抛出位置之后再执行的
  32. //所以检查完内层try再检查外层循环时会出现这种情况
  33. if (finally_op_num && (!catch_op_num || catch_op_num >= finally_op_num)) {
  34. zval *fast_call = EX_VAR(EX(func)->op_array.opcodes[finally_op_end].op1.var);
  35. cleanup_live_vars(execute_data, op_num, finally_op_num);
  36. if (in_finally && Z_OBJ_P(fast_call)) {
  37. zend_exception_set_previous(EG(exception), Z_OBJ_P(fast_call));
  38. }
  39. //临时将EG(exception)转移到finally下,执行完finally再抛出
  40. Z_OBJ_P(fast_call) = EG(exception);
  41. EG(exception) = NULL;
  42. fast_call->u2.lineno = (uint32_t)-1;
  43. ZEND_VM_SET_OPCODE(&EX(func)->op_array.opcodes[finally_op_num]);
  44. ZEND_VM_CONTINUE();
  45. }else{
  46. //这个是善后处理,因为异常抛出后后面的opcode将不再执行,但有些情况下还需要把一些资源释放掉
  47. //比如前面我们介绍goto时提到的foreach中是不能直接跳出的,throw也是类似
  48. cleanup_live_vars(execute_data, op_num, catch_op_num);
  49. ...
  50. if (catch_op_num) {
  51. //匹配到catch(但不一定命中),跳到catch处执行ZEND_CATCH进行判断
  52. ZEND_VM_SET_OPCODE(&EX(func)->op_array.opcodes[catch_op_num]);
  53. ZEND_VM_CONTINUE();
  54. } else if (UNEXPECTED((EX(func)->op_array.fn_flags & ZEND_ACC_GENERATOR) != 0)) {
  55. ...
  56. } else {
  57. //当前zend_op_array下已经没有匹配到的try了,如果异常仍没有被捕获则将在zend_leave_helper_SPEC()将异常抛给prev_execute_data继续捕获
  58. ZEND_VM_TAIL_CALL(zend_leave_helper_SPEC(ZEND_OPCODE_HANDLER_ARGS_PASSTHRU));
  59. }
  60. }
  61. }

具体的实现过程还有很多额外的处理,这里不再展开,感兴趣的可以详细研究下ZEND_HANDLE_EXCEPTIONZEND_CATCH两条opcode以及zend_exception.c中具体逻辑。

4.6.3 内核的异常处理

前面介绍的异常处理是PHP语言层面的实现,在内核中也有一套供内核使用的异常处理模型,也就是C语言异常处理的实现,如:

  1. static int php_start_sapi(void)
  2. {
  3. ...
  4. zend_try {
  5. ...
  6. } zend_catch {
  7. ...
  8. } zend_end_try();
  9. ...
  10. }

C语言并没有在语言层面提供try-catch机制,那么PHP中的是如何实现的呢?这个主要利用sigsetjmp()、siglongjmp()两个函数实现堆栈的保存、还原,在try的位置通过sigsetjmp()将当前位置的堆栈保存在一个变量中,异常抛出通过siglongjmp()跳回原位置,具体看下这几个宏的定义:

  1. #define zend_try \
  2. { \
  3. JMP_BUF *__orig_bailout = EG(bailout); \
  4. JMP_BUF __bailout; \
  5. \
  6. EG(bailout) = &__bailout; \
  7. if (SETJMP(__bailout)==0) {
  8. #define zend_catch \
  9. } else { \
  10. EG(bailout) = __orig_bailout;
  11. #define zend_end_try() \
  12. } \
  13. EG(bailout) = __orig_bailout; \
  14. }
  15. # define JMP_BUF sigjmp_buf
  16. # define SETJMP(a) sigsetjmp(a, 0)
  17. # define LONGJMP(a,b) siglongjmp(a, b)
  18. # define JMP_BUF sigjmp_buf

展开后:

  1. {
  2. //保存上一个zend_try记录的JMP_BUF,目的是实现多层嵌套try
  3. JMP_BUF *__orig_bailout = EG(bailout);
  4. JMP_BUF __bailout;
  5. //将当前堆栈保存在__bailout
  6. EG(bailout) = &__bailout;
  7. if (SETJMP(__bailout)==0) {
  8. //try中的代码
  9. //抛出异常调用:LONGJMP()
  10. }else { //异常抛出后到这个分支
  11. EG(bailout) = __orig_bailout;
  12. }
  13. EG(bailout) = __orig_bailout;
  14. }