4.3 循环结构

实际应用中有许多具有规律性的重复操作,因此在程序中就需要重复执行某些语句。循环结构是在一定条件下反复执行某段程序的流程结构,被反复执行的程序被称为循环体。循环语句是由循环体及循环的终止条件两部分组成的。

PHP中的循环结构有4种:while、for、foreach、do while,接下来我们分析下这几个结构的具体的实现。

4.3.1 while循环

while循环的语法:

  1. while(expression)
  2. {
  3. statement;//循环体
  4. }

while的结构比较简单,由两部分组成:expression、statement,其中expression为循环判断条件,当expression为true时重复执行statement,具体的语法规则:

  1. statement:
  2. ...
  3. | T_WHILE '(' expr ')' while_statement { $$ = zend_ast_create(ZEND_AST_WHILE, $3, $5); }
  4. ...
  5. ;
  6. while_statement:
  7. statement { $$ = $1; }
  8. | ':' inner_statement_list T_ENDWHILE ';' { $$ = $2; }
  9. ;

从while语法规则可以看出,在解析时会创建一个ZEND_AST_WHILE节点,expression、statement分别保存在两个子节点中,其AST如下:

4.3 循环结构 - 图1

while编译的过程也比较简单,比较特别的是while首先编译的是循环体,然后才是循环判断条件,更像是do while,编译过程大致如下:

  • (1) 首先编译一条ZEND_JMP的opcode,这条opcode用来跳到循环判断条件expression的位置,由于while是先编译循环体再编译循环条件,所以此时还无法确定具体的跳转值;
  • (2) 编译循环体statement;编译完成后更新步骤(1)中ZEND_JMP的跳转值;
  • (3) 编译循环判断条件expression;
  • (4) 编译一条ZEND_JMPNZ的opcode,这条opcode用于循环判断条件执行完以后跳到循环体的,如果循环条件成立则通过此opcode跳到循环体开始的位置,否则继续往下执行(即:跳出循环)。

具体的编译过程:

  1. void zend_compile_while(zend_ast *ast)
  2. {
  3. zend_ast *cond_ast = ast->child[0];
  4. zend_ast *stmt_ast = ast->child[1];
  5. znode cond_node;
  6. uint32_t opnum_start, opnum_jmp, opnum_cond;
  7. //(1)编译ZEND_JMP
  8. opnum_jmp = zend_emit_jump(0);
  9. zend_begin_loop(ZEND_NOP, NULL);
  10. //(2)编译循环体statement,opnum_start为循环体起始位置
  11. opnum_start = get_next_op_number(CG(active_op_array));
  12. zend_compile_stmt(stmt_ast);
  13. //设置ZEND_JMP opcode的跳转值
  14. opnum_cond = get_next_op_number(CG(active_op_array));
  15. zend_update_jump_target(opnum_jmp, opnum_cond);
  16. //(3)编译循环条件expression
  17. zend_compile_expr(&cond_node, cond_ast);
  18. //(4)编译ZEND_JMPNZ,用于循环条件成立时跳回循环体开始位置:opnum_start
  19. zend_emit_cond_jump(ZEND_JMPNZ, &cond_node, opnum_start);
  20. zend_end_loop(opnum_cond);
  21. }

编译后opcode整体如下:

4.3 循环结构 - 图2

运行时首先执行ZEND_JMP,跳到while条件expression处开始执行,然后由ZEND_JMPNZ对条件的执行结果进行判断,如果条件成立则跳到循环体statement起始位置开始执行,如果条件不成立则继续向下执行,跳出while,第一次循环执行以后将不再执行ZEND_JMP,后续循环只有靠ZEND_JMPNZ控制跳转,循环体执行完成后接着执行循环判断条件,进行下一轮循环的判断。

Note: 实际执行时可能会省略ZEND_JMPNZ这一步,这是因为很多while条件expression执行完以后会对下一条opcode进行判断,如果是ZEND_JMPNZ则直接根据条件成立与否进行快速跳转,不需要再由ZEND_JMPNZ判断,比如:

$a = 123; while($a > 100){ echo “yes”; } $a > 100对应的opcode:ZEND_IS_SMALLER,执行时发现$a与100类型可以直接比较(都是long),则直接就能知道循环条件的判断结果,这种情况下将会判断下一条opcode是否为ZEND_JMPNZ,是的话直接设置下一条要执行的opcode,这样就不需要再单独执行依次ZEND_JMPNZ了。

上面的例子如果$a = '123';就不会快速进行处理了,而是按照正常的逻辑调用ZEND_JMPNZ。

4.3.2 do while循环

do while与while非常相似,唯一的区别在于do while第一次执行时不需要判断循环条件。

do while循环的语法:

  1. do{
  2. statement;//循环体
  3. }while(expression)

do while编译过程与while的基本一致,不同的地方在于do while没有ZEND_JMP这条opcode:

  1. void zend_compile_do_while(zend_ast *ast)
  2. {
  3. zend_ast *stmt_ast = ast->child[0];
  4. zend_ast *cond_ast = ast->child[1];
  5. znode cond_node;
  6. uint32_t opnum_start, opnum_cond;
  7. //(1)编译循环体statement,opnum_start为循环体起始位置
  8. opnum_start = get_next_op_number(CG(active_op_array));
  9. zend_compile_stmt(stmt_ast);
  10. //(2)编译循环判断条件expression
  11. opnum_cond = get_next_op_number(CG(active_op_array));
  12. zend_compile_expr(&cond_node, cond_ast);
  13. //(3)编译ZEND_JMPNZ
  14. zend_emit_cond_jump(ZEND_JMPNZ, &cond_node, opnum_start);
  15. }

编译后的结果:

4.3 循环结构 - 图3

运行时首先执行循环体statement,然后执行循环判断条件,如果条件成立跳到循环体起始位置,否则结束循环。

4.3.3 for循环

for循环语法:

  1. for (init expr; condition expr; loop expr){
  2. statement
  3. }

init expr在循环开始前无条件执行一次,后面循环不再执行;condition expr在每次循环开始前运算,是循环的判断条件,如果值为true,则继续循环,执行循环体,如果值为false,则终止循环;loop expr在每次循环体执行完以后被执行。

for的语法规则:

  1. statement:
  2. ...
  3. | T_FOR '(' for_exprs ';' for_exprs ';' for_exprs ')' for_statement
  4. { $$ = zend_ast_create(ZEND_AST_FOR, $3, $5, $7, $9); }
  5. ...
  6. ;

从语法规则可以看出,for被编译为ZEND_AST_FOR节点,包含4个子节点,分别为:expr1、expr2、expr3、statement。

4.3 循环结构 - 图4

for的编译与while类似,只是多了init expr、loop expr两部分,编译过程大致如下:

  • (1) 首先编译初始化表达式:init expr;
  • (2) 编译一条ZEND_JMP的opcode,此opcode用于跳到条件expression位置,具体跳转值需要后面才能确定;
  • (3) 编译循环体statement;
  • (4) 编译loop expr;然后设置步骤(2)中ZEND_JMP的跳转值;
  • (5) 编译循环条件:condition expr;
  • (6) 编译一条ZEND_JMPNZ,此opcode用于循环条件成立时跳到循环体起始位置。

具体编译过程:

  1. void zend_compile_for(zend_ast *ast)
  2. {
  3. zend_ast *init_ast = ast->child[0];
  4. zend_ast *cond_ast = ast->child[1];
  5. zend_ast *loop_ast = ast->child[2];
  6. zend_ast *stmt_ast = ast->child[3];
  7. znode result;
  8. uint32_t opnum_start, opnum_jmp, opnum_loop;
  9. //(1)编译init expression
  10. zend_compile_expr_list(&result, init_ast);
  11. zend_do_free(&result);
  12. //(2)编译ZEND_JMP
  13. opnum_jmp = zend_emit_jump(0);
  14. //opnum_start是循环体起始位置
  15. opnum_start = get_next_op_number(CG(active_op_array));
  16. //(3)编译循环体
  17. zend_compile_stmt(stmt_ast);
  18. //(4)编译loop expression
  19. opnum_loop = get_next_op_number(CG(active_op_array));
  20. zend_compile_expr_list(&result, loop_ast);
  21. zend_do_free(&result);
  22. //设置ZEND_JMP跳转值
  23. zend_update_jump_target_to_next(opnum_jmp);
  24. //(5)编译循环条件expression
  25. zend_compile_expr_list(&result, cond_ast);
  26. zend_do_extended_info();
  27. //(6)编译ZEND_JMPNZ
  28. zend_emit_cond_jump(ZEND_JMPNZ, &result, opnum_start);
  29. }

最终编译结果:

4.3 循环结构 - 图5

运行时首先执行初始化表达式:init expression,然后执行ZEND_JMP跳到循环条件expression处,如果条件成立则执行ZEND_JMPNZ跳到循环体起始位置依次执行循环体、loop expression,如果条件不成立则终止循环,第一次循环之后就是:循环条件->ZEND_JMPNZ->循环体->loop expression之间循环了。

4.3.4 foreach循环

foreach是PHP针对数组、对象提供的一种遍历方式,foreach语法:

  1. foreach (array_expression as $key => $value){
  2. statement
  3. }

遍历arraiy_expression时每次循环会把当前单元的值赋给$value,当前单元的键值赋给$key,其中$key可以省略,$value前也可以加”&”表示引用单元的值。

foreach的语法规则:

  1. statement:
  2. ...
  3. //省略key的规则: foreach($array as $v){ ... }
  4. | T_FOREACH '(' expr T_AS foreach_variable ')' foreach_statement
  5. { $$ = zend_ast_create(ZEND_AST_FOREACH, $3, $5, NULL, $7); }
  6. //有key的规则: foreach($array as $k=>$v){ ... }
  7. | T_FOREACH '(' expr T_AS foreach_variable T_DOUBLE_ARROW foreach_variable ')' foreach_statement
  8. { $$ = zend_ast_create(ZEND_AST_FOREACH, $3, $7, $5, $9); }
  9. ...
  10. ;

foreach在编译阶段解析为ZEND_AST_FOREACH节点,包含4个子节点,分别表示:遍历的数组或对象、遍历的value、遍历的key以及循环体,生成的AST类似这样:

4.3 循环结构 - 图6

如果value是指向数组或对象成员的引用,则value对应的节点类型为ZEND_AST_REF

相对上面几种常规的循环结构,foreach的实现略显复杂:$key、$value实际就是两个普通的局部变量,遍历的过程就是对两个局部变量不断赋值、更新的过程,以数组为例,首先将数组拷贝一份用于遍历(只拷贝zval,value还是指向同一份),从arData第一个元素开始,把Bucket.zval.value值赋值给$value,把Bucket.key(或Bucket.h)赋值给$key,然后更新迭代位置:将下一个元素的位置记录在zval.u2.fe_iter_idx中,这样下一轮遍历时直接从这个位置开始,这也是遍历前为什么要拷贝一份zval用于遍历的原因,如果发现zval.u2.fe_iter_idx已经到达arData末尾了则结束遍历,销毁一开始拷贝的zval。举个例子来看:

  1. $arr = array(1,2,3);
  2. foreach($arr as $k=>$v){
  3. echo $v;
  4. }

局部变量对应的内存结构:

4.3 循环结构 - 图7

如果value是引用则在循环前首先将原数组或对象重置为引用类型,然后新分配一个zval指向这个引用,后面的过程就与上面的一致了,仍以上面的例子为例,如果是:foreach($arr as $k=>&$v){ ... }则:

4.3 循环结构 - 图8

了解了foreach的实现、运行机制我们再回头看下其编译过程:

  • (1) 编译拷贝数组、对象操作的指令:ZEND_FE_RESET_R,如果value是引用则是ZEND_FE_RESET_RW。执行时如果发现遍历的变量不是数组、对象,则抛出一个warning,然后跳出循环,所以这条指令还需要知道跳出的位置,这个位置需要编译完foreach以后才能确定;
  • (2) 编译fetch数组/对象当前单元key、value的opcode:ZEND_FE_FETCH_R,如果是引用则是ZEND_FE_FETCH_RW,此opcode还需要知道当遍历已经到达数组末尾时跳出遍历的位置,与步骤(1)的opcode相同,另外还有一个关键操作,前面已经说过遍历的key、value实际就是普通的局部变量,它们的内存存储位置正是在这一步分配确定的,分配过程与普通局部变量的过程完全相同,如果value不是一个CV变量(比如:foreach($arr as $v[“xx”]){…})则还会编译其它操作的opcode;
  • (3) 如果foreach定义了key则编译一条赋值opcode,此操作是对key进行赋值;
  • (4) 编译循环体statement;
  • (5) 编译跳回遍历开始位置的opcode:ZEND_JMP,一次遍历结束时会跳回步骤(2)编译的opcode处进行下次遍历;
  • (6) 设置步骤(1)、(2)两条opcode跳过的opcode数;
  • (7) 编译ZEND_FE_FREE,此操作用于释放步骤(1)”拷贝”的数组。

最终编译后的结构:

4.3 循环结构 - 图9

运行时的步骤:

  • (1) 执行ZEND_FE_RESET_R,过程上面已经介绍了;
  • (2) 执行ZEND_FE_FETCH_R,此opcode的操作主要有三个:检查遍历位置是否到达末尾、将数组元素的value赋值给$value、将数组元素的key赋值给一个临时变量(注意与value不同);
  • (3) 如果定义了key则执行ZEND_ASSIGN,将key的值从临时变量赋值给$key,否则跳到步骤(4);
  • (4) 执行循环体的statement;
  • (5) 执行ZEND_JMPNZ跳回步骤(2);
  • (6) 遍历结束后执行ZEND_FE_FREE释放数组。

PHP中还有几个与遍历相关的函数:

  • current() - 返回数组中的当前单元
  • each() - 返回数组中当前的键/值对并将数组指针向前移动一步
  • end() - 将数组的内部指针指向最后一个单元
  • next() - 将数组中的内部指针向前移动一位
  • prev() - 将数组的内部指针倒回一位