3.3.4 全局execute_data和opline

Zend执行器在opcode的执行过程中,会频繁的用到execute_data和opline两个变量,execute_data为zend_execute_data结构,opline为当前执行的指令。普通的处理方式在执行每条opcode指令的handler时,会把execute_data地址作为参数传给handler使用,使用时先从当前栈上获取execute_data地址,然后再从堆上获取变量的数据,这种方式下Zend执行器展开后是下面这样:

  1. ZEND_API void execute_ex(zend_execute_data *ex)
  2. {
  3. zend_execute_data *execute_data = ex;
  4. while (1) {
  5. int ret;
  6. if (UNEXPECTED((ret = ((opcode_handler_t)execute_data->opline->handler)(execute_data)) != 0)) {
  7. if (EXPECTED(ret > 0)) {
  8. execute_data = EG(current_execute_data);
  9. } else {
  10. return;
  11. }
  12. }
  13. }
  14. }

执行器实际是一个大循环,从第一条opcode开始执行,execute_data->opline指向当前执行的指令,执行完以后指向下一条指令,opline类似eip(或rip)寄存器的作用。通过这个循环,ZendVM完成opcode指令的执行。opcode执行完后以后指向下一条指令的操作是在当前handler中完成,也就是说每条执行执行完以后会主动更新opline,这里会有下面几个不同的动作:

  1. #define ZEND_VM_CONTINUE() return 0
  2. #define ZEND_VM_ENTER() return 1
  3. #define ZEND_VM_LEAVE() return 2
  4. #define ZEND_VM_RETURN() return -1

ZEND_VM_CONTINUE()表示继续执行下一条opcode;ZEND_VM_ENTER()/ZEND_VM_LEAVE()是调用函数时的动作,普通模式下ZEND_VM_ENTER()实际就是return 1,然后execute_ex()中会将execute_data切换到被调函数的结构上,对应的,在函数调用完成后ZEND_VM_LEAVE()会return 2,再将execute_data切换至原来的结构;ZEND_VM_RETURN()表示执行完成,返回-1给execute_ex(),比如exit,这时候execute_ex()将退出执行。下面看一个具体的例子:

  1. $a = "hi~";
  2. echo $a;

执行过程如下图所示:

3.3.4 全局execute_data和opline - 图1

以ZEND_ASSIGN这条赋值指令为例,其handler展开前如下:

  1. static ZEND_OPCODE_HANDLER_RET ZEND_FASTCALL ZEND_ASSIGN_SPEC_CV_CONST_HANDLER(ZEND_OPCODE_HANDLER_ARGS)
  2. {
  3. USE_OPLINE
  4. ...
  5. ZEND_VM_NEXT_OPCODE_CHECK_EXCEPTION();
  6. }

所有opcode的handler定义格式都是相同的,其参数列表通过ZEND_OPCODE_HANDLER_ARGS宏定义,展开后实际只有一个execute_data,展开后:

  1. static int ZEND_ASSIGN_SPEC_CV_CONST_HANDLER(zend_execute_data *execute_data)
  2. {
  3. //USE_OPLINE
  4. const zend_op *opline = execute_data->opline;
  5. ...
  6. //ZEND_VM_NEXT_OPCODE_CHECK_EXCEPTION()
  7. execute_data->opline = execute_data->opline + 1;
  8. return 0;
  9. }

从这个例子可以很清楚的看到,执行完以后会将execute_data->opline加1,也就是指向下一条opcode,然后返回0给execute_ex(),接着执行器在下一次循环时执行下一条opcode,依次类推,直至所有的opcode执行完成。这个处理过程比较简单,并没有不好理解的地方,而且整个过程看起来也都那么顺理成章。PHP7针对execute_data、opline两个变量的存储位置进行了优化,那就是使用全局寄存器保存这两个变量的地址,以实现更高效率的读取。这种方式下execute_data、opline直接从寄存器读取地址,在性能上大概有5%的提升(官方说法)。在分析PHP7的优化之前,我们先简单介绍下什么是寄存器变量。

寄存器变量存放在CPU的寄存器中,使用时,不需要访问内存直接从寄存器中读写,与存储在内存中的变量相比,寄存器变量具有更快的访问速度,在计算机的存储层次中,寄存器的速度最快,其次是内存,最慢的是硬盘。C语言中使用关键字register来声明局部变量为寄存器变量,需要注意的是,只有局部自动变量和形式参数才能够被定义为寄存器变量,全局变量和局部静态变量都不能被定义为寄存器变量。而且,一个计算机中寄存器数量是有限的,一般为2到3个,因此寄存器变量的数量不能太多。对于在一个函数中说明的多于2到3个的寄存器变量,C编译程序会自动地将寄存器变量变为自动变量。 受硬件寄存器长度的限制,寄存器变量只能是char、int或指针型,而不能使其他复杂数据类型。由于register变量使用的是硬件CPU中的寄存器,寄存器变量无地址,所以不能使用取地址运算符”&”求寄存器变量的地址。

GCC从4.8.0版本开始支持了另外一项特性:全局寄存器变量(Global Register Variables,详细介绍),也就是可以把全局变量定义为寄存器变量,从而可以实现函数间共享数据。可以通过下面的语法告诉编译器使用寄存器来保存数据:

  1. register int *foo asm ("r12"); //r12、%r12

或者:

  1. register int *foo __asm__ ("r12"); //r12、%r12

这里r12就是指定使用的寄存器,它必须是运行平台上有效的寄存器,这样就可以像使用普通的变量一样使用foo,但是foo同样没有地址,也就是无法通过&获取它的地址,在gdb调试时也无法使用foo符号,只能使用对应的寄存器获取数据。举个例子来看:

  1. //main.c
  2. #include <stdlib.h>
  3. typedef struct _execute_data {
  4. int ip;
  5. }zend_execute_data;
  6. register zend_execute_data* execute_data __asm__ ("%r14");
  7. int main(void)
  8. {
  9. execute_data = (zend_execute_data *)malloc(sizeof(zend_execute_data));
  10. execute_data->ip = 9999;
  11. return 0;
  12. }

编译:$ gcc -o main -g main.c,然后通过gdb看下:

  1. $ gdb main
  2. (gdb) break main
  3. (gdb) r
  4. Starting program: /home/qinpeng/c/php/main
  5. Breakpoint 1, main () at main.c:12
  6. 12 execute_data = (zend_execute_data *)malloc(sizeof(zend_execute_data));
  7. (gdb) n
  8. 13 execute_data->ip = 9999;
  9. (gdb) n
  10. 15 return 0;

这时我们就无法再像普通变量那样直接使用execute_data访问数据,只能通过r14寄存器读取:

  1. (gdb) p execute_data
  2. Missing ELF symbol "execute_data".
  3. (gdb) info register r14
  4. r14 0x601010 6295568
  5. (gdb) p ((zend_execute_data *)$r14)->ip
  6. $3 = 9999

了解完全局寄存器变量,接下来我们再回头看下PHP7中的用法,处理也比较简单,就是在execute_ex()执行各opcode指令的过程中,不再将execute_data作为参数传给handler,而是通过寄存器保存execute_data及opline的地址,handler使用时直接从全局变量(寄存器)读取,执行完再把下一条指令更新到全局变量。

该功能需要GCC 4.8+支持,默认开启,可以通过 —disable-gcc-global-regs 编译参数关闭。以x86_64为例,execute_data使用r14寄存器,opline使用r15寄存器:

  1. //file: zend_execute.c line: 2631
  2. # define ZEND_VM_FP_GLOBAL_REG "%r14"
  3. # define ZEND_VM_IP_GLOBAL_REG "%r15"
  4. //file: zend_vm_execute.h line: 315
  5. register zend_execute_data* volatile execute_data __asm__(ZEND_VM_FP_GLOBAL_REG);
  6. register const zend_op* volatile opline __asm__(ZEND_VM_IP_GLOBAL_REG);

execute_data、opline定义为全局变量,下面看下execute_ex()的变化,展开后:

  1. ZEND_API void execute_ex(zend_execute_data *ex)
  2. {
  3. const zend_op *orig_opline = opline;
  4. zend_execute_data *orig_execute_data = execute_data;
  5. //将当前execute_data、opline保存到全局变量
  6. execute_data = ex;
  7. opline = execute_data->opline
  8. while (1) {
  9. ((opcode_handler_t)opline->handler)();
  10. if (UNEXPECTED(!opline)) {
  11. execute_data = orig_execute_data;
  12. opline = orig_opline;
  13. return;
  14. }
  15. }
  16. }

这个时候调用各opcode指令的handler时就不再传入execute_data的参数了,handler使用时直接从全局变量读取,仍以上面的赋值ZEND_ASSIGN指令为例,handler展开后:

  1. static int ZEND_ASSIGN_SPEC_CV_CONST_HANDLER(void)
  2. {
  3. ...
  4. //ZEND_VM_NEXT_OPCODE_CHECK_EXCEPTION()
  5. opline = execute_data->opline + 1;
  6. return;
  7. }

当调用函数时,会把execute_data、opline更新为被调函数的,然后回到execute_ex()开始执行被调函数的指令:

  1. # define ZEND_VM_ENTER() execute_data = EG(current_execute_data); LOAD_OPLINE(); ZEND_VM_CONTINUE()

展开后:

  1. //ZEND_VM_ENTER()
  2. execute_data = execute_data->current_execute_data;
  3. opline = execute_data->opline;
  4. return;

这两种处理方式并没有本质上的差异,只是通过全局寄存器变量提升了一些性能。

Note: automake编译时的命令是cc,而不是gcc,如果更新gcc后发现PHP仍然没有支持这个特性,请检查下cc是否指向了新的gcc