3.5 运行时缓存

在本节开始之前我们先分析一个例子:

  1. class my_class {
  2. public $id = 123;
  3. public function test() {
  4. echo $this->id;
  5. }
  6. }
  7. $obj = new my_class;
  8. $obj->test();
  9. $obj->test();
  10. ...

这个例子定义了一个类,然后多次调用同一个成员方法,这个成员方法功能很简单:输出一个成员属性,根据前面对成员属性的介绍可以知道其查找过程为:”首先根据对象找到所属zend_class_entry,然后再根据属性名查找zend_class_entry.properties_info哈希表,得到zend_property_info,最后根据属性结构的offset定位到属性值的存储位置”,概括一下这个过程就是:zend_object->zend_class_entry->properties_info->属性值,那么问题来了:每次执行my_class::test()时难道上面的过程都要完整走一遍吗?

我们再仔细看下这个过程,字面量”id”在”$this->id”此条语句中就是用来索引属性的,不管执行多少次它的任务始终是这个,那么有没有一种办法将”id”与查找到的zend_class_entry、zend_property_info.offset建立一种关联关系保存下来,这样再次执行时直接根据”id”拿到前面关联的这两个数据,从而避免多次重复相同的工作呢?这就是本节将要介绍的内容:运行时缓存。

在执行期间,PHP经常需要根据名称去不同的哈希表中查找常量、函数、类、成员方法、成员属性等,因此PHP提供了一种缓存机制用于缓存根据名称查找到的结果,以便再次执行同一opcode时直接复用上次缓存的值,无需重复查找,从而提高执行效率。

开始提到的那个例子中会缓存两个东西:zend_class_entry、zend_property_info.offset,此缓存可以认为是opcode操作的缓存,它只属于”$this->id”此语句的opcode:这样再次执行这条opcode时就直接取出上次缓存的两个值。

所以运行时缓存机制是在同一opcode执行多次的情况下才会生效,特别注意这里的同一opcode指的并不是opcode值相同,而是指内存里的同一份数据,比如:echo $a; echo $a;这种就不算,因为这是两条opcode。

那么缓存是如何保存和索引的呢?执行opcode时如何知道缓存的位置?

实际上运行时缓存是基于所属opcode中CONST操作数存储的,也就是说只有包含IS_CONST类型的操作数才有可能用到此机制,其它类型都不会用到,这是因为只有CONST操作数是固定不变的,其它CV、VAR等类型值都不是固定的,既然其值是不固定的那么缓存的值也就不是固定的,所以不会针对CONST以外类型的opcode操作进行缓存,还是以开始那个例子为例,比如:echo $this->$var;这种,操作数类型是CV,其正常查找时的zend_property_info是随$var值而变的,所以给他们建立一种不可变的关联关系,而:echo $this->id;中”id”是固定写死的,它索引到zend_property_info始终是不变的。

缓存的存储格式是一个数组,用于保存缓存的数据指针,而指针在数组中的起始存储位置则保存在CONST操作数对应的zval.u2.cache_slot中(前面讲过,CONST操作数对应值的zval保存在zend_op_array->literals数组中)。上面那个例子对应的缓存结构:

3.5 运行时缓存 - 图1

  • (1) 第一次执行echo $this->id;时首先根据$this取出zend_class_entry,然后根据“id”查找zend_class_entry.properties_info找到属性zend_property_info,取出此结构的offset,第一次执行后将zend_class_entry及offset保存到了test()函数的zend_op_array->run_time_cache中,占用16字节,起始位置为0,这个值记录在“id”的zval.u2.cache_slot中;
  • (2) 之后再次执行echo $this->id;时直接根据opline从zend_op_literals中取出“id”的zval,得到缓存数据保存位置:0,然后去zend_op_array->run_time_cache取出缓存的zend_class_entry、offset。

这个例子缓存数据占用了16字节(2个sizeof(void*))大小的空间,而有的只需要8字节,取决于操作类型:

  • 8字节:常量、函数、类
  • 16字节:成员属性、成员方法、类常量

另外一个问题是这些操作数的缓存位置(zval.u2.cache_slot)是在什么阶段确定的呢?实际上这个值是在编译阶段确定的,通过zend_op_array.cache_size记录缓存可用起始位置,编译过程中如果发现当前操作适用缓存机制,则根据缓存数据的大小从cache_size开始分配8或16字节给那个操作数,cache_size向后移动对应大小,然后将起始位置保存于CONST操作数的zval.u2.cache_slot中,执行时直接根据这个值确定缓存位置。

具体缓存的读写通过以下几个宏完成:

  1. //设置缓存
  2. CACHE_PTR(Z_CACHE_SLOT_P(EX_CONSTANT(opline->op1/2)), ptr); //ptr: 缓存的数据指针
  3. //读取缓存
  4. CACHED_PTR(Z_CACHE_SLOT_P(EX_CONSTANT(opline->op1/2)));
  5. //EX_CONSTANT(opline->op1/2)是取当前IS_CONST操作数对应数据的zval

展开后:

  1. ((void**)((char*)execute_data->run_time_cache + (num)))[0]

execute_data->run_time_cache缓存的zend_op_array->run_time_cache