欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  php教程

PHP中的NOP及为什么有这个opcode

程序员文章站 2022-04-21 19:06:34
...

什么是NOP NOP 是一个特殊的opcode,表示空操作,在很多地方存在,汇编中的NOP含义也一样,机器指令中的空操作通常用来将内存地址进行对齐,以提高CPU访问内存的效率,GCC等编译器也会将特定的语句进行优化而产生空操作。 PHP中的空操作opcode NOP: ZEND_NOP

什么是NOP

NOP 是一个特殊的opcode,表示空操作,在很多地方存在,汇编中的NOP含义也一样, 机器指令中的空操作通常用来将内存地址进行对齐,以提高CPU访问内存的效率, GCC等编译器也会将特定的语句进行优化而产生空操作。

PHP中的空操作opcode NOP: ZEND_NOP

PHP基于Zend虚拟机,其他基于虚拟机的语言中大都会有类似NOP的指令, PHP文档有对此的简单说明:


/* VLD 的输出结果 */
line  #   op  fetch   ext return  operands
6 0   NOP              
7 1   RETURN              1
Function name: A
Compiled variables: none
line  #   op  fetch   ext return  operands
6 0   RETURN              null

上面的VLD结果可以看出,函数A()的声明编译后变成了NOP操作。

Zend虚拟机是高级抽象,不要考虑内存对齐等的问题,为什么还需要空操作这样的opcode呢?

原因简单讲就是:编译过程优化的结果。有的内容由于可以在编译时就可确定(称为提早绑定Early Binding), 那么一部分opcode可以在编译时替换成空操作。

我们来看看这段代码的编译结果:

 > JMPZ                                                     true, ->3
   3     1  >   ZEND_DECLARE_CLASS                               $0      '%00foo%2FUsers%2Freeze%2FOpensource%2Fphp-test%2Fphp-src-5.4%2Ftest.php0x106cd601f', 'foo'
   4     2    > JMP                                                      ->3
   6     3  >   ZEND_FETCH_CLASS                              4  :1      'Bar'
       4      NEW                                                      :1
       5      DO_FCALL_BY_NAME                              0
   7     6      NOP
   9     7    > RETURN

和前面官方函数定义代码一样,上面VLD输出的第7行看到类Bar的opcode变成了NOP,不过请留意第3行, 这一行类Foo定义的opcode是ZEND_DECLARE_CLASS,也就是类的声明。

为什么同样是类的声明,第一个类声明的OPCODE和第二个的不一样呢?

上例中的代码,在Bar类声明之前是可以执行的new Bar,但是此时Bar类的声明并没有执行到, 那为什么可以访问到Bar类呢,这是因为Bar类的声明在编译时就已经完成了, 因为Bar类已经在编译时声明好了,所以在真正执行的时候就不需要再次执行声明类的操作了, 所以它所对应的opcode被替换成NOP了。

而Foo这个类由于处在条件判断块之中,编译期无法确定Foo类是否一定会被执行,所以还是需要在 执行时来声明这个类,所以opcode没有改变。

对于使用了opcode缓存的代码来说,把函数和类的声明移到了编译时,也就减少了执行时的opcode执行, 这能加快代码的执行。

优化

你可能会想,既然类及函数的声明可以优化掉,为什么不能直接丢弃这个opcode呢? 一能减少opcode占用的内容,比如很多的框架中有大量的类定义,也能减少执行时间, 因为空操作并不是0成本的,执行NOP的时候还是需要消耗CPU的。

先看看opcode编译过程的一个重要函数:

zend_op *get_next_op(zend_op_array *op_array TSRMLS_DC)
{
  zend_uint next_op_num = op_array->last++;
  zend_op *next_op;
  if (next_op_num >= CG(context).opcodes_size) {
      if (op_array->fn_flags & ZEND_ACC_INTERACTIVE) {
          /* we messed up */
          zend_printf("Ran out of opcode space!\n"
                      "You should probably consider writing this huge script into a file!\n");
          zend_bailout();
      }
      CG(context).opcodes_size *= 4;
      op_array_alloc_ops(op_array, CG(context).opcodes_size);
  }
  next_op = &(op_array->opcodes[next_op_num]);
  init_op(next_op TSRMLS_CC);
  return next_op;
}

这个函数每次会返回一个zend_op(也就是opcode一个最小单位),opcode的存储空间申请和哈希表类似, 通过预先申请空间的方式,如果空间不足则适当扩容。在编译时,opcode是以文件为单位的,而通常 在一个文件中函数或类声明的个数是不会太多的。而在编译时opcode数组已经是预先申请好的,所以 及时优化掉这个opcode,而实际在编译时的内存占用也不会有任何的优化。

目前只有少数几处使用了ZEND_NOP这个opcode。读者可以参考Zend/zend_compile.c: zend_do_early_binding(), 这个函数进行就是在确定在编译时能确定的函数以及类声明,在完成函数或类的声明后将当前编译的opcode设置为ZEND_NOP。 因为后续在执行是并需要再次对该函数或类进行声明了。

NOTE 当然也并不是所有的全局类或者方法都会进行提早绑定,具体可以参考前面提到的Zend_compile.c文件的实现

在这个函数中其实可以将生成的ZEND_NOP优化掉的,比如eAccelarator扩展中就对opcode进行了优化,将ZEND_NOP从 opcode_array数组中移除了,因为使用了opcode cache扩展优化只进行一次,而执行对多次执行, 这样的优化是值得的。目前Zend引擎并没有进行任何的优化,首先从代码上来看,类和函数声明的数量和其他指令的数量 之间差很多个等级,所以至少这个地方优化的收益是有限的,为了保证Zend引擎的简洁它没有进行优化。

目前APC扩展已经基本确定为将要进入PHP默认opcode缓存的官方扩展了,那么这些优化都可以在扩展中进行, 保证Zend引擎的简单易维护更为重要。