欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

深入剖析PHP7内核源码(一)- PHP架构与生命周期

程序员文章站 2022-08-02 10:42:14
PHP7 为什么这么快? 全新的zval 更节约的空间,栈上分配内存 zend_string 存储字符串的Hash值,数组查询的时候不需要进行Hash计算 在HashTable桶内直接存数据,减少了内存的申请次数,提升了cache命中率和内存访问速度 zend_parse_parameters改为了 ......

php7 为什么这么快?

  • 全新的zval 更节约的空间,栈上分配内存
  • zend_string 存储字符串的hash值,数组查询的时候不需要进行hash计算
  • 在hashtable桶内直接存数据,减少了内存的申请次数,提升了cache命中率和内存访问速度
  • zend_parse_parameters改为了宏实现,性能提升5%
  • 增加opcode指令 call_user_function,is_init/string/array,strlen,defined函数变成opcode指令,速度更快
  • 排序算法的改进

php7 架构

深入剖析PHP7内核源码(一)- PHP架构与生命周期

  • zend 引擎:zend引擎为php提供了基础服务,包括词法分析 语法分析 ,ast抽象语法树编译 opcodes执行,php的变量设计、内存管理、进程管理。
  • php层:绑定了sapi层并处理与它的通信,它同时对safe_mode和open_basedir的检测提供一致的控制层,将fopen()、fread()和fwrite()等用户空间的函数与文件和网络i/o联系起来。
  • sapi:包括了cli fpm等,把接口对外接口都抽象出来,只要遵守sapi协议便可以实现一个server。
  • 拓展:zend 引擎提供了核心能力和接口规范,在此基础上可以开发拓展

这里的拓展分为了两种,通常在php.ini中,通过extension=加载的扩展我们称为php扩展,通过zend_extension=加载的扩展我们称为zend扩展,但从源码的角度来讲,php扩展应该称为“模块”(源码中以module命名),而zend扩展称为“扩展”(源码中以extension命名)。两者最大的区别在于向引擎注册的钩子,向用户层面提供一些c实现的php函数,需要用到zend_module_entry(即作为php扩展),而需要hook到zend引擎的话,就得用到zend_extension(即作为zend扩展)。

php7执行流程

深入剖析PHP7内核源码(一)- PHP架构与生命周期

  1. 词法分析,把源代码切割成多个字符串单元(token)
  2. 语法分析器把token转换成ast抽象语法树
  3. 抽象语法树转换成opcodes(opcode指令集合)
  4. 虚拟机解释执行执行opcodes(opcode是一组指令标识,对应handler处理函数)

执行实例

词法分析
<?php 
echo "hello world";

切割成了4部分

<?php  => #define t_open_tag 379

echo => #define t_echo 328

空格 =>  #define t_whitespace 382

"hello world" => #define t_constant_encapsed_string 323
语法分析

单独存在的词块不能完整表达语义,还需要语法分析器,它会检查语法,匹配token,对token进行关联,组织串联后的产物就是ast.ast 分为多种类型,对应php语法,比如赋值语句,生成的抽象语法树节点是zend_ast_assign,赋值语句的左右会被作为zend_ast_assign类型节点的孩子(ast是php7才加入的,解耦了编译器和解释器).

opcodes

opcode是php执行过程中的中间代码,生成后由虚拟机执行,生成的opcode是类似下面的样子

line     op
1        echo
2        return

源码中对应的opcode及handler

zend_echo // handler:zend_echo_spec_const_handler 实现的功能是输出"hello world"
zend_return  // handler:zend_return_spec_const_handler

php 生命周期

cli生命周期

深入剖析PHP7内核源码(一)- PHP架构与生命周期

  • php_module_startup:注册全局变量gpc等,加载内部拓展和外部拓展。
  • php_request_startup:重置垃圾回收器,初始化执行器,初始化扫描器,设置超时时间等。
  • php_execute_script
=> compile_file
=> open_file_for_scanning(读取php代码内容,并使词法分析指针指向第一个位置) 
=> zendparse(词法分析语法分析后生成ast) => init_op_array(初始化op_array) 
=> zend_compile_top_stmt(把ast转为op_array) 
=> pass_two(设置op_array对应的zend虚拟机handler) 
=> 生成op_array
=> zend_execute(zend虚拟机中执行op_array)
  • php_request_shutdown:调用所有关闭函数,调用所有析构函数,输出缓冲区内容,重置最大执行时间,关闭输出层(http头等),释放所有request的全局变量
  • php_module_shutdown:调用module对应的flush函数,清理持久化的符号表,销毁全局变量,关闭所有拓展,关闭内存管理,关闭输出output,析构垃圾回收

fpm模式的生命周期

深入剖析PHP7内核源码(一)- PHP架构与生命周期

  • fpm跟cli模式不同的是,fpm是常驻内存的,所以php_module_startup只在启动进程的时候做一次初始化,对应的php_module_shutdown也只做一次。
  • 进入循环,调用fcgi_accept_request(accept) 阻塞等待,如果请求进来,则进入php_request_startup,初始化请求,同时加了锁来防止惊群效应
fcgi.c 
...
fcgi_lock(req->listen_socket); 
req->fd = accept(listen_socket, (struct sockaddr *)&sa, &len);
fcgi_unlock(req->listen_socket);

引用

  • php7的性能优化总结
  • php扩展与zend扩展区别
  • 《php7 底层设计与源码实现》 陈雷等