深入理解PHP中的empty和isset函数
近日被问到php中empty和isset函数时怎么判断变量的,刚开始我是一脸懵逼的,因为我自己也只是一知半解,为了弄懂其真正的原理,赶紧翻开源码研究研究。经过分析可发现两个函数调用的都是同一个函数,因此本文将对两个函数一起分析。
我在github有对php源码更详细的注解。感兴趣的可以围观一下,给个star。php5.4源码注解。可以通过commit记录查看已添加的注解。
函数使用格式
empty
bool empty ( mixed $var )
判断变量是否为空。
isset
bool isset ( mixed $var [ , mixed $... ] )
判断变量是否被设置且不为null。
参数说明
对于empty,在php5.5版本以前,empty只支持变量参数,其他类型的参数会导致解析错误,比如函数调用的结果不能作为参数。
对于isset,如果变量被如unset的函数设为null,则函数会返回false。如果多个参数被传递到isset函数,那么只有所有参数都被设置isset函数才会返回true。从左到右计算,一旦遇到没被设置的变量就停止。
运行示例
$result = empty(0); // true $result = empty(null); // true $result = empty(false); // true $result = empty(array()); // true $result = empty('0'); // true $result = empty(1); // false $result = empty(callback function); // 报错 $a = null; $result = isset($a); // false; $a = 1; $result = isset($a); // true; $a = 1;$b = 2;$c = 3; $result = isset($a, $b, $c); // true $a = 1;$b = null;$c = 3; $result = isset($a, $b, $c); // false
找到函数的定义位置
实际上,empty不是一个函数,而是一个语言结构。语言结构是在php程序运行前编译好的,因此不能像之前那样简单地搜索"php_function empty"或"zend_function empty"查看其源码。要想看empty等语言结构的源码,先要理解php代码执行的机制。
php执行代码会经过4个步骤,其流程图如下所示:
在第一个阶段,即scanning阶段,程序会扫描zend_language_scanner.l文件将代码文件转换成语言片段。对于isset和empty函数来说,在zend_language_scanner.l文件中搜索empty和isset可以得到函数在此文件中的宏定义如下:
<st_in_scripting>"isset" { return t_isset; } <st_in_scripting>"empty" { return t_empty; }
接下来就到了parsing阶段,这个阶段,程序将t_isset和t_empty等tokens转换成有意义的表达式,此时会做语法分析,tokens的yacc保存在zend_language_parser.y文件中,可以找到t_isset和t_empty的定义
internal_functions_in_yacc: t_isset '(' isset_variables ')' { $$ = $3; } | t_empty '(' variable ')' { zend_do_isset_or_isempty(zend_isempty, &$$, &$3 tsrmls_cc); } | t_include expr { zend_do_include_or_eval(zend_include, &$$, &$2 tsrmls_cc); } | t_include_once expr { zend_do_include_or_eval(zend_include_once, &$$, &$2 tsrmls_cc); } | t_eval '(' expr ')' { zend_do_include_or_eval(zend_eval, &$$, &$3 tsrmls_cc); } | t_require expr { zend_do_include_or_eval(zend_require, &$$, &$2 tsrmls_cc); } | t_require_once expr { zend_do_include_or_eval(zend_require_once, &$$, &$2 tsrmls_cc); } ;
isset和empty函数最终都执行了zend_do_isset_or_isempty函数,继续查找
grep -rn "zend_do_isset_or_isempty"
可以发现,此函数在zend_compile.c文件中定义。
函数执行步骤
1、解析参数
2、检查是否为可写变量
3、如果是变量的op_type是is_cv(编译时期的变量),则设置其opcode为zend_isset_isempty_var;否则从active_op_array中获取下一个op值,根据其op值设置last_op的opcode。
4、设置了opcode之后,之后会交给zend_excute执行。
源码解读
is_cv是编译器使用的一种cache机制,这种变量保存着它被引用的变量的地址,当一个变量第一次被引用的时候,就会被cv起来,以后这个变量的引用就不需要再去查找active符号表了。
对于empty函数,到了opcode的步骤后,参阅opcode处理函数,可以知道,isset和empty在excute的时候执行的是zend_isset_isempty_var等一系列函数,以zend_isset_isempty_var_spec_cv_var_handler为例,找到这个函数的定义在zend_vm_execute.h。查看函数可以知道,empty函数的最终执行函数是i_zend_is_true(),而i_zend_is_true函数定义在zend_execute.h。i_zend_is_true函数的核心代码如下:
switch (z_type_p(op)) { case is_null: result = 0; break; case is_long: case is_bool: case is_resource: // empty参数为整数时非0的话就为false result = (z_lval_p(op)?1:0); break; case is_double: result = (z_dval_p(op) ? 1 : 0); break; case is_string: if (z_strlen_p(op) == 0 || (z_strlen_p(op)==1 && z_strval_p(op)[0]=='0')) { // empty("0") == true result = 0; } else { result = 1; } break; case is_array: // empty(array) 是根据数组的数量来判断 result = (zend_hash_num_elements(z_arrval_p(op))?1:0); break; case is_object: if(is_zend_std_object(*op)) { tsrmls_fetch(); if (z_obj_ht_p(op)->cast_object) { zval tmp; if (z_obj_ht_p(op)->cast_object(op, &tmp, is_bool tsrmls_cc) == success) { result = z_lval(tmp); break; } } else if (z_obj_ht_p(op)->get) { zval *tmp = z_obj_ht_p(op)->get(op tsrmls_cc); if(z_type_p(tmp) != is_object) { /* for safety - avoid loop */ convert_to_boolean(tmp); result = z_lval_p(tmp); zval_ptr_dtor(&tmp); break; } } } result = 1; break; default: result = 0; break; }
这段代码比较直观,函数没有对检测值做任何的转换,通过这段代码来进一步分析示例中的empty函数做分析:
empty(null),到is_null分支,result=0,i_zend_is_true() == 0,!i_zend_is_true() == 1,因此返回true。
empty(false),到is_bool分支,result = zlval_p(false) = 0,i_zend_is_true() == 0,!i_zend_is_true() == 1,因此返回true。
empty(array()),到is_array分支,result = zend_hash_num_elements(z_arrval_p(op)) ? 1 : 0),zend_hash_num_elements返回数组元素的数量,array为空,因此result为0,i_zend_is_true() == 0,!i_zend_is_true() == 1,因此返回true。
empty('0'),到is_string分支,因为z_strlenp(op) == 1 且 z_strval_p(op)[0] == '0',因此result为0,i_zend_is_true() == 0,!i_zend_is_true() == 1,因此返回true。
empty(1),到is_long分支,result = z_lval_p(op) = 1,i_zend_is_true == 1,!i_zend_is_true() == 0,因此返回false。
对于isset函数,最终实现判断的代码是:
if (isset && z_type_pp(value) != is_null) { zval_bool(&ex_t(opline->result.var).tmp_var, 1); } else { zval_bool(&ex_t(opline->result.var).tmp_var, 0); }
只要value被设置了且不为null,isset函数就返回true。
小结
这次阅读这两个函数的源码,学习到了:
1、php代码在编译期间的执行步骤
2、如何查找php语言结构的源码位置
3、如何查找opcode处理函数的具体函数
学无止境,每个人都有自己的短板,只有通过不断学习才能将自己的短板补上。
原创文章,文笔有限,才疏学浅,文中若有不正之处,万望告知。
如果本文对你有帮助,请点下推荐吧,谢谢^_^
以上这篇深入理解php中的empty和isset函数就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。
下一篇: php通过文件头判断格式的方法