近日被問到PHP中empty和isset函數(shù)時怎么判斷變量的,剛開始我是一臉懵逼的,因為我自己也只是一知半解,為了弄懂其真正的原理,趕緊翻開源碼研究研究。經(jīng)過分析可發(fā)現(xiàn)兩個函數(shù)調(diào)用的都是同一個函數(shù),因此本文將對兩個函數(shù)一起分析。
我在github有對PHP源碼更詳細的注解。感興趣的可以圍觀一下,給個star。PHP5.4源碼注解。可以通過commit記錄查看已添加的注解。
函數(shù)使用格式emptybool empty ( mixed $var )
判斷變量是否為空。
bool isset ( mixed $var [ , mixed $... ] )
判斷變量是否被設(shè)置且不為NULL。
參數(shù)說明對于empty,在PHP5.5版本以前,empty只支持變量參數(shù),其他類型的參數(shù)會導(dǎo)致解析錯誤,比如函數(shù)調(diào)用的結(jié)果不能作為參數(shù)。
對于isset,如果變量被如unset的函數(shù)設(shè)為NULL,則函數(shù)會返回false。如果多個參數(shù)被傳遞到isset函數(shù),那么只有所有參數(shù)都被設(shè)置isset函數(shù)才會返回true。從左到右計算,一旦遇到?jīng)]被設(shè)置的變量就停止。
運行示例$result = empty(0); // true$result = empty(null); // true$result = empty(false); // true$result = empty(array()); // true$result = empty('0'); // true$result = empty(1); // false$result = empty(callback function); // 報錯$a = null;$result = isset($a); // false;$a = 1;$result = isset($a); // true;$a = 1;$b = 2;$c = 3;$result = isset($a, $b, $c); // true
$a = 1;$b = null;$c = 3;$result = isset($a, $b, $c); // false找到函數(shù)的定義位置
實際上,empty不是一個函數(shù),而是一個語言結(jié)構(gòu)。語言結(jié)構(gòu)是在PHP程序運行前編譯好的,因此不能像之前那樣簡單地搜索'PHP_FUNCTION empty'或'ZEND_FUNCTION empty'查看其源碼。要想看empty等語言結(jié)構(gòu)的源碼,先要理解PHP代碼執(zhí)行的機制。
PHP執(zhí)行代碼會經(jīng)過4個步驟,其流程圖如下所示:
在第一個階段,即Scanning階段,程序會掃描zend_language_scanner.l文件將代碼文件轉(zhuǎn)換成語言片段。對于isset和empty函數(shù)來說,在zend_language_scanner.l文件中搜索empty和isset可以得到函數(shù)在此文件中的宏定義如下:
<ST_IN_SCRIPTING>'isset' {return T_ISSET;}<ST_IN_SCRIPTING>'empty' {return T_EMPTY;}
接下來就到了Parsing階段,這個階段,程序?qū)_ISSET和T_EMPTY等Tokens轉(zhuǎn)換成有意義的表達式,此時會做語法分析,Tokens的yacc保存在zend_language_parser.y文件中,可以找到T_ISSET和T_EMPTY的定義:
internal_functions_in_yacc:T_ISSET '(' isset_variables ')' { $$ = $3; }| T_EMPTY '(' variable ')' { zend_do_isset_or_isempty(ZEND_ISEMPTY, &$$, &$3 TSRMLS_CC); }| T_INCLUDE expr { zend_do_include_or_eval(ZEND_INCLUDE, &$$, &$2 TSRMLS_CC); }| T_INCLUDE_ONCE expr { zend_do_include_or_eval(ZEND_INCLUDE_ONCE, &$$, &$2 TSRMLS_CC); }| T_EVAL '(' expr ')' { zend_do_include_or_eval(ZEND_EVAL, &$$, &$3 TSRMLS_CC); }| T_REQUIRE expr { zend_do_include_or_eval(ZEND_REQUIRE, &$$, &$2 TSRMLS_CC); }| T_REQUIRE_ONCE expr { zend_do_include_or_eval(ZEND_REQUIRE_ONCE, &$$, &$2 TSRMLS_CC); };
isset和empty函數(shù)最終都執(zhí)行了zend_do_isset_or_isempty函數(shù),繼續(xù)查找
grep -rn 'zend_do_isset_or_isempty'
可以發(fā)現(xiàn),此函數(shù)在zend_compile.c文件中定義。
1、解析參數(shù)
2、檢查是否為可寫變量
3、如果是變量的op_type是IS_CV(編譯時期的變量),則設(shè)置其opcode為ZEND_ISSET_ISEMPTY_VAR;否則從active_op_array中獲取下一個op值,根據(jù)其op值設(shè)置last_op的opcode。
4、設(shè)置了opcode之后,之后會交給zend_excute執(zhí)行。
IS_CV是編譯器使用的一種cache機制,這種變量保存著它被引用的變量的地址,當(dāng)一個變量第一次被引用的時候,就會被CV起來,以后這個變量的引用就不需要再去查找active符號表了。
對于empty函數(shù),到了opcode的步驟后,參閱opcode處理函數(shù),可以知道,isset和empty在excute的時候執(zhí)行的是ZEND_ISSET_ISEMPTY_VAR等一系列函數(shù),以ZEND_ISSET_ISEMPTY_VAR_SPEC_CV_VAR_HANDLER為例,找到這個函數(shù)的定義在zend_vm_execute.h。查看函數(shù)可以知道,empty函數(shù)的最終執(zhí)行函數(shù)是i_zend_is_true(),而i_zend_is_true函數(shù)定義在zend_execute.h。i_zend_is_true函數(shù)的核心代碼如下:
switch (Z_TYPE_P(op)) { case IS_NULL: result = 0; break; case IS_LONG: case IS_BOOL: case IS_RESOURCE: // empty參數(shù)為整數(shù)時非0的話就為false result = (Z_LVAL_P(op)?1:0); break; case IS_DOUBLE: result = (Z_DVAL_P(op) ? 1 : 0); break; case IS_STRING: if (Z_STRLEN_P(op) == 0 || (Z_STRLEN_P(op)==1 && Z_STRVAL_P(op)[0]=='0')) { // empty('0') == true result = 0; } else { result = 1; } break; case IS_ARRAY: // empty(array) 是根據(jù)數(shù)組的數(shù)量來判斷 result = (zend_hash_num_elements(Z_ARRVAL_P(op))?1:0); break; case IS_OBJECT: if(IS_ZEND_STD_OBJECT(*op)) { TSRMLS_FETCH(); if (Z_OBJ_HT_P(op)->cast_object) { zval tmp; if (Z_OBJ_HT_P(op)->cast_object(op, &tmp, IS_BOOL TSRMLS_CC) == SUCCESS) { result = Z_LVAL(tmp); break; } } else if (Z_OBJ_HT_P(op)->get) { zval *tmp = Z_OBJ_HT_P(op)->get(op TSRMLS_CC); if(Z_TYPE_P(tmp) != IS_OBJECT) { /* for safety - avoid loop */ convert_to_boolean(tmp); result = Z_LVAL_P(tmp); zval_ptr_dtor(&tmp); break; } } } result = 1; break; default: result = 0; break; }
這段代碼比較直觀,函數(shù)沒有對檢測值做任何的轉(zhuǎn)換,通過這段代碼來進一步分析示例中的empty函數(shù)做分析:
empty(null),到IS_NULL分支,result=0,i_zend_is_true() == 0,!i_zend_is_true() == 1,因此返回true。
empty(false),到IS_BOOL分支,result = ZLVAL_P(false) = 0,i_zend_is_true() == 0,!i_zend_is_true() == 1,因此返回true。
empty(array()),到IS_ARRAY分支,result = zend_hash_num_elements(Z_ARRVAL_P(op)) ? 1 : 0),zend_hash_num_elements返回數(shù)組元素的數(shù)量,array為空,因此result為0,i_zend_is_true() == 0,!i_zend_is_true() == 1,因此返回true。
empty('0'),到IS_STRING分支,因為Z_STRLENP(op) == 1 且 Z_STRVAL_P(op)[0] == '0',因此result為0,i_zend_is_true() == 0,!i_zend_is_true() == 1,因此返回true。
empty(1),到IS_LONG分支,result = Z_LVAL_P(op) = 1,i_zend_is_true == 1,!i_zend_is_true() == 0,因此返回false。
對于isset函數(shù),最終實現(xiàn)判斷的代碼是:
if (isset && Z_TYPE_PP(html' target='_blank'>value) != IS_NULL) { ZVAL_BOOL(&EX_T(opline->result.var).tmp_var, 1);} else { ZVAL_BOOL(&EX_T(opline->result.var).tmp_var, 0);}
只要value被設(shè)置了且不為NULL,isset函數(shù)就返回true。
小結(jié)這次閱讀這兩個函數(shù)的源碼,學(xué)習(xí)到了:
1、PHP代碼在編譯期間的執(zhí)行步驟
2、如何查找PHP語言結(jié)構(gòu)的源碼位置
3、如何查找opcode處理函數(shù)的具體函數(shù)
學(xué)無止境,每個人都有自己的短板,只有通過不斷學(xué)習(xí)才能將自己的短板補上。
原創(chuàng)文章,文筆有限,才疏學(xué)淺,文中若有不正之處,萬望告知。
如果本文對你有幫助,請點下推薦吧,謝謝^_^
最后再安利一下,我在github有對PHP源碼更詳細的注解。感興趣的可以圍觀一下,給個star。PHP5.4源碼注解??梢酝ㄟ^commit記錄查看已添加的注解。
參考文章
opcode處理函數(shù)查找:http://www.laruence.com/2008/06/18/221.html
PHPopcode深入理解及PHP代碼執(zhí)行步驟:http://www.php-internals.com/book/?p=chapt02/02-03-03-from-opcode-to-handler
更多源碼文章,歡迎訪問個人主頁繼續(xù)查看:hoohack
PHP編程鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯(lián)系我們修改或刪除,多謝。
新聞熱點
疑難解答
圖片精選