本篇文章給大家帶來的內容是關于php trim函數的詳細解析,有一定的參考價值,有需要的朋友可以參考一下,希望對你有所幫助。
字符串的處理在任何程序中應該是最最常見的了吧。php 的trim函數就是用來去除字符串的字符串。最常用的就是去除空格了。但是,這個簡單的函數,是否真的像你認為的那樣簡單呢?
trim函數的定義如下:
trim是兩邊去除,還有ltrim 從左邊去除,rtrim從右邊去除,在php源碼中,最終都是通過一個函數處理的。所以一下關于trim是對php 內部統一的trim而言。
源碼在ext/standard/string.c中php_trim函數中。
trim函數處理邏輯:
1、判斷是否設置去除內容what,沒設置則去除默認字符串
2、判斷去除內容的長度,分為1個字符,多個字符去除
3、使用model分別與1,2按位與運算,確定是否進行左右去除
去除一個字符的情況:
對于左邊去除,遍歷字符串的每個字符,把第一個與what不相等的字符的位置作為新字符串的起始位置,同時更新長度
對右邊去除,從右邊開始遍歷,找到第一個不等于what的字符,把字符串長度減去遍歷次數。
到這里,新字符串起始位置有了,長度也確定了,然后執行字符串賦復制命令,返回去除之后的字符串
去除多個字符串的情況:
首先使用一個mask數據,用于標記那些需要去除的字符串(mask 可以理解為一個以字符ascii值為鍵值的hash表)。 然后執行操作跟去除一個字符類似,只是結束條件是尋找到第一個不在字符表里的元素。
默認情況:
處理方式跟之前一樣,只是去除內容限制在ascii碼小于32(即空格)的字符。且只去除’/r’,’/t’,’/v’,’/0’,’/n’字符
看到這里,我們所了解到的有一下幾點:
1、trim 默認去除’/r’,’/t’,’/v’,’/0’,’/n’
2、trim 給定單個字符是一個循環操作,循環結束條件是第一個不相等的字符
3、trim 多個字符去除,是循環去除,直到遇到第一個不在列表中的字符。
在來看php_charmask這個函數
中間省略部分可以不看,只是對非法數據的一個錯誤返回。
只要看第一個if的內容。如果字符串假設傳入內容what=‘a…f’。input指針指向a,這個時候滿足if條件,在里面執行的操作相當于把a,b,c,d,e,f內容添加到mask中去。所以所trim是可以指定去除區間的trim(‘abcdefg’,‘a…f’)返回內容只剩下g。
下面幾個實際的輸出更容易理解:
1、trim(‘abcdf’ , ‘fd’); 輸出abc,trim不是按順序的,只要在列表內,統統去掉
2、trim(‘abccdffff’ , ‘f’); 輸出abccd, trim會把所有滿足條件的去掉
3、trim(‘abcdffff’ , ‘a…d’); 輸出內容ffff, trim可以指定區間,但是如果你真的想要去除’a…d’,就不能用trim了
trim去除列表的性質,在多字節處理的時候就會出現問題了,這也就是為什么trim對于中文會產生亂碼。
trim(‘品、’ , ‘、’),‘品’ utf字符十六進制表示為’e5 93 81’, 字符串’、‘的十六進制表示’e3 80 81’。在trim中,按字節計算,utf8中文編碼3個字節表示一個漢字。因此相當于trim去掉內容是三個字符。這三個字符的十六進制表示為’e3 80 81’。所以最終返回字符串的十六進制表示為’e5 93’,因為81已經被去除了。
trim(‘的、’, ‘、’) 就能返回正確結果。因為’的’的十六進制表示’e7 9a 84’。
所以trim并不簡單。要時刻記著,trim是去除列表內的所有字符,遇到第一個非列表字符停止!!
新聞熱點
疑難解答