今天寫代碼時遇到一個中文字符串截取的問題,原來簡單的想直接用substr()來,但這個是在單字節符下用的,對于多字節編碼的漢字或是其它語言字符中,這個函數就不能能用了,容易截出亂碼來!
現在做下工作記錄和總結分享:
問題產生及使用案例網站:天氣預報15天查詢(http://tqybw.net)
問題時間:2013-10-20
解決思路:把漢字按一個漢字在編碼下按其在完整性正則分割成數組,再根據需要取截取長度;
1、實現方法函數
開啟mbstring擴展,然后自定義函數:
<?php header('content-Type:text/html:charset=utf-8'); function substr_chinese($str, $start, $length = null) { return join("", array_slice( preg_split("//u", $str, -1, PREG_SPLIT_NO_EMPTY), $start, $length) ); } //實例 $str = "中國地圖全圖"; echo substr_utf8($str, 0, 4); //輸出: 中國地圖 ?>
2、主要函數功能說明preg_split:
對于初學者來說,大家對 說明 array preg_split ( string $pattern, string $subject [, int $limit [, int $flags]] )
返回一個數組,包含 subject 中沿著與 pattern 匹配的邊界所分割的子串。
如果指定了 limit,則最多返回 limit 個子串,如果 limit 是 -1,則意味著沒有限制,可以用來繼續指定可選參數 flags。
flags 可以是下列標記的任意組合(用按位或運算符 | 組合):
PREG_SPLIT_NO_EMPTY
如果設定了本標記,則 preg_split() 只返回非空的成分。
PREG_SPLIT_DELIM_CAPTURE
如果設定了本標記,定界符模式中的括號表達式也會被捕獲并返回。本標記添加于 PHP 4.0.5。
PREG_SPLIT_OFFSET_CAPTURE
如果設定了本標記,如果設定本標記,對每個出現的匹配結果也同時返回其附屬的字符串偏移量。注意這改變了返回的數組的值,使其中的每個單元也是一個數組,其中第一項為匹配字符串,第二項為其在 subject 中的偏移量。本標記自 PHP 4.3.0 起可用。
提示
如果不需要正則表達式的功能,可以選擇使用更快(也更簡單)的替代函數如 explode() 或 str_split()。
3、array_slice說明:
array_slice() 函數在數組中根據條件取出一段值,并返回。
<?php $a=array(0=>"Dog",1=>"Cat",2=>"Horse",3=>"Bird"); print_r(array_slice($a,1,2)); ?> 輸出:Array ( [0] => Cat [1] => Horse )PHP編程
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。
新聞熱點
疑難解答