大家都知道,json_encode通常會把json中的漢字轉義成unicode,但是這并不一定是我們想要的。有時候,我們需要獲得漢字形式的json字符串,比如需要獲得gbk編碼的json字符串(只要把漢字形式的字符串轉碼就可以得到了)。有什么好辦法么?
php官方聽到了這個需求,并提供了一種可靠的解決方案:JSON_UNESCAPED_UNICODE。這個參數可以保證json_encode不再將漢字轉為unicode。
似乎這樣就解決了?當我們高高興興的用這個參數的時候,發現并沒有什么卵用。仔細一看,這個參數只有5.4之后的php支持。那更早期的php怎么辦呢?
社區提供了一種方案:
function my_json_encode($arr){//convmap since x char codes so it takes all multibyte codes (above ASCII ). So such characters are being "hidden" from normal json_encodingarray_walk_recursive($arr, function (&$item, $key) { if (is_string($item)) $item = mb_encode_numericentity($item, array (x, xffff, , xffff), 'UTF-'); });return mb_decode_numericentity(json_encode($arr), array (x, xffff, , xffff), 'UTF-');}
不過這種方法只有5.3才支持,因為5.2并不支持匿名函數。至于解決辦法?把匿名函數定義一下即可。
ps:解決json_encode中文UNICODE轉碼問題
用PHP的json_encode來處理中文的時候, 中文都會被編碼, 變成不可讀的, 類似”/u***”的格式,如果想漢字不進行轉碼,這里提供三種方法
1.升級PHP,在PHP5.4, 這個問題終于得以解決, Json新增了一個選項: JSON_UNESCAPED_UNICODE, 故名思議, 就是說, Json不要編碼Unicode.
<?phpecho json_encode("中文", JSON_UNESCAPED_UNICODE);//"中文"
2.把漢字先urlencode然后再使用json_encode,json_encode之后再次使用urldecode來解碼,這樣編碼出來的json數組中的漢字就不會出現unicode編碼了。
$array = array('test'=>urlencode("我是測試"));$array = json_encode($array);echo urldecode($array);//{"test":"我是測試"}
3.對unicode碼再進行解碼,解碼函數如下:
function decodeUnicode($str){return preg_replace_callback('/////u([0-9a-f]{4})/i',create_function('$matches','return mb_convert_encoding(pack("H*", $matches[1]), "UTF-8", "UCS-2BE");'),$str);}