編碼表,雙字節(jié)字符編碼范圍:
1. gbk (gb2312/gb18030)
x00-xff gbk雙字節(jié)編碼范圍
xa1-xff 中文 gb2312
x80-xff 中文 gbk
2. utf-8 (unicode)
u4e00-u9fa5 (中文)
x3130-x318f (韓文
xac00-xd7a3 (韓文)
u0800-u4e00 (日文)
- <?
- $str = "中國";
- echo $str;
- echo "<hr>";
- //if (preg_match("/^[".chr(0xa1)."-".chr(0xff)."]+$/", $str)) { //只能在gb2312情況下使用
- if (preg_match("/^[x7f-xff]+$/", $str)) { //兼容gb2312,utf-8
- echo "正確輸入";
- } else {
- echo "錯誤輸入";
- }
- ?>
中文判斷問題,其實有很多學(xué)問,底層的內(nèi)部編碼,涉及utf-8,gbk,gb13800的各種不同。曾經(jīng)研究過如何區(qū)分一個字符是什么字符的問題,關(guān)聯(lián)細節(jié)太多。
新聞熱點
疑難解答