麻豆小视频在线观看_中文黄色一级片_久久久成人精品_成片免费观看视频大全_午夜精品久久久久久久99热浪潮_成人一区二区三区四区

首頁 > 語言 > PHP > 正文

php 檢測字符編碼代碼

2024-09-04 11:47:47
字體:
來源:轉載
供稿:網友
  1. function utf8_gb2312($str$default = 'gb2312'
  2.     $str = preg_replace("/[x01-x7f]+/"""$str); 
  3.     if (emptyempty($str)) return $default
  4.      
  5.     $preg =  array
  6.         "gb2312" => "/^([xa1-xf7][xa0-xfe])+$/"//正則判斷是否是gb2312 
  7.         "utf-8" => "/^[x{4e00}-x{9fa5}]+$/u",      //正則判斷是否是漢字(utf8編碼的條件了),這個范圍實際上已經包含了繁體中文字了 
  8.     ); 
  9.     if ($default == 'gb2312') { 
  10.         $option = 'utf-8'
  11.     } else { 
  12.         $option = 'gb2312'
  13.     } 
  14.     if (!preg_match($preg[$default], $str)) { 
  15.         return $option
  16.     } 
  17.     $str = @iconv($default$option$str); 
  18.      
  19.     //不能轉成 $option, 說明原來的不是 $default 
  20.     if (emptyempty($str)) { 
  21.         return $option
  22.     } 

默認編碼是gb2312,而且我統計了一下,90%的情況下都是gb2312,所以,我的檢測函數不能出現本來是gb2312的,結果被檢測出utf8. 基本思路是:

1. 把所有的ascii去掉,如果全部都是ascii,那么就是gb2312。

2. 假設這個字符串是gb2312,用一個正則檢查它是否是真的gb2312,如果不是,那么就是utf-8

3. 然后,用iconv 把字符串轉換成utf8,如果轉換不成功,那么原來可能不是真正的一個gb2312編碼的字符(用正則匹配我已經盡量精確,但是,gb2312的編碼不是連續的,還是會有空洞),那么最后的編碼就是utf-8.

4. 否則就是gb2312 編碼:加入這樣的檢查功能后,在1000個關鍵字里面,就出現了1個亂碼,比以前的近100個關鍵字亂碼少了很多。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 精品一区二区电影 | 狠狠操电影 | 亚洲一区二区网址 | 免费一级毛片在线播放视频 | 国产青草视频在线观看视频 | 性大片1000免费看 | 手机在线看片国产 | 久国产 | 国产精品久久久久久久久久三级 | 国产黄色录像片 | 日韩精品免费看 | 久草在线高清 | 欧美成人精品一区二区三区 | 91福利影视 | 成人午夜免费看 | 九九热视频这里只有精品 | av之家在线观看 | 黄色影院一级片 | 日本高清在线免费 | 懂色av懂色aⅴ精彩av | 黄色网页在线观看 | 国产精品一区二区三区在线播放 | 4p一女两男做爰在线观看 | 亚洲精品一区中文字幕 | 欧美日韩亚洲不卡 | 日韩黄色片免费看 | 免费观看欧美一级片 | 久啪视频| 欧美精品a∨在线观看不卡 午夜精品影院 | 2级毛片| 99麻豆久久久国产精品免费 | 日韩黄色免费电影 | 欧美在线观看视频一区二区 | 激情综合视频 | 色视频在线观看 | 成人福利视频在线 | 久久久久久久亚洲精品 | 国产理论视频在线观看 | av在线大全 | 精品国产高清一区二区三区 | 青青草华人在线 |