麻豆小视频在线观看_中文黄色一级片_久久久成人精品_成片免费观看视频大全_午夜精品久久久久久久99热浪潮_成人一区二区三区四区

首頁 > 編程 > PHP > 正文

php頁面編碼與字符操作

2020-03-22 20:08:00
字體:
來源:轉載
供稿:網友
  • 我們可以用header來定義一個html' target='_blank'>php頁面為utf編碼或GBK編碼,也可以在html中用meta標簽來指定編碼例如:php頁面為utf編碼 header("Content-type: text/html; charset=utf-8");我們通常使用header或meta,下面說一說兩者的區別一、采用meta頁面編碼 用meta來設置頁面編碼
    1 <meta http-equiv="content-type" content="text/html; charset=編碼類型">
    作用是:聲明客戶端瀏覽器用什么字符集編碼顯示該頁面,起到通知瀏覽器的作用。只有字符編碼與瀏覽器編碼相同時才不會造成錯誤而產生亂碼。二、采用header()頁面編碼用header()來設置頁面編碼
    1 header("content-type:text/html; charset=編碼類型"); 
    header是發送原始 HTTP 標頭,作用是把括號里面的信息發到http標頭,瀏覽器會采用header()中設置的編碼。三、AddDefaultCharset方式設置編碼 注意:以前版本的Apache配置時修改AddDefaultCharset這個選項,要改為gb2312或者utf-8,否則漢字會變為亂碼,但從Apache 2.0.53 開始,取消了AddDefaultCharset,現在的新版本會自適應瀏覽器的。所以在apache2.4中是找不到AddDefaultCharset的。文檔中:低版本的Apache的 .conf 文件里,有AddDefaultCharset??梢栽O置defaultcharset 字符編碼(刪除前面的#)。設置完成后相當于在每個文件中加上header("content-type:text/html; charset=字符編碼")。但是和header()還是有區別的(優先級不一樣)

    1:如果頁面沒有指定編碼, Apache配置defaultcharset gbk , 頁面文件編碼是utf-8。

    頁面顯示是亂碼。在頁面沒有meta指明charset,設置defaultcharset gbk,這個時候服務器的設置生效,編碼不一致,造成亂碼;

    2:如果頁面指定編碼為utf-8, Apache配置defaultcharset gbk. 頁面文件編碼是utf-8。

    頁面顯示亂碼。設置defaultcharset gbk,會覆蓋頁面級別(meta)的編碼設置;

    3:如果頁面header申明charset為utf8, Apache配置defaultcharst gbk,頁面文件編碼是utf8。

    頁面顯示正常。這個說明header優先級要高于服務器和瀏覽器的設置;

    4:如果Apache關閉DefaultCharset 。

    頁面顯示正常。

    由此得出結論: header() >>AddDefaultCharset >> meta 所以添加header()是比較好的方法四、編碼轉換函數1:mb_detect_encoding 檢查編碼
    1 $string = "趙亞飛";2 $encode = mb_detect_encoding($string, array("ASCII","UTF-8","GB2312","GBK","BIG5"));3 header("content-Type: text/html; charset=".$encode);4 echo $string;

    有時會出現檢查錯誤(解決辦法)例如:對與GB2312和UTF- 8,或者UTF-8和GBK網上說是由于字符短是,mb_detect_encoding會出現誤判。不是bug,寫程序時也不應當過于依賴mb_detect_encoding,當字符串較短時,檢測結果產生偏差的可能性很大。

    $encode = mb_detect_encoding($keytitle, array('ASCII','GB2312′,'GBK','UTF-8');三個參數分別是:被檢測的輸入變量、編碼方式的檢測順序(如果為真,后面自動忽略)、strict模式
    對編碼檢測的順序進行調整,將最大可能性放在前面,這樣減少被錯誤轉換的機會。一般要先排gb2312,當有GBK和UTF-8時,需要將常用的排列到前面。2:mb_convert_encoding 轉換編碼函數原型:string mb_convert_encoding ( string str, string to_encoding [, mixed from_encoding] )
    例如:
    1 1: 將任意類型( 'ASCII,GB2312,GBK,UTF-8')字符串$html_str轉換成'UTF-8'編碼2      $html_str = mb_convert_encoding($html_str, 'UTF-8', 'ASCII,GB2312,GBK,UTF-8');3 2:gbk To utf-84  < ?php 5     header("content-Type: text/html; charset=Utf-8"); 6     echo mb_convert_encoding("趙亞飛", "UTF-8", "GBK"); 7  ?> 

    注意:使用上面的函數需要安裝但是需要先enable mbstring 擴展庫。在 php.ini里將; extension=php_mbstring.dll 前面的 ;去掉

    mb_convert_encoding 可以指定多種輸入編碼,它會根據內容自動識別,;執行效率比iconv差很多3:iconv轉換編碼iconv函數庫能夠完成各種字符集間的轉換,是php編程中不可缺少的基礎函數庫。
    需要注意一下:iconv在轉換字符有時會出錯,(如果將utf-8轉換為gb2312時,可能會出現字符串被截斷的情況發生。)解決方法:在需要轉成的編碼后加"http://IGNORE" 是iconv函數第二個參數后。如下:
    1  iconv("UTF-8","GB2312//IGNORE",$data) 
    ignore意思是忽略轉換時的錯誤,如果沒有ignore參數,所有該字符后面的字符串都無法被保存(不往下進行轉換)。iconv不是php的默認函數,也不是默認安裝的模塊。需要安裝才能用的。這里有一個自動判斷編碼類型,進行轉化的函數:
     1 function check_encod($encod,$string){ 2          //判斷字符編碼 3         $encode = mb_detect_encoding($string, array("ASCII","UTF-8","GB2312","GBK","BIG5")); 4         var_dump($encode); 5         if($encode != $encod){ 6              $string = iconv($encode, $encod, $string); 7          } 8          return $string; 9  }10 $path = "趙亞飛。.jpg";11 $path = check_encod("GB2312",$path);
    五:字符串截取1:mb_substr() PHP substr()函數可分割文字,但分割的文字如果包括中文字符往往會遇到問題,這時可以用mb_substr()這個函 數,用法與substr()相似,只是在mb_substr()最后要加入多一個參數,以設定字符串的編碼,需要打開php_mbstring.dll,需要在php.ini中把php_mbstring.dll打開。例如:
    1  echo mb_substr('趙亞飛趙亞飛er',0,9);         //輸出:趙亞飛2  echo mb_substr('趙亞飛趙亞飛er',0,9,'utf-8'); //輸出:趙亞飛趙亞飛er

    第一個是以三個字節為一個中文,這就是utf-8編碼的特點,下面加上utf-8字符集說明,是以一個字為單位來截取的

    2:iconv_substr()

    Substr是截取字符的函數,但是很多時候,截取中文卻需要額外處理,原因是中文在UTF-8中占用3個字節,在GB2312中占用2個字節,在截取中隨時存在截取的字符串長度與組成未知,所以給很多人造成了困擾。PHP5開始,iconv_substr函數出現

    1 <?php2       $str='趙z亞y飛f/include';  3       echo substr($str,1,5);4       echo "<br>";5       echo iconv_substr($str,1,5,"UTF-8");  6 ?>  

    這個是在網頁編碼為UTF-8的PHP代碼中使用的截取編碼。如果在UTF-8網頁中使用GB2312或者GBK編碼來截取,會出錯,占用字節不同;反之,在GB2312或GBK網頁中,不能使用UTF-8來進行截取 。由于iconv_substr是按照字符而非占用字節來計算,所以“a”和“葉”均計算為1位。在GB2312或者GBK中,由于占用字節是一樣的,所以可以隨意使用GB2312或GBK編碼來截取,截取結果是一樣的。

    3:兼容良好的截取字符串的函數

     1 function msub_str($str, $start=0, $length, $charset="utf-8", $suffix=true){ 2         if(function_exists("mb_substr")) 3                 return mb_substr($str, $start, $length, $charset); 4         else if(function_exists('iconv_substr')) { 5                 return iconv_substr($str,$start,$length,$charset); 6         } 7         $re['utf-8'] = "/[/x01-/x7f]|[/xc2-/xdf][/x80-/xbf]|[/xe0-/xef][/x80-/xbf]{2}|[/xf0-/xff][/x80-/xbf]{3}/"; 8         $re['gb2312'] = "/[/x01-/x7f]|[/xb0-/xf7][/xa0-/xfe]/"; 9         $re['gbk'] = "/[/x01-/x7f]|[/x81-/xfe][/x40-/xfe]/";10         $re['big5'] = "/[/x01-/x7f]|[/x81-/xfe]([/x40-/x7e]|/xa1-/xfe])/";11         preg_match_all($re[$charset], $str, $match);12         $slice = join("",array_slice($match[0], $start, $length));13         if($suffix) {14                 return $slice."…";15          }16         return $slice;17  }
    PHP編程

    鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。

  • 發表評論 共有條評論
    用戶名: 密碼:
    驗證碼: 匿名發表
    主站蜘蛛池模板: 亚洲成人在线免费观看 | 黄色一级电影网 | 91看片免费版 | 午夜丰满少妇高清毛片1000部 | 亚洲一区免费观看 | 久久久在线 | 99精彩视频在线观看 | 日韩精品| 一本色道久久久888 国产一国产精品一级毛片 国产精品高潮视频 | 夏目友人帐第七季第一集 | 精品一区二区三区免费 | 激情亚洲一区二区三区 | 色网站免费观看 | 国产精品免费小视频 | 久久成人免费网站 | 久久国产精品二国产精品 | hd性videos意大利复古 | 色吧综合网 | 成人在线影视 | 色网站免费观看 | av中文字幕免费在线观看 | 亚洲九色 | 毛片免| 毛片免费看网站 | 国产乱淫av| 男女牲高爱潮免费视频男女 | 国产欧美在线一区二区三区 | 一级毛片电影网 | 国产激情视频在线 | 中文字幕在线网站 | 91社区电影 | 国产资源在线免费观看 | 奇米888一区二区三区 | 97中文字幕在线观看 | 久久精品视频2 | 黄色一级片在线观看 | 干少妇av| 大胆在线日本aⅴ免费视频 美国黄色毛片女人性生活片 | 成人国产免费观看 | 欧美福利视频一区二区三区 | 一级免费观看 |