本文主要介紹了PHP處理url字符串編碼、解碼與解析。下面進行詳細的舉例說明
base64_encode — 使用 MIME base64 對數據進行編碼
base64_encode() returns 使用 base64 對 data 進行編碼。設計此種編碼是為了使二進制數據可以通過非純 8-bit 的傳輸層傳輸,例如電子郵件的主體。
Base64-encoded 數據要比原始數據多占用 33% 左右的空間,代碼如下:
- <?php
- $str = 'This is an encoded string';
- // VGhpcyBpcyBhbiBlbmNvZGVkIHN0cmluZw==
- echo base64_encode($str);
- ?>
base64_decode — 對使用 MIME base64 編碼的數據進行解碼。
base64_decode() 對 encoded_data 進行解碼,返回原始數據,失敗則返回 FALSE。返回的數據可能是二進制的,代碼如下:
- <?php
- $str = 'VGhpcyBpcyBhbiBlbmNvZGVkIHN0cmluZw==';
- // This is an encoded string
- echo base64_decode($str);
- ?>
get_headers — 取得服務器響應一個 HTTP 請求所發送的所有標頭
get_headers() 返回一個數組,包含有服務器響應一個 HTTP 請求所發送的標頭。如果失敗則返回 FALSE 并發出一條 E_WARNING 級別的錯誤信息。
如果將可選的 format 參數設為 1,則 get_headers() 會解析相應的信息并設定數組的鍵名,代碼如下:
- <?php
- $phpha1 = get_headers('http://www.companysz.com');
- $phpha2 = get_headers('http://www.companysz.com', 1);
- print_r($phpha1);
- print_r($phpha2);
- ?>
輸出如下:
- Array
- (
- [0] => HTTP/1.1 200 OK
- [1] => Server: nginx/1.2.2
- [2] => Date: Tue, 06 Nov 2012 10:17:59 GMT
- [3] => Content-Type: text/html; charset=UTF-8
- [4] => Connection: close
- [5] => X-Powered-By: PHP/5.3.8
- [6] => X-Pingback: https://www.companysz.com/xmlrpc.php
- [7] => Via: 10.67.15.26
- [8] => Set-Cookie: saeut=124.127.138.35.1352197078737175; path=/; max-age=311040000
- )
- Array
- (
- [0] => HTTP/1.1 200 OK
- [Server] => nginx/1.2.2
- [Date] => Tue, 06 Nov 2012 10:17:59 GMT
- [Content-Type] => text/html; charset=UTF-8
- [Connection] => close
- [X-Powered-By] => PHP/5.3.8
- [X-Pingback] => https://www.companysz.com/xmlrpc.php
- [Via] => 10.67.15.21
- [Set-Cookie] => saeut=124.127.138.35.1352197079055460; path=/; max-age=311040000
- )
get_meta_tags — 從一個文件中提取所有的 meta 標簽 content 屬性,返回一個數組,可以想象的到,某些網站可以方便的用此函數進行網站SEO信息的提取,代碼如下:
- <?php
- //天涯PHP博客 http://www.companysz.com
- $phpha = get_meta_tags('http://www.companysz.com');
- print_r($phpha);
- ?>
輸出如下:
- Array
- (
- [keywords] => 天涯博客,PHP博客,PHP技術博客,PHP學習博客,PHP開發博客
- [description] => 天涯PHP博客是以PHP為主的學習博客,記載PHPER的學習歷程,關注互聯網最新發展動態。
- [generator] => WordPress 3.2.1
- )
- http_build_query — 生成 URL-encode 之后的請求字符串
- <?php
- $url = array('c'=>'blog', 'a'=>'show', 'id'=>10, 'hello', 'world');
- // c=blog&a=show&id=10&0=hello&1=world
- echo http_build_query($url);
- // c=blog&a=show&id=10&phpha_0=hello&phpha_1=world
- echo http_build_query($url, 'jb51_');
- ?>
- [/code]
這個函數目前我用的最多的地方就是做各種API時,組合請求的url,非常的方便。
另外可以看到,對于數組內數字索引的成員,還可以指定前綴。
parse_url — 解析 URL,返回其組成部分
本函數解析一個 URL 并返回一個關聯數組,包含在 URL 中出現的各種組成部分。本函數不是用來驗證給定 URL 的合法性的,只是將其分解為下面列出的部分。不完整的 URL 也被接受,parse_url() 會嘗試盡量正確地將其解析,代碼如下:
- <?php
- $url = 'http://tianya:[email protected]/hello.php?id=10#nav';
- print_r(parse_url($url));
- ?>
- Array
- (
- [scheme] => http
- [host] => Vevb.com
- [user] => tianya
- [pass] => Vevbcom
- [path] => /hello.php
- [query] => id=10
- [fragment] => nav
- )
rawurlencode — 按照 RFC 1738 對 URL 進行編碼
rawurldecode — 對已編碼的 URL 字符串進行解碼
urlencode — 編碼 URL 字符串
urldecode — 解碼已編碼的 URL 字符串
代碼如下:
- <?php
- $url = 'http://www.companysz.com tianya';
- echo urlencode($url);
- echo '<br />';
- echo rawurlencode($url);
- echo '<br />';
- echo urldecode($url);
- echo '<br />';
- echo rawurldecode($url);
- ?>
輸出如下:
- http%3A%2F%2Fwww.companysz.com+tianya
- http%3A%2F%2Fwww.companysz.com%20tianya
可以看到,urlencode與rawurlencode的區別在于:
urlencode() 會把空格編碼為加號(+),rawurlencode() 則把空格編碼為 %20
urldecode()和rawurldecode() 則為對應的解碼函數。
新聞熱點
疑難解答