URL和URI
URL和URLConnection類封裝了大量復雜的實現細節,這些細節涉及如何從遠程站點獲取信息。例如,可以通過傳遞字符串來構建一個URL對象 :
URL url = new URL(String);如果只是想獲得該資源的內容,可以使用URL類中的openStream方法。該方法返回一個InputStream對象,然后就可以按照一般的用法來使用這個對象了,比如用它構建一個Scanner對象。java.net包對統一資源定位符(uniform resource locator,URL)和統一資源標識符(uniform resource identifier,URI)作了非常有用的區分。URI是個純粹的句法結構,用于指定標識Web資源的字符串的各個不同部分。URL是URI的一個特例,它包含了用于定位Web資源的足夠信息 。在Java類庫中,URI類不包含任何用于訪問資源的方法,它的惟一作用就是解析。相反的是,URL類可以打開一個到達資源的流。因此,URL類只能作用于那些Java類庫知道該如何處理的模式,例如http:、https:、ftp:、本地文件系統(file:)和JAR文件(jar:)。
URI規范給出了標記這些標識符的規則 。一個URI具有以下句法 :
[scheme:]schemeSpecificPart[#fragment][ . . . ]表示可選部分,它與:和#可以被包含在標識符內 .包含scheme:部分的URI被稱為絕對URI。否則,被稱為相對URI。如果絕對URI的schemeSpecificPart不是以/開頭的,我們就稱它是不透明的 。所有絕對的透明URI和所有相對URI都是分層的(hierarchical)。一個分層URI的schemeSpecificPart具有以下結構
[//authority][path][?query]對于那些基于服務器的URI,authority部分采用以下形式[user-info@]host[:port]URI類的作用之一是解析標識符并將它分解成各種不同的組成部分 。URI類的另一個作用是處理絕對標識符和相對標識符。http://xxx/a/b/c.html和../a/b/c.html#xxx可以合為http://xxx/a/b/c.html#xxx這個過程被稱為相對URL的轉換( resolving)。 與此相反的過程稱為相對化(relativization)。使用URLConnection獲取信息如果想從某個Web資源獲取更多信息,那么應該使用URLConnection類,它能得到比基本的URL類更多的控制功能。1.調用URL類中的openConnection方法獲得URLConnection對象
URLConnection uc = url.openConnection();2.設置任意的請求屬性 3.調用connect方法連接遠程資源uc.connect();4.與服務器建立連接后,你可以查詢頭信息。 getHeaderFieldKey和getHeaderField兩個方法列舉了消息頭的所有字段getHeaderFields方法返回一個包含了消息頭中所有字段的標準Map對象。5. 最后,訪問資源數據。使用getInputStream方法獲取一個輸入流用以讀取信息(這個輸入流與URL類中的openStream方法所返回的流相同)。另一個方法getContent在實際操作中并不是很有用。在默認情況下建立的連接只有從服務器讀取信息的輸入流,并沒有任何執行寫操作的輸出流。如果想獲得輸出流(例如,向一個Web服務器提交數據),那么你需要調用 uc.setDoOutput(true);接下來,也許想設置某些請求頭(request header)。請求頭是與請求命令一起被發送到服務器的。
setIfModifiedSince方法用于告訴連接你只對自某個特定日期以來被修改過的數據感興趣;setUseCaches和setAllowUserInteraction這兩個方法只作用于Applet;setUseCaches方法用于命令瀏覽器首先檢查它的緩存;setAllowUserInteraction方法則用于在訪問有密碼保護的資源時彈出對話框。setRequestPRoperty,它可以用來設置對特定協議起作用的任何“名-值(name/value)對”。例如,如果你想訪問一個有口令保護的Web頁
1.將用戶名、冒號和口令以字符串形式連接在一起
String string=username+":"+passWord;2.計算上一步驟所得字符串的base64編碼。(base64編碼用于將字節流編碼成可打印的ASCII字符流。)String code =base64Encode(string);3.調用setRequestProperty方法,設置name參數的值為“Authorization”、value參數的值為“ Basic”+encoding .uc.setRequestProperty("Authorization","Basic"+code);一旦調用了connect方法,就可以查詢響應頭信息。首先,我們將介紹如何列舉所有響應頭的字段。似乎是為了展示自己的個性,該操作采用了另一種迭代方式。String key = uc.getHeaderFieldKey(n); 可以獲得響應頭的第n個鍵,其中n從1開始。如果n為0或大于消息頭的字段總數,該方法將返回null值。沒有哪種方法可以返回字段的數量,你必須反復調用getHeaderFieldKey方法直到返回null為止。String value=uc.getHeaderField(n); getHeaderFields方法可以返回一個封裝了響應頭字段的Map對象 。Map<String,List<String>> map = uc.getHeaderFields(); 為了簡便起見,Java提供了6個方法用以訪問大多數常用的消息頭類型的值,并在需要的時候將它們轉換成數字類型。返回類型為long的方法返回的是從格林尼治時間1970年1月1日開始計算的秒數。Date getdate longExpires getExpiration longLast-Modified getLastModified longContent-Length getContentLength intContent-Type getContentType StringContent-Encoding getContentEncoding String 除了base64編碼的計算稍顯復雜之外,程序的其他部分非常簡單明了。有一個類sun.misc.BASE64Encoder,雖然沒有被歸檔,但是可以用它來代替我們在示例程序中提供的類。URL url = new URL("http://www.baidu.com"); URLConnection connection = url.openConnection(); connection.connect(); Map<String,List<String>>map = connection.getHeaderFields(); for(Map.Entry<String, List<String>> a:map.entrySet()){ String b = a.getKey(); for(String c:a.getValue()){ System.out.println(b+":"+c); } } System.out.println(connection.getDate()); System.out.println(connection.getContentLength()); System.out.println(connection.getContentEncoding()); System.out.println(connection.getLastModified()); System.out.println(connection.getContentType()); System.out.println(connection.getExpiration()); Scanner scanner = new Scanner(connection.getInputStream()); while(scanner.hasNextLine()){ System.out.println(scanner.nextLine()); }URLEncoderstatic String encode(String s, String encoding)采用指定的字符編碼模式(推薦使用“ UTF-8”)對字符串s進行編碼,并返回它的URL編碼形式。在URL編碼中, 'A' - 'Z', 'a' - 'z', '0' - '9', '-', '_', '.'和'*'等字符保持不變,空格被編碼成'+',所有其他字符被編碼成"%XY"形式的字節序列,其中0xXY為該字節十六進制數URLDecoderstatic string decode(String s, String encoding) 采用指定編碼模式對已編碼字符串s進行解碼,并返回結果。URLConnectionvoid setDoInput(boolean doInput)boolean getDoInput()如果doInput為true,那么用戶可以接收來自該URLConnection的輸入。void setDoOutput(boolean doOutput)boolean getDoOutput()如果doOutput為true,那么用戶可以將輸出發送到該URLConnection。void setIfModifiedSince(long time)long getIfModifiedSince()屬性ifModifiedSince用于配置URLConnection對象,使它只獲取那些自從某個給定時間以來被修改過的數據。調用方法時需要傳入的time參數指的是從格林尼治時間1970年1月1日午夜開始計算的秒數。void setUseCaches(boolean useCaches)boolean getUseCaches()如果useCaches為true,那么數據可以從本地緩存中得到。請注意, URLConnection本身并不維護這樣一個緩存,緩存必須由瀏覽器之類的外部程序提供。void setAllowUserInteraction(boolean allowUserInteraction)boolean getAllowsUserInteraction()如果allowUserInteraction為true,那么可以查詢用戶的口令。請注意,URLConnection本身并不提供這種查詢功能。查詢必須由瀏覽器或瀏覽器插件之類的外部程序實現。void setConnectTimeout(int timeout) int getConnectTimeout() 設置或得到連接超時時限(單位:毫秒)。如果在連接建立之前就已經達到了超時的時限,那么輸入流的connect方法就會拋出一個SocketTimeoutException異常。void setReadTimeout(int timeout) int getReadTimeout() 5.0設置讀取數據的超時時限(單位:毫秒)。如果在一個讀操作成功之前就已經達到了超時的時限,那么read方法就會拋出一個SocketTimeoutException異常。void setRequestProperty(String key, String value)設置請求頭的一個字段。Map<String,List<String>> getRequestProperties()返回請求頭屬性的一個映射表。相同的鍵對應的所有值被放置在同一個映射表中。void connect()連接遠程資源并獲取響應頭信息。Map<String,List<String>> Map getHeaderFields() 返回響應的一個映射表。相同的鍵對應的所有值被放置在同一個映射表中。String getHeaderFieldKey(int n)得到響應頭第n個字段的鍵。如果n等于0或大于響應頭字段的總數,該方法返回null值。String getHeaderField(int n)得到響應頭第n個字段的值。如果n等于0或大于響應頭字段的總數,該方法返回null值。int getContentLength()如果知道內容長度,則返回該長度值,否則返回-1。String getContentType獲取內容的類型,比如text/plain或image/gif。String getContentEncoding()獲取內容的編碼,比如gzip。這個值不太常用,因為默認的identity編碼并不是用ContentEncoding頭來設定的。long getDate()long getExpiration()long getLastModifed()獲取創建日期、過期日以及最后一次被修改的日期。這些日期指的是從格林尼治時間1970年1月1日午夜開始計算的秒數。InputStream getInputStream()OutputStream getOutputStream()返回從資源讀取信息或向資源寫入信息的流。Object getContent()選擇適當的內容處理器,以便讀取資源數據并將它轉換成對象。該方法不能用于讀取諸如text/plain或image/gif之類的標準內容類型,除非你安裝了自己的內容處理器。
|
新聞熱點
疑難解答