麻豆小视频在线观看_中文黄色一级片_久久久成人精品_成片免费观看视频大全_午夜精品久久久久久久99热浪潮_成人一区二区三区四区

首頁 > 編程 > Regex > 正文

Java中使用正則表達式處理文本數據

2020-03-16 21:02:09
字體:
來源:轉載
供稿:網友
正則表達式就是一個字符串,但和普通的字符串不同的是,正則表達式是對一組相似字符串的抽象。本文將給大家介紹java中使用正則表達式處理文本數據的相關的資料,感興趣的朋友一起看看吧
 

本文將介紹如何在Java中使用正則表達式來處理文本數據。正則表達式就是一個字符串,但和普通的字符串不同的是,正則表達式是對一組相似字符串的抽象,如下面的幾個字符串:

a98b   c0912d   c10b   a12345678d   ab

我們仔細分析上面五個字符串,可以看出它們有一個共同特征,就是第一個字符必須是'a'或'c',最后一個字符必須是'b'或'd',而中間的字符是任意多個數字組成(包括0個數字)。因此,我們可以將這五個字符串的共同特點抽象出來,這就產生了一個正則表達式:[ac]//d*[bd]。而根據這個正則表達式,我們可以寫出無窮多個滿足條件的字符串。

在Java中使用正則表達式的方法非常多,最簡單的就是和字符串一起使用。在String中有四個方法可以使用正則表達式,它們是matches、split、replaceAll和replaceFirst。

一、matches方法

matches方法可以判斷當前的字符串是否匹配給定的正則表達式。如果匹配,返回true,否則,返回false。matches方法的定義如下:

 

復制代碼代碼如下:

public boolean matches(String regex)

 

如上面給出的正則表達式我們可以用如下程序驗證。
 

  1. <!---->String[] ss = new String[]{"a98b""c0912d""c10b""a12345678d""ab"}; 
  2. for(String s: ss) 
  3.  System.out.println(s.matches("[ac]//d*[bd]")); 
?

輸出結果:

true
true
true
true
true

下面簡單解釋一下這個正則表達式的含義。如果我們學過編譯原理的詞法分析,就會很容易理解上面的正則表達式(因為正則表達式的表示方法和詞法分析中的表達式類似)。如在 [...]中的相當于或"|",如[abcd]相當于a|b|c|d,也就是a或b或c或d。如上面的正則表達式的開頭部分是[ac],就代表著字符串的開頭只能是a或c。[bd]表達字符串結尾只能是b或d。而中間的/d表達0-9的數字,由于/在正則表達式中有特殊含義,所以用//來表示/。而*表示有0或無窮多個(這在詞法分析中叫*閉包),由于*跟在/d后面,因此表達有0或無窮多個數字。

二、split方法

split方法使用正則表達式來分割字符串,并以String數組的形式返回分割結果。split有兩種重載形式,它們定義如下:
 

  1. <!---->public String[] split(String regex) 
  2. public String[] split(String regex, int limit) 
?

如下面的代碼將使用split的第一種重載形式來分割HTTP請求頭的第一行,代碼如下:
 

  1. <!---->String s = "GET /index.html HTTP/1.1"
  2. String ss[] = s.split(" +"); 
  3. for(String str: ss) 
  4. System.out.println(str); 
?

輸出結果:

GET
/index.html
HTTP/1.1

在使用split的第一種重載形式時應注意,如果分割后的字符串最后有空串,將被忽略。如使用正則表達式/d來分割字符串a0b1c3456時,得到的數組的長度為3,而不是7。

在split的第二種重載形式中有一個limit參數,要分三種情況討論:

1. 大于0: 如limit的值為n,那么將對正則表達式使用n-1次,下面的代碼:
 

  1. <!---->String s = "a0b1c3456"
  2. String ss[] = s.split("//d", 3); 
  3. for(String str: ss) 
  4.   System.out.println(str); 
?

輸出結果:

a
b
c3456

從輸出結果可以看出,程序只對" a0b1c3456"使用了兩次正則表達式,也就是在少掃描完字符'1'后,不管后面有沒有滿足條件的字符串,都將后面的字符串作為一個整體來作為返回數組的最后一個值。

2. 小于0: 不忽略結尾的空串。也就是上面的例子返回數組的長度應該是7,而不是3。

3. 等于0:這是默認值,相當于split的第一種重載形式。

三、replaceAll 和 replaceFirst方法

為兩個方法的定義如下:
 

  1. public String replaceAll(String regex, String replacement) 
  2. public String replaceFirst(String regex, String replacement) 
?

這兩個方法用replacement替換當前字符串中和regex匹配的字符串。使用方法很簡單,這里不再詳述,感興趣的讀者可以參考相關的文檔。


發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 国产免费黄色 | 色综合久久久久久久久久久 | chinese军人gay呻吟 | 精品一区二区在线观看 | 欧美精品一区二区久久 | h视频在线免费看 | av观看网站 | 久久羞羞视频 | 伊人成人免费视频 | 一区二区三区视频在线观看 | 性欧美在线视频 | 亚洲最大中文字幕 | av电影免费在线 | 国产成人综合在线观看 | 久久久久免费精品 | av日韩一区二区三区 | 免费看成年人网站 | 欧美一级特级 | fc2成人免费人成在线观看播放 | 午夜精品老牛av一区二区三区 | 美女久久| 日韩av片网站 | 亚洲精品成人av在线 | 欧美日韩手机在线观看 | 一级看片免费视频 | 色妞欧美 | av成人在线免费观看 | 成人mm视频在线观看 | 免费的性生活视频 | h视频免费在线 | 精品一区二区三区在线观看国产 | 1级毛片在线观看 | 国产中出在线观看 | 精品xxxx户外露出视频 | 欧美中文字幕一区二区三区亚洲 | 欧美精品亚洲人成在线观看 | 一本色道久久99精品综合蜜臀 | 日韩视频一二区 | 2021免费日韩视频网 | 天天操天天骑 | 欧美成人毛片 |