本文實(shí)例講述了正則表達(dá)式教程之匹配單個(gè)字符。分享給大家供大家參考,具體如下:
注:在所有例子中正則表達(dá)式匹配結(jié)果包含在源文本中的【和】之間,有的例子會(huì)使用Java來(lái)實(shí)現(xiàn),如果是java本身正則表達(dá)式的用法,會(huì)在相應(yīng)的地方說(shuō)明。所有java例子都在JDK1.6.0_13下測(cè)試通過(guò)。
java測(cè)試代碼:
/** * 根據(jù)正則表達(dá)式和要匹配的源文本,輸出匹配結(jié)果 * @param regex 正則表達(dá)式 * @param sourceText 要匹配的源文本 */public static void matchAndPrint(String regex, String sourceText){ Pattern pattern = Pattern.compile(regex); Matcher matcher = pattern.matcher(sourceText); while(matcher.find()){ System.out.println(matcher.group()); }}
一、匹配純文本
1、只有一個(gè)匹配結(jié)果
首先來(lái)看一個(gè)簡(jiǎn)單的正則表達(dá)式,today,雖然它本身是純文本,但它是一個(gè)正則表達(dá)式。來(lái)看一個(gè)例子:
源文本:Yesterday is history,tomorrow is a mystery, but today is a gift.
正則表達(dá)式:today
結(jié)果:Yesterday is history,tomorrow is a mystery, but 【today】 is a gift.
分析:這里使用的正則表達(dá)式是純文本,它匹配了源文本中的today。
調(diào)用matchAndPrint方法,輸出結(jié)果是:
today
2、有多個(gè)匹配結(jié)果
源文本:Yesterday is history,tomorrow is a mystery, but today is a gift.
正則表達(dá)式:is
結(jié)果:Yesterday is history,tomorrow is a mystery, but 【today】 is a gift.
分析:在源文本中,有三個(gè)is,但輸出了四個(gè)is,因?yàn)閔istory中的is也會(huì)被匹配到。
調(diào)用matchAndPrint方法,輸出結(jié)果是:
is
is
is
is
3、字母大小寫問(wèn)題
正則表達(dá)式是區(qū)分字母大小寫的,但很多正則表達(dá)式的實(shí)現(xiàn)中也支持不區(qū)分大小寫的匹配操作。在JavaScript中,使用i標(biāo)志來(lái)執(zhí)行一次不區(qū)分字母大小寫的匹配。在java中,如果要不區(qū)分大小寫,那么在編譯正則表達(dá)式時(shí),可以指定:
Patternpattern = Pattern.compile(regex, Pattern.CASE_INSENSITIVE);
二、匹配任意字符
前面見(jiàn)到的正則表達(dá)式都是靜態(tài)的純文本,它們根本體現(xiàn)不出正則表達(dá)式的威力。下面,來(lái)看看如何使用正則表達(dá)式來(lái)匹配不可預(yù)知的字符。
在正則表達(dá)式中,特殊字符(或字符集合)用來(lái)給出要搜索的東西。.字符(英文狀態(tài)句號(hào))可以匹配任何一個(gè)單個(gè)字符。相當(dāng)于DOS中的?字符和SQL中的_(下劃線)字符。如:正則表達(dá)式c.t將匹配cat、cut、cot等等。下面來(lái)看一個(gè)例子。
文本:
orders1.txt
orders2.txt
sales1.txt
salesA.txt
orders3.txt
sales2.txt
sales.txt
正則表達(dá)式:sales.
結(jié)果:
orders1.txt
orders2.txt
【sales1】.txt
【salesA】.txt
orders3.txt
【sales2】.txt
【sales.】txt
分析:正則表達(dá)式sales.將把由字符串sales和另外一個(gè)字條構(gòu)成的文件名找出來(lái),從結(jié)果可以看出,.可以匹配字母、數(shù)字以及它本身。7個(gè)文件中有4個(gè)與這個(gè)模式匹配。
如果調(diào)用matchAndPrint方法,輸出結(jié)果是:
sales1
salesA
sales2
sales.
三、匹配特殊字符
.字符在正則表達(dá)式中有著特殊的含義。如果模式里需要一個(gè).,就要想辦法來(lái)告訴正則表達(dá)式你需要的是.字符本身而不是它在正則表達(dá)式中的特殊含義。為此,必須在.前面加上/字符來(lái)對(duì)它進(jìn)行轉(zhuǎn)義。/也是一個(gè)元字符(metacharacter,表示這個(gè)字符有特殊含義,而不是字符含義本身)。來(lái)看下面這個(gè)例子。
找出na或sa開頭的文件,不管它后面跟的是一個(gè)什么數(shù)字。
文本:
sales.txt
na1.txt
na2.txt
sa1.txt
sanatxt.txt
正則表達(dá)式:.a..txt
結(jié)果:
【sal】es.txt
【na1】.txt
【na2】.txt
【sa1】.txt
【sanatxt】.txt
分析:這個(gè)正則把na1.txt、na2.txt、sa1.txt找出來(lái)了,但是還找到了2個(gè)意料之外的結(jié)果。因?yàn)?a..txt這個(gè)正則中的.字符將與任意一個(gè)字符匹配。要想匹配.字符本身,那么需要使用/轉(zhuǎn)義。把正則修改成.a./.txt,則能夠滿足我們的需求。
注意:如果使用java,那么.a./.txt這個(gè)正則表達(dá)式應(yīng)該寫成.a.//.txt,因?yàn)?在java語(yǔ)言中也是一個(gè)轉(zhuǎn)義字符。
四、總結(jié)
正則表達(dá)式通常簡(jiǎn)稱為模式,它們其實(shí)是一些字符構(gòu)成的字符串。這些字符可以是普通字符(純文本)或元字符(有特殊含義的特殊字符)。這里介紹了如何使用普通字符和元字符去匹配單位字符。.可以匹配任何字符。/用來(lái)對(duì)字符進(jìn)行轉(zhuǎn)義。在正則表達(dá)式中,有特殊含義的字符序列總是以/字符開頭。在接下來(lái)的文章中,我們將介紹如何匹配一組一組字符。
希望本文所述對(duì)大家正則表達(dá)式學(xué)習(xí)有所幫助。
新聞熱點(diǎn)
疑難解答
圖片精選