麻豆小视频在线观看_中文黄色一级片_久久久成人精品_成片免费观看视频大全_午夜精品久久久久久久99热浪潮_成人一区二区三区四区

首頁 > 編程 > ASP > 正文

微軟的正則表達式教程(四):限定符和定位符

2024-05-04 11:07:35
字體:
來源:轉載
供稿:網友

限定符

有時候不知道要匹配多少字符。為了能適應這種不確定性,正則表達式支持限定符的概念。這些限定符可以指定正則表達式的一個給定組件必須要出現多少次才能滿足匹配。

下表給出了各種限定符及其含義的說明:

字符 描述
* 匹配前面的子表達式零次或多次。例如,zo* 能匹配 "z" 以及 "zoo"。 * 等價于{0,}。
+ 匹配前面的子表達式一次或多次。例如,'zo+' 能匹配 "zo" 以及 "zoo",但不能匹配 "z"。+ 等價于 {1,}。
? 匹配前面的子表達式零次或一次。例如,"do(es)?" 可以匹配 "do" 或 "does" 中的"do" 。? 等價于 {0,1}。
{n} n 是一個非負整數。匹配確定的 n 次。例如,'o{2}' 不能匹配 "Bob" 中的 'o',但是能匹配 "food" 中的兩個 o。
{n,} n 是一個非負整數。至少匹配n 次。例如,'o{2,}' 不能匹配 "Bob" 中的 'o',但能匹配 "foooood" 中的所有 o。'o{1,}' 等價于 'o+'。'o{0,}' 則等價于 'o*'。
{n,m} mn 均為非負整數,其中n <= m。最少匹配 n 次且最多匹配 m 次。劉, "o{1,3}" 將匹配 "fooooood" 中的前三個 o。'o{0,1}' 等價于 'o?'。請注意在逗號和兩個數之間不能有空格。

對一個很大的輸入文檔而言,章節數很輕易就超過九章,因此需要有一種方法來處理兩位數或者三位數的章節號。限定符就提供了這個功能。下面的JScript 正則表達式可以匹配具有任何位數的章節標題:

/Chapter [1-9][0-9]*/

下面的 VBScript 正則表達式執行同樣的匹配:

"Chapter [1-9][0-9]*"

請注意限定符出現在范圍表達式之后。因此,它將應用于所包含的整個范圍表達式,在本例中,只指定了從 0 到 9 的數字。

這里沒有使用 '+' 限定符,因為第二位或后續位置上并不一定需要一個數字。同樣也沒有使用 '?' 字符,因為這將把章節數限制為只有兩位數字。在 'Chapter' 和空格字符之后至少要匹配一個數字。

如果已知章節數限制只有99 章,則可以使用下面的 JScript 表達式來指定至少有一位數字,但不超過兩個數字。

/Chapter [0-9]{1,2}/

對 VBScript 可以使用下述正則表達式:

"Chapter [0-9]{1,2}"

上述表達式的缺點是如果有一個章節號大于 99,它仍只會匹配前兩位數字。另一個缺點是某些人可以創建一個 Chapter 0,而且仍能匹配。一個更好的用來匹配兩位數的 JScript 表達式如下:

/Chapter [1-9][0-9]?/

或者

/Chapter [1-9][0-9]{0,1}/

對 VBScript 而言,下述表達式與上面等價:

"Chapter [1-9][0-9]?"

或者

"Chapter [1-9][0-9]{0,1}"

'*'、 '+'和 '?' 限定符都稱之為貪婪的,也就是說,他們盡可能多地匹配文字。有時這根本就不是所希望發生的情況。有時則正好希望最小匹配。

例如,你可能要搜索一個 HTML 文檔來查找一處包含在 H1 標記中的章節標題。在文檔中該文字可能具有如下形式:

<H1>Chapter 1 &ndash; Introduction to Regular Expressions</H1>

下面的表達式匹配從開始的小于號 (<) 到 H1 標記結束處的大于號之間的所有內容。

/<.*>/

 VBScript 的正則表達式為:

"<.*>"

如果所要匹配的就是開始的 H1 標記,則下述非貪婪地表達式就只匹配 <H1>。

/<.*?>/

或者

"<.*?>"

通過在 '*'、 '+' 或 '?' 限定符后放置 '?',該表達式就從貪婪匹配轉為了非貪婪或最小匹配。

 

 

定位符

到現在為止,所看到的示例都只考慮查找任何地方出現的章節標題。出現的任何一個字符串 'Chapter' 后跟一個空格和一個數字可能是一個真正的章節標題,也可能是對其他章節的交叉引用。由于真正的章節標題總是出現在一行的開始,因此需要設計一個方法只查找標題而不查找交叉引用。

定位符提供了這個功能。定位符可以將一個正則表達式固定在一行的開始或結束。也可以創建只在單詞內或只在單詞的開始或結尾處出現的正則表達式。下表包含了正則表達式及其含義的列表:

 

 

字符 描述
^ 匹配輸入字符串的開始位置。如果設置了 RegExp 對象的 Multiline 屬性,^ 也匹配 '/n' 或 '/r' 之后的位置。
$ 匹配輸入字符串的結束位置。如果設置了RegExp 對象的 Multiline 屬性,$ 也匹配 '/n' 或 '/r' 之前的位置。
/b 匹配一個單詞邊界,也就是指單詞和空格間的位置。
/B 匹配非單詞邊界。

 

 

不能對定位符使用限定符。因為在一個換行符或者單詞邊界的前面或后面不會有連續多個位置,因此諸如 '^*' 的表達式是不允許的。

要匹配一行文字開始位置的文字,請在正則表達式的開始處使用 '^' 字符。不要把 '^' 的這個語法與其在括號表達式中的語法弄混。它們的語法根本不同。

要匹配一行文字結束位置的文字,請在正則表達式的結束處使用 '$' 字符。

要在查找章節標題時使用定位符,下面的 JScript 正則表達式將匹配位于一行的開始處最多有兩個數字的章節標題:

/^Chapter [1-9][0-9]{0,1}/

VBScript 中相同功能的正則表達式如下:

"^Chapter [1-9][0-9]{0,1}"

一個真正的章節標題不僅出現在一行的開始,而且這一行中也僅有這一個內容,因此,它必然也位于一行的結束。下面的表達式確保所指定的匹配只匹配章節而不會匹配交叉引用。它是通過創建一個只匹配一行文字的開始和結束位置的正則表達式來實現的。

/^Chapter [1-9][0-9]{0,1}$/

對 VBScript 則使用:

"^Chapter [1-9][0-9]{0,1}___FCKpd___16quot;

匹配單詞邊界有少許不同,但卻給正則表達式增加了一個非常重要的功能。單詞邊界就是單詞和空格之間的位置。非單詞邊界就是其他任何位置。下面的 JScript 表達式將匹配單詞 'Chapter' 的前三個字符,因為它們出現在單詞邊界后:

//bCha/

對 VBScript 為:

"/bCha"

這里 '/b' 操作符的位置很關鍵。如果它位于要匹配的字符串的開始,則將查找位于單詞開頭處的匹配;如果它位于改字符串的末尾,則查找位于單詞結束處的匹配。例如,下面的表達式將匹配單詞 'Chapter' 中的 'ter',因為它出現在單詞邊界之前:

/ter/b/

以及

"ter/b"

下面的表達式將匹配 'apt',因為它位于 'Chapter' 中間,但不會匹配 'aptitude' 中的'apt':

//Bapt/

以及

"/Bapt"

這是因為在單詞 'Chapter' 中 'apt' 出現在非單詞邊界位置,而在單詞 'aptitude' 中位于單詞邊界位置。非單詞邊界操作符的位置不重要,因為匹配與一個單詞的開頭或結尾無關。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 国产免费观看av | 性猛aa久久久 | 爽爽视频免费看 | 成人在线观看网 | 精品国产一区二区三区在线观看 | 在线成人av观看 | 欧美爱爱视频免费看 | 免费色片 | 中文字幕在线观看亚洲 | av手机免费在线观看 | 国产一区二区在线观看视频 | 久久草在线看 | 免费亚洲视频在线观看 | www.成人精品 | 在线成人一区 | 久久国产精品久久久久久电车 | 91精品国产日韩91久久久久久360 | 久久久久国产成人免费精品免费 | 欧洲成人一区二区 | 精品在线视频播放 | 视频国产一区二区 | 欧美一级特黄特色大片免费 | 国产男女 爽爽爽爽视频 | 青草久久av| 视频在线亚洲 | 爱性久久久久久久 | 91成人久久| 91美女视频在线观看 | 国产啊v在线观看 | 91色一区二区三区 | 7m视频成人精品分类 | 色999国产 | 亚洲男人的天堂在线视频 | 蜜桃网站在线 | 玩偶姐姐 在线观看 | 日本欧美一区二区 | 色综合视频网 | 久久免费视频精品 | 国产一国产一级毛片视频在线 | 人人看人人艹 | 精品国产91久久久久久 |