關(guān)于Perl里面正則表達(dá)式規(guī)范
2020-10-31 15:20:41
供稿:網(wǎng)友
1,定界符
=~ m/there/;
=~ s/there/here/;
還有類型的定界符:
=~ /there/
=~ m#there#;
=~ s#there#here#;
=~ m(there);
=~ s(there)(here);
=~ m{there};
=~ s{there}{here};
=~ m[there];
=~ s[there][here];
=~ m,there,;
=~ s,there,here,;
=~ m.there.;
=~ s.there.here.;
=~ m|there|;
=~ s|there|here|;
=~ m'there';
=~ s'there'here';
2,修改符
修改符一般放在語句最后一個正斜杠(或者其他分隔符)的后面,修改符還可在匹配范式內(nèi)定義,這是用(? 修改符)來實(shí)現(xiàn)的。
/x 允許在范式中加上注釋和額外的空白字符,以提高程序的可讀性。
/i 允許不分大小寫的匹配范式。
/s 單行方式,決定了圓點(diǎn) . 是否匹配換行符,使用了/s,圓點(diǎn)就匹配換行符,否則就不匹配。
比如:
#!/usr/bin/perl
use strict;
use warnings;
my $string = "./n.";
print "The original string is: $string/n";
my $num = $string =~ s|(.)|#|sg;
print "$num occurences change, and be changed to: $string/n"; exit;
/m 多行方式,決定了脫字號 ^ 和美圓符 $ 是否匹配換行符,如果不用/s,^和$只能定位在字串的開始和結(jié)束處,它們并不匹配嵌入的換行符,這種情況等同于/A和/Z,否則不僅僅匹配字串的開始和結(jié)束,也匹配剛好處在嵌入換行符前后的一個位置。
/o 僅僅一次計(jì)算表達(dá)式的值
/e 將替代字符串作為一個表達(dá)式(僅僅在替代操作時有效)
/g 是一個全局修改符。另外,/g與while使用能在字串的所有匹配中進(jìn)行遍歷。修改符/G必須與/g一起使用,用來匹配前一個/g匹配的停止位置。
如
#!/usr/bin/perl
use strict;
use warnings;
my $string = "~32sda13dAZ.'sDa#!3_C-!";
print "The original string is: $string/n";
my $num = $string =~ s./w.#.g;
print "$num occurences change, and be changed to: $string/n";
exit;
3,正則里一些特殊字符
() 將表達(dá)式結(jié)組
[] 尋找一組字符
/d 等于 [0-9]
/D 等于 [^0-9]
/w 等于 [0-9A-Za-z_]
/W 等于 [^0-9A-Za-z_]
/s 等于 [/f/n/r/t ]
/S 等于 [^/f/n/r/t ]
. 等于 [^/n]
4,關(guān)于一些特殊符號
/b 不屬于空白字符,向前縮進(jìn)一個字符
/t 屬于空白字符,匹配制表符
/r 屬于空白字符,匹配回車符
/a 不屬于空白字符,匹配鬧鐘符
/e 不屬于空白字符,匹配轉(zhuǎn)義符
/033 不屬于空白字符,匹配八進(jìn)制符
/x1B 不屬于空白字符,匹配十六進(jìn)制符
/c[ 不屬于空白字符,匹配控制字符
屬于空白字符,匹配空格
屬于空白字符,匹配制表符
/f 屬于空白字符,匹配換頁符
/n 屬于空白字符,匹配換行符
/0 不屬于空白字符,功能不詳
/c 不屬于空白字符,功能不詳
/x 不屬于空白字符,功能不詳
5,注意正則里的選擇符的特殊性
選擇運(yùn)算符是所有運(yùn)算符中優(yōu)先級最低的,這意味著它最后執(zhí)行。
6,正則里的限定符的一些經(jīng)典用法
限定符常常與一些字符或詞聯(lián)合使用
* 匹配任意數(shù)個;
+ 匹配一個或多個;
? 匹配零個或一個;
{n} 匹配 n 個;
{n,m} 匹配 n 至 m 個;
{n,} 匹配 n 和 n 個以上;
限定符貪婪好像與生俱有的。在缺省狀態(tài)下,*或+限定符匹配滿足正則表達(dá)式的一個范式的最大實(shí)例數(shù)??捎??號顯式的規(guī)定限定符的不貪婪。如果問號放在另一個限制符之后(甚至另一個問號之后),都可以使限定符不貪婪。
7,聲明與斷言
首先注意聲明的長度為 0;
Perl種有一組控制大小寫和換碼的聲明:
/u 使下一個字母變大寫;
/l 使下一個字母變小寫;
/U 使文本的剩余字符變成大寫;
/L 使文本的剩余字符變成小寫;
/Q 會除字母之外的其他字符進(jìn)行換碼處理,直至遇到 /E 聲明、常規(guī)表達(dá)式結(jié)束或者字串結(jié)束。
/A聲明和脫字符號(^)匹配字串的開始;
/Z聲明和美元符號($)匹配字串的結(jié)束或剛好在字串結(jié)束前的換行符;
/z 只匹配字串的結(jié)束;
/b 匹配一個單詞(字)邊界;
/B 匹配一個非單詞(字)邊界;
(?#text) 忽略括號內(nèi)的注釋文本;
(?:pattern) 與組一致,但匹配時不生成$1,$2;
(?imsx:pattern) 與組一致,但匹配時不生成$1,$2,在特定的風(fēng)格有效期間,內(nèi)嵌風(fēng)格匹配修飾符;
(?=pattern) 前看聲明,如果正則表達(dá)式在下一次匹配 pattern 風(fēng)格,就開始匹配,而且不影響匹配效果。如//w+(?=/t)/將匹配制表符是否恰好在一個字/w+后面出現(xiàn),并且制表符不添加到$&的值中;
(?!pattern) 如果正則表達(dá)式在后面不匹配 pattern ,才會開始匹配。如/foo(?!bar)/,只有當(dāng)出現(xiàn) foo,并且后面不出現(xiàn) bar 時才開始匹配;
(?<=pattern) 后看聲明,只有在pattern已經(jīng)匹配下面的表達(dá)式,并且不將 pattern 的結(jié)果放入$&變量中,才匹配下面的語句。如/(?<=/t)/W+/匹配制表符是否恰好在/W+前出現(xiàn),但又不將制表符送到$&中;
(? (?[code]) 表示對 code 的使用是試驗(yàn)性的。如果返回真,就認(rèn)為是與(?:pattern)斷言同一行里的匹配。code 不插入變量。這個斷言僅僅在 use re 'eval' 編譯指示符時才有效;
(?>pattern) 如果類型鎖定在當(dāng)前位置,就使用單獨(dú)的 pattern 匹配子字符串。如正則表達(dá)式/^(?>a*)ab/永遠(yuǎn)不會匹配,因?yàn)檎Z句(?>a*)將匹配字符串開頭所有的 a 字符,并刪除與 ab 匹配的字符 a;
(!<=pattern) 非后看聲明,與后看聲明意思相反;
(!=pattern) 非前看聲明,與前看聲明意思相反;
(?(condition)yes-pattern|no-pattern) 條件表達(dá)式――條件語句或者是一個圓括號中的整數(shù),或者是一個斷言;
(?(condition)yes-pattern)
(?imsx) 嵌入風(fēng)格匹配修飾符。當(dāng)要把表達(dá)式修改符嵌入在變量中,然后把變量用在不指定自己的修飾符的一般規(guī)則表達(dá)式中;
(?-imsx) 這個斷言很有用――后面帶任何內(nèi)容都會關(guān)閉修飾符,直到出現(xiàn)另一個嵌入的修飾符。
8,向后引用
Perl的正則表達(dá)式引擎允許使用前面匹配好的值,這些值叫做向后引用。
例如:
=~ m/(/w)/W*(/w)/W*(/w)/W*(/w)/W*/4/W*/3/W*/2/W*/1/;
=~ s/(/w)/W*(/w)/W*(/w)/W*(/w)/$4$3$2$1/;