繼上幾篇正則表達(dá)式相關(guān)說(shuō)明(詳情:正則表達(dá)式 ),我們今天繼續(xù)討論下,它的單行,多行模式使用,及容易出現(xiàn)錯(cuò)誤地方。單行,多行模式,都是正則表達(dá)式的模式修飾符里面出現(xiàn)的參數(shù)。目前常用正則表達(dá)式都有該使用選項(xiàng),如:javascript 正則表達(dá)式,一般是:”/正則表達(dá)式匹配字符/修飾符“ ,最后一個(gè)”/” 后面是修飾符。然后,php也是類似的,c#,python等,一般調(diào)用正則表達(dá)式的匹配函數(shù),都有一個(gè)另外選項(xiàng)的,設(shè)置模式。
單行、多行模式容易出現(xiàn)理解錯(cuò)誤
為什么說(shuō),容易出現(xiàn)理解錯(cuò)誤呢,它們英文對(duì)應(yīng)說(shuō)明是:SingleLine ,MultiLine,剛好是單行、多行意思。因此,很多朋友就會(huì)從字面理解里面,得出以下結(jié)論:(哈哈、剛剛使用,我也是這些朋友中一員)
1、單行,就是從頭到尾匹配,多行就是如果匹配字符串,里面有換行符,就匹配到之前
2、單行跟多行是沖突的,一次只能指定一個(gè)選項(xiàng),不能同時(shí)使用
這樣來(lái)理解其實(shí),很容易就會(huì)這樣的。我們來(lái)看看,官方手冊(cè)里面怎么說(shuō)的。
單行、多行模式官方解釋
模式符 | 描述 |
---|---|
s(單行) | 如果設(shè)置了這個(gè)修飾符, 模式中的點(diǎn)號(hào)元字符匹配所有字符, 包含換行符. 如果沒(méi)有這個(gè) 修飾符, 點(diǎn)號(hào)不匹配換行符 |
m(多行) | 目標(biāo)字符串是由單行字符組成的(然而實(shí)際上它可能會(huì)包含多行), “行首”元字符(^)僅匹配字符串的開(kāi)始位置, 而”行末”元字符($)僅匹配字符串末尾。當(dāng)這個(gè)修飾符設(shè)置之后, “行首”和”行末”就會(huì)匹配目標(biāo)字符串中任意換行符(/n)之前或之后 |
通過(guò)上面說(shuō)明,其實(shí)這2個(gè)修飾符都只是,修改正則表達(dá)式常見(jiàn)元字符的匹配范圍了。如果加”s”修飾符,元字符”.” 將能夠匹配換行符(/n),如果加”m”修飾符,元字符”$”,將只匹配到”/n”字符前;元字符”^”,將匹配到”/n”字符后。我們還是舉例說(shuō)明吧!(下面關(guān)于正則表達(dá)式?字符,可以看看前面一節(jié):正則表達(dá)式(regex) 貪婪模式、懶惰模式使用)
舉例,看單行應(yīng)用
<?php///讀取hao123.com首頁(yè)///并且去掉里面script代碼 /** *去掉script標(biāo)簽* * @author chengmo * @copyright http://blog.chacuo.net/ * @param string $content 原字符串 * @param int $style 匹配模式 * @return string */function remove_script($content,$style=1){ $reg = $style == 1?"%<script.*?>.*?</script>%":"%<script.*?>.*?</script>%s"; return preg_replace($reg,"",$content);} $content = file_get_contents('http://www.hao123.com');echo remove_script($content);
舉例,看多行應(yīng)用
<?php///讀取hao123.com首頁(yè)///讀取meta標(biāo)簽內(nèi)容 /** *讀取meta標(biāo)簽內(nèi)容* * @author chengmo * @copyright http://blog.chacuo.net/ * @param string $content 原字符串 * @param int $style 匹配模式 * @return string */function read_meta($content,$style=1){ $reg = $style == 1?"%^<meta.*?/>%":"%^<meta.*?>/s+$%m"; preg_match_all($reg,$content,$arr); return $arr;} $content = file_get_contents('http://www.hao123.com');var_dump(read_meta($content));
后記:s,m 修飾符只對(duì),幾個(gè)特殊元字符有改變。如果你正則表達(dá)式中沒(méi)有那幾個(gè)元字符。開(kāi)啟s,m字符前后將沒(méi)有什么變化的。對(duì)于上面讀取hao123.com代碼,我們可以繼續(xù)同時(shí)使用s,m模式。如:”%<script.*?>.*?(^currentProfile.*$).*?</script>%sm” ,匹配所有script標(biāo)簽,并且里面js代碼,有一行以curentProfile開(kāi)頭字符串。(以下是正則表達(dá)式,單行多行一起使用)