麻豆小视频在线观看_中文黄色一级片_久久久成人精品_成片免费观看视频大全_午夜精品久久久久久久99热浪潮_成人一区二区三区四区

首頁 > 編程 > Regex > 正文

正則表達式不包含屬性

2020-03-16 21:18:33
字體:
來源:轉載
供稿:網友
一個標簽里不包含某個屬性 的 正則表達式的寫法
 
 
找出所有img標簽的,沒有帶說明屬性alt的標簽: 

正則:<img(?![^<>]*?alt[^<>]*?>).*?> 
例子:<img src="" alt=""> <img src="" >  <img src="" title="">  <img src="" id="">  <img src=""  title="" alt=""> 


擴展,如果要找沒有帶title屬性的a應該是: 

正則:<a(?![^<>]*?title[^<>]*?>).*?> 
例子:<a src="" alt=""> <a src="" >  <a src="" title="">  <a src="" id="">  <a src=""  title="" alt=""> 
用正則表達式找出不包含連續(xù)字符串abc的單詞 

[^abc]表示不包含a、b、c中任意字符, 我想實現(xiàn)不包含字符串abc應該如何寫表達式? 

就我自己而言,這個問題最簡單的解決方法是使用編程語言的配合,找出那些包含abc的,剩下的就是不包含的了——懶人的風格。但我寫的是教程,讀者未必都有編程的基礎,有些只是使用一些工具從txt文檔中抽取出一些信息,所以要回答還是必須完全通過正則表達式來完成。 

于是打開了RegexTester,開始試驗,先是試了使用((?'test'abc)|.)*(?(test)(?!))(含意是:查找abc,或任意的字符,如果找到了abc,就把它存入命名為test的組里,到最后檢查test組里是否有內容,如果有就匹配失敗,相關說明見教程),結果是"abc","aabc","abcd","aa"都能通過測試,看來是到最后測試到test組存在后又回溯了,此解決方案不可行。 

然后又試了(.(?!abc))*(找出所有后面不是abc的字符),結果是"abc","abcd"通過測試,"aabc"則只截取了后面的"abc",顯然不行。 

那加強條件試試:((?<!abc).(?!abc))*(找出所有前面和后面都不是abc的字符),結果是所有包含abc的字符串都只截取了里面的"abc",不包含abc的則直接通過。 

現(xiàn)在看來有點戲了,但是怎么把那些內部包含abc的字符串過濾掉呢?這個問題換句話說也就是怎么匹配整體而不是部分呢?現(xiàn)在需要明確用戶的需求了:如果用戶想要找的是單詞,那就在表達式的兩端加上/b,如果要找的是行,就加上^和$。由于用戶的問題沒有明確說明,我就當作是單詞吧。 

于是等到了這樣的表達式:/b((?<!abc).(?!abc))*/b,經過測試,這個表達式能匹配所有不包含abc的單詞,以及單詞abc。 

怎么排除單詞abc?經過一番思考,最后我認為判斷單詞是否以a開頭的方式最為方便:/b(a(?!bc)|[^a](?!abc))((?<!abc).(?!abc))*/b(要么以后面不是bc的a開頭,要么不以a開頭,除了開頭后面所有的字符必須前面和后面都不是abc)。經過測試,完全滿足要求,Bingo! 

使用正則表達式查找不包含連續(xù)字符串abc的單詞,最終結果:/b(a(?!bc)|[^a](?!abc))((?<!abc).(?!abc))*/b 
---------------- 
更新:根據maple的評論,更簡潔的作法是:/b((?!abc)/w)+/b 

正則表達式-不包含某個字符串

在使用正則表達式的場合,常常有這種需求,就是匹配一個不包含某個子串的子符串。比如說,我要從“eabcdfgh”得到"cd"之前的子串。有些人可能會寫:

([^cd]*)

這種寫法是徹底錯誤的,因為[]中的是集合,也就是說,[^cd]表示不等于c或者d,而不是cd。下面的程序中沒有cd,但eab還是被匹配出來了。

復制代碼代碼如下:

String s = "([^cd]*)";  
Match m = Regex.Match("eabcfgh", s);  
MessageBox.Show(m.Value);//eab  
MessageBox.Show(m.Groups[1].Value);//eab 

 

上面這種寫法是錯的比較離譜的,正常青年一般都可以避免這種錯誤。在特殊情況下,正則表達式可以這么寫,而且效率是比較高的。

([/s/S]*cd)

先說明下/s/S是表示匹配任何字符。所謂特殊情況,就是我知道這個字符串中必有cd的存在。假如,我的要求是匹配不包含cd的部分(為了描述方便,只匹配cd之前的部分),也就是說,當cd不存在時,應該把整個字符串都取出來。

復制代碼代碼如下:

String s = "((.(?!cd))*.)";  
//String s = "([/s/S]*cd)";  
Match m = Regex.Match("eabcdfgh", s);  
MessageBox.Show(m.Value);//eab  
MessageBox.Show(m.Groups[1].Value);//eab 

 

這種寫法終于符合要求了。不過值得一提的是,相較前一種而言,它的效率比較低。
回顧一下相關的語法:
(?:子表達式)         定義非捕獲組。

復制代碼代碼如下:

//定義非捕獲組  
String s = "e(?:ab)(.*)";  
Match m = Regex.Match("eabcd", s);  
MessageBox.Show(m.Value);//eabcd  
MessageBox.Show(m.Groups[1].Value);//cd 

 

ab是被匹配的,但是它所在的組沒有被捕獲,Group[1]是cd

(?=子表達式)       零寬度正預測先行斷言。

復制代碼代碼如下:

//零寬度正預測先行斷言  
//String s = "b(cd|de)(.*)";  
String s = "b(?=cd|de)(.*)";  
Match m = Regex.Match("eabcdfg", s);  
MessageBox.Show(m.Value);  
MessageBox.Show(m.Groups[1].Value);//區(qū)別 cd  cdfg 

 

這種寫法和注釋掉的寫法是有區(qū)別的,區(qū)別就是“零寬度”,這種寫法會被捕獲,也就是不占一個Group。

(?!子表達式)       零寬度負預測先行斷言。

!表示非,就是不包含,同樣是零寬度,不會被捕獲。

(?<=子表達式)    零寬度正回顧后發(fā)斷言。

例:(?<=19)/d{2}/b

“1851 1999 1950 1905 2003”中的“99”、“50”和“05”

(?<!子表達式)     零寬度負回顧后發(fā)斷言。

例:(?<!19)/d{2}/b

“1851 1999 1950 1905 2003”中的“51”和“03”


發(fā)表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發(fā)表
主站蜘蛛池模板: 羞羞视频免费视频欧美 | 毛片毛片 | 久久久国产精品电影 | 在线成人免费观看www | 亚洲热线99精品视频 | 黄污网站在线观看 | 日韩美女电影 | 国产精品999在线 | 中国产一级毛片 | 欧美性生话视频 | 88xx成人永久免费观看 | 免费观看国产精品视频 | 青青操精品| 成人午夜一区二区 | 久久亚洲精选 | 国产一区二区精彩视频 | 92精品国产自产在线 | 日本欧美一区二区三区在线播 | 亚洲成人福利在线观看 | 国产成人精品区一区二区不卡 | 亚洲3atv精品一区二区三区 | 久久精品一二三区 | 日本成年免费网站 | 黄色电影免费提供 | 粉嫩粉嫩一区二区三区在线播放 | 久久不射电影网 | 久久久日韩精品一区二区 | 综合国产在线 | 国产精品片一区二区三区 | 99久久婷婷国产综合精品青牛牛 | 少妇一级淫片高潮流水电影 | 国产成人午夜高潮毛片 | 中国女警察一级毛片视频 | 久久中文字幕在线观看 | 羞羞视频2023 | 久久在线精品视频 | 亚洲男人的天堂在线视频 | 午夜激情视频网站 | 欧美黄色看 | 精品亚洲一区二区三区 | 国产 视频 一区二区 |