麻豆小视频在线观看_中文黄色一级片_久久久成人精品_成片免费观看视频大全_午夜精品久久久久久久99热浪潮_成人一区二区三区四区

首頁 > 編程 > Regex > 正文

正則表達式性能優(yōu)化方法(高效正則表達式書寫)

2020-03-16 20:58:50
字體:
來源:轉載
供稿:網友
這里說的正則表達式優(yōu)化,主要是針對目前常用的NFA模式正則表達式
 

這里說的正則表達式優(yōu)化,主要是針對目前常用的NFA模式正則表達式,詳細可以參考:正則表達式匹配解析過程探討分析(正則表達式匹配原理)。從上面例子,我們可以推斷出,影響NFA類正則表達式(常見語言:GNU Emacs,Java,ergp,less,more,.NET語言, 
PCRE library,Perl,PHP,Python,Ruby,sed,vi )其實主要是它的“回溯”,減少“回溯”次數(減少循環(huán)查找同一個字符次數),是提高性能的主要方法。 我們來看個例子:

源字符串:<script type="text/javascript">adsfadfsdasfsdafdsfsadfsa</script>

匹配要求,匹配<script….>….</script>標簽里面所有內容,包括改標簽

常見寫法(1),因為<script后面可能出現字符、空白、特殊符號等,還有標簽里面也可能出現各種js代碼。我們簡單方法是:

正則表達式:<script.*?>.*?</script> (測試工具使用了:regexBuddy)

正則表達式,性能優(yōu)化

總共花費115步,回溯了:48次。 因為我們使用”.”字符,匹配默認情況下除了/n之外所有字符。
方法(2),我們分析特點發(fā)現,<script…>后面,應該是除了”>”之外都可以字符,然后一對<script>標簽里面js內容。可以定義為除了”<”之外。(這里面我只是舉例說明優(yōu)化方法,實際網頁中script標簽里面,常見都會出現有”<”字符了)

正則表達式:<script[^?>]+>[^<]+</script>

正則表達式,性能優(yōu)化

19步,0次回溯! ,步驟只有原先的15%左右,性能幾倍的提升了!
從上面我們看到,不同正則表達式,對通用字符配平,性能相差會很大。減少“回溯”是最好的方法,減少回溯其中最主要的方法是:”用最小范圍的元字符,盡量避免用過大的元字符!”。一般規(guī)律如下:

1、使用正確的邊界匹配器(^、$、/b、/B等),限定搜索字符串位置
2、使用具體的元字符、字符類(/d、/w、/s等) ,少用”.”字符
3、使用正確的量詞(+、*、?、{n,m}),如果能夠限定長度,匹配最佳
4、使用非捕獲組、原子組,減少沒有必要的字匹配捕獲用(?:)

如:我想匹配一些英文字母,它后面接的是數字。如:abc1234,我可以寫 “/w+/d+”,也可以寫”[a-zA-Z]+/d+” ,其中第一個/w+會先匹配所有abc1234,然后回溯,匹配滿足/d+格式。一共4步,而后面這個只需要2步,步驟減少一半了!好了,今天就先到這里,歡迎大家討論、交流!



注:相關教程知識閱讀請移步到正則表達式頻道。
發(fā)表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發(fā)表
主站蜘蛛池模板: 色婷婷tv| 免费的性生活视频 | 国产午夜精品一区二区三区四区 | 成人一级视频在线观看 | 国产亚洲高清在线精品不卡 | 一级成人毛片 | 日韩每日更新 | 国内精品免费一区二区2001 | 久久精品视频8 | 97色在线观看免费视频 | 男女污污视频网站 | 在线播放免费播放av片 | 99国产精品欲a | 18pao国产成人免费视频 | 国产午夜精品久久久久婷 | 成人免费一区二区三区视频网站 | 黄色免费av网站 | 1314av| 欧美日韩在线视频一区 | av在线大全 | 操皮视频| 好吊色欧美一区二区三区四区 | 精品久久久久久久久久久久包黑料 | 国内精品久久久久久久影视红豆 | 久久久久久久亚洲精品 | 午夜噜噜噜 | 国产精品久久久久久久久粉嫩 | 羞羞色院91精品网站 | 亚洲啊v在线观看 | 天天夜干 | 日日草夜夜 | 免费黄色大片在线观看 | 国产毛片视频 | 欧美日韩在线播放 | 色婷婷a | 欧美成人一区二区三区 | 中国漂亮护士一级a毛片 | 中文字幕www| 色网在线视频 | 亚洲国产精品一区二区久久 | 成人午夜在线免费视频 |