色视频在线观看,成人免费毛片一,天天夜天天操

正則表達式性能優(yōu)化方法（高效正則表達式書寫）

2020-03-16 20:58:50

字體：大中小

來源：轉載

供稿：網友

這里說的正則表達式優(yōu)化，主要是針對目前常用的NFA模式正則表達式

這里說的正則表達式優(yōu)化，主要是針對目前常用的NFA模式正則表達式，詳細可以參考：正則表達式匹配解析過程探討分析（正則表達式匹配原理）。從上面例子，我們可以推斷出，影響NFA類正則表達式（常見語言：GNU Emacs,Java,ergp,less,more,.NET語言,
PCRE library,Perl,PHP,Python,Ruby,sed,vi )其實主要是它的“回溯”，減少“回溯”次數（減少循環(huán)查找同一個字符次數），是提高性能的主要方法。我們來看個例子：

源字符串：<script type="text/javascript">adsfadfsdasfsdafdsfsadfsa</script>

匹配要求，匹配<script….>….</script>標簽里面所有內容，包括改標簽

常見寫法(1)，因為<script后面可能出現字符、空白、特殊符號等，還有標簽里面也可能出現各種js代碼。我們簡單方法是：

正則表達式：<script.*?>.*?</script> (測試工具使用了：regexBuddy)

正則表達式,性能優(yōu)化

總共花費115步，回溯了：48次。因為我們使用”.”字符，匹配默認情況下除了/n之外所有字符。
方法（2），我們分析特點發(fā)現，<script…>后面，應該是除了”>”之外都可以字符，然后一對<script>標簽里面js內容。可以定義為除了”<”之外。（這里面我只是舉例說明優(yōu)化方法，實際網頁中script標簽里面，常見都會出現有”<”字符了）

正則表達式：<script[^?>]+>[^<]+</script>

正則表達式,性能優(yōu)化

19步，0次回溯！，步驟只有原先的15%左右，性能幾倍的提升了！
從上面我們看到，不同正則表達式，對通用字符配平，性能相差會很大。減少“回溯”是最好的方法，減少回溯其中最主要的方法是：”用最小范圍的元字符，盡量避免用過大的元字符！”。一般規(guī)律如下：

1、使用正確的邊界匹配器（^、$、/b、/B等），限定搜索字符串位置
2、使用具體的元字符、字符類（/d、/w、/s等），少用”.”字符
3、使用正確的量詞（+、*、?、{n,m}），如果能夠限定長度，匹配最佳
4、使用非捕獲組、原子組，減少沒有必要的字匹配捕獲用(?:)

如：我想匹配一些英文字母，它后面接的是數字。如：abc1234,我可以寫 “/w+/d+”，也可以寫”[a-zA-Z]+/d+” ，其中第一個/w+會先匹配所有abc1234，然后回溯，匹配滿足/d+格式。一共4步，而后面這個只需要2步，步驟減少一半了！好了，今天就先到這里，歡迎大家討論、交流！

注：相關教程知識閱讀請移步到正則表達式頻道。

麻豆小视频在线观看_中文黄色一级片_久久久成人精品_成片免费观看视频大全_午夜精品久久久久久久99热浪潮_成人一区二区三区四区

正則表達式性能優(yōu)化方法（高效正則表達式書寫）