麻豆小视频在线观看_中文黄色一级片_久久久成人精品_成片免费观看视频大全_午夜精品久久久久久久99热浪潮_成人一区二区三区四区

首頁 > 編程 > Regex > 正文

JavaScript的正則也有單行模式了

2020-03-16 20:54:37
字體:
來源:轉載
供稿:網友

正則表達式最早是由 Ken Thompson 于 1970 年在他改進過的 QED 編輯器里實現的,正則里最簡單的元字符 “.” 在當時所匹配的就是除換行符外的任意字符:

"." is a regular expression which matches any character except <nl>.

上面這句話出自 QED 在 1970 年的官方文檔,這可能是史上第一份正則文檔。

為什么要這么規定?是因為 QED 是以行為單位來編輯文件的,而且行尾的換行符也算在這一行的內容里。比如你想把一段代碼中所有的單行注釋刪掉,在 QED 里可以用下面這句命令: 

1,$s#//.*##

如果 “.” 能匹配到換行符,那么換行符也會被刪除,會導致這些行和它的下一行合并,這通常都不是我們想要的結果,所以,“.” 在最初發明時被設計成了不能匹配換行符。雖然現在的操作系統上已經沒有 QED 命令讓我們測試了,但我們還有 VIM,VIM 里的 “.” 也一樣不能匹配換行符,因為同樣的原因。

不像在 Node 中,讀取文件通常是一股腦讀完整個文件,Perl 繼承了眾多 Linux 命令按行讀取文件的傳統,像這樣:

while (<>) {print $_}

_ 的末尾也有換行符,所以 Perl 也就很自然的繼承了 QED 的 “.” 不匹配換行符的規定。但 Perl 畢竟是門編程語言,而不是編輯器,它的正則要匹配的對象不單單會是單行文本,還可能是多行文本,因此在它的正則中,“.” 有跨行匹配的需求,因此 Perl 發明了正則的單行模式 /s,即讓 “.” 也能匹配換行符。

Perl 中用來打開單行模式的 /s 修飾符的官方描述是 “Treat the string as single line”,這個 “single line” 要這么理解:“.” 在普通模式下只能匹配行內字符,不能跨行;而在單行模式下,Perl 會假裝把多行字符串看成一行,把其中的換行符看做是行內字符,所以 “.” 也就能匹配它們了。更形象點說,就是把下面的三行文本

123

看成 "1/n2/n3/n" 一行文本,單行模式就是這個意思。

但要命的是,因為同樣的原因(字符串變量可以包含多行文本),Perl 還發明了 /m 修飾符,即多行模式,官方描述是 “Treat the string as multiple lines”,這個模式 JavaScript 的正則里自古也有,這里這個“多行”的意思是說:^ 和 $ 元字符默認不會匹配一個字符串中間的那些換行符前后的位置,即認為字符串永遠只有一行,打開多行模式后就能匹配了。

也就是說,單行模式和多行模式是針對不同的元字符的,剛接觸正則的人都會被“單行模式”和“多行模式”這兩個看似是相對應的概念,實則毫無關聯的名詞給搞暈。

后來,Ruby 的作者可能覺得“單行模式”這個正則術語起的不好,特例獨行把讓 “.” 匹配換行符這一模式稱之為“多行模式”,即讓 .* 之類的正則能夠匹配多行了,所以也完全講得通,修飾符也用了 /m(Ruby 中默認會開啟 Perl 中的“多行模式”,所以 /m 沒被占用),這真是雪上加霜,更亂了。 

再后來,Python 作者可能也覺得應該避免“單行模式”這個叫法,于是起了個新的名字 “dotall”,也就是讓 dot 能匹配所有字符的意思,很好的名字,再后來 Java 也使用了這個名字。

上面回顧了一下歷史,解釋了下單行模式的由來以及說明了下單行模式這個名字起得不好。V8 最近剛剛實現了一個 stage 3 的 ES 提案 https://github.com/mathiasbynens/es-regexp-dotall-flag,這個提案為 JavaScript 的正則引入了 /s 修飾符和 dotAll 屬性,dotAll 屬性是學了 Python 和 Java,/s 修飾符是繼承了 Perl 的,這里也沒必要發明一個新的修飾符比如 /d,只會讓事情更復雜。/s 在 JavaScript 的具體效果是讓 “.” 能匹配以前不能匹配的四個行終止符:/n(換行)、/r(回車)、/u2028(行分隔符)、/u2029(段落分隔符):

/foo/s.dotAll // true/^.{4}$/s.test("/n/r/u2028/u2029") // true

其實就是個很簡單的東西,但可能一些沒有接觸過 JavaScript 以外的正則的同學到時候學到這個新的模式后會產生困惑,這里再澄清一下:多行模式控制的是 ^ 和 $ 的表現,單行模式控制的是 “.” 的表現,兩者沒有直接關系。

然而當初引入單行模式和多行模式這兩個易混淆概念的 Perl 語言,已經在 Perl 6 中完全刪除了這兩個模式:“.” 號默認就匹配換行符,/N 可以匹配換行符除外的任意字符;^ 和 $ 始終匹配字符串的首尾,而新引入了 ^^ 和 $$ 兩個元字符來匹配行的首尾。

過去我們常用的單行模式的替代品 [^] 或者 [/s/S] 也不是完全沒有用了,比如在一些使用 JavaScript 正則的編輯器里(VS Code、Atom),不太可能給你提供開啟單行模式的界面。不過說起編輯器里的正則功能,用 JavaScript 實現的編輯器的正則功能還是太弱了,比如不能在正則自身內部開啟某些模式,比如要是在 Sublime(使用 Python 正則)里的話,在正則內部使用 (?s) 就能開啟 dotall 模式,比如可以用 (?s)//*.+?/*/ 匹配到所有的多行注釋。

 

注:相關教程知識閱讀請移步到正則表達式頻道。
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 91成人一区二区三区 | 亚洲人成中文字幕在线观看 | 久草在线精品观看 | 国产精品亚洲综合一区二区三区 | 黄色电影免费网址 | 免费毛片a线观看 | vidz 98hd| www.91在线| 中文字幕亚洲欧美 | 欧美www| qyl在线视频精品免费观看 | 欧美电影在线观看 | 水卜樱一区二区av | 国产精品久久久久久影视 | 黑人一级片视频 | 日本一道aⅴ不卡免费播放 视屏一区 | 国产成人精品一区二区视频免费 | 欧美人xxx | 男女羞羞视频在线免费观看 | 大学生一级毛片在线视频 | 欧美一级美国一级 | 免费观看欧美一级片 | 极品美女一级毛片 | 日本精品免费观看 | 美女视频黄a视频免费全过程 | 国产精品99久久久久久大便 | 91av大片 | 中文字幕视频在线播放 | 福利免费观看 | 久久久久av69精品 | 91精品国产综合久久久欧美 | 亚洲天堂岛国片 | 欧美 日本 在线 | 九九热在线视频免费观看 | 国产1区2区3区在线观看 | 香蕉视频网站在线观看 | 最新中文在线视频 | 久久久电影电视剧免费看 | 伦理三区 | 一级做a爱片久久毛片a高清 | 中文字幕精品在线视频 |