麻豆小视频在线观看_中文黄色一级片_久久久成人精品_成片免费观看视频大全_午夜精品久久久久久久99热浪潮_成人一区二区三区四区

首頁 > 編程 > Regex > 正文

python 正則表達式 反斜杠(/)的麻煩和陷阱

2020-03-16 21:16:03
字體:
來源:轉載
供稿:網友
這里是一點小心得。 由于正則表達式使用反斜杠來轉義特殊字符,而python自身處理字符串時,反斜杠也是用于轉義字符,這樣就產生了一個雙重轉換的問題
 
 
要匹配字符串中1個反斜杠應該怎么寫正則表達式?"//",這樣行嗎?試試就知道了,re模塊拋異常了,因為"//"就是一個反斜杠,對于正則表達式解析器來說,是一個轉義字符,但是后面啥也沒有,自然就報錯了,"///"三個肯定是不行的,試試四個"////",完美匹配。 
復制代碼代碼如下:

import re 
re_str_patt = "////" 
reObj = re.compile(re_str_patt) 
str_test = "abc//cd//hh" 
print reObj.findall(str_test) 


輸出:['//', '//'] 

這里要這么理解,首先第一重轉換是字符串自身的轉義,那么"////",實際上就是表示兩個反斜杠(兩個字符),然后傳入正則表達式解析器,因為反斜杠依然是轉義字符,那么進行第二重轉換,兩個反斜杠就代表一個反斜杠,所以就能和一個反斜杠進行匹配了,那么匹配連續的兩個反斜杠,寫正則表達式時就要寫8次"/"了,相當壯觀,要匹配/d+(這個在正則表達式里面表示連續1一個以上的數字字符)這個字符串怎么寫呢? 
復制代碼代碼如下:

import re 
re_str_patt = "////d//+" 
print re_str_patt 
reObj = re.compile(re_str_patt) 
print reObj.findall("//d+") 
寫成re_str_patt = "////d/+"也行,因為/+對于字符串來說,沒有轉義意義,所以就當成一個反斜杠了。 

在python中寫正則表達式時用得最多的是raw字符串,原生字符串,什么意思?就是只有一重轉換了,沒有字符串轉換了,只在正則表達式內部進行轉換了,這樣匹配一個反斜杠的正則表達式可以這樣寫,re_str_patt = r"//",有人會想,以后寫windows的文件路徑什么的方便了,呵呵直接 path = r"c:/myforder/xx" 搞定,是的,這句沒有問題,但是如果你寫成 path = r"c:/myforder/xx/",直接報錯了,為什么?因為反斜杠雖然不作為轉義字符了,但是還是對它后面的引號(包括單引號)有影響,使這個引號不被視為字符串的終止,以為它后面還有字符,但是實際沒有,因此會報錯。其實可以反過來想raw字符串里面要表示引號怎么辦呢?,可以發現 path = r"//123/"xxx" 是可以的,那用raw字符串豈不是有局限性?不過raw在設計之初就是用來支持正則表達式的,而在正則里面反斜杠是轉義字符,所以不可能出現在字符串的末尾的,所以建議不要圖方便在其他的地方使用raw。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 一边吃奶一边插下面 | 欧美日韩影视 | 亚洲精品久久久久久久久久 | 久草在线看片 | 91福利社在线 | 国产精品视频一区二区三区四 | 成人午夜在线免费观看 | 日韩精品羞羞答答 | 一区二区三区无码高清视频 | 久久久无码精品亚洲日韩按摩 | 亚洲精品久久久久久久久久久 | 免费观看一级黄色片 | 曰批全过程120分钟免费69 | 高清成人在线 | 一区www| 国产电影精品久久 | 久久久国产精品免费观看 | 国产成人在线一区二区 | 国产精品一品二区三区四区18 | a免费毛片 | 在线a亚洲视频播放在线观看 | 国产成人综合在线观看 | 久久色伦理资源站 | 免费人成年短视频在线观看网站 | 国产小视频一区 | 免费放黄网站在线播放 | 久久网站热最新地址 | 欧美一级一片 | 91在线播放国产 | 天天操综 | 爱操在线 | 久久综合久久综合久久 | 色a综合| 欧美a级毛片 | 精精国产xxxx视频在线野外 | 日韩av有码在线 | 99精品国产成人一区二区 | 国产精品久久久久久久久久久久久久久久 | 欧美精品成人一区二区在线观看 | 国产88久久久国产精品免费二区 | 黄色大片在线免费观看 |