麻豆小视频在线观看_中文黄色一级片_久久久成人精品_成片免费观看视频大全_午夜精品久久久久久久99热浪潮_成人一区二区三区四区

首頁 > 編程 > regex > 正文

正則表達式之文本模式的匹配和查找

2020-01-20 21:33:49
字體:
來源:轉載
供稿:網友

1、需求

我們想要按照特定的文本模式進行匹配或查找。

2、解決方案

如果想要匹配的只是簡單的文字,那么通常只需要用基本的字符串方法就可以了,比如str.find()、str.endswith()、str.startswith()或類似函數。

示例:

text='mark ,帥哥,18,183 帥,mark'print(text=='mark')print(text.startswith('mark'))print(text.startswith('mark'))print(text.find('帥哥'))

結果:

False
True
True
6

如果更為復雜的匹配則需要使用正則表達式以及re模塊。為了說明使用正則表達式的基本流程,假設我們想匹配以數字形式構成的日期,比如"11/27/2018"。示例如下:

import retext1='11/27/2018'text2='Nov 27, 2018'if re.match(r'/d+//d+//d+',text1):  print('符合模型:數字/數字/數字')else:  print('不符合模型:數字/數字/數字')if re.match(r'/d+//d+//d+',text2):  print('符合模型:數字/數字/數字')else:  print('不符合模型:數字/數字/數字')

運行結果:

符合模型:數字/數字/數字
不符合模型:數字/數字/數字

如果打算針對同一模型做多次匹配,那么通常會先將正則表達式模式預編譯成一個模式對象。

例如:

import retext1='11/27/2018'text2='Nov 27, 2018'datepat=re.compile(r'/d+//d+//d+')if datepat.match(text1):  print('符合模型:數字/數字/數字')else:  print('不符合模型:數字/數字/數字')if datepat.match(text2):  print('符合模型:數字/數字/數字')else:  print('不符合模型:數字/數字/數字')

結果:

符合模型:數字/數字/數字
不符合模型:數字/數字/數字

match()方法總是嘗試在字符串的開頭找到匹配項。如果想針對整個文本搜索出所有的匹配項,那么就應該使用findall()方法,例如:

import retext='今天是 11/27/2018,昨天是11/26/2018'datepat=re.compile(r'/d+//d+//d+')print(datepat.findall(text))

運行結果:

['11/27/2018', '11/26/2018']

當定義正則表達式時,我們常會將部分模式用括號包起來的方式引入捕獲組,捕獲組通常簡化后續對匹配文本的處理,因為每個組的內容都可以單獨提取出來。findall()方法搜索整個文本并找出所有的匹配項然后將它們以列表的形式返回。如果想以迭代的方式找出匹配項,可以使用finditer()方法。

例如:

import re#加入捕獲組datepat=re.compile(r'(/d+)+/(/d+)+/(/d+)')m=datepat.match('11/27/2018')print(m.group(0))print(m.group(1))print(m.group(2))print(m.group(3))print(m.groups())month,day,year=m.groups()print(month)print(day)print(year)print('*'*20)text='今天是 11/27/2018,昨天是11/26/2018'for month,day,year in datepat.findall(text):  print('{}-{}-{}'.format(year,month,day))print('*'*20)for m in datepat.finditer(text):  print(m.groups())

結果:

11/27/2018
11
27
2018
('11', '27', '2018')
11
27
2018
********************
2018-11-27
2018-11-26
********************
('11', '27', '2018')
('11', '26', '2018')

3、分析

本節主要介紹了re模塊對文本匹配和搜索的基本功能,首先用re.compile()對模式進行編譯,然后使用想match()、findall()、finditer()這樣的方法做匹配和搜索。

當指定模式時我們通常會使用原始字符串,例如:

r'(/d+)/(/d+)/(/d+)'

這樣的字符串不會對反斜字符轉義,這在正則表達式中非常有用。否則,我們需要用雙反斜杠線來標識一個單獨的'',例如:

'(//d+)/(//d+)/(//d+)'

請注意match()方法只會檢查字符的開頭,有可能出現的匹配的結果并不是你想要的,例如:

import re#加入捕獲組datepat=re.compile(r'(/d+)+/(/d+)+/(/d+)')m=datepat.match('11/27/2018xxxx')print(m)

結果:

<re.Match object; span=(0, 10), match='11/27/2018'>

如果想要精確匹配,可以加一個結束標記:$

import re#加入捕獲組datepat=re.compile(r'(/d+)+/(/d+)+/(/d+)$')m1=datepat.match('11/27/2018xxxx')m2=datepat.match('11/27/2018')print(m1)print(m2)

結果:

None
<re.Match object; span=(0, 10), match='11/27/2018'>

如果只是執行簡單的文本匹配和搜索操作,可以省略編譯步驟。
如果打算執行很多匹配或查找操作的話,通常需要先將模式編譯然后重復使用。模塊級的函數會對最近編譯過的模式做緩存處理,并且比較省步驟。

總結

以上所述是小編給大家介紹的正則表達式之文本模式的匹配和查找,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復大家的。在此也非常感謝大家對武林網網站的支持!
如果你覺得本文對你有幫助,歡迎轉載,煩請注明出處,謝謝!

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 欧美成人精品不卡视频在线观看 | av在线免费看片 | 国产精品成人一区二区三区吃奶 | 91久久夜色精品国产网站 | 精品国产欧美一区二区 | 黄色免费小视频网站 | 国产午夜精品久久久久久免费视 | 久久国产不卡 | 日本在线播放一区二区三区 | 中文字幕亚洲情99在线 | 香蕉久久久精品 | 欧美18—19sex性hd按摩 | 免费看成人av | 国产va在线观看 | 羞羞网站视频 | 91午夜少妇三级全黄 | 国产乱淫av | 毛片视频在线免费观看 | 欧洲黄色一级视频 | 成人在线视频免费 | 久久久久亚洲美女啪啪 | 中文字幕在线播放一区 | 久久国产精品久久久久久久久久 | 国产在线看一区 | 成人在线视频在线观看 | 视频一区二区三区在线播放 | 激情网站免费观看 | 欧美精品一区二区三区在线播放 | 免费观看一级 | 中文在线免费观看 | 国产在线1区 | 国产精品美女久久久久久网站 | 操操操操操 | 黄色网址免费在线 | 精品久久久久久久久久久久久久久久久久久 | 天堂精品在线 | 欧美日韩夜夜 | 91久久久久久久久久久久久久 | fc2成人免费人成在线观看播放 | 黄色av片在线观看 | 手机免费看一级片 |