python正則表達式從字符串中提取數字的思路詳解

2020-01-20 21:34:05

字體：大中小

來源：轉載

供稿：網友

python從字符串中提取數字

使用正則表達式，用法如下：

## 總結## ^ 匹配字符串的開始。## $ 匹配字符串的結尾。## /b 匹配一個單詞的邊界。## /d 匹配任意數字。## /D 匹配任意非數字字符。## x? 匹配一個可選的 x 字符 (換言之，它匹配 1 次或者 0 次 x 字符)。## x* 匹配0次或者多次 x 字符。## x+ 匹配1次或者多次 x 字符。## x{n,m} 匹配 x 字符，至少 n 次，至多 m 次。## (a|b|c) 要么匹配 a，要么匹配 b，要么匹配 c。## (x) 一般情況下表示一個記憶組 (remembered group)。你可以利用 re.search 函數返回對象的 groups() 函數獲取它的值。## 正則表達式中的點號通常意味著 “匹配任意單字符”

解題思路：

既然是提取數字，那么數字的形式一般是：整數，小數，整數加小數；

所以一般是形如：----.-----；

根據上述正則表達式的含義，可寫出如下的表達式："/d+/.?/d*"；

/d+匹配1次或者多次數字，注意這里不要寫成*，因為即便是小數，小數點之前也得有一個數字；/.?這個是匹配小數點的，可能有，也可能沒有；/d*這個是匹配小數點之后的數字的，所以是0個或者多個；

代碼如下：

import restring="A1.45，b5，6.45，8.82"print re.findall(r"/d+/.?/d*",string)# ['1.45', '5', '6.45', '8.82']

匹配指定字符串開頭的數字

例如下面的string：

tensorflow:Final best valid   0 loss=0.20478513836860657 norm_loss=0.767241849151384 roc=0.8262403011322021 pr=0.39401692152023315 calibration=0.9863265752792358 rate=0.0提取 calibration=0.9863265752792358 .# 匹配“calibration=”后面的數字pattern = re.compile(r'(?<=calibration=)/d+/.?/d*')pattern.findall(string)# ['0.9863265752792358']

在這里插入圖片描述

匹配包含指定字符串開頭的數字

pattern = re.compile(r'(?:loss=)/d+/.?/d*')pattern.findall(string)# ['loss=0.20478513836860657', 'loss=0.767241849151384']

在這里插入圖片描述

匹配時間，17:35:24

string = "WARNING:tensorflow: 20181011 15:28:39 Initialize training"pattern = re.compile(r'/d{2}:/d{2}:/d{2}')pattern.findall(string)# ['15:28:39']

匹配時間，20181011 15:28:39

string = "WARNING:tensorflow: 20181011 15:28:39 Initialize training"pattern = re.compile(r'/d{4}/d{2}/d{2}/s/d{2}:/d{2}:/d{2}')pattern.findall(string)# ['20181011 15:28:39']

總結

以上所述是小編給大家介紹的python正則表達式從字符串中提取數字的思路詳解 ,希望對大家有所幫助，如果大家有任何疑問請給我留言，小編會及時回復大家的。在此也非常感謝大家對武林網網站的支持！
如果你覺得本文對你有幫助，歡迎轉載，煩請注明出處，謝謝！

上一篇：Python 正則表達式匹配數字及字符串中的純數字

下一篇：詳解Python3中的正則表達式的基本用法