問題:我們需要在散沙一般的數據中提取出字符,分隔符不止一個,而且還有不少空格,比如:
原字符串如下:
'asd ff gg; asd , foo| og '
我們需要刪除上面的,;|分隔符和多余空格,提取出:
['asd', 'ff', 'gg', 'asd', 'foo', 'og']
這種一般用于處理日志或者網頁數據提取,一般而言,這種數據中需要的數據分布規律性不是太強,而且比較散。
處理結果如下:
import reline = 'asd ff gg; asd , foo| og 'data = re.split(r'[;,|/s]/s*',line)for i in data: if i == '': data.remove(i)print(data)
以上這篇python針對不定分隔符切割提取字符串的方法就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持武林站長站。
新聞熱點
疑難解答