假如有一列全是字符串的dataframe,希望提取包含特定字符的所有數據,該如何提取呢?
因為之前嘗試使用filter,發現行不通,最終找到這個行得通的方法。
舉例說明:
我希望提取所有包含'Mr.'的人名
1、首先將他們進行字符串化,并得到其對應的布爾值:
>>> bool = df.str.contains('Mr/.') #不要忘記正則表達式的寫法,'.'在里面要用'/.'表示>>> print('bool : /n', bool)
2、通過dataframe的基本操作將其選取出來:
>>> filter_data = df[bool]>>> print('filter data : /n', filter_data)
總結:這樣就成功將特定數據選取出來了,將代碼匯總一下就是
>>> bool = df.str.contains('Mr/.')>>> filter_data = df[bool]
以上這篇Pandas過濾dataframe中包含特定字符串的數據方法就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持武林站長站。
新聞熱點
疑難解答