實(shí)際項(xiàng)目中有這樣的需求,將某一列的值,映射成類別型的數(shù)據(jù),這個(gè)時(shí)候,需要我們將范圍等頻切分,或者等距切分。
具體的做法可以先看某一些特征的具體分布情況,然后我們選擇合適的閾值進(jìn)行分割。
def age_map(x): if x < 26: return 0 elif x >=26 and x <= 35: return 1 elif x > 35 and x <= 45: return 2 elif pd.isnull(x): #判斷是否為NaN值,== 和in 都無法判斷 return 3 else: return 4
也就是用pandas自帶的函數(shù)來表示:
pd.isnull(x)
最后我們可以應(yīng)用map函數(shù):
data['age'] = data['birth_year'].map(age_map)
以上這篇對(duì)pandas數(shù)據(jù)判斷是否為NaN值的方法詳解就是小編分享給大家的全部內(nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持武林站長站。
|
新聞熱點(diǎn)
疑難解答
圖片精選