麻豆小视频在线观看_中文黄色一级片_久久久成人精品_成片免费观看视频大全_午夜精品久久久久久久99热浪潮_成人一区二区三区四区

首頁 > 編程 > Python > 正文

在Python dataframe中出生日期轉化為年齡的實現方法

2020-02-15 23:17:49
字體:
來源:轉載
供稿:網友

我們在做數據挖掘項目或大數據競賽時,如果個體是人的時候,獲得的數據中可能有出生日期的Series,舉個簡單例子,比如這樣的一些數:

# -*- coding: utf-8 -*-import pandas as pdfrom pandas import Series, DataFrameimport numpy as npimport seaborn as snsimport matplotlib.pyplot as plt %matplotlib inlinedata = {'birth': ['10/8/00', '7/21/93', '6/14/01', '5/18/99', '1/5/98']}frame = DataFrame(data)frame

從數據來看,'10/8/00'之類的數,最左邊的數表示月份,中間的數表示日,最后的數表示年度。

實際上我們在分析時并不需要人的出生日期,而是需要年齡,不同的年齡階段會有不同的狀態,比如收入、健康、居住條件等等,且能夠很好地把不同樣本的差異性進行大范圍的劃分,而不是像出生日期那樣包含信息量過大且在算法訓練時不好作為有效數據進行訓練,age是一個很好地特征工程指示變量。

那如何把上述birth數據變為年齡age呢?

在這里用到datetime這個庫,如下:

(1)首先把birth轉化為標準時間格式

frame['birth'] = pd.to_datetime(frame['birth'])frame

 

(2)獲取當前時間的年份,并減去birth的年份

import datetime as dtnow_year =dt.datetime.today().year #當前的年份frame['age']=now_year-frame.birth.dt.yearframe

在這里使用了dt.datetime.today().year來獲取當前日期的年份,然后將birth數據中的年份數據提取出來(frame.birth.dt.year),兩者相減就得到需要的年齡數據,如下:

有時候我們可能還會關注到人的出生月份與要預測變量的關系,比如人的星座就是很流行的一種以出生月份、日份來評估其對人的影響,也可以按這種方法去提取月、日數據。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 午夜精品福利影院 | 久在线播放| 宅男噜噜噜66国产免费观看 | 暖暖免费观看高清完整版电影 | 第一区免费在线观看 | 黄色成人av在线 | 国产一国产一级毛片视频 | 羞羞电影在线观看 | 污黄视频在线播放 | 欧美精品一区二区三区在线 | 玖草在线资源 | 露脸各种姿势啪啪的清纯美女 | 久久狠狠高潮亚洲精品 | 国产一级二级毛片 | 钻石午夜影院 | 精品久久久久久久 | 日韩毛片网 | 国产小视频在线观看 | 精品久久9999 | 国产午夜精品久久久久久免费视 | 欧美人的天堂一区二区三区 | 毛片免费在线视频 | 欧美成人一区二区三区 | 久久久国产精品免费观看 | 91av在线免费视频 | 精品一区二区免费视频视频 | 日韩午夜片 | 欧美精品第1页 | 久久久久亚洲精品国产 | 天天夜天天操 | 黄色片网站免费在线观看 | 国产精品999在线观看 | 国产亚洲区 | 中文字幕四区 | 亚洲九九爱 | 欧美日韩国产一区二区三区在线观看 | 精品一区二区久久久久久久网精 | xnxx 日本免费| av在线免费观看不卡 | 搜一级毛片 | 成人国产精品一区二区毛片在线 |