麻豆小视频在线观看_中文黄色一级片_久久久成人精品_成片免费观看视频大全_午夜精品久久久久久久99热浪潮_成人一区二区三区四区

首頁 > 編程 > Python > 正文

python 快速把超大txt文件轉存為csv的實例

2020-02-15 23:24:09

字體：大中小

來源：轉載

供稿：網友

今天項目有個需求，就是把txt文件轉為csv，txt之間是空格隔開，轉為csv時需要把空格轉換為逗號，網上找的一個版本，只需要三行代碼，特別犀利：

import numpy as npimport pandas as pddata_txt = np.loadtxt('datas_train.txt')data_txtDF = pd.DataFrame(data_txt)data_txtDF.to_csv('datas_train.csv',index=False)

上述的datas_train.txt只有不到100MB，560W行數據，三分鐘之內轉換完畢。

然后我換了一個5600W行共1.2G的txt文本，用上述代碼轉換，電腦直接卡死了。

原因在于上述代碼會把全部的txt加載進內存，然后再轉換，這就會造成電腦內存耗盡。

然后就想到了切割數據的辦法，具體實現如下：

import numpy as npimport pandas as pdtrain_data = pd.read_table('big_data.txt',iterator=True,header=None)while True: try:  chunk = train_data.get_chunk(5600000)  chunk.columns = ['user_id','spu_id','buy_or_not','date']  chunk.to_csv('big_data111.csv', mode='a',header=False,index = None) except Exception as e:  break

這里我把數據分成了小塊，每塊數據有560W行，分11次加載就能全部加載完了，速度也很快，總共花了5分鐘左右。

注意，get_chunk()里面的參數表示文件的行數，而非字節數。

以上這篇python 快速把超大txt文件轉存為csv的實例就是小編分享給大家的全部內容了，希望能給大家一個參考，也希望大家多多支持武林站長站。

上一篇：使用python Fabric動態修改遠程機器hosts的方法

下一篇：Python/ArcPy遍歷指定目錄中的MDB文件方法

學習交流

如何重啟打印機打印服務

如何重啟打印機打印服務...

熱門圖片

猜你喜歡的新聞

猜你喜歡的關注

新聞熱點

明兮語文停止運營發展資金鏈斷裂

2020-02-16 09:52:44

2006年李俊編寫了“熊貓燒香”電腦病毒，現在過得怎么樣？

2020-02-15 15:53:44

谷歌合并Alphabet旗下子公司Jigsaw，未來會如何發展？

2020-02-11 22:02:38

NASA說今天地球引力最小能讓掃帚立起來？原因很簡單

2020-02-11 21:45:12

TCL集團宣布今日起正式更名為“TCL科技”

2020-02-07 10:36:18

黑莓曲終落，情懷價幾何？

2020-02-06 12:16:44

疑難解答

圖片精選

網友關注

主站蜘蛛池模板：久久αv | 亚洲一区二区中文 | 一区小视频 | 久久久久久久久久久高潮一区二区 | 69性欧美高清影院 | 在线观看一二三 | 韩国三级日本三级香港三级黄 | 中文字幕亚洲欧美 | 欧美成人精品一区 | 成人一级片毛片 | 欧美成人免费电影 | 中文字幕免费在线看 | 久久亚洲一区二区三区成人国产 | 国产成人网| 欧美日韩1区2区 | 91精品国产91热久久久做人人 | 精品国产一区二区在线 | 国产成人在线视频 | 一级毛片在线观看免费 | 久草视频免费 | 国产一区二区在线观看视频 | 99成人在线 | 久久国产精品二国产精品中国洋人 | 91嫩草丨国产丨精品入口 | 久久成人亚洲 | 9999久久 | 国产手机在线视频 | 亚洲午夜不卡 | av成人在线免费观看 | 羞羞视频一区 | 美国av免费看 | 精品一区二区在线观看视频 | 久久久精品视频国产 | 亚洲免费视 | 毛片视频观看 | 欧美精品一区二区久久 | 久久国产综合精品 | 青青操精品 | 一级黄色免费观看视频 | 久久亚洲国产精品 | 国产成人综合在线 |