Python 序列化 pickle/cPickle模塊使用介紹

2020-02-23 06:14:38

字體：大中小

來源：轉載

供稿：網友

Python序列化的概念很簡單。內存里面有一個數據結構，你希望將它保存下來，重用，或者發送給其他人。你會怎么做？這取決于你想要怎么保存，怎么重用，發送給誰。很多游戲允許你在退出的時候保存進度，然后你再次啟動的時候回到上次退出的地方。（實際上，很多非游戲程序也會這么干）在這種情況下，一個捕獲了當前進度的數據結構需要在你退出的時候保存到硬盤上，接著在你重新啟動的時候從硬盤上加載進來。

Python標準庫提供pickle和cPickle模塊。cPickle是用C編碼的，在運行效率上比pickle要高，但是cPickle模塊中定義的類型不能被繼承（其實大多數時候，我們不需要從這些類型中繼承，推薦使用cPickle）。cPickle和pickle的序列化/反序列化規則是一樣的，使用pickle序列化一個對象，可以使用cPickle來反序列化。同時，這兩個模塊在處理自引用類型時會變得更加“聰明”，它不會無限制的遞歸序列化自引用對象，對于同一對象的多次引用，它只會序列化一次。

pickle模塊中的兩個主要函數是dump()和load()。dump()函數接受一個數據對象和一個文件句柄作為參數，把數據對象以特定的格式保存到給定的文件中。當我們使用load()函數從文件中取出已保存的對象時，pickle知道如何恢復這些對象到它們本來的格式。

dumps()函數執行和dump()函數相同的序列化。取代接受流對象并將序列化后的數據保存到磁盤文件，這個函數簡單的返回序列化的數據。
loads()函數執行和load()函數一樣的反序列化。取代接受一個流對象并去文件讀取序列化后的數據，它接受包含序列化后的數據的str對象, 直接返回的對象。

cPickle.dump(obj, file, protocol=0)
序列化對象，并將結果數據流寫入到文件對象中。參數protocol是序列化模式，默認值為0，表示以文本的形式序列化。protocol的值還可以是1或2，表示以二進制的形式序列化。

cPickle.load(file)
反序列化對象。將文件中的數據解析為一個Python對象。

下面通過一個簡單的例子來演示上面兩個方法的使用：

>>> import pickle,cPickle>>> info_dict = {'name':'yeho','age':100,'Lang':'Python'}>>> f = open('info.pkl','wb')>>> pickle.dump(info_dict,f)>>> f.close()>>> exit()

# cat info.pkl(dp0S'Lang'p1S'Python'p2sS'age'p3I100sS'name'p4S'yeho'p5s.

>>> import cPickle>>> info_dictTraceback (most recent call last): File "<stdin>", line 1, in <module>NameError: name 'info_dict' is not defined>>> f = open('info.pkl','r+')>>> info2_dict = cPickle.load(f)>>> info2_dict{'Lang': 'Python', 'age': 100, 'name': 'yeho'}>>> info2_dict['age'] = 110>>> cPickle.dump(info2_dict,f)>>> f.close()>>> exit()

上一篇：給Python IDLE加上自動補全和歷史功能

下一篇：Python標準庫os.path包、glob包使用實例