Python序列化的概念很簡單。內存里面有一個數據結構,你希望將它保存下來,重用,或者發送給其他人。你會怎么做?這取決于你想要怎么保存,怎么重用,發送給誰。很多游戲允許你在退出的時候保存進度,然后你再次啟動的時候回到上次退出的地方。(實際上,很多非游戲程序也會這么干)在這種情況下,一個捕獲了當前進度的數據結構需要在你退出的時候保存到硬盤上,接著在你重新啟動的時候從硬盤上加載進來。
Python標準庫提供pickle和cPickle模塊。cPickle是用C編碼的,在運行效率上比pickle要高,但是cPickle模塊中定義的類型不能被繼承(其實大多數時候,我們不需要從這些類型中繼承,推薦使用cPickle)。cPickle和pickle的序列化/反序列化規則是一樣的,使用pickle序列化一個對象,可以使用cPickle來反序列化。同時,這兩個模塊在處理自引用類型時會變得更加“聰明”,它不會無限制的遞歸序列化自引用對象,對于同一對象的多次引用,它只會序列化一次。
pickle模塊中的兩個主要函數是dump()和load()。dump()函數接受一個數據對象和一個文件句柄作為參數,把數據對象以特定的格式保存到給定的文件中。當我們使用load()函數從文件中取出已保存的對象時,pickle知道如何恢復這些對象到它們本來的格式。
dumps()函數執行和dump()函數相同的序列化。取代接受流對象并將序列化后的數據保存到磁盤文件,這個函數簡單的返回序列化的數據。
loads()函數執行和load()函數一樣的反序列化。取代接受一個流對象并去文件讀取序列化后的數據,它接受包含序列化后的數據的str對象, 直接返回的對象。
cPickle.dump(obj, file, protocol=0)
序列化對象,并將結果數據流寫入到文件對象中。參數protocol是序列化模式,默認值為0,表示以文本的形式序列化。protocol的值還可以是1或2,表示以二進制的形式序列化。
cPickle.load(file)
反序列化對象。將文件中的數據解析為一個Python對象。
下面通過一個簡單的例子來演示上面兩個方法的使用:
>>> import pickle,cPickle>>> info_dict = {'name':'yeho','age':100,'Lang':'Python'}>>> f = open('info.pkl','wb')>>> pickle.dump(info_dict,f)>>> f.close()>>> exit()
# cat info.pkl(dp0S'Lang'p1S'Python'p2sS'age'p3I100sS'name'p4S'yeho'p5s.
>>> import cPickle>>> info_dictTraceback (most recent call last): File "<stdin>", line 1, in <module>NameError: name 'info_dict' is not defined>>> f = open('info.pkl','r+')>>> info2_dict = cPickle.load(f)>>> info2_dict{'Lang': 'Python', 'age': 100, 'name': 'yeho'}>>> info2_dict['age'] = 110>>> cPickle.dump(info2_dict,f)>>> f.close()>>> exit()
新聞熱點
疑難解答