新聞中心
pickle模塊,json模塊

(1)把變量從內(nèi)存中變成可存儲或傳輸?shù)倪^程,稱之為序列化。python中叫pickling,其他語言中也被稱為serialization,marshalling,flattening等,都是相同的意思。
(2)序列化之后,就可以把序列化后的內(nèi)容(序列化后的內(nèi)容是一個Bytes)寫入磁盤,或者通過網(wǎng)絡(luò)傳輸?shù)絼e的機器上。
(3)把變量內(nèi)容從序列化的對象重新讀到內(nèi)存里,稱之為反序列化,即unpickling。
(4)Pickle的問題和所有其他編程語言特有的序列化問題一樣,就是它只能用于Python,并且可能不同版本的Python彼此都不兼容,因此,只能用pickle保存那些不重要的數(shù)據(jù),不能成功地反序列化也沒關(guān)系。
把一個對象序列化并寫入文件,有兩種方法:
(1)pickle.dumps( )方法: 把任意對象序列化成一個bytes,然后,通過一定方式把這個bytes寫入文件。
import pickle d=dict(name='bob',age=23,score=98) print(pickle.dumps(d))
(2)pickle.dump( )方法: 直接把對象序列化后寫入一個file-like Object
import pickle
d=dict(name='shirley',age=23,score=98)
f=open('dump.txt','wb') #因為序列化之后是bytes,所以是wb
pickle.dump(d,f)
f.close()
#通過pickle.dump()將對象保存到文件中,通過下面語句可以查看寫入的序列化內(nèi)容
f=open("dump.txt",'rb')#rb
print(f.read())pickle.dumps( )和pickle.dump( )的區(qū)別:就在于中間過程我們是否還需要再做一些操作。
前者我們還要再做一些操作;后者不需要我們再進行任何操作。
同序列化一樣,當要把對象從磁盤讀到內(nèi)存時,有兩種方法:
(1)pickle.loads( ):可以先把內(nèi)容讀到一個bytes,然后用pickle.loads( )方法反序列化出對象
(2)pickle.load( ):直接用pickle.load( )方法從一個file-like Object中直接反序列化出對象
import pickle
f=open('dump.txt','rb')
s=pickle.load(f)
f.close()
print("反序列化后的對象s:",s)運行結(jié)果: 反序列化后的對象s: {'score': 98, 'age': 23, 'name': 'shirley'}
注意:這個反序列化后的對象和原來的變量d是完全不相干的,它們只是內(nèi)容相同而已。
JSON
Python內(nèi)置的json模塊可以實現(xiàn)從Python對象到JSON格式的轉(zhuǎn)換
(1)JSON表示出來就是一個字符串,可以被所有語言讀取,也可以方便地存儲到磁盤或者通過網(wǎng)絡(luò)傳輸。
(2)JSON是標準格式,比XML更快,而且可以直接在Web頁面中讀取。
(3)JSON表示的對象就是標準的JavaScript語言的對象
JSON和Python內(nèi)置的數(shù)據(jù)類型對應(yīng)如下:
JSON類型------Python類型
{ }----------------dict
[ ]----------------list
"string"---------str
1234.56--------int或float
true/false-------True/False
null---------------None
注: 把Python對象轉(zhuǎn)換成JSON格式時,只要是上面表格中列舉的Python類型即可,其他類型,例如變量,就會報錯。
把Python對象轉(zhuǎn)換成JSON格式:json.dumps( )方法,json.dump( )方法(可以直接把JSON寫入一個file-like Object)
要把JSON反序列化為Python對象:json.loads( )方法,json.load( )方法 (前者把JSON的字符串反序列化,后者從file-like Object 中讀取字符串并反序列化)
實例:把Python對象變成一個JSON
import json d=dict(name='shirley',age=23,score=98) print(json.dumps(d)) print(isinstance(json.dumps(d),str)) #判斷序列化后的內(nèi)容類型 print(type(json.dumps(d)))#判斷序列化后的內(nèi)容類型
運行結(jié)果:
json.dumps(d): {"name": "shirley", "age": 23, "score": 98}
True
JSON字符串反序列化:
import json
json_str = '{"age": 20, "score": 88, "name": "Bob"}'
print(json.loads(json_str))
print(type(json.loads(json_str)))注:由于JSON標準規(guī)定JSON編碼是UTF-8,所以我們總是能正確地在Python的字符串str與JSON的字符串之間轉(zhuǎn)換。
JSON進階
由于Python的字典dict對象在上面表格列舉的Python類型中,所以字典dict可以直接序列化為JSON的{ },不過,很多時候,更喜歡用class表示對象,比如定義Student類,然后序列化:
import json
class Student(object):
def __init__(self,name,age,score):
self.name=name
self.age=age
self.score=score
s=Student('Nancy',24,89)
print(json.dumps(s))運行結(jié)果:
Traceback (most recent call last): …………………………………… TypeError:is not JSON serializable
錯誤的原因是:
Student對象不是一個可序列化為JSON的對象。 如果class的實例對象都無法序列化為JSON,這肯定不合理。(我的理解是class的實例對象s是一個變量,不在上面列舉的Python類型中,所以報錯)
前面的代碼之所以無法把Student類實例序列化為JSON,是因為默認情況下,dumps( )方法不知道如何將Student實例變?yōu)橐粋€JSON的{ }對象。
解決辦法是:定制JSON序列化
####對可選參數(shù)default進行設(shè)置,把任意class的實例變?yōu)閐ict
print(json.dumps(s, default=lambda obj: obj.__dict__))
通常類class的實例都有一個dict屬性,它就是一個dict,用來存儲實例變量(注意:是實例變量,即不同實例,該屬性存儲的變量不同,互不影響)。也有少數(shù)例外,比如定義了slots
同理,把JSON反序列化為一個Student對象實例,loads( )方法首先轉(zhuǎn)換出一個dict對象,然后,我們傳入的object_hook函數(shù)負責把dict轉(zhuǎn)換為Student實例
class Student(object):
def __init__(self,name,age,score):
self.name=name
self.age=age
self.score=score
import json
def dict2student(d):
return Student(d['name'], d['age'], d['score'])
json_str = '{"age": 20, "score": 88, "name": "Bob"}'
print(json.loads(json_str))
print(json.loads(json_str, object_hook=dict2student))運行結(jié)果:
{'age': 20, 'score': 88, 'name': 'Bob'}
打印出的是反序列化的實例對象。
小結(jié)
Python語言特定的序列化模塊是pickle,但如果要把序列化搞得更通用、更符合Web標準,就可以使用json模塊。
json模塊的dumps( )和loads( )函數(shù)是定義得非常好的接口的典范。使用時只需要傳入一個必須的參數(shù)。但是,當默認的序列化或反序列機制不滿足我們的要求時,又可以傳入更多的參數(shù)來定制序列化或反序列化的規(guī)則,既做到了接口簡單易用,又做到了充分的擴展性和靈活性。
python學習網(wǎng),免費的在線學習python平臺,歡迎關(guān)注!
文章題目:創(chuàng)新互聯(lián)Python教程:python怎么序列化
文章轉(zhuǎn)載:http://www.fisionsoft.com.cn/article/cohjohp.html


咨詢
建站咨詢
