Python序列化模块pickle和cPickle
Python的序列化是指把变量从内存中变为可以储存/传输的数据/文件的过程. 在Python中叫pickling,在其他语言中也被称之为serialization,marshalling,flattening等等,都是一个意思。序列化之后,就可以把序列化后的内容写入磁盘,或者通过网络传输到别的机器上。反过来,把变量内容从序列化的对象重新读到内存里称之为反序列化,即unpickling。
在Python中最基础的实现序列化的两个模块是cPickle和pickle模块, 功能基本一样, 前者是C写的更快, 后者是python写的会慢点. 一般优先使用cPickle. 这里只介绍cPickle, 一般用其四个函数(dump、dumps、dump、loads)也就OK了, pickle包含了类和另外一些内容, 更多细节可以看官方手册。一般引用时我们会做如下引用:
try: import cPickle as pickle except ImportError: import pickle
一、导出数据 和 导入数据
1、导出数据
dump 导出数据(序列化)主要有两个函数:
dump(data,file_handle[, protocol]) : 将数据序列化到文件. dumps(data[, protocol]) : 将数据序列化成字符串.
protocol是数据流处理策略:
0: ascii串保存, 默认形式, 方便人读取 1: 旧式兼容性较强2进制形式 2: 支持新式类的2进制模式,Python2.3开始引入.
2、导入数据
load 载入数据(反序列化)主要有两个函数:
load(file) : 将序列化数据从文件读入返回数据. loads(string) : 将字符串的序列化数据读入并返回数据.
二、示例
1、写入文件及读取
#!/usr/bin/env python # coding=utf-8 # code from www.361way.com try: import cPickle as pickle except: import pickle obj = {'a' : 'b', 'c' : 'd'} obj2 = [0, 1, 1, 0, 1] f = open('obj.pkl', 'wb') pickle.dump(obj, f, protocol=2) pickle.dump(obj2, f, protocol=2) f.close() f = open('obj.pkl', 'rb') x1 = pickle.load(f) x2 = pickle.load(f) print x1,x2 f.close()
这里保存数据的时候,选用的是protocol 2,所以保存后的obj.pkl 打开会发现是乱码 。这里需要注意的是pickle不能指定key信息,只能按顺序一次次的load结果 。这点不像shelve模块 。
2、写入内存及读写
示例1中通过open将数据写入二进制文件或读取,通过StringIO模块,也可以将数据在内存中进行写入和读取 ,示例如下:
try: import cPickle as pickle except: import pickle import pprint from StringIO import StringIO class SimpleObject(object): def __init__(self, name): self.name = name l = list(name) l.reverse() self.name_backwards = ''.join(l) return data = [] data.append(SimpleObject('pickle')) data.append(SimpleObject('cPickle')) data.append(SimpleObject('last')) # Simulate a file with StringIO out_s = StringIO() # Write to the stream for o in data: print 'WRITING: %s (%s)' % (o.name, o.name_backwards) pickle.dump(o, out_s) out_s.flush() # Set up a read-able stream in_s = StringIO(out_s.getvalue()) # Read the data while True: try: o = pickle.load(in_s) except EOFError: break else: print 'READ: %s (%s)' % (o.name, o.name_backwards)
执行结果如下:
$ python pickle_stream.py WRITING: pickle (elkcip) WRITING: cPickle (elkciPc) WRITING: last (tsal) READ: pickle (elkcip) READ: cPickle (elkciPc) READ: last (tsal)
3、pickle对像元素操作
在成为pickle的对象后即为列表对象,由此可对list进行一系列的操作,如下是一个append的示例:
>>> pw = open('test1','wb') >>> pw.write(pickle.dumps(['a','b'])) >>> pw.close() >>> pr = open("test1","rb") >>> prf = pickle.load(pr) >>> print(prf) ['a', 'b'] >>> print(prf.append('c')) None >>> print(prf) ['a', 'b', 'c']
本站的发展离不开您的资助,金额随意,欢迎来赏!
You can donate through PayPal.My paypal id: itybku@139.comPaypal page: https://www.paypal.me/361way
You can donate through PayPal.My paypal id: itybku@139.comPaypal page: https://www.paypal.me/361way
近期评论