浅析Python pickle 包的理解和使用

picklePython 库中的一个模块,用于将 Python 对象序列化和反序列化。pickle 可以将对象序列化为字符串或字节序列,以便在网络上传输或保存到文件中。

pickle 是一个非常有用的工具,可以将 Python 对象转换为可序列化的字符串或字节序列,然后将这些数据保存到文件中或在网络上传输。这在多个领域中都非常有用,特别是在缓存、配置和持久化等领域。pickle 可以处理大多数 Python 对象,包括基本数据类型、字典、列表、元组、集合、用户自定义类和实例等。

使用 pickle,可以轻松地将一个 Python 对象序列化为字节流:

import pickle
data = [1, 2, 3, 4, 5]
# 序列化对象
pickled_data = pickle.dumps(data)
print(pickled_data)

输出结果为:

b'\x80\x04\x95\x0f\x00\x00\x00\x00\x00\x00\x00]\x94(K\x01K\x02K\x03K\x04K\x05e.'

反序列化:

unpickled_data = pickle.loads(pickled_data)
print(unpickled_data)

输出结果为:

[1, 2, 3, 4, 5]

注意:pickle 序列化的对象是二进制数据,所以在打印输出时需要使用字节串前缀 “b”

pickle 还有很多其他功能,比如使用 dump()load() 将数据序列化和反序列化到文件中,使用 Protocol 参数控制序列化的版本,使用 HIGHEST_PROTOCOL 指定最高版本的序列化协议等。需要注意的是,pickle 可能存在一些安全问题,因为它可以反序列化任意 Python 代码。因此,建议只从受信任的源中反序列化 pickle 数据。

picklePython 标准库中的一个序列化模块,它可以将 Python 对象转换成字节流,以便将它们保存到文件或将它们在网络上传输。

pickle 能够处理大多数 Python 对象,包括基本数据类型、复杂数据类型和用户自定义类的实例。pickle 可以实现序列化和反序列化,将一个对象转换成字节流即序列化,将一个字节流转换成对象即反序列化。pickle 的主要应用包括:缓存、配置和持久化等领域。

举个例子,假设我们有一个 Python 的字典,我们想要将它持久化到文件中或者将它传输到网络中,可以使用 pickle 包来实现:

import pickle
# 定义一个字典
person = {'name': 'Alice', 'age': 28, 'gender': 'Female'}
# 将字典对象序列化为字节流
bytes_person = pickle.dumps(person)
# 将字节流反序列化为对象
new_person = pickle.loads(bytes_person)
print(person)       # {'name': 'Alice', 'age': 28, 'gender': 'Female'}
print(new_person)   # {'name': 'Alice', 'age': 28, 'gender': 'Female'}

输出结果为:

{'name': 'Alice', 'age': 28, 'gender': 'Female'}
{'name': 'Alice', 'age': 28, 'gender': 'Female'}

我们再来一个更实际的例子。假设我们有一个机器学习模型,我们希望将该模型保存到文件中,并在需要的时候重新加载该模型,以便进行预测。我们可以使用 pickle 包来实现模型的序列化和反序列化。

import pickle
import numpy as np
from sklearn.linear_model import LogisticRegression
# 生成一些随机数据
X = np.random.rand(100, 5)
y = np.random.randint(0, 2, (100,))
# 实例化一个逻辑回归模型
clf = LogisticRegression()
# 拟合模型
clf.fit(X, y)
# 将模型序列化为字节流
bytes_model = pickle.dumps(clf)
# 将字节流反序列化为模型对象
new_clf = pickle.loads(bytes_model)
# 对新数据进行预测
new_X = np.random.rand(10, 5)
new_y_pred = new_clf.predict(new_X)
print(new_y_pred)

输出结果为:

[1 1 0 1 0 1 1 0 1 1]

到此这篇关于Python pickle 包的理解和使用的文章就介绍到这了,更多相关Python pickle 包使用内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!

(0)

相关推荐

  • Python 序列化 pickle/cPickle模块使用介绍

    Python序列化的概念很简单.内存里面有一个数据结构,你希望将它保存下来,重用,或者发送给其他人.你会怎么做?这取决于你想要怎么保存,怎么重用,发送给谁.很多游戏允许你在退出的时候保存进度,然后你再次启动的时候回到上次退出的地方.(实际上,很多非游戏程序也会这么干)在这种情况下,一个捕获了当前进度的数据结构需要在你退出的时候保存到硬盘上,接着在你重新启动的时候从硬盘上加载进来. Python标准库提供pickle和cPickle模块.cPickle是用C编码的,在运行效率上比pickle要高,

  • Python使用pickle模块报错EOFError Ran out of input的解决方法

    本文实例讲述了Python使用pickle模块报错EOFError Ran out of input的解决方法.分享给大家供大家参考,具体如下: 遇到了 EOFError:Ran out of input 不到为什么这样,最后用捕获异常的办法解决掉了,暂时对程序本身没有啥影响,代码如下: # coding=utf-8 import pickle def usr_date(): try: with open('usr_date.pkl','rb') as f: return pickle.load

  • Python使用pickle模块储存对象操作示例

    本文实例讲述了Python使用pickle模块储存对象操作.分享给大家供大家参考,具体如下: 众所周知,当我们需要储存数据的时候,就需要用到重定向.但是,这些都是储存简单的数据类型,那么当我们需要存储一个类的实例的时候该怎么存储呢? 实际上,我们需要用到一个模块---pickle,翻译为泡菜坛子 首先贴上一篇:pickle的使用方法 然后贴上一份代码: # -*- coding:utf-8 -*- import pickle class Person(): def __init__(self,

  • Python 中Pickle库的使用详解

    在"通过简单示例来理解什么是机器学习"这篇文章里提到了pickle库的使用,本文来做进一步的阐述. 那么为什么需要序列化和反序列化这一操作呢? 1.便于存储.序列化过程将文本信息转变为二进制数据流.这样就信息就容易存储在硬盘之中,当需要读取文件的时候,从硬盘中读取数据,然后再将其反序列化便可以得到原始的数据.在Python程序运行中得到了一些字符串.列表.字典等数据,想要长久的保存下来,方便以后使用,而不是简单的放入内存中关机断电就丢失数据.python模块大全中的Pickle模块就派

  • python中cPickle类使用方法详解

    在python中,一般可以使用pickle类来进行python对象的序列化,而cPickle提供了一个更快速简单的接口,如python文档所说的:"cPickle – A faster pickle". cPickle可以对任意一种类型的python对象进行序列化操作,比如list,dict,甚至是一个类的对象等.而所谓的序列化,我的粗浅的理解就是为了能够完整的保存并能够完全可逆的恢复.在cPickle中,主要有四个函数可以做这一工作,下面使用例子来介绍. 1. dump: 将pyth

  • Python使用Pickle模块进行数据保存和读取的讲解

    pickle 是一个 python 中, 压缩/保存/提取 文件的模块,字典和列表都是能被保存的. 但必须注意的是python2以ASCII形式保存,而在python3中pickle是使用转换二进制的数据压缩方法保存数据 所以,在保存或者读取数据的时候,打开文件应该使用'wb' 'rb'的方式 import pickle a = 'owoof' with open('111.pkl', 'wb') as file: pickle.dump(a, file) 在Pickle模块中还有dumps()

  • 如何理解Python中包的引入

    Python的from import *和from import *,它们的功能都是将包引入使用,但是它们是怎么执行的以及为什么使用这种语法呢? 从一模块导入全部功能 from import * means意味着"我希望能访问中我有权限访问的全部名称".例如以下代码something.py: # something.py public_variable = 42 _private_variable = 141 def public_function(): print("I'm

  • 浅析Python中的套接字编程

    目录 一.为什么使用套接字 二.什么是套接字 三.如何在Python中实现Socket编程 四.什么是服务器 五.什么是客户端 5.1.Echo Client-Server 5.2.Multiple Communications 六.传输Python对象 6.1.Python pickle模块 6.2.如何使用pickle模块传递python对象结构 一.为什么使用套接字 套接字是网络的基础.它们使在两个不同程序或设备之间的信息传输成为可能.例如,当您打开浏览器时,您作为客户端正在与服务器建立连

  • 浅析Python的对象拷贝和内存布局

    目录 前言 Python 对象的内存布局 牛刀小试 查看对象的内存地址 copy模块 可变和不可变对象与对象拷贝 代码片段分析 撕开 Python 对象的神秘面纱 总结 前言 在本篇文章当中主要给大家介绍 python 当中的拷贝问题,话不多说我们直接看代码,你知道下面一些程序片段的输出结果吗? a = [1, 2, 3, 4] b = a print(f"{a = } \t|\t {b = }") a[0] = 100 print(f"{a = } \t|\t {b = }

  • 浅析Python中的元编程

    目录 什么是元编程 元编程应用场景 综合实战 什么是元编程 Python元编程是指在运行时对Python代码进行操作的技术,它可以动态地生成.修改和执行代码,从而实现一些高级的编程技巧.Python的元编程包括元类.装饰器.动态属性和动态导入等技术,这些技术都可以帮助我们更好地理解和掌握Python语言的特性和机制.元编程在一些场景下非常有用,比如实现ORM框架.实现特定领域的DSL.动态修改类的行为等.掌握好Python元编程技术可以提高我们的编程能力和代码质量. 想要搞定元编程,必须要理解和

  • 深入浅析python中的多进程、多线程、协程

    进程与线程的历史 我们都知道计算机是由硬件和软件组成的.硬件中的CPU是计算机的核心,它承担计算机的所有任务. 操作系统是运行在硬件之上的软件,是计算机的管理者,它负责资源的管理和分配.任务的调度. 程序是运行在系统上的具有某种功能的软件,比如说浏览器,音乐播放器等. 每次执行程序的时候,都会完成一定的功能,比如说浏览器帮我们打开网页,为了保证其独立性,就需要一个专门的管理和控制执行程序的数据结构--进程控制块. 进程就是一个程序在一个数据集上的一次动态执行过程. 进程一般由程序.数据集.进程控

  • 浅析python协程相关概念

    这篇文章是读者朋友的python协程的学习经验之谈,以下是全部内容: 协程的历史说来话长,要从生成器开始讲起. 如果你看过我之前的文章python奇遇记:迭代器和生成器 ,对生成器的概念应该很了解.生成器节省内存,用的时候才生成结果. # 生成器表达式 a = (x*x for x in range(10)) # next生成值 next(a()) # 输出0 next(a()) # 输出1 next(a()) # 输出4 与生成器产出数据不同的是,协程在产出数据的同时还可以接收数据,具体来说就

  • python pickle存储、读取大数据量列表、字典数据的方法

    先给大家介绍下python pickle存储.读取大数据量列表.字典的数据 针对于数据量比较大的列表.字典,可以采用将其加工为数据包来调用,减小文件大小 #列表 #存储 list1 = [123,'xiaopingguo',54,[90,78]] list_file = open('list1.pickle','wb') pickle.dump(list1,list_file) list_file.close() #读取 list_file = open('list1.pickle','rb')

  • 浅析Python语言自带的数据结构有哪些

    Python作为一种脚本语言,其要求强制缩进,使其易读.美观,它的数据类型可以实现自动转换,而不需要像C.Java那样给变量定义数据类型,使其编写非常方便简单,所以广受大家的欢迎. 现如今,Python已经广泛的应用于数据分析.数据挖掘.机器学习等众多科学计算领域.所以既然涉及到科学计算,深入了解Python原生提供的数据结构是很有必要的,这样才能在数据的海洋中游刃有余.得心应手.本文便以此展开,做一个归纳整理,方便收藏. Python 一.序列结构 首先介绍的数据结构是序列结构,所谓序列,也就

  • 浅谈Python中文件夹和python package包的区别

    pycharm右键新建时会有目录(文件夹)和python package两个选项,这两个到底有什么不同呢 1.原来在python模块的每一个包中,都有一个__init__.py文件(这个文件定义了包的属性和方法)然后是一些模块文件和子目录,假如子目录中也有__init__.py那么它就是这个包的子包了. 当你将一个包作为模块导入(比如从 xml导入 dom)的时候,实际上导入了它的__init__.py 文件. 2.而目录跟包唯一不同的就是没有__init__.py 文件,一个包是一个带有特殊文

  • 深入浅析python 中的self和cls的区别

    python 中的self和cls 一句话描述:self是类(Class)实例化对象,cls就是类(或子类)本身,取决于调用的是那个类. @staticmethod 属于静态方法装饰器,@classmethod属于类方法装饰器.我们需要从声明和使用两个方面来理解. 详细介绍 一般来说,要使用某个类的方法,需要先⚠️实例化一个对象再调用方法.而使用@staticmethod或@classmethod,就可以不需要实例化,直接类名.方法名()来调用.这有利于组织代码,把某些应该属于某个类的函数给放到

随机推荐