Pandas提取数据的三种方式
目录
- 前言
- Pandas读取数据的几种方式
- 1. read_csv
- 2. read_excel
- 3. read_sql
前言
快期末了,数据挖掘的大作业需要用到python的相关知识(这太难为我这个以前主学C++的人了,不过没办法还是得学),下面是我在使用pandas时总结的一些东西,我对于python不是很熟悉,如果下面的一些知识点有哪里出问题或者有不同理解的,请一定一定要在评论区提出来,让我这个菜鸡学习学习~~/(ㄒoㄒ)/~~
Pandas读取数据的几种方式
Pandas需要先读取表格类型的数据然后进行分析

1. read_csv
1.1 读取csv,使用默认的标题行逗号分隔
先来看数据文件吧(myTest1.txt)

相关代码:

1.2 读取txt文件,自己指定分隔符,列名
有些.txt文件不一定是使用","进行分隔,也有可能使用"\t","-","/"进行分隔,这就需要自己指定分隔符了,而有些数据文件可能不会给咱们列名,那么我们自己其实也是可以指定列名。
先看数据文件吧(myTest.txt)

相关代码:

2. read_excel
读取excel表应该是最常见的了,咱们可以直接使用read_excel进行数据读取,下面的代码用于展示的是一个excel文件中包含多个sheet,咱们可以选择读取某个sheet
先看下数据文件吧

相关代码:

3. read_sql
想要读取数据库表的方法,就可以使用read_sql对表数据进行读取,操作步骤为:
①链接数据库(指定好各种信息,host,user,password…),需要下载包pymysql

②读取数据库中表的数据
先来看下我的数据文件吧

相关代码:

到此这篇关于Pandas提取数据的三种方式的文章就介绍到这了,更多相关Pandas 提取数据内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们!
相关推荐
-
pandas进行时间数据的转换和计算时间差并提取年月日
#pd.to_datetime函数 #读取数据 import pandas as pd data = pd.read_csv('police.csv') #将stop_date转化为datetime的格式的dataframe,存到stop_datetime data['stop_datetime'] = pd.to_datetime(data.stop_date') #自定义一个时间,计算时间差 data_new = pd.to_datetime('2006-01-01') data['time
-
Pandas提取数据的三种方式
目录 前言 Pandas读取数据的几种方式 1. read_csv 2. read_excel 3. read_sql 前言 快期末了,数据挖掘的大作业需要用到python的相关知识(这太难为我这个以前主学C++的人了,不过没办法还是得学),下面是我在使用pandas时总结的一些东西,我对于python不是很熟悉,如果下面的一些知识点有哪里出问题或者有不同理解的,请一定一定要在评论区提出来,让我这个菜鸡学习学习~~/(ㄒoㄒ)/~~ Pandas读取数据的几种方式 Pandas需要先读取表格类型
-
Pandas保存csv数据的三种方式详解
目录 方法一 方法二 方法三 补充 方法一 import os import pandas as pd path = 'data/train/' img_label_list=[] testList = os.listdir(path) for file in testList: label='aa' img_label_list.append([file, label]) df1 = pd.DataFrame(data=img_label_list, columns=['id', 'label
-
SpringMVC返回json数据的三种方式
Spring MVC属于SpringFrameWork的后续产品,已经融合在Spring Web Flow里面.Spring 框架提供了构建 Web 应用程序的全功能 MVC 模块.使用 Spring 可插入的 MVC架构,从而在使用Spring进行WEB开发时,可以选择使用Spring的SpringMVC框架或集成其他MVC开发框架,如Struts1,Struts2等. 1.第一种方式是spring2时代的产物,也就是每个json视图controller配置一个Jsoniew. 如:<bean
-
iOS开发中UIWebView的加载本地数据的三种方式
UIWebView是IOS内置的浏览器,可以浏览网页,打开文档 html/htm pdf docx txt等格式的文件. safari浏览器就是通过UIWebView做的. 服务器将MIME的标识符等放入传送的数据中告诉浏览器使用那种插件读取相关文件. uiwebview加载各种本地文件(通过loadData方法): UIWebView加载内容的三种方式: 1 加载本地数据文件 指定文件的MIMEType 编码格式使用@"UTF-8" 2加载html字符串(可以加载全部或者部分html
-
Oracle批量插入数据的三种方式【推荐】
第一种: begin insert into tableName(column1, column2, column3...) values(value1,value2,value3...); insert into tableName(column1, column2, column3...) values(value1,value2,value3...); insert into tableName(column1, column2, column3...) values(value1,val
-
vue请求数据的三种方式
请求数据的方式: vue-resource 官方提供的 vue的一个插件 axios fetch-jsonp 一,vue-resource请求数据 介绍:vue-resource请求数据方式是官方提供的一个插件 使用步骤: 1.安装vue-resource模块 cnpm install vue-resource --save 加--save是为了在package.json中引用,表示在生产环境中使用.因为我们在日常开发中,如果我们要打包代码给其他人或者上传到github,又或者要发布代码时,pa
-
java从命令行获取数据的三种方式代码实例
这篇文章主要介绍了java从命令行获取数据的三种方式代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 第一种:利用Scanner对象 import java.util.Scanner; public class TestInputOuput { public static void main(String[] args) { System.out.println("请输入:"); Scanner inp = new Scanne
-
浅谈TensorFlow中读取图像数据的三种方式
本文面对三种常常遇到的情况,总结三种读取数据的方式,分别用于处理单张图片.大量图片,和TFRecorder读取方式.并且还补充了功能相近的tf函数. 1.处理单张图片 我们训练完模型之后,常常要用图片测试,有的时候,我们并不需要对很多图像做测试,可能就是几张甚至一张.这种情况下没有必要用队列机制. import tensorflow as tf import matplotlib.pyplot as plt def read_image(file_name): img = tf.read_fil
-
SQLServer批量插入数据的三种方式及性能对比
昨天下午快下班的时候,无意中听到公司两位同事在探讨批量向数据库插入数据的性能优化问题,顿时来了兴趣,把自己的想法向两位同事说了一下,于是有了本文. 公司技术背景:数据库访问类(xxx.DataBase.Dll)调用存储过程实现数据库的访问. 技术方案一: 压缩时间下程序员写出的第一个版本,仅仅为了完成任务,没有从程序上做任何优化,实现方式是利用数据库访问类调用存储过程,利用循环逐条插入.很明显,这种方式效率并不高,于是有了前面的两位同事讨论效率低的问题. 技术方案二: 由于是考虑到大数据量的批量
-
MongoDB中优雅删除大量数据的三种方式
目录 为什么要"瘦身"呢? MongoDB中删除数据的三种方式 三种方式的执行效率对比 1. remove 2. deleteMany 3. bulkWrite 通过 Write Concern 规避主从延迟 删除过程中遇到的Bug 总结 删除大量数据,无论是在哪种数据库中,都是一个普遍性的需求.除了正常的业务需求,我们需要通过这种方式来为数据库"瘦身". 为什么要"瘦身"呢? 1.表的数据量到达一定量级后,数据量越大,表的查询性能会越差. 毕竟
随机推荐
- 用 INNER JOIN语法联接多个表建记录集
- jQuery+CSS3+Html5实现弹出层效果实例代码(附源码下载)
- WordPress下载监控插件id参数SQL注入漏洞
- 为什么Java要把字符串设计成不可变的
- Java程序连接数据库的常用的类和接口介绍
- GridView_RowUpdating取不到新值的解决方法
- python制作爬虫爬取京东商品评论教程
- 善用事件代理,警惕闭包的性能陷阱。
- Ubuntu Server下MySql数据库备份脚本代码
- 轻量级jQuery插件slideBox实现带底栏轮播(焦点图)代码
- js实现图片淡入淡出切换简易效果
- 用javascript实现自动输出网页文本
- js取消单选按钮选中并判断对象是否为空
- Windows环境下如何配置wamp的虚拟域名
- 用DNSPod和Squid打造自己的CDN (四)
- 第五节--克隆
- TensorFlow实现AutoEncoder自编码器
- Ubuntu环境下使用G++编译CPP文件
- python中for循环输出列表索引与对应的值方法
- iOS APP 多服务器环境分离的方法
