-
2019-03-08 19:37:33
之前是直接用Excel处理数据,后来觉得实在是繁琐,尤其在数据量过大的情况下,特此去学了用python处理数据。学完之后不禁感叹pandas的强大。
Excel和CSV的处理方式大致相同,以下用csv举例。均为一些基础操作。
1.读取表格
import pandas as pd new_data=pd.read_csv('/Users/ymhzb1994/Desktop/movie/movielens.csv') #如果文件没有表头,还可以自己添加表头 new_data=pd.read_csv('/Users/ymhzb1994/Desk/data.csv',header=None,names = ['userId','movieId','rating'] )
2.查看数据
#查看前12行 head()的()中为空为默认前5行 new_data.head(12)
#查看表尾后几行 new_data.tail()
3.去除重复数据
new_data.drop_duplicates(subset=None,keep='first',inplace=True)
(1)subset:按照哪些列重复进行删除
subset=None时,全部列重复则删除该行;
若仅userid和movieId重复,就删除该行,则subset=['userid','movieId']
(2)keep=None 删除所有重复数据;kepp=‘first’保留第一次出现的重复行;keep='last' 保留重复行出现的最后一次
(3)inplace=True 是在原来的datafram上去除;inplace=False是 产生一个副本
如:
data_distinct=new_data.drop_duplicates(subset=None,keep='first',inplace=False)
4.选取其中几列作为新的datafram
data_select=new_data[['userid','movieId']]
5.存成新的表
data_select.to_csv('/user/my/newdata.csv')
更多相关内容 -
Python表格数据处理.rar
2021-01-26 10:32:44Python 对excel表按列按行进行填充对应数据 -
python爬虫爬取网页表格数据
2020-09-20 17:53:15主要为大家详细介绍了python爬虫爬取网页表格数据,具有一定的参考价值,感兴趣的小伙伴们可以参考一下 -
python实现数据写入excel表格
2020-09-20 16:55:12主要为大家详细介绍了python实现数据写入excel表格,具有一定的参考价值,感兴趣的小伙伴们可以参考一下 -
Python基于pandas爬取网页表格数据
2020-12-17 13:56:50该网站数据存在table标签,直接用requests,需要结合bs4解析正则/xpath/lxml等,没有几行代码是搞不定的。 今天介绍的黑科技是pandas自带爬虫功能,pd.read_html(),只需传人url,一行代码搞定。 原网页结构如下: ... -
python读取word 中指定位置的表格及表格数据
2021-01-02 17:59:011.Word文档如下: 2.代码 # -*- coding: UTF-8 -*- from docx import Document def readSpecTable(filename, specText): document = Document(filename) paragraphs = document.paragraphs ... -
Python网页数据抓取以及表格的制作
2019-07-16 22:30:35Python的网页数据抓取,表格的制作,CSS文件的生成,字体的改变 -
python处理excel表格数据
2020-12-21 15:45:24python处理excel表格数据 方法一 你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。 excel表格数据筛选功能 ... -
Python获取数据库数据并保存在excel表格中的方法
2020-12-26 03:56:07将数据库中的数据保存在excel文件中有很多种方法,这里主要介绍pyExcelerator的使用。 一、前期准备(不详细介绍MySQL) python包pyExcelerator和MySQLdb 导入方法:(以Pycharm为例) 在File->Settings中点击右上角... -
【python】删除excel表格重复行,数据预处理
2020-12-22 11:17:59使用python删除excel表格重复行。 # 导入pandas包并重命名为pd import pandas as pd # 读取Excel中Sheet1中的数据 data = pd.DataFrame(pd.read_excel('test.xls', 'Sheet1')) # 查看读取数据内容 print(data) # ... -
python获取表格类数据解析并存入mysql数据库
2020-05-21 23:06:43运行代码前需要安装好mysql数据库哦,并且将conn = create_engine("mysql+pymysql://root:123456@localhost:3306/trytry2?charset=utf8mb4")这段代码中的数据库用户名(root)、密码(123456)、你建好的数据库名称... -
基于python实现把json数据转换成Excel表格
2020-12-20 08:24:24json数据: [{“authenticate”:-99,”last_ip”:”156.2.98.429″,”last_time”:”2020/05/23 01:41:36″,”member_id”:5067002,”mg_id”:1,”name”:”yuanfang”,”status”:0,”username”:”L7898″},{... -
Python遍历pandas数据方法总结
2021-01-01 07:12:31DataFrame 是一种二维的数据结构,接近于电子表格或者mysql数据库的形式。 在数据分析中不可避免的涉及到对数据的遍历查询和处理,比如我们需要将dataframe两列数据两两相除,并将结果存储于一个新的列表中。本文... -
对python制作自己的数据集实例讲解
2020-09-19 20:55:02今天小编就为大家分享一篇对python制作自己的数据集实例讲解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧 -
用Python将Excel数据导入到SQL Server的例子
2021-01-20 07:10:44因为近期需要将excel导入到SQL Server,但是使用的是其他语言,闲来无事就尝试着用python进行导入,速度还是挺快的,1w多条数据,也只用了1s多,代码也比较简单,就不多解释了。 用到的库有xlrd(用来处理excel),... -
Python实现导出数据生成excel报表的方法示例
2020-12-25 05:42:35本文实例讲述了Python实现导出数据生成excel报表的方法。分享给大家供大家参考,具体如下: #_*_coding:utf-8_*_ import MySQLdb import xlwt from datetime import datetime def get_data(sql): # 创建数据库连接... -
python 删除excel表格重复行,数据预处理操作
2020-09-16 13:30:55主要介绍了python 删除excel表格重复行,数据预处理操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧 -
python3 读取Excel表格中的数据
2020-09-20 01:15:59主要介绍了python3 读取Excel表格中的数据的相关资料,需要的朋友可以参考下 -
使用python将大量数据导出到Excel中的小技巧分享
2020-09-20 09:05:09今天小编就为大家分享一篇使用python将大量数据导出到Excel中的小技巧心得,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧 -
基于Python快速处理PDF表格数据
2020-12-17 16:16:42使用Python提取表格数据需要使用pdfplumber模块,打开CMD,安装代码如下: pip install pdfplumber 安装完之后,将需要使用的模块导入 import pdfplumberimport pandas as pd 然后打开PDF文件 # 使用with语句打开... -
Python读取Excel数据并生成图表过程解析
2020-12-17 11:18:18通过Python程序读取Excel文件中的数据,生成图表,最好将生成图表生成至浏览器页面,后期数据多之后,也能自动缩放,而不会出现显示不全问题。 三、需求实现代码 # 调用本地echarts.min.js 文件 from pyecharts.... -
详谈Python 窗体(tkinter)表格数据(Treeview)
2020-09-20 01:39:48今天小编就为大家分享一篇详谈Python 窗体(tkinter)表格数据(Treeview),具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧 -
Python将列表数据写入文件(txt, csv,excel)
2021-01-20 06:51:38def text_save(filename, data):#filename为写入CSV文件的路径,data为要写入数据列表. file = open(filename,'a') for i in range(len(data)): s = str(data[i]).replace('[','').replace(']','')#去除[],这两行... -
python处理数据,存进hive表的方法
2020-09-20 07:16:27今天小编就为大家分享一篇python处理数据,存进hive表的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧 -
python Excel数据表格转为HTML网页数据表格
2022-03-09 19:36:09python Excel数据表格转为HTML网页数据表格python Excel数据表格转为HTML网页数据表格
文章目录
准备test数据
首先,准备一个excel。以以下代码为例,在当前目录下生成一个Excel文件:test.xslx。
import pandas as pd df = pd.DataFrame(index=['a', 'b', 'c', 'd', 'e', 'f']) df['num1'] = [1, 2, 3, 4, 5, 6] df['num2'] = [11, 22, 33, 44, 55, 66] print(df) df.to_excel('test.xlsx')
生成的这个Excel如图所示:
Excel转html
读取这个excel文件,并转变为html文件:
import pandas as pd df = pd.read_excel('test.xlsx') df.to_html('mrbooks.html', header=True, index=False)
如图生成了一个html文件,
经过浏览器渲染后展示如下:
-
Python3读取和写入excel表格数据的示例代码
2020-09-16 17:30:46主要介绍了Python3读取和写入excel表格数据的示例代码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧 -
python写入已存在的excel数据实例
2020-12-24 14:27:40python可以使用xlrd读excel,使用xlwt写excel,但是如果要把数据写入已存在的excel,需要另外一个库xlutils配合使用. 大概思路: 1、用xlrd.open_workbook打开已有的xsl文件 注意添加参数formatting_info=True,得以...
收藏数
134,894
精华内容
53,957