-
2022-05-25 11:42:47
一、提取txt数据特定列数据,并保存的实现步骤:
(1)使用codecs库的open()方法按行读取txt数据。注意txt文件读取时,编码方式设置(例如:encoding='utf-8');
(2)选取txt数据特定列。使用append()方法对特定列数据进行存储;
(3)循环遍历得到的特定列数据,并保存到txt数据文件中;
二、以下案例以保存txt文件的前两列数据为例,使用该方法实现特定列数据保存:
import codecs f = codecs.open('1.txt', mode='r', encoding='utf-8') # 打开txt文件,以‘utf-8'编码读取 line = f.readline() # 以行的形式进行读取文件 x = [] # 设置x y z数组 y = [] z = [] while line: a = line.split(',') # 每行数据分隔情况,此数据以“,”分隔 b = a[0] # 选取需要读取的数据列数 c = a[1] x.append(b) # 将其添加在列表之中 y.append(c) x.append(y) line = f.readline() f.close() # close文件 f = open (r'new1.txt','w') # 对获取的txt前两列数据进行保存 for i in x: print(i,file = f) f.close() # close文件
更多相关内容 -
python提取txt文件每一行中的特定字符内容,并写入文件
2022-05-15 16:24:40#这里以读取video_reqtest.txt中后一个括号内的数字0.079,存到train.txt为例,video_reqtest.txt文件中的内容如下 #video 1/1 (1/902) /content/drive/MyDrive/yolov5-5.0/mydata/barbecue.mp4: 384x640 1 fire, ...import re #这里以读取video_reqtest.txt中后一个括号内的数字0.079,存到train.txt为例,video_reqtest.txt文件中的内容如下 #video 1/1 (1/902) /content/drive/MyDrive/yolov5-5.0/mydata/barbecue.mp4: 384x640 1 fire, Done. (0.079s) #video 1/1 (2/902) /content/drive/MyDrive/yolov5-5.0/mydata/barbecue.mp4: 384x640 1 fire, Done. (0.015s) #video 1/1 (3/902) /content/drive/MyDrive/yolov5-5.0/mydata/barbecue.mp4: 384x640 1 fire, Done. (0.015s) # 读取文件的每一行 read_txt = open("video_reqtest.txt", "r",encoding="utf-8") #定义一个空列表用于接收提取出来的内容 temp = [] for line in read_txt: a = re.findall(r'[(](.*?)[)]', line) #读出一行中()内的值,用到是python的正则表达式,不懂。。。如 abbc(0.1s) ,读出为 0.1s ''' print(a) 输出结果: ['1/902', '0.079s'] ['2/902', '0.015s'] ['3/902', '0.015s'] 要提取的内容在列表的第二个索引中,再去掉a[1]中的s ''' b = re.findall(r'(.*?)[s]', a[1]) #按上面的方法把s去掉 ''' print(b) 输出结果: ['0.079'] ['0.015'] ['0.015'] 要提取的内容在列表的第一个索引中,注意不是列表b呦。。。 ''' temp.append((b[0])) #添加到临时列表中 ''' print(temp) 输出内容: ['0.079'] ['0.079', '0.015'] ['0.079', '0.015', '0.015'] 循环一次添加一个,最后得到我们要的列表。。。。 对一个python小白来说搞到这里好艰难,参考网友的内容,一点点的搞出来了。。。。。 还有最后一步,保存到文件。。。 ''' #写入到文件 with open("train.txt","w",encoding='utf-8') as file: for i in temp: file.write(i+'\n') file.close() '''trian文件内容''' #0.079 #0.015 #0.015 #于2022-05-15
ps:python中open读写模式的参数:
要了解文件读写模式,需要了解几种模式的区别,以及对应指针
r : 读取文件,若文件不存在则会报错
w: 写入文件,若文件不存在则会先创建再写入,会覆盖原文件
a : 写入文件,若文件不存在则会先创建再写入,但不会覆盖原文件,而是追加在文件末尾
rb,wb: 分别于r,w类似,但是用于读写二进制文件
r+ : 可读、可写,文件不存在也会报错,写操作时会覆盖
w+ : 可读,可写,文件不存在先创建,会覆盖
a+ : 可读、可写,文件不存在先创建,不会覆盖,追加在末尾
-
(转)提取TXT文本中指定内容——python
2020-12-12 10:17:55项目介绍:在PYTHON的计算机二级考试中有这么一个题,要求我们从一个文本中按照特定的格式提取指定内容。文件名称为“论语-网络版.txt”,其内容采用如下格式组织:【原文】1.11子曰:“父在,观其(1)志;父没,观其...项目介绍:
在PYTHON的计算机二级考试中有这么一个题,要求我们从一个文本中按照特定的格式提取指定内容。
文件名称为“论语-网络版.txt”,其内容采用如下格式组织:
【原文】
1.11子曰:“父在,观其(1)志;父没,观其行(2);三年(3)无改于父之道(4),可谓孝矣。”
【注释】
(略)
【译文】
(略)
【评析】
(略)
该版本通过【原文】标记《论语》原文内容,采用【注释】、【译文】和【评析】标记对原文的注释、译文和评析。
问题1:请编写程序,提取《论语》文档中所有原文内容,输出保存到“论语-提取版.txt”文件。输出文件格式要求:去掉文章中原文部分每行行首空格及如“1.11”等的数字标志,行尾无空格、无空行。参考格式如下(原文中括号及内部数字是对应源文件中注释项的标记):
子曰(1):“学(2)而时习(3)之,不亦说(4)乎?有朋(5)自远方来,不亦乐(6)乎?人不知(7),而不愠(8),不亦君子(9)乎?”
有子(1)曰:“其为人也孝弟(2),而好犯上者(3),鲜(4)矣;不好犯上,而好作乱者,未之有也(5)。君子务本(6),本立而道生(7)。孝弟也者,其为人之本与(8)?”
子曰:“巧言令色(1),鲜(2)仁矣。”
(略)
问题2:请编写程序,在“论语-提取版.txt”基础上,进一步去掉每行文字中所有括号及其内部数字,保存为“论文-原文.txt”文件。参考格式如下:
子曰:“学而时习之,不亦说乎?有朋自远方来,不亦乐乎?人不知,而不愠,不亦君子乎?”
有子曰:“其为人也孝弟,而好犯上者,鲜矣;不好犯上,而好作乱者,未之有也。君子务本,本立而道生。孝弟也者,其为人之本与?”
子曰:巧言令色,鲜仁矣。”
(略)
实现程序如下(python):
fi = open("论语-网络版","r",encoding="utf-8")
fo = open("论语-提取版.txt","w",encoding="utf-8")
wflag =False #写标记
newline = [] #创建一个新的列表
for line in fi : #按行读入文件,此时line的type是str
if "【" in line: #重置写标记
wflag =False
if "【原文】" in line: #检验是否到了要写入的内容
wflag = True
continue
if wflag == True:
K = list(line)
if len(K)>1: #去除文本中的空行
for i in K : #写入需要内容
newline.append(i)
strlist = "".join(newline) #合并列表元素
newlines = str(strlist) #list转化成str
for D in range(1,100): #删掉句中()
newlines = newlines.replace("({})".format(D),"")
for P in range(0,9): #删掉前面数值标题
for O in range(0,9):
for U in range(0, 9):
newlines = newlines.replace("{}.{}{}".format(P,O,U), "")
fo.write(newlines)
fo.close()
fi.close()
("论语-网络版","r",encoding="utf-8")
fo = open("论语-提取版.txt","w",encoding="utf-8")
wflag = False #写标记
for line in fi:
if "【" in line : #遇到【时,说明已经到了新的区域,写标记置否
wflag = False
if "【原文】" in line: #遇到【原文】时,设置写标记为Ture
wflag = True
continue
if wflag == True: #根据写标记将当前行内容写入新的文件
for i in range(0,25):
for j in range(0,25):
line = line.replace("{}·{}".format(i,j),"**")
for i in range(0,10):
line = line.replace("*{}".format(i),"")
for i in range(0,10):
line = line.replace("{}*".format(i),"")
line = line.replace("*","")
fo.write(line)
fi.close()
fo.close()
fi = open("论语-提取版.txt","r")
fo = open("论语-原文","w")
for line in fi:
for i in range(1,23):
line = line.replace("({})".format(i),"")
fo.write(line)
fi.close()
fo.close()
其运行结果如下:
————————————————
版权声明:本文为CSDN博主「MENG_痴痴」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/weixin_44409075/article/details/88080091
-
python读取txt中的特定内容
2021-05-01 19:35:17python是以字符串形式读取txt文件的,每行一个字符串。对于对一个字符串,先去除’(‘和’)’,再用strip去除’\n’符,再用split分割(split处理后str转为list)得到四个数字,存入数组中备用即可。 ...问题描述:
想要读取txt文件中每一行括号中的三个数字
代码实现:
python是以字符串形式读取txt文件的,每行一个字符串。对于对一个字符串,先去除’(‘和’)’,再用strip去除’\n’符,再用split分割(split处理后str转为list)得到四个数字,存入数组中备用即可。 -
如何使用python从.txt文件中提取两列?
2020-11-26 07:47:05我想从数据中提取两列,并用python将它们保存在另一个文件中。在到目前为止,我所做的就是:将文件保存为.txt,然后编写以下脚本:# -*- coding: utf-8 -*-import csvf = open('file.txt')csv_f=csv.reader(f)for ... -
python利用正则表达式提取文本中特定内容
2020-12-05 21:22:24Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式。re 模块使 Python 语言拥有全部的正则表达式功能。compile 函数根据一个模式字符串和可选的标志参数生成一个正则表达式对象。该对象拥有一系列... -
如何使用python代码实现对txt文件指定数字内容的提取并保存至excel文件?
2021-08-20 23:27:09如图所示,提取所有开头为50136的行的第10列的数据,并保存到新的Excel文件中。有很多文件里都有这样的数据,怎么做到把这么多文件里所有的开头为50136的行的第10列的数据提取出来并保存到新的Excel文件中? -
如何用python提取txt文件中的特定信息并写入Excel
2019-10-07 10:54:25我的问题: 我有一个这样的数据集,大概几百上千行,两行数据之间隔一个空行。...现在我希望能提取每一行X:和Y:后面的数字,然后保存下来做进一步的数据处理和分析 就拿第一行来说,我只需要-2.668 和... -
[python]正则表达式实战,提取txt文档的指定内容,并输出为表格csv文件
2019-04-17 22:13:32于是花了一个晚上的时间更改文件后缀名为txt,并将文件的部分内容进行删除,剩下需要提取的部分。大大小小的文件有几十个吧,花了不少功夫。 较长时间没写python了,主要用到 正则表达式 和 文件读写功能。写的过程... -
提取TXT文本中指定内容——python
2019-03-02 19:30:20在PYTHON的计算机二级考试中有这么一个题,要求我们从一个文本中按照特定的格式提取指定内容。 文件名称为“论语-网络版.txt”,其内容采用如下格式组织: 【原文】 1.11子曰:“父在,观其(1)志;父没,观其行... -
python批量处理txt文本,获取指定内容
2021-05-30 15:44:17那就是批量处理txt文本啦,获取里面指定内容,然后进行保存。刚开始拿到,发现无从下手。整理了思路后发现还是可以做的,嘿嘿! 首先文本里的内容是这样的: 要取的内容就是最后的那些数字。还好每个文档的格式都是... -
python 获取txt文件中指定的段落
2019-05-17 10:33:56获取 txt文件中,从<...到</Package>之间的内容 用正则表达式实现: import re file = open('power_whitelist_cfg.txt') keyStart = '<Package name="com.tencent.tmgp.sgame">'... -
Python提取excel中指定关键字的单元格
2021-11-12 20:02:56在网络运维中会有处理excel形式的单列的log的场景,需要从中根据关键字来提取需要的那一行数据以方便查看,尤其是面向运营商网络,大量的设备使得人工汇总非常麻烦,使用python的xlrd和xlwt类可以很好的帮我们处理... -
Python如何提取TXT中的指定数据
2021-08-12 14:16:15我想提取文本里所有car_x,和car_y的数据并把它写入一个新的txt文件中,其他数据都不要 -
PYTHON提取TXT或log特定内容
2021-09-25 14:57:43import os import re import tkinter as tk from tkinter import filedialog root = tk.Tk() ...Files_r = filedialog.askopenfilenames(title="选择要转换历史告警log文件",filetypes=[('log、TXT -
如何使用python从文本文件中提取特定信息?
2021-01-13 04:34:435.5. DictionariesAnother useful data type built into Python is the dictionary (see Mapping Types — dict). Dictionaries are sometimes found in other languages as “associative memories” or ... -
python——将某一文本内容提取并形成新的文件
2020-12-08 11:49:31有时候我们从网上下载某些.txt文件,想对文件内容进行提取并生成新的目录文件首先我们应遍历某特定目录下的所有.txt文件这里我们采用广度遍历目录的方式(队列遍历)import osimport collectionsdef getAllDirQue(path... -
提取txt文件中指定数据至excel中(python)
2021-05-23 15:03:26步骤1、导入txt文件2、定位目标数据! 正则表达式!切割数组3、制作目标格式! 改成字典形式! 改成DataFrame格式4、导出为Excel踩雷&报错 1、导入txt文件 f = open(r"D:\0-12 化雪装置\测雪仪\4-程序\... -
使用Python提取txt文件中的数据到excel中
2021-10-24 22:17:37对txt根据','进行切片 n = 1 with open('QWS数据集1.txt','r+') as f: for line in f.readlines(): for i in range(11): sheet.write(n, i, line.split(',')[i]) n = n + 1 将输出数据保存在指定的excel文件中【我... -
如何使用python提取json中指定字段的数据?
2020-12-03 08:26:41如何使用python提取json中指定字段的数据?现在有一个json数据,如下:{"favourite":{"bkmrk":{"id1490843709594066":{"guid":"904eff52277f403b89f6410fe2758646.11","lcate":"1"},"id1490843712805183":{"guid":... -
python3.4.3实现txt文本指定字符提取
2017-09-01 14:56:38TXT文档中提取指定文本 在每天上班的路上,都会在地铁上看看高晓松的《鱼羊野史》。很有意思的一本书,口头语言记录成册,来自《晓松奇谈》。每天都会按着日期看,今天是哪一天就翻到哪一天,看看历史上的今天发生了... -
python怎么读取txt文件并统计其字数-python计算文件的行数和读取某一行内容的实现方法...
2020-10-30 18:19:17linecache预先把文件读入缓存起来,后面如果你访问该文件的话就不再从硬盘读取 二、读取文件某一行的内容(测试过1G大小的文件,效率还可以) import linecache count = linecache.getline(filename,linenum) 三、... -
问:python如何提取txt中的特定字符后的段落
2019-08-03 22:49:49这个txt是论文数据,PMID是文章编号 TI是标题 AB是摘要,想提取这三个字段的内容。整个txt中有十万片文章左右,提取所有文章的这三个字段然后输出新的txt文档。 输出的结果大致长这样,先谢过各位大神 ... -
Python批量提取PDF文件中文本的脚本
2020-12-25 06:41:38本文实例为大家分享了Python批量提取PDF文件中文本的具体代码,供大家参考,具体内容如下 首先需要执行命令pip install pdfminer3k来安装处理PDF文件的扩展库。 import os import sys import time pdfs = (pdfs ... -
Python正则表达式之提取指定字符串内容后的数值
2022-01-08 19:52:59需求:提取散装商品斤重统计表格中describe列中高值、高高值、中值的斤重 describe列样例如下,高值、高高值、中值分别对应不同的价格分类,我们需要提取不同价格的斤重,以计算总的销售额。如果只是几行这样的记录... -
使用python提取html文件中的特定数据的实现代码
2020-12-24 16:06:45例如 具有如下结构的html文件 复制代码 代码如下: ’entry-content’> 感兴趣内容1</p> 感兴趣内容2</p> …… 感兴趣内容n</p> </div> ’content’> 内容1</p> 内容2</p> …… 内容n</p> </div> 我们尝试获得’感... -
如何用python读取TXT文件的特定内容
2018-11-18 06:16:38 如图,TXT文件里的每段内容都是以PT P开始,ER结束,怎样提取每段内容里PN,TI,AU 后的数据 -
python根据txt中指定信息从一个文件夹中移动数据到另一个文件夹
2021-05-26 14:15:58# -*- coding:utf-8 -*- import shutil import os ...file_path = 'random_8500.txt' # txt中指定移动文件的文件信息 #从文件中获取要拷贝的文件的信息 def get_filename_from_txt(file): filena -
Python中json的取值 如何使用python提取json中指定字段的数据
2021-03-18 10:25:37python中为什么用json...数据如下,我想要读取name、location里面的lat和lng,还有address,弄了首先需要在桌面新建‘json.txt’文件,内容为jsonline格式。F5运行程序,Shell打印出json文本信息。怎么使用python提...