精华内容
下载资源
问答
  • python提取txt中指定行
    千次阅读
    2020-11-26 04:01:37

    python提取txt中几行的方法

    发布时间:2020-09-01 11:04:43

    来源:亿速云

    阅读:121

    作者:小新

    python提取txt中几行的方法?这个问题可能是我们日常学习或工作经常见到的。希望通过这个问题能让你收获颇深。下面是小编给大家带来的参考内容,让我们一起来看看吧!

    python中的文件,通常是用read()方法来读取。

    如果程序要读取行,通常只能用文本方式来读取,道理很简单,只有文本文件才有行的概念,二进制文件没有所谓行的概念。

    文件对象提供了如下两个方法来读取行:

    readline([n]):读取一行内容。如果指定了参数 n,则只读取此行内的 n 个字符。

    readlines():读取文件内所有行。

    下面程序示范了使用 readline() 方法来读取文件内容:import codecs

    # 指定使用utf-8字符集读取文件内容

    f = codecs.open("readline_test.py", 'r', 'utf-8', buffering=True)

    while True:

    # 每次读取一行

    line = f.readline()

    # 如果没有读到数据,跳出循环

    if not line: break

    # 输出line

    print(line, end='')

    f.close()

    上面程序使用 UTF-8 字符集打开 readline_test.py 文件,这是由于该 Python 源文件是采用 UTF-8 字符集保存的,因此,如果直接用普通的 open() 函数打开文件,则会引发 UnicodeDecodeError 异常。(更多学习内容,请点击python学习网)

    接下来程序使用 readline() 方法逐行进行读取,当读取到结尾时,该方法将会返回空,程序就会退出循环。

    程序也可以使用 readlines() 方法一次读取文件内所有行。例如如下程序:import codecs

    # 指定使用utf-8字符集读取文件内容

    f = codecs.open("readlines_test.py", 'r', 'utf-8', buffering=True)

    # 使用readlines()读取所有行,返回所有行组成的列表

    for 1 in f.readlines():

    print(1, end='')

    f.close()

    感谢各位的阅读!看完上述内容,你们对python提取txt中几行的方法大概了解了吗?希望文章内容对大家有所帮助。如果想了解更多相关文章内容,欢迎关注亿速云行业资讯频道。

    更多相关内容
  • 以上这篇python读取TXT,并存到LIST的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持软件开发网。 您可能感兴趣的文章:python之从文件读取数据到list的实例讲解python 读取...
  • #这里以读取video_reqtest.txt中后一个括号内的数字0.079,存到train.txt为例,video_reqtest.txt文件的内容如下 #video 1/1 (1/902) /content/drive/MyDrive/yolov5-5.0/mydata/barbecue.mp4: 384x640 1 fire, ...
    import re
    #这里以读取video_reqtest.txt中后一个括号内的数字0.079,存到train.txt为例,video_reqtest.txt文件中的内容如下
    #video 1/1 (1/902) /content/drive/MyDrive/yolov5-5.0/mydata/barbecue.mp4: 384x640 1 fire, Done. (0.079s)
    #video 1/1 (2/902) /content/drive/MyDrive/yolov5-5.0/mydata/barbecue.mp4: 384x640 1 fire, Done. (0.015s)
    #video 1/1 (3/902) /content/drive/MyDrive/yolov5-5.0/mydata/barbecue.mp4: 384x640 1 fire, Done. (0.015s)
    # 读取文件的每一行
    read_txt =  open("video_reqtest.txt", "r",encoding="utf-8")
    #定义一个空列表用于接收提取出来的内容
    temp = []
    
    for line in read_txt:
        a = re.findall(r'[(](.*?)[)]', line)  #读出一行中()内的值,用到是python的正则表达式,不懂。。。如  abbc(0.1s)   ,读出为 0.1s
        '''
        print(a)
        输出结果:
        ['1/902', '0.079s']
        ['2/902', '0.015s']
        ['3/902', '0.015s']
        要提取的内容在列表的第二个索引中,再去掉a[1]中的s
        '''
        b = re.findall(r'(.*?)[s]', a[1])    #按上面的方法把s去掉
        '''
        print(b)
        输出结果:
        ['0.079']
        ['0.015']
        ['0.015']
        要提取的内容在列表的第一个索引中,注意不是列表b呦。。。
        '''
        temp.append((b[0]))  #添加到临时列表中
        '''
        print(temp)
        输出内容:
        ['0.079']
        ['0.079', '0.015']
        ['0.079', '0.015', '0.015']
        循环一次添加一个,最后得到我们要的列表。。。。
        对一个python小白来说搞到这里好艰难,参考网友的内容,一点点的搞出来了。。。。。
        还有最后一步,保存到文件。。。
        '''
    #写入到文件
    with open("train.txt","w",encoding='utf-8') as file:
        for i in temp:
            file.write(i+'\n')
        file.close()
    
    '''trian文件内容'''
    #0.079
    #0.015
    #0.015
    
    #于2022-05-15

     ps:python中open读写模式的参数:

    要了解文件读写模式,需要了解几种模式的区别,以及对应指针

    r : 读取文件,若文件不存在则会报错

    w: 写入文件,若文件不存在则会先创建再写入,会覆盖原文件

    a : 写入文件,若文件不存在则会先创建再写入,但不会覆盖原文件,而是追加在文件末尾

    rb,wb: 分别于r,w类似,但是用于读写二进制文件

    r+ : 可读、可写,文件不存在也会报错,写操作时会覆盖

    w+ : 可读,可写,文件不存在先创建,会覆盖

    a+ : 可读、可写,文件不存在先创建,不会覆盖,追加在末尾

    展开全文
  • 在生活和工作,我们可能遇到要从单一格式的文本提取指定内容的...本文将介绍如何用代码提取txt文件的制定模块内容,以提取基金季度报告基金经理在“报告期内基金投资策略和运作分析”处的观点内容为例。......

    目录

    前言

    使用步骤

    1.引入库

    2.设定文件所在地址

    3.提取特定模块内容

    总结


    前言

            在生活和工作中,我们可能遇到要从单一格式的文本中提取指定内容的情况,重复打开一份份文件再查找很繁琐,我们可以寻求更简单的方法。本文将介绍如何用代码提取txt文件中的制定模块内容,以提取基金季度报告中基金经理在“报告期内基金投资策略和运作分析”处的观点内容为例。


    使用步骤

    1.引入库

    代码如下:

    import re
    import os

    2.设定文件所在地址

    代码如下:

    file_path = "E:/cjia_code/report"

    3.提取特定模块内容

    代码如下:

    for file in os.listdir(file_path):
        suff_name = os.path.splitext(file)[1]  # 获取文件后缀
        # 过滤非txt格式文件
        if suff_name == '.txt':
            file_name = os.path.splitext(file)[0]  # 获取文件名称
            path = os.path.join(file_path + '//' + file_name+'.txt')  # 获取文件路径
            with open(path,"r",encoding='utf-8') as f:
                content = f.read()
            # 提取“4.4 报告期内基金投资策略和运作分析”和“4.5 报告期内基金的业绩表现”之间的内容
            re_str = r'4.4 报告期内基金投资策略和运作分析(.+)4.5 报告期内基金的业绩表现'   
            resp = re.findall(re_str, content, re.S)
            result = ' '.join(resp)
            result.split('\n')  #删除换行符
            print(result)

    全部代码如下:

    import re
    import os
    file_path = "E:/cjia_code/report"
    for file in os.listdir(file_path):
        suff_name = os.path.splitext(file)[1]  # 获取文件后缀
        # 过滤非txt格式文件
        if suff_name == '.txt':
            file_name = os.path.splitext(file)[0]  # 获取文件名称
            path = os.path.join(file_path + '//' + file_name+'.txt')  # 获取文件路径
            with open(path,"r",encoding='utf-8') as f:
                content = f.read()
            # 提取“4.4 报告期内基金投资策略和运作分析”和“4.5 报告期内基金的业绩表现”之间的内容
            re_str = r'4.4 报告期内基金投资策略和运作分析(.+)4.5 报告期内基金的业绩表现'   
            resp = re.findall(re_str, content, re.S)
            result = ' '.join(resp)
            result.split('\n')  #删除换行符
            print(result)

    总结

            以上就是今天要讲的内容,本文简单介绍了如何提取txt文件中固定板块的内容,希望能给读者带来一些帮助。

    展开全文
  • with open(rC:\Users\LENOVO\Desktop\20170513155231.txt, encoding='utf-8') as f:#从TXT文件读出数据 for line1 in f: list.append(line1) #通过for循环一加载 datalist=[] #定义一个数组 for item in ...
  • 主要介绍了python 提取文件指定列的方法示例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
  • 项目介绍:在PYTHON的计算机二级考试有这么一个题,要求我们从一个文本按照特定的格式提取指定内容。文件名称为“论语-网络版.txt”,其内容采用如下格式组织:【原文】1.11子曰:“父在,观其(1)志;父没,观其...

    项目介绍:

    在PYTHON的计算机二级考试中有这么一个题,要求我们从一个文本中按照特定的格式提取指定内容。

    文件名称为“论语-网络版.txt”,其内容采用如下格式组织:

    【原文】

    1.11子曰:“父在,观其(1)志;父没,观其行(2);三年(3)无改于父之道(4),可谓孝矣。”

    【注释】

    (略)

    【译文】

    (略)

    【评析】

    (略)

    该版本通过【原文】标记《论语》原文内容,采用【注释】、【译文】和【评析】标记对原文的注释、译文和评析。

    问题1:请编写程序,提取《论语》文档中所有原文内容,输出保存到“论语-提取版.txt”文件。输出文件格式要求:去掉文章中原文部分每行行首空格及如“1.11”等的数字标志,行尾无空格、无空行。参考格式如下(原文中括号及内部数字是对应源文件中注释项的标记):

    子曰(1):“学(2)而时习(3)之,不亦说(4)乎?有朋(5)自远方来,不亦乐(6)乎?人不知(7),而不愠(8),不亦君子(9)乎?”

    有子(1)曰:“其为人也孝弟(2),而好犯上者(3),鲜(4)矣;不好犯上,而好作乱者,未之有也(5)。君子务本(6),本立而道生(7)。孝弟也者,其为人之本与(8)?”

    子曰:“巧言令色(1),鲜(2)仁矣。”

    (略)

    问题2:请编写程序,在“论语-提取版.txt”基础上,进一步去掉每行文字中所有括号及其内部数字,保存为“论文-原文.txt”文件。参考格式如下:

    子曰:“学而时习之,不亦说乎?有朋自远方来,不亦乐乎?人不知,而不愠,不亦君子乎?”

    有子曰:“其为人也孝弟,而好犯上者,鲜矣;不好犯上,而好作乱者,未之有也。君子务本,本立而道生。孝弟也者,其为人之本与?”

    子曰:巧言令色,鲜仁矣。”

    (略)

    实现程序如下(python):

    fi = open("论语-网络版","r",encoding="utf-8")

    fo = open("论语-提取版.txt","w",encoding="utf-8")

    wflag =False #写标记

    newline = [] #创建一个新的列表

    for line in fi : #按行读入文件,此时line的type是str

    if "【" in line: #重置写标记

    wflag =False

    if "【原文】" in line: #检验是否到了要写入的内容

    wflag = True

    continue

    if wflag == True:

    K = list(line)

    if len(K)>1: #去除文本中的空行

    for i in K : #写入需要内容

    newline.append(i)

    strlist = "".join(newline) #合并列表元素

    newlines = str(strlist) #list转化成str

    for D in range(1,100): #删掉句中()

    newlines = newlines.replace("({})".format(D),"")

    for P in range(0,9): #删掉前面数值标题

    for O in range(0,9):

    for U in range(0, 9):

    newlines = newlines.replace("{}.{}{}".format(P,O,U), "")

    fo.write(newlines)

    fo.close()

    fi.close()

    ("论语-网络版","r",encoding="utf-8")

    fo = open("论语-提取版.txt","w",encoding="utf-8")

    wflag = False #写标记

    for line in fi:

    if "【" in line : #遇到【时,说明已经到了新的区域,写标记置否

    wflag = False

    if "【原文】" in line: #遇到【原文】时,设置写标记为Ture

    wflag = True

    continue

    if wflag == True: #根据写标记将当前行内容写入新的文件

    for i in range(0,25):

    for j in range(0,25):

    line = line.replace("{}·{}".format(i,j),"**")

    for i in range(0,10):

    line = line.replace("*{}".format(i),"")

    for i in range(0,10):

    line = line.replace("{}*".format(i),"")

    line = line.replace("*","")

    fo.write(line)

    fi.close()

    fo.close()

    fi = open("论语-提取版.txt","r")

    fo = open("论语-原文","w")

    for line in fi:

    for i in range(1,23):

    line = line.replace("({})".format(i),"")

    fo.write(line)

    fi.close()

    fo.close()

    其运行结果如下:

    ————————————————

    版权声明:本文为CSDN博主「MENG_痴痴」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。

    原文链接:https://blog.csdn.net/weixin_44409075/article/details/88080091

    展开全文
  • python批量删除txt文件指定行

    千次阅读 多人点赞 2021-03-01 17:43:22
    @python批量删除txt文件指定行 python批量删除txt文件指定行 只需用到os模块即可 在这段代码里,只需要输入你的文件目录和要删除的行数即可 import os # 工作文件夹,可以含有子文件夹 text = "E:/as" #只需输入txt...
  • Python提取并保存txt文件特定列数据

    千次阅读 2022-05-25 11:42:47
    一、提取txt数据特定列数据,并保存的实现步骤: (1)使用codecs库的open()方法按读取txt数据。注意txt文件读取时,编码方式设置(例如:encoding='utf-8'); (2)选取txt数据特定列。使用append()方法对...
  • Python 解析txt文件获取Json数据并提取,Python解析Json数据 Json键值对数据提取 ...利用Python提取指定数据。 提取数据描述,预期获取Json数据的所有"problem_id"列表方便后续实现自动答题......
  • 最近在做服务组合的一些研究,从作者那获取到了QWS数据集,因此需要对数据集进行处理,获取到数据集的数据,保存在excel文件。QWS数据集包含2000多条数据,每条数据之间的数值采用“,”隔开,因此可以使用spilt...
  • #!/usr/bin/env python # -*- coding: utf-8 -*- # @Time : 2020/11/23 21:47 # @Author : Qiufen.Chen ...# @File : extract_H.py ...purpose:提取行中第二列为 H 的,保存输出 例如: Q 1 31 9.626 22.325 .
  • 提取TXT文本中指定内容——python

    万次阅读 多人点赞 2019-03-02 19:30:20
    PYTHON的计算机二级考试有这么一个题,要求我们从一个文本按照特定的格式提取指定内容。 文件名称为“论语-网络版.txt”,其内容采用如下格式组织: 【原文】 1.11子曰:“父在,观其(1)志;父没,观其...
  • 我想提取文本里所有car_x,和car_y的数据并把它写入一个新的txt文件,其他数据都不要
  • 默认你知道“指定21135261”的行号那么:def appoint_line(num,file):with open(file,"r",encoding='utf-8') as f:out = f.readlines[num-1]return outprint(appoint_line(2,"c:/text.txt"))以上示例为4102读取c盘...
  • Python3实现从txt文件读取指定行的方法 本文实例讲述了Python3实现从文件读取指定行的方法。分享给大家供大家参考。具体实现方法如下: def getline(the_file_path, line_number): if line_number <...
  • 用“python”怎么提取文件里的指定内容?python读取文件内容的方法: 一.最方便的方法是一次性读取文件的所有内容并放置到一个大字符串: all_the_text = open('thefile.txt').read( )# 文本文件的所有文本all...
  • 1、使用python读取指定长度的文本; 2、使用python读取某一范围内的文本。 Python代码 test.txt文本内包含的字符串为“AAAAAAAABBBBBBBBCCCCCCCCDDDDDDDD”,A,B,C,D均为8个 # -*- coding:utf-8 -*- text_file = ...
  • 方法一:思路:将txt文件读成一个字符串,在整个字符串进行匹配,匹配到的是数组,再从数组的对应位置取数据txt样例:------begin checkaccuracy--------- Validating batch 10 Validating batch 20 Validating ...
  • 最近在做实例分割,想将分割出的每个实例提取出来 ...fa = open("0000_014.txt", 'r') for line in fa.readlines(): print line str1 = line.split(" ")[-1] str2 = str1.split('.')[0] int_value =
  • -0.865999 ], [ 0.379297 , -1.00048 , -0.654541 , -0.0906588, 0.401206 , 0.44239 ], [-0.0794765, -2.68794 , -0.84847 , 0.931357 , -0.31156 , 0.552622 ]]) 编辑 如果你想读每k,你可以指定chunksize....
  • python读取txt中的特定内容

    千次阅读 2021-05-01 19:35:17
    python是以字符串形式读取txt文件的,每一个字符串。对于对一个字符串,先去除’(‘和’)’,再用strip去除’\n’符,再用split分割(split处理后str转为list)得到四个数字,存入数组备用即可。 ...
  • 步骤1、导入txt文件2、定位目标数据! 正则表达式!切割数组3、制作目标格式! 改成字典形式! 改成DataFrame格式4、导出为Excel踩雷&报错 1、导入txt文件 f = open(r"D:\0-12 化雪装置\测雪仪\4-程序\...
  • 主要介绍了python 根据正则表达式提取指定的内容实例详解的相关资料,需要的朋友可以参考下
  • python获取txt某一
  • python提取文本指定内容

    千次阅读 2022-03-02 21:01:45
    python输出文本内某段的内容 输入匹配样式获取匹配内容 1.代码 代码如下(示例): import re import numpy as np # import csv x=int(input("输入起始:")) y=int(input("输入结束:")) z=input("输入匹配模式:...
  • python 获取txt文件中指定的段落

    万次阅读 2019-05-17 10:33:56
    获取 txt文件,从<Package name="com.tencent.tmgp.sgame">到</Package>之间的内容 用正则表达式实现: import re file = open('power_whitelist_cfg.txt') keyStart = '<Package name=...
  • import os import re import tkinter as tk from tkinter import filedialog root = tk.Tk() ...Files_r = filedialog.askopenfilenames(title="选择要转换历史告警log文件",filetypes=[('log、TXT

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 26,177
精华内容 10,470
热门标签
关键字:

python提取txt中指定行