精华内容
下载资源
问答
  • 处理 TXT 文本技巧
    千次阅读
    2019-05-21 10:22:48

    在一些场景会碰到需要从 TXT 文本文件提取需要的表格,TXT 文本并没有固定的格式,所以基本上每一个不同的 TXT 文本都需要单独写程序,下面是一些我在项目中用到的 TXT 文本处理技巧。

    有用到的 Python 处理 TXT 代码:

    # 打开 TXT 文本
    with open("*.txt","r") as f:
        # 逐行读取 TXT 文本内容
        info=f.readlines()
    # 按空格逐行分解每一行数据
    for ls in info:
        info_list = ls.strip()
    

    由于 TXT 文本并没有固定的格式,所以基本上不可能碰到可以重复复用的 TXT 公式,灵活运用上面的公式,或者也可以使用一些 Python 的第三方库来辅助。每当我们拿到一个 TXT 文本数据时,首先要做的事和客户沟通确定该文本的样式和瞄点,总结规律,比如通过定位 TXT 文本中的唯一值来定位所需求的数据,或者为什么我们要逐行读取 TXT 文本,因为大部分 TXT 文本都是有固定的行和列,举个例子:

    CITIC INDUSTRIAL BANK
    外卡收单 M/C 资金清算报表
    报表号码: 报表日期 2018-08-15 货币 840
    交易类型 笔数 交易金额 手续费收入 手续费支出 结算金额 其他金额 清算日期
    ATM 59 12237.53 97.63 12335.16 0.00 2018-08-14
    合计: 59 12237.53 97.63 0.00 12335.16 0.00
    * * * 报表结束 * * *

    如上的 TXT 文档,我们需要读取合计一栏的结算金额,我先逐行读取 TXT 表格,然后瞄定‘合计‘(此值唯一),然后用 split 函数分割数据,取分割后得到的列表的倒数第 3 个数据就是结算金额了。

    更多相关内容
  • 数据:对txt文件进行数据处理txt_file_path = "basic_info.txt"write_txt_file_path = "basic_info1.txt"def write_txt_file():if os.path.exists(txt_file_path) is False:returnwith open(txt_file_path,'r') as...

    数据:

    对txt文件进行数据处理:

    txt_file_path = "basic_info.txt"

    write_txt_file_path = "basic_info1.txt"

    def write_txt_file():

    if os.path.exists(txt_file_path) is False:

    return

    with open(txt_file_path,'r') as r_file:

    for row in r_file:

    list = row.split("\t")

    # print("用\\t分割行的结果:{}".format(list))

    # print("待分割的列:{}".format(list[2]))

    col = list[2]

    res = col[2:-2].split('|')

    # print("对此列进行分割的结果:{}".format(res))

    #将分割结果写入新的文件中

    with open(write_txt_file_path,'a') as w_file:

    w_file.write(' '.join(res))

    w_file.write('\n')

    #break

    if __name__ == "__main__":

    write_txt_file()

    python 简单的txt文件读写

    1 读取txt文件.跟c相比,python的文件读写简直是方便的可怕 首先是读取文件 首先获得文件名称,然后通过 open函数打开文件,通过for循环逐行读出文件内容 #!python file by ...

    python导入csv/txt文件

    1. 导入csv文件 ### python导入csv文件的三种方法 ```python #原始的方式 lines = [line.split(',') for line in open('iris.c ...

    python应用:TXT文件的读写

    python读写TXT文件不需要导入包 python中常用的读写方式: 文件打开模式 描述 r 以只读模式打开文件,并将文件指针指向文件头:如果文件不存在会报错 w 以只写模式打开文件,并将文件指针指 ...

    python批量读取txt文件为DataFrame

    我们有时候会批量处理同一个文件夹下的文件,并且希望读取到一个文件里面便于我们计算操作.比方我有下图一系列的txt文件,我该如何把它们写入一个txt文件中并且读取为DataFrame格式呢? 首先我们要 ...

    python中写入txt文件需要换行,以及\r 和\n

    在Python中,用open()函数打开一个txt文件,写入一行数据之后需要一个换行 如果直接用 f.write(’\n’)只会在后面打印一个字符串’\n’,而不是换行’需要用 f.write(’\r ...

    python基础===取txt文件的若干行到另一个文件

    #取txt文件 的若干行到另一个txt f1 = open(r'F:\movie.txt','rb') f2= open(r'F:\movie2.txt','ab') i=0 while True: ...

    python 逐行读取txt文件

    逐行读取txt文件 path = r'D:\123456\1.txt'with open(path, 'r', encoding='utf-8') as f:    for line in f:   ...

    python批量创建txt文件,以demo.txt内的内容为文件名

    #批量创建txt文件import sys,osa=open("demo.txt")n=0aList=[]for line in a.readlines(): aList.appen ...

    随机推荐

    笔试之STL

    1. map是如何实现的?它的keys是否经过排序?如何实现它的clear方法? A 实现: map是通过红黑树来实现的,keys是经过排序的: map的所有元素都是pair,同时拥有实值(value ...

    linux下文件查找工具--find

    常用的文件查找命令有:which,locate,find 1.which命令 查找二进制数或二进制命令,由PATH给出 2.loacte 特点: 1.非实时,每天在系统上生成数据库,通过数据库查询 2 ...

    Python链接Mssql之Python库pymssql

    连接数据库 pymssql连接数据库的方式和使用sqlite的方式基本相同: 使用connect创建连接对象 connect.cursor创建游标对象,SQL语句的执行基本都在游标上进行 cursor ...

    Codeforces 1154E Two Teams

    题目链接:http://codeforces.com/problemset/problem/1154/E 题目大意: 有n个队员,编号1~n,每个人的能力各自对应1~n中的一个数,每个人的能力都不相同 ...

    (网络数据交互)Android解析Internet中的DOM树数据 “DOM树”

    从网络请求回来的数据格式可能是.xml文件格式,常见的有:DOM树结构,下面讲述如何解析.具体可以参考博客文章:http://www.cnblogs.com/shenliang123/archive/ ...

    简明 Vim 练级攻略------转自陈皓coolshell

    vim的学习曲线相当的大(参看各种文本编辑器的学习曲线),所以,如果你一开始看到的是一大堆VIM的命令分类,你一定会对这个编辑器失去兴趣的.下面的文章翻译自

    3.十分钟搞定Vue搭建

    Vue推荐开发环境 Node.js 6.2.0.npm 3.8.9.webpack 1.13.vue-cli 2.5.1.webstrom2016 现在开始安装环境 安装nodejs 可以在终端里下载 ...

    python3 开发面试题(面向对象)6.6

    """ 封装.继承.多态 1. 谈谈你对面向对象的理解? 2. Python面向对象中的继承有什么特点? 3. 面向对象深度优先和广度优先是什么? 4. 面向对象中sup ...

    mysql禁止远程访问的解决办法

    1. 改表法. 可能是你的帐号不允许从远程登陆,只能在localhost.这个时候只要在localhost的那台电脑,登入mysql后,更改 "mysql" 数据库里的 &qu ...

    redis-benchmark压力测试

    redis-benchmark是redis官方提供的压测工具,安装好redis后,默认安装.使用简便. 语法: Usage: redis-benchmark [-h ] [-p ...

    展开全文
  • python处理txt文件

    千次阅读 2020-10-10 13:23:08
    python处理txt文件 1.因为遇到需要大量处理相同格式的数据,这里用到python的一个小脚本来处理 首先。需要处理的文件大致上是如下格式: 可以看出来,这都是一些电话号码,然后里面全部都是以中文的逗号结尾 2.使用...

    python处理txt文件(所有句号替换为换行)
    1.因为遇到需要大量处理相同格式的数据,这里用到python的一个小脚本来处理
    首先。需要处理的文件大致上是如下格式:
    在这里插入图片描述
    可以看出来,这都是一些电话号码,然后里面全部都是以中文的句号结尾
    2.使用脚本来实现
    思路如下:将需要处理的数据放入一个文本文档,将此文本文档放入脚本相同文件夹下。使用python的文件读写操作,将该文本文档以r+方式全部读出。针对拿到的字符串进行替换操作,将句号全部替换为换行符\n,最后写入一个新的文件即可

    代码如下:

    f = open("1.txt", "r+")
    lines = f.readlines()
    for line in lines:
        strlist = line.replace("。", "\n")
        for value in strlist:
            # print(value)
            with open("2.txt", "a") as file1:
                file1.write(value)
    

    文件格式如下:
    在这里插入图片描述

    结果展示:
    在这里插入图片描述

    展开全文
  • python处理txt文件的常用操作

    万次阅读 多人点赞 2020-04-07 22:06:59
    f = open("data.txt","r") f.close() #方法2,使用文件后自动关闭文件 with open('data.txt',"r") as f: 打开文件的模式主要有,r、w、a、r+、w+、a+ r:以读方式打开文件,可读取文件信息。 w:以写方式打开...

    1.打开文件

    #方法1,这种方式使用后需要关闭文件
    f = open("data.txt","r")
    f.close()
    
    #方法2,使用文件后自动关闭文件
    with open('data.txt',"r") as f: 

    打开文件的模式主要有,r、w、a、r+、w+、a+

    r:以读方式打开文件,可读取文件信息。
    w:以写方式打开文件,可向文件写入信息。如文件存在,则清空该文件,再写入新内容
    a:以追加模式打开文件(即一打开文件,文件指针自动移到文件末尾),如果文件不存在则创建
    r+:以读写方式打开文件,可对文件进行读和写操作。
    w+:消除文件内容,然后以读写方式打开文件。
    a+:以读写方式打开文件,并把文件指针移到文件尾。

     

    2.读取文件

    f.read([count])    读出文件,如果有count,则读出count个字节,如果不设count则读取整个文件。
    f.readline()    读出一行信息。
    f.readlines()    读出所有行,也就是读出整个文件的信息。

    假设我们读取的文件如下:

    readline()读取的数据为str类型:

    read()读取数据为str类型:

    readlines()读取数据为list类型,而且会把换行符读入:

     

    3.如何把txt文件数据存入numpy数组

    还是以上面文件做例子,首先通过read()将文件内容存为str

    file_path = ("D:/FDTD/test.txt")
    with open(file_path,'r') as f:
        file = f.read()
    print(file)
    print(type(file))

    然后对str进行分割,然后转化为numpy数组:

    a = file.split()
    print(a)
    a = np.array(a)
    a = a.reshape(3,5)
    print(a)

    结果如下:

     

    4.一些常用操作

    f.close()

    关闭文件,记住用open()打开文件后一定要记得关闭它,否则会占用系统的可打开文件句柄数。

    f.fileno()

    获得文件描述符,是一个数字

    f.flush()

    刷新输出缓存

    f.isatty()

    如果文件是一个交互终端,则返回True,否则返回False。

    f.read([count])

    读出文件,如果有count,则读出count个字节。

    f.readline()

    读出一行信息。

    f.readlines()读出所有行,也就是读出整个文件的信息。
    f.seek(offset[,where])把文件指针移动到相对于where的offset位置。where为0表示文件开始处,这是默认值 ;1表示当前位置;2表示文件结尾。
    f.tell()获得文件指针位置。

    f.truncate([size])

    截取文件,使文件的大小为size。

    f.write(string)

    把string字符串写入文件。

    f.writelines(list)

    把list中的字符串一行一行地写入文件,是连续写入文件,没有换行。

     

    5.批量读取txt文件

    我们使用os模块中的listdir来列举所有的txt文件:

    file_path = ("D:/FDTD/t")
    files= os.listdir(file_path)
    for file in files:
        file_path2=file_path+ '/' + file
        with open(file_path2,"r") as f:

    假如文件中都是n行5列数据,我们需要对其进行合并:

    file_path = ("D:/FDTD/t")
    files= os.listdir(file_path)
    time = 0
    for file in files:
        file_path2=file_path+ '/' + file
        with open(file_path2,"r") as f:
            t = f.read()    #读取文件数据,此时为文件内容为字符串形式
            t = t.split()    #按空格或换行对字符串进行分割
            t = np.array(t)    #将list转化为numpy数组
            t = t.reshape(-1,5)    
            print('\n'+file_path2+':')
            print(t)    #打印一个文件的数据
            if time ==0:
                a = t    #如果是第一个文件,则令a=t
            else:    
                a = np.vstack((t,a))    #如果不是第一个文件,则将t与前面文件数据进行拼接
            time += 1
    print('\n合并后:')
    print(a)

    输出结果:

     

    展开全文
  • python对txt文件进行处理(详细教程) # -*- coding : utf-8 -*- # coding: utf-8 from __future__ import division import shutil import pandas as pd # Pandas使用一个二维的数据结构DataFrame来表示表格式的数据...
  • python自动化处理txt文本文件

    千次阅读 2018-05-17 22:26:20
    这学期从开学到现在,关于自动化处理文件的编程需求已经做过一次了,上次是处理excel文件,用Java语言写的,因为文件内容牵涉到学生信息,就没有写博客公布源码了。需求是师姐提出来的,这次是采用python语言实现的...
  • 小波TxT文件超级批量处理

    千次下载 热门讨论 2015-05-03 09:59:45
    对文本文档之类的文件进行批处理,批量删除,批量添加,批量替换,批量查找 win7测试正常 如有任何问题 请及时联系
  • txt文件数据处理

    千次阅读 2020-06-29 11:13:27
    读取每行数据,并进行简单处理 f = open('result.txt', 'r') row = f.readline() print(row) # [8, 0, 30, 30, 30, 30, 30, 30, 45, 90, 1.460]\n print(row.strip().strip('[]').strip(',')) # 8, 0, 30, 30, 30...
  • 针对我们实验室实验数据做的matlab处理程序,用于进行频谱分析,指向性图显示等。
  • matlab处理txt文件数据

    万次阅读 2018-05-17 11:20:46
    read_txtfile.,mclear close all clc %load函数一般将用来导入纯数字的文件,可以是文本格式的文件或者是matlab保存的mat格式的文件 position=load('坐标点.txt'); %将.txt数据读入到matlab工作空间 [m,n]=size...
  • python处理数据,pandas 处理txt文件

    万次阅读 2019-05-21 17:54:03
    目前大多数的数据集以txt文件居多,但是我们在数据处理中,可能最终会在Excel上进行一些分析、制图, 当然也可以使用python制图包,也可以做出很精美的结果图。 此篇只是简单的读取,文件,保存到Excel中,可以做...
  • vs2010-c#读取txt文件至DataTable经过处理后导出txt 某油田项目中数据需要处理,里面包括项目中的几个txt数据文件,主要有参考意义的是里面读取txt方法和写入txt方法 简洁有效,处理方法是针对特定数据结构编写的。
  • var fs = require('fs');... * 递归遍历指定目录,处理所有 txt 文件 * @param {路径} filePath * @param {处理逻辑} callback * @param {扩展名,默认.txt} ext */ function myProcess(filePath, callback,
  • 气象数据.txt读取与可视化

    千次阅读 2019-12-23 11:59:22
    很多网站上都可以方便的下载到气象数据,如美国海洋和大气管理局NOAA、美国航空航天局NASA和英国气象局哈德利研究中心等,数据格式包括文本(.txt)、NetCDF(.nc)和普通的二进制格式(.ascii),txt格式读取灵活,...
  • 新手求教,处理数据时使用(急),在网上搜索并尝试无果,请问如何通过python或bat实现以下目标: 1.对文件夹下的所有txt文件批量提取某几列数据(不相邻),并分别放入与原文件名对应的txt内(文本名为“原文本名+...
  • python批量处理txt文本,获取指定内容

    千次阅读 多人点赞 2021-05-30 15:44:17
    那就是批量处理txt文本啦,获取里面指定内容,然后进行保存。刚开始拿到,发现无从下手。整理了思路后发现还是可以做的,嘿嘿! 首先文本里的内容是这样的: 要取的内容就是最后的那些数字。还好每个文档的格式都是...
  • 已经解决了很多问题,但是仍然会有很多奇怪的问题,像今天就有网友遇到了Win10蓝屏SrtTrail.txt无法开机的情况,对于不了解系统的网友就不知道Win10蓝屏SrtTrail.txt无法开机的问题该如何处理,要是想自己学习学习...
  • txt格式的电子书非常适合在各种设备上阅读,但是网上下载下来的电子书质量参差不齐,排版上存在一定的问题,可以结合辅助工具进行智能排版 使用工具: 开源文本编辑器visual Studio Code  解决不正确断行问题: ...
  • matlab批量处理txt文件

    2017-02-01 03:16:03
    比如我有一个文件夹psd下有1000个文件,每个文件的数据格式都相同,为, y, z>,现在我要依次遍历每个文件,得到的值,然后画图.求大佬指点!
  • JS读取txt文件,并进行相关的处理

    千次阅读 2020-06-01 17:10:09
    确实,在应用场景中是不会用JS去处理txt的,所以网络上相关的内容很少。所以我写下这篇博客,记录一下JS读取txt的方法,以及我在处理中遇到的一些问题。 在读取文件上,Chrome与IE略有不同,我的代码是针对于Chrome...
  • Python处理txt数据实例

    万次阅读 2016-07-18 18:29:09
    现在有一个具体的案例是这样的:CST电磁仿真软件得到一些txt数据在origin_data文件夹中。需要其中的一些数据来通过origin软件绘制曲线分析一些问题,而且需要里面的所有数据曲线显示在同一个图形中。如果通过手动将...
  • C# 读取TXT数据并处理

    千次阅读 2017-03-15 19:03:16
    处理TXT中的数据规则 场景: 如下图所示,在验证“输入”后面的E开头的数据是将被处理的数据之后,将同名称第二列的数据作处理,只取一个最大值与一个最小值,然后绑定到前端页面中。
  • 准备对一个txt文档内容进行TF-IDF处理,首先准备进行分词处理。但是目前不知道如何处理txt文档。 参考帖子http://blog.csdn.net/qq_30843221/article/details/54909788 其中他的样本为 好看 电影 惊悚 ...
  • kettle读txt文件并处理

    千次阅读 2018-11-27 11:55:27
    PS:你直接输入“*”是不行的,读取特定条件的文件可用“zhang.*\.txt”,此句就是把以zhang开头,后缀是txt文件输入 2.row flatter功能 作用:通过增加列减少记录条数 读取文件内容如图: 你在Text ...
  • Porject_Kiwi 离线式数字信号处理(一) 使用Matlab读取TXT数据文件并做FFT分析 在我群项目Project_Kiwi中,LTC2208的评估已经圆满完成,现在开始下一步的工作。 今天要来测试的,是使用matlab对数据进行简单处理。 ...
  • Python 批量处理txt文本(保留数字)

    千次阅读 2019-05-27 08:58:17
    ".txt" : readFile ( newDir ) pass else : eachFile ( newDir ) eachFile ( 'E:\\text' ) print ( "End!" ) 由 https://www.cnblogs.com/SeekHit/p/6245283.html 改的。
  • 实现批量txt的读取并合并到一个txt中进行输出,主要用于tcga数据的预处理
  • python .txt文件读取及数据处理总结

    万次阅读 多人点赞 2017-11-30 18:27:32
    1、处理包含数据的文件最近利用Python读取txt文件时遇到了一个小问题,就是在计算两个np.narray()类型的数组时,出现了以下错误: TypeError: ufunc 'subtract' did not contain a loop with signature matching ...
  • [Python数据处理] 怎样用Python预处理txt文档提取数据

    万次阅读 多人点赞 2019-05-31 15:08:11
    grade.txt ANSI编码格式,共三条数据,每条数据的第一项是姓名,第二项是语文,第三项是数学,第四项是英语 张三,128,136,112 李四,99,106,73 王五,102,148,88 要求将文件改造成适合scikitlearn下KMeans聚类方法...
  • 01. 目的  &...用java编程实现删除txt文档中的空白行,代替手动删除,减少不必要的工作。将修改的内容存入新的文档,在修改完成后自动打开,便于查看

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 679,791
精华内容 271,916
关键字:

TXT处理