精华内容
下载资源
问答
  • Python读取Word表格数据及批量处理的方法.pdf
  • Python读取Word表格数据

    千次阅读 2020-03-06 20:49:17
    path = "E:\\python_data\\1234.docx" #文件路径 document = Document(path) #读入文件 tables = document.tables #获取文件中的表格集 table = tables[0 ]#获取文件中的第一个表格 for i in range...

    import docx
    from docx import Document #导入库

    path = "E:\\python_data\\1234.docx" #文件路径
    document = Document(path) #读入文件
    tables = document.tables #获取文件中的表格集
    table = tables[0  ]#获取文件中的第一个表格
    for i in range(1,len(table.rows)):#从表格第二行开始循环读取表格数据
        result = table.cell(i,0).text + "" +table.cell(i,1).text+
        table.cell(i,2).text + table.cell(i,3).text
        #cell(i,0)表示第(i+1)行第1列数据,以此类推
        print(result)
     

    展开全文
  • python调用com,如何完成word表格操作word中doc这个格式的文件是微软特有格式,微软没有向外公开任何的api接口文档,只能通过微软提供的OLE组件来提其COM接口,只要你的机器上安装了Offices完整的办公软件,在安装...

    python调用com,如何完成word表格操作

    word中doc这个格式的文件是微软特有格式,微软没有向外公开任何的api接口文档,只能通过微软提供的OLE组件来提其COM接口,只要你的机器上安装了Offices完整的办公软件,在安装目录下面有个MSWORD.OLB组件,导入这个即可。

    1、相关操作Excel有MSPPT.OLB,EXCEL.exe等。

    python操作word文档表格

    office 2007中不能直接打开VB编辑器,请按Alt + F11打开。

    import win32com.client # 导入脚本模块 WordApp = win32com.client.Dispatch("Word.Application") # 载入WORD模块 WordApp.Visible = True # 显示Word应用程序 1、 新建Word文档 doc = WordApp.Documents.Add() # 新建空文件 doc = WordApp.Documents.Open(r"d:\2011专业考试计划.doc") # 打开指定文档 doc.SaveAs(r"d:\2011专业考试计划.doc") # 文档保存 doc.Close(-1) # 保存后关闭,doc.Close()或doc.Close(0)直接关闭不保存 2、 页面设置 doc.PageSetup.PaperSize = 7 # 纸张大小, A3=6, A4=7 doc.PageSetup.PageWidth = 21*28.35 # 直接设置纸张大小, 使用该设置后PaperSize设置取消 doc.PageSetup.PageHeight = 29.7*28.35 # 直接设置纸张大小 doc.PageSetup.Orientation = 1 # 页面方向, 竖直=0, 水平=1 doc.PageSetup.TopMargin = 3*28.35 # 页边距上=3cm,1cm=28.35pt doc.PageSetup.BottomMargin = 3*28.35 # 页边距下=3cm doc.PageSetup.LeftMargin = 2.5*28.35 # 页边距左=2.5cm doc.PageSetup.RightMargin = 2.5*28.35 # 页边距右=2.5cm doc.PageSetup.TextColumns.SetCount(2) # 设置页面分栏=2 3、 格式设置 sel = WordApp.Selection # 获取Selection对象 sel.InsertBreak(8) # 插入分栏符=8, 分页符=7 sel.Font.Name = "黑体" # 字体 sel.Font.Size = 24 # 字大 sel.Font.Bold = True # 粗体 sel.Font.Italic = True # 斜体 sel.Font.Underline = True # 下划线 sel.ParagraphFormat.LineSpacing = 2*12 # 设置行距,1行=12磅 sel.ParagraphFormat.Alignment = 1 # 段落对齐,0=左对齐,1=居中,2=右对齐 sel.TypeText("XXXX") # 插入文字 sel.TypeParagraph() # 插入空行 注:ParagraphFormat属性必须使用TypeParagraph()之后才能二次生效

    如何用python读取word

    使用Python的内部方法open()读取文本文件try:f=open('/file','r')print(f.read())finally:if f:f.close()如果读取word文档推荐使用第三方插件,python-docx 可以在官网上下载使用方式# -*- coding: cp936 -*-import docxdocument = docx.Document(文件路径)docText = '\n\n'.join([paragraph.text.encode('utf-8') for paragraph in document.paragraphs])print docText

    如何用python读取excel文件

    展开全部 >>> app=my.Office.Word.GetInstance()>>> doc=app.Documents[0]>>> table=doc.Tables[1]>>> table.Cell(1,1).Select()>>> app.Selection.MoveDown(Unit=5, Count=2, Extend=1)>>> app.Selection.Cells.Merge()>>>my.Office.Word.GetInstance()用win32com得到Word的Application对象的实例我所使用的样本word文件中包含两个Table第二个Table是想要修改的table.Cell(1,1).Select()用于选中这个样表的第一个单元格app.Selection.MoveDown用于获得向下多选取3个单元格app.Selection.Cells.Merge()用于执行合并工作 ...

    Python 读取文档各行中同一列数据并按首尾相接合并输出到另一个文...

    展开全部 假设数据存储在文件 test.txt中,程序如下(未经测试,大概是这么个意思)lines=open(r'test.txt').readlines()text=[]for line in lines: word=line.split() thirdword=word[2].strip() text.append(thirdword)result=''.join(text)print result...

    怎么用python读取txt文件里指定行的内容,并导入excel

    展开全部 如果文件不大,建议使用下面的方法。

    由于linecache会缓存,所以对大文件可以使用自己简单是实现getline如下:def getline(thefilepath, desired_line_number):if desired_line_number < 1: return ''for current_line_number, line in enumerate(open(thefilepath, 'rU')):if current_line_number == desired_line_number - 1 : return linereturn ''...

    展开全文
  • 首先需要安装相应的支持库:直接在命令行执行pip install python-docx示例代码如下:import docxfrom docx import Document #导入库path = "E:\\python_data\\1234.docx" #文件路径document = Document(path) #读入...

    首先需要安装相应的支持库:

    直接在命令行执行pip install python-docx

    示例代码如下:import docx

    from docx import Document #导入库

    path = "E:\\python_data\\1234.docx" #文件路径

    document = Document(path) #读入文件

    tables = document.tables #获取文件中的表格集

    table = tables[0 ]#获取文件中的第一个表格

    for i in range(1,len(table.rows)):#从表格第二行开始循环读取表格数据

    result = table.cell(i,0).text + "" +table.cell(i,1).text+

    table.cell(i,2).text + table.cell(i,3).text

    #cell(i,0)表示第(i+1)行第1列数据,以此类推

    print(result)

    展开全文
  • 1.Word文档如下:2.代码# -*- coding: UTF-8 -*-from docx import Documentdef readSpecTable(filename, specText):document = Document(filename)paragraphs = document.paragraphsallTables = document....

    1.Word文档如下:

    blank.gif

    2.代码

    # -*- coding: UTF-8 -*-

    from docx import Document

    def readSpecTable(filename, specText):

    document = Document(filename)

    paragraphs = document.paragraphs

    allTables = document.tables

    specText = specText.encode('utf-8').decode('utf-8')

    for aPara in paragraphs:

    if aPara.text == specText:

    ele = aPara._p.getnext()

    while (ele.tag != '' and ele.tag[-3:] != 'tbl'):

    ele = ele.getnext()

    if ele.tag != '':

    for aTable in allTables:

    if aTable._tbl == ele:

    for i in range(len(aTable.rows)):

    for j in range(len(aTable.columns)):

    print(aTable.cell(i, j).text)

    if __name__ == '__main__':

    readSpecTable('test.docx', '符号约定')

    3.结果

    符号

    符号

    含义

    数据域取值符号

    M

    必须填写的域

    数据域取值符号

    C

    某条件成立时必须填写的域

    数据域取值符号

    O

    可选,非必须填写的域

    数据域取值符号

    必须与先前报文中对应域的值相同的域

    数据域取值符号

    -

    必须去除的域

    数据域属性符号

    基本数据域

    数据域属性符号

    []

    标识为消息组件名称数据域

    数据域属性符号

    {}

    标识为消息组件中重复的数据域

    数据域属性符号

    标识为消息组件中包含的基础数据域

    数据域属性符号

    →[]

    标识为消息组件中的子消息组件

    数据域属性符号

    →{}

    标识为子消息组件中重复的数据域块

    数据域属性符号

    →→

    标识为子消息组件中包含的基础数据域

    PS:python读取word文档表格里的数据

    首先需要安装相应的支持库:

    直接在命令行执行pip install python-docx

    示例代码如下:

    import docx

    from docx import Document #导入库

    path = "E:\\python_data\\1234.docx" #文件路径

    document = Document(path) #读入文件

    tables = document.tables #获取文件中的表格集

    table = tables[0 ]#获取文件中的第一个表格

    for i in range(1,len(table.rows)):#从表格第二行开始循环读取表格数据

    result = table.cell(i,0).text + "" +table.cell(i,1).text+

    table.cell(i,2).text + table.cell(i,3).text

    #cell(i,0)表示第(i+1)行第1列数据,以此类推

    print(result)

    总结

    以上所述是小编给大家介绍的python读取word 中指定位置的表格及表格数据,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对我们网站的支持!

    如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

    时间: 2019-10-20

    展开全文
  • 1 #http://www.jb51.net/article/70318.htm2 #http://www.cnblogs.com/graphics/articles/2953665.html3 #http://shouce.jb51.net/python/4 importwin32com,re5 from win32com.client importDispatch,constants678 w...
  • importdocxfn= r'D:\长恨歌.docx'doc=docx.Document(fn)#按段落读取全部数据for paragraph indoc.paragraphs:print(paragraph.text)#按表格读取全部数据for table indoc.tables:for row intable.rows:for cell inrow...
  • 本文实例讲述了Python实现批量读取word表格信息的方法。分享给大家供大家参考。具体如下:单位收集了很多word格式的调查表,领导需要收集表单里的信息,我就把所有调查表放一个文件里,写了个python小程序把所需的...
  • 本文实例讲述了Python实现批量读取word表格信息的方法。分享给大家供大家参考。具体如下:单位收集了很多word格式的调查表,领导需要收集表单里的信息,我就把所有调查表放一个文件里,写了个python小程序把所需的...
  • 两个简单的word文档, 各有一个表格:读取文档中的表格到列表(为演示只对单列表格操作):import docxdef 取表格(文件名):文件 = docx.Document(文件名)首个表 = 文件.tables[0]值 = []for 行 in 首个表.rows:for in...
  • 1.Word文档如下:2.代码# -*- coding: UTF-8 -*-from docx import Documentdef readSpecTable(filename, specText):document = Document(filename)paragraphs = document.paragraphsallTables = document....
  • python 读取word表格中的表格## 标题 解决方案: 在网上没有找到可行的嵌套表格内容读取方法。查看python-docx包源代码找到以下两种解决方案: 方案一:按行列读到单元格后再取tables,此处table_cell.tables值为一...
  • 1.环境 安装pip install pywin32pip install python-docx2.关键代码,根据表格标题搜索内容#根据标题获取同一行的值def find_row_value(d,sts):lists=[]tlen=len(d.tables)#print("tlen"+str(tlen))for i in range(0...
  • 通过搜索,确实搜到了一个python操作word的模块,python-docx通过命令安装:pip install python-docx使用代码示例:#读取docx中的文本代码示例import docx#获取文档对象file=docx.Document("D:\\t...
  • 先读取段落,代码如下:1 '''2 #利用python读取word文档,先读取段落3 '''4 #导入所需库5 from docx importDocument67 #打开word文档8 document = Document("D:/路径/长恨歌.docx")910 #获取所有段落11 all_...
  • 如何用python数据写入excel表格工作中经常用到Excel,很情都重复处理,比天的日报,每周报,数据表,这种固定的表其实都是重复性的劳动。最近这段时间一直在学python,但是断断续续的,眼高手低,看别人的代码看的...
  • 在工作中可能需要两者对excel和word进行转化,今天介绍例如Python 将excel转word表格看图,我需要将这份excel文档转word表格:思路:1、创建需要的表格;2、读取excel文档;3、将excel文档数据写入word表格对应的...
  • 1.Word文档如下: 2.代码 # -*- coding: UTF-8 -*- from docx import Document def readSpecTable(filename, specText): document = Document(filename) paragraphs = document.paragraphs allTables = ...
  • python读取word文档表格里的数据

    万次阅读 2018-05-25 14:33:39
    直接在命令行执行pip install python-docx 示例代码如下: import docx from docx import Document #导入库 path = &quot;E:\\python_data\\1234.docx&quot; #文件路径 document = Document(path) #...
  • 在工作中可能需要两者对excel和word进行转化,今天介绍例如Python 将excel转word表格看图,我需要将这份excel文档转word表格:思路:1、创建需要的表格;2、读取excel文档;3、将excel文档数据写入word表格对应的...
  • 在之前的文章[1] [2]中,我用python-docx这个包读取外部数据,驱动了word文档的更新,相当于是实现了Excel数据word文档的数据流动。实现的方式比起之前依靠vba用Excel驱动word更新这个文章中说的要更可靠一些。...
  • python 读取word 表格,写入excel

    千次阅读 2019-04-11 21:33:39
    以上word表格汇总为下面的EXCEL表格 用到两个模块,docx,openpyxl 也可以写到csv文件,不过csv文件过长的数字文本会自动转科学计数 excel文件,内容没有转成数字,是默认插入的文本,如果加入判断语句又会有点...
  • 1.Word文档如下:2.代码# -*- coding: UTF-8 -*-from docx import Documentdef readSpecTable(filename, specText):document = Document(filename)paragraphs = document.paragraphsallTables = document....
  • 目标最近实验室里成立了一个计算机兴趣小组倡议大家多把自己解决问题的经验记录并分享就像在...我用python”所以决定用python从docx文档中提取文件头的信息然后把信息更新到一个xls电子表格中,像下面这样(直接po...
  • Python 读取excel及批量生成word模板 问题-来源 前几天,我姐遇见了一个难题:需要从excel表格中不断复制数据word模板中,相当繁琐,询问我有没有解决的办法。于是我百度了一下,借鉴了相关博主的博文,结合自己的...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 6,832
精华内容 2,732
关键字:

python读取word表格数据

python 订阅