精华内容
下载资源
问答
  • python 直接打开word文档

    千次阅读 2016-12-17 16:42:49
    首先直接导入webbrowser 然后直接用open的方法就可以打开,title是文档的名字,也可以用绝对路径,我直接打开的保存路径 import webbrowserwebbrowser.open(title+'.docx')
    首先直接导入webbrowser
    然后直接用open的方法就可以打开,title是文档的名字,也可以用绝对路径,我直接打开的保存路径
    import webbrowser

    webbrowser.open(title+'.docx')
    展开全文
  • word.Documents.Open('c:/test')doc.SaveAs('c:/test.text', 2)doc.Close()word.Quit()这种方式2113产生5261的text文档,不能...

    展开全部

    首先下载安装win32com

    from win32com import client as wc

    word = wc.Dispatch('Word.Application')

    doc = word.Documents.Open('c:/test')

    doc.SaveAs('c:/test.text', 2)

    doc.Close()

    word.Quit()

    这种方式2113产生5261的text文档,不能用python用普通的r方式读取,4102为了让python可以用1653r方式读取,应当写成

    doc.SaveAs('c:/test', 4)

    注意:系统执行完成后,会自动产生文件后缀txt(虽然没有指明后缀)。

    在xp系统下面,应当,

    open(r'c:\text','r')

    wdFormatDocument = 0

    wdFormatDocument97 = 0

    wdFormatDocumentDefault = 16

    wdFormatDOSText = 4

    wdFormatDOSTextLineBreaks = 5

    wdFormatEncodedText = 7

    wdFormatFilteredHTML = 10

    wdFormatFlatXML = 19

    wdFormatFlatXMLMacroEnabled = 20

    wdFormatFlatXMLTemplate = 21

    wdFormatFlatXMLTemplateMacroEnabled = 22

    wdFormatHTML = 8

    wdFormatPDF = 17

    wdFormatRTF = 6

    wdFormatTemplate = 1

    wdFormatTemplate97 = 1

    wdFormatText = 2

    wdFormatTextLineBreaks = 3

    wdFormatUnicodeText = 7

    wdFormatWebArchive = 9

    wdFormatXML = 11

    wdFormatXMLDocument = 12

    wdFormatXMLDocumentMacroEnabled = 13

    wdFormatXMLTemplate = 14

    wdFormatXMLTemplateMacroEnabled = 15

    wdFormatXPS = 18

    照着字面意思应该能对应到相应的文件格式,如果你是office

    2003可能支持不了这么多格式。word文件转html有两种格式可选wdFormatHTML、wdFormatFilteredHTML(对应数字

    8、10),区别是如果是wdFormatHTML格式的话,word文件里面的公式等ole对象将会存储成wmf格式,而选用

    wdFormatFilteredHTML的话公式图片将存储为gif格式,而且目测可以看出用wdFormatFilteredHTML生成的HTML

    明显比wdFormatHTML要干净许多。

    当然你也可以用任意一种语言通过com来调用office API,比如PHP.

    from win32com import client as wc

    word = wc.Dispatch('Word.Application')

    doc = word.Documents.Open(r'c:/test1.doc')

    doc.SaveAs('c:/test1.text', 4)

    doc.Close()

    import re

    strings=open(r'c:\test1.text','r').read()

    result=re.findall('\(\s*[A-D]\s*\)|\(\xa1*[A-D]\xa1*\)|\(\s*[A-D]\s*\)|\(\xa1*[A-D]\xa1*\)',strings)

    chan=re.sub('\(\s*[A-D]\s*\)|\(\xa1*[A-D]\xa1*\)|\(\s*[A-D]\s*\)|\(\xa1*[A-D]\xa1*\)','()',strings)

    question=open(r'c:\question','a+')

    question.write(chan)

    question.close()

    answer=open(r'c:\answeronly','a+')

    for i,a in enumerate(result):

    m=re.search('[A-D]',a)

    answer.write(str(i+1)+' '+m.group()+'\n')

    answer.close()

    chan=re.sub(r'\xa3\xa8\s*[A-D]\s*\xa3\xa9','()',strings)

    #不要(),容易引起歧义。

    2Q==

    已赞过

    已踩过<

    你对这个回答的评价是?

    评论

    收起

    展开全文
  • python自动化word使用文档python-docx允许您创建新文档以及更改现有文档。实际上,它只允许您更改现有文档; 但如果不存在此文件,将会自动从头开始创建一个。这个功能很强大。文档的主要格式外观取决于删除所有内容...

    上节python办公自动化:python自动化word快速入门,对python自动化word的操作做了快速入门,从本小节开始,逐步细致的分解讲解每一个关键步骤。

    063J36414-0.jpg

    python自动化word

    使用文档

    python-docx允许您创建新文档以及更改现有文档。实际上,它只允许您更改现有文档; 但如果不存在此文件,将会自动从头开始创建一个。

    这个功能很强大。文档的主要格式外观取决于删除所有内容时剩下的部分。样式和页眉和页脚等格式信息与要内容分开存在,并允许您在起始文档中进行各种自定义,最后生成最终文档。

    让我们逐步完成一个示例创建文档的步骤。从2大主要功能开始吧,打开并保存它。

    打开文件

    最简单的入门方法是打开一个新文档而不指定要打开的文件:from docx import Document

    document = Document()

    document.save('test.docx')

    这将从内置的默认模板创建一个新文档,并将其保存为名为“test.docx”的文件。所谓的“默认模板”实际上只是一个没有内容的Word文件,与已安装的python-docx 软件包一起存储。它与您 在选择Word的文件>从模板新建...菜单项后选择Word 文档模板大致相同。

    真的打开文件

    如果您想要对最终文档进行更多控制,或者如果要更改现有文档,则需要使用文件名打开一个文档:document = Document('existing-document-file.docx')

    document.save('new-file-name.docx')

    注意事项:您可以通过这种方式打开任何Word 2007或更高版本的文件(Word 2003及更早版本中的.doc文件将不起作用)。虽然您可能无法操作所有内容,但已经存在的任何内容都会加载并保存得很好。功能集仍在构建中,因此您无法添加或更改标题或脚注之类的内容,但如果文档中包含它们,python-docx则可以让它们保持单独且足够智能以保存它们而无需实际了解它们是什么。

    如果您使用相同的文件名打开并保存文件,python-docx将乖乖地覆盖原始文件而不会窥视。你要确保这是你想要的。

    打开'文件'文档

    python-docx可以从所谓的类似文件的对象中打开文档。它还可以保存到类似文件的对象。当您希望通过网络连接或数据库获取源文档或目标文档并且不希望(或不允许)与文件系统交互时,这可能很方便。实际上,这意味着您可以传递打开的文件或StringIO / BytesIO流对象来打开或保存文档,如下所示:f = open('foobar.docx', 'rb')

    document = Document(f)

    f.close()

    # or

    with open('foobar.docx', 'rb') as f:

    source_stream = StringIO(f.read())

    document = Document(source_stream)

    source_stream.close()

    ...

    target_stream = StringIO()

    document.save(target_stream)

    该'rb'文件打开方式参数不是必需的所有操作系统上。默认情况下'r'有时足够,但Windows上至少需要某些版本的Linux才能使用'b'(选择二进制模式),以允许Zipfile打开文件。

    终上所述,打开了一个文件,并且将它保存到某个地方。下一步,我将会带你领略下如何自动对文档进行排版。

    063J33322-1.jpg

    文档进行排版

    展开全文
  • When trying to open a .dot file with python-docx, I am getting the error:KeyError: "no relationship of type '...

    When trying to open a .dot file with python-docx, I am getting the error:

    KeyError: "no relationship of type 'http://schemas.openxmlformats.org/officeDocument/2006/relationships/officeDocument' in collection"

    This is the code in question:

    from docx import Document

    document = Document('file.dot')

    What is the actual problem here?

    解决方案

    How did you generate the input file? Here it is an issue about the type when you save the file as Strict Open XML Document. Try the standard Word document.

    You can get more informations about relations inside the file using opc-diag:

    opc browse .rels

    An idea to try to fix the bad file:

    # Extract the bad file to a temporary folder

    unzip -d bad-file

    # Repackage the extracted data to a new fresh file

    opc repackage bad-file new-file.docx

    # A diff of relationships

    opc diff-item test.docx test-ok.docx .rels

    展开全文
  • When trying to open a .dot file with python-docx, I am getting the error:KeyError: "no relationship of type '...
  • 利用python打开word文件

    千次阅读 2019-09-14 21:40:37
    打开pip所在文件,并在cmd命令提示符中输入pip的位置 然后输入pip install python-docx 显示下载完成 引用docx,os,并且用os.getcwd()得到当前位置,确保目标文件在这个位置里,获得文件段落数len(file name....
  • python调用word接口...使用python新建一个word文档,操作就像文档里介绍的那样:1 from docx import Document2 from docx.shared import Inches34 document = Document()56 document.add_heading('Document Title...
  • 这篇经验告诉你如何利用pythonpython-docx模块读取Word文档。工具/原料windows系统电脑一台python软件方法/步骤1第一,先安装python-docx模块。打开cmd命令窗口,输入pip install python-docx,就可通过管道安装...
  • 先读取段落,代码如下:1 '''2 #利用python读取word文档,先读取段落3 '''4 #导入所需库5 from docx importDocument67 #打开word文档8 document = Document("D:/路径/长恨歌.docx")910 #获取所有段落11 all_...
  • 今天中公优就业大白和大家分享Python办公自动化:自动打开word文档python-docx允许您创建新文档以及更改现有文档。实际上,它只允许您更改现有文档;但如果不存在此文件,将会自动从头开始创建一个。这个功能很强大...
  • office 2007中不能直接打开VB编辑器,请按Alt + F11打开。import win32com.client#导入脚本模块WordApp = win32com.client.Dispatch("Word.Application")#载入WORD模块WordApp.Visible = True#显示Word应用程序1、...
  • Python可以利用python-docx模块处理word文档,处理方式是面向对象的。也就是说python-docx模块会把word文档,文档中的段落、文本、字体等都看做对象,对对象进行处理就是对word文档的内容处理。如果需要读取word文档...
  • 我这里有一个简单的批处理文件,它将从命令行打印word文档."C:\Program Files\Microsoft Office\Office12\winword.exe" "p:\docs\daily checks.doc" /mFilePrintDefault /mFileExit我试图将其放入python脚本,我已设法...
  • Python-docxPython-docx是专门针对于word文档的一个模块,只能操作docx 不能读取doc文件。在这里python-docx主要的功能是对docx文件进行操作,管理等。官方文档:...
  • I just read through the documentation on python-docx.They mention several times that added content is created at the end of the document, but I didn't notice any way to alter this functionality.Does a...
  • Python-生成word、docs文件[生成word文档]方法一:写入新建文档安装第三方库实现代码运行结果注意方法二:运用模板写入word文档安装第三方库创建模板或修改模板实现代码实现效果注wps加密文档word加密文档 ...
  • python-docx是一个在Python环境下读写word文档的“利器”。在使用前可以通过pip install python-docx命令安装,再通过import docx 引用即可。下面简单介绍一下 python-docx 的基本操作。1、新建/打开及保存文档的...
  • 原博文2020-02-16 20:53 −...有人已经做了如何修改一些格式的博客:用python-docx修改已存在的Word文档的表格的字体格式。我这里给出替换内容给的例子,简...相关推荐2019-11-27 21:18 −pyth...
  • 主要为大家详细介绍了python批量实现Word文件转换为PDF文件的方法,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
  • Python读写docx文件+介绍Python读写word文档有现成的库可以处理。我这里采用 python-docx。可以用pip install python-docx安装一下。这里说一句,ppt和excel也有类似的库哦,而且是直接读取文件里面的xml数据。所以...
  • 前言全网找了一番,用python创建和更新word(.docx)文档,还是 python-docx 包比较好用。依赖Python 2.6, 2.7, 3.3, or 3.4lxml >= 2.3.2安装模块由于 python-docx 已经提交给 PyPI 仓库,所以可以使用 pip 安装,...
  • Python3 读取Word文件

    万次阅读 2018-07-23 09:36:42
    查询了很多有关资料,发现都是Python2版本操作Word文件的,所以就写了这篇短小的文章。 一、安装 docx pip install docx 完了之后,导入:import docx 发现报错:ModuleNotFoundError: No module named ...
  • python批量更改word文档名 最近需要批量修改文档的名字,由于是从网站下载的文档,很多文档名字带有数字,需要给文档重新命名并需要去掉数字,觉得一个个修改word文档太麻烦,于是就参考了一下网上的资料自己写了...
  • 使用库 python-docx 的官方文档地址是:python-docx一、安装 python-docx 库文件在 cmd 命令行中使用以下命令安装库文件pip install python-docx安装效果如下图:二、引入库,创建&打开&保存 docx 文档from do...
  • 1.Pythonword文档要操作word文档首先需要安装python-docx...from docx import Document然后使用Document()创建一个word文档,若指定路径则是打开文档;document = Document()接着就可以在文档中插入内容,比如插入...
  • 使用Pythonword文档进行操作一、安装Python-docxPython-docx是专门针对于word文档的一个模块,只能读取docx 不能读取doc文件。说白了,python就相当于windows操作系统,QQ就是跑在windows操作系统上的软件,QQ最大...
  • 一,简介上一篇已经介绍了python-docx模块的安装和导入,本篇直接介绍如何创建并写入word文档,需要注意的是:创建word并写入之后,操作的都是内存中的对象,最后需要保存到文件,才能看到真实的文件。二,代码演示...
  • 可以使用python-docx库将表直接写入.docx文件。如果使用Conda或已安装的Python使用Anaconda,则可以从命令行运行该命令:conda install python-docx --channel conda-forge或者从命令行执行pip安装:pip install ...
  • 所以决定用python从docx文档中提取文件头的信息 然后把信息更新到一个xls电子表格中,像下面这样(直接po结果好了) 而且点击文件路径可以直接打开对应的文件(含超链接) 代码实现 1. 采集docx里面文件头信息 # ...
  • 目标最近实验室里成立了一个计算机兴趣小组倡议大家多把自己解决问题的经验记录并分享就像在...我用python”所以决定用python从docx文档中提取文件头的信息然后把信息更新到一个xls电子表格中,像下面这样(直接po...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 34,345
精华内容 13,738
关键字:

python直接打开word文档

python 订阅