精华内容
下载资源
问答
  • python Word助手的程序源程序.rar
  • 而对于 Word 文本时同样也有对应的 PythonPython-docx,在日常办公中,如果需要处理多个 word 文本,且操作步骤都是重复单调的,我想这个库就可以帮到你 在了解 Python-docx 常用函数之前,需要知道 在 Python-...
  • python word自动写入模板 搭配博客内容使用 后续将会持续更新excel,ppt,爬虫,人工智能等相关内容,敬请关注
  • python Word模块

    千次阅读 2020-03-06 23:06:03
    相关包 python-docx ...python读取Word文档内容 doc.paragraphs 得到一个列表,包含了每个段落实例 from docx import Document doc = Document("lian.docx") print(doc.paragraphs) para...

    相关包

    python-docx

    import docx

     

    Word文档结构

     

    python读取Word文档内容

     

    doc.paragraphs  得到一个列表,包含了每个段落实例

    from docx import Document
    
    doc = Document("lian.docx")
    
    print(doc.paragraphs)

     

    paragraph.text  得到该段落的文字内容

    from docx import Document
    
    doc = Document("lian.docx")
    
    for paragraph in doc.paragraphs:
    	print(paragraph.text)

     

    run.text 得到该文字块的文字内容

    from docx import Document
    
    doc = Document("lian.docx")
    
    paragraph = doc.paragraphs[0]
    
    runs = paragraph.runs
    
    for run in runs:
    	print(run.text)

     

    python向Word文档写入内容

     

    添加文字内容

    添加标题

    doc.add_heading(‘ 标题名称’,level=标题等级)

    from docx import Document
    
    doc = Document("lian.docx")
    
    doc.add_heading("一级标题",level=1)
    

     

    添加段落

    doc.add_paragraph("段落文字内容")

    paragraph1 = doc.add_paragraph("这是一个段落")
    doc.add_paragraph("这又是一个段落")

     

    添加文字块

    paragraph.add_run("文字内容")

    paragraph3 = doc.add_paragraph()
    paragraph3.add_run("加粗").bold = True
    paragraph3.add_run("普通")
    paragraph3.add_run("斜体").italic = True

     

    添加分页

    doc.add_page_break()

    doc.add_page_break()

     

    添加图片及表格

    添加图片

    doc.add_picture("图片地址")

    doc.add_picture("my.png")

     

    添加图片,给定宽度或高度

    dic.add_picture("图片地址", width=宽度, height=高度)

    from docx.shared import Cm
    
    doc.add_picture("my.png", width = Cm(5))  #设定宽度为5cm
    doc.add_picture("my.png", heigtht = Cm(5))  #设定高度为5cm

    Cm就是厘米

    如果只给一个宽度或高度,另一个的尺寸会自动计算

     

    添加表格

    doc.add_table(rows=多少行, cols=多少列)

    records = [
        ["学号","姓名","成绩"],
        [101,"李雷",95],
        [102,"韩梅梅",100],
        [103,"马冬梅",98]
    ]
    
    table = doc.add_table(rows = 4, cols = 3)
    for row in range(4):
    	cells = table.rows[row].cells
    	for col in range(3):
    		cells[col].text = str(records[row][col])

     

    总起来

    from docx import Document
    from docx.shared import Cm
    
    doc = Document()
    
    doc.add_heading("一级标题",level=1)
    
    paragraph1 = doc.add_paragraph("这是一个段落")
    paragraph2 = doc.add_paragraph("这又是一个段落")
    
    paragraph3 = doc.add_paragraph()
    paragraph3.add_run("加粗").bold = True
    paragraph3.add_run("普通")
    paragraph3.add_run("斜体").italic = True
    
    doc.add_page_break()
    
    doc.add_picture("my.png")
    
    doc.add_picture("my.png", width = Cm(5))
    doc.add_picture("my.png", height = Cm(5))
    
    
    records = [
        ["学号","姓名","成绩"],
        [101,"李雷",95],
        [102,"韩梅梅",100],
        [103,"马冬梅",98]
    ]
    
    table = doc.add_table(rows = 4, cols = 3)
    for row in range(4):
    	cells = table.rows[row].cells
    	for col in range(3):
    		cells[col].text = str(records[row][col])
    
    
    doc.save("shi.docx")  #最后一定不要忘了保存

     

    python调整Word文档样式

     

    对文字字体样式进行修改

    run.font.样式=xxx

     

    注意这里设定字体的时候,如果是英文名称的字体就直接 run.font.name = ""  就可以了

    如果是中文名称字体的话,要这样才行

            r = run._element.rPr.rFonts
            r.set(qn("w:eastAsia"), "微软雅黑")

    from docx import Document
    from docx.shared import Pt,RGBColor
    from docx.oxml.ns import qn
    
    doc = Document("lian.docx")
    
    for paragraph in doc.paragraphs:
        for run in paragraph.runs:
            run.font.bold = True      #加粗
            run.font.italic = True    #斜体
            run.font.underline = True #下划线
            run.font.strike = True  #删除线
            run.font.shadow = True  #阴影
            run.font.size = Pt(20)  #20号字体的大小
            run.font.color.rgb = RGBColor(255,255,0)
            #run.font.name = "微软雅黑"
            r = run._element.rPr.rFonts
            r.set(qn("w:eastAsia"), "微软雅黑")
    
    doc.save("shi.docx") 

     

    修改段落样式

    对齐样式

    paragraph.alignment = 对齐方式

     

    行间距

    paragraph.paragraph_format.line_spacing = 2.0

    注意用浮点数,2.0就表示两倍行间距

     

    段前和段后间距

    paragraph.paragraph_format.space_before = Pt(12)
    paragraph.paragraph_format.space_after = Pt(12)

    Pt(12)表示12磅

     

    总起来

    from docx.enum.text import WD_ALIGN_PARAGRAPH
    from docx import Document
    from docx.shared import Pt,RGBColor
    from docx.oxml.ns import qn
    
    doc = Document()
    
    paragraph = doc.add_paragraph()
    paragraph. alignment = WD_ALIGN_PARAGRAPH.CENTER
    
    paragraph.paragraph_format.line_spacing = 2.0
    
    
    paragraph.paragraph_format.space_before = Pt(12)
    paragraph.paragraph_format.space_after = Pt(12)
    
    
    doc.save("shi.docx")
    

     

     

     

     

     

     

     

     

     

     

     

    展开全文
  • 主要介绍了Python读取word文本操作详解,介绍了涉及到的模块,相关概念,模块的安装等内容,小编觉得还是挺不错的,具有一定借鉴价值,需要的朋友可以参考下
  • 舍友从网上下载的word题库文档很乱,手动改了大半天才改了一点,想起python是大名鼎鼎的自动化脚本,于是乎开始了pythonword的一顿瞎操作。 分析需求 对文档中的内容进行分析,只留下题目,选项,并且题号要从1...
  • python入门,包括字典,和excel,word,操作等。可读性很强。
  • python word自动写入模板 搭配博客内容使用 后续将会持续更新excel,ppt,爬虫,人工智能等相关内容,敬请关注
  • python word 创建超链接

    千次阅读 2019-11-26 16:34:14
    import docx from docx.enum.text import WD_ALIGN_...https://github.com/python-openxml/python-docx/issues/74 https://www.cnblogs.com/z123zero/p/10770097.html#%E5%AF%B9%E8%B1%A1%E5%85%B3%E7%B3%BB
    import docx
    from docx.enum.text import WD_ALIGN_PARAGRAPH
    from docx.oxml.ns import qn
    from docx.shared import Cm, Pt
    
    #document = Document()
    # 设置一个空白样式
    #style = document.styles['Normal']
    # 设置西文字体
    #style.font.name = 'Times New Roman'
    ## 设置中文字体
    #style.element.rPr.rFonts.set(qn('w:eastAsia'), '微软雅黑')
    
    #定义 创建 超链接 函数
    def add_hyperlink(paragraph, url, text, color, underline):
        """
        A function that places a hyperlink within a paragraph object.
    
        :param paragraph: The paragraph we are adding the hyperlink to.
        :param url: A string containing the required url
        :param text: The text displayed for the url
        :return: The hyperlink object
        """
    
        # This gets access to the document.xml.rels file and gets a new relation id value
        part = paragraph.part
        r_id = part.relate_to(url, docx.opc.constants.RELATIONSHIP_TYPE.HYPERLINK, is_external=True)
    
        # Create the w:hyperlink tag and add needed values
        hyperlink = docx.oxml.shared.OxmlElement('w:hyperlink')
        hyperlink.set(docx.oxml.shared.qn('r:id'), r_id, )
    
        # Create a w:r element
        new_run = docx.oxml.shared.OxmlElement('w:r')
    
        # Create a new w:rPr element
        rPr = docx.oxml.shared.OxmlElement('w:rPr')
    
        # Add color if it is given
        if not color is None:
            c = docx.oxml.shared.OxmlElement('w:color')
            c.set(docx.oxml.shared.qn('w:val'), color)
            rPr.append(c)
    
        # Remove underlining if it is requested
        if not underline:
            u = docx.oxml.shared.OxmlElement('w:u')
            u.set(docx.oxml.shared.qn('w:val'), 'none')
            rPr.append(u)
    
        # Join all the xml elements together add add the required text to the w:r element
        new_run.append(rPr)
        new_run.text = text
        hyperlink.append(new_run)
    
        paragraph._p.append(hyperlink)
    
        return hyperlink
    #定义 创建 书签 函数
    def add_bookmark(paragraph, bookmark_text, bookmark_name):
        """
        A function that places a hyperlink within a paragraph object.
    
        :param paragraph: 创建一个段落
        :param bookmark_text: 定位到书签文本会被插入到文档中,
        :param tebookmark_name: 书签名称
        """
        run = paragraph.add_run()
        tag = run._r  # for reference the following also works: tag =  document.element.xpath('//w:r')[-1]
        start = docx.oxml.shared.OxmlElement('w:bookmarkStart')
        start.set(docx.oxml.ns.qn('w:id'), '0')
        start.set(docx.oxml.ns.qn('w:name'), bookmark_name)
        tag.append(start)
    
        text = docx.oxml.OxmlElement('w:r')
        text.text = bookmark_text
        tag.append(text)
    
        end = docx.oxml.shared.OxmlElement('w:bookmarkEnd')
        end.set(docx.oxml.ns.qn('w:id'), '0')
        end.set(docx.oxml.ns.qn('w:name'), bookmark_name)
        tag.append(end)
    
    document = docx.Document()
    p = document.add_paragraph()
    paragraph= document.add_paragraph()
    
    document.add_page_break()
    
    # 添加链接到本文档到书签链接 #temp1 #号后面跟书签名称
    hyperlink = add_hyperlink(p, '#temp1', '书签', None, True)
    #分页
    document.add_page_break()
    
    # 添加链接到url
    hyperlink = add_hyperlink(p, 'www.baidu.com', '百度', None, True)
    
    #可以将插入段落放在 add_paragraph('1') 也可以  将插入段落 放在 bookmark_text  书签名称bookmark_name
    a=add_bookmark(paragraph= document.add_paragraph('1'), bookmark_text="",bookmark_name="temp1")
    document.add_page_break()
    
    b=add_bookmark(paragraph= document.add_paragraph('2'), bookmark_text="",bookmark_name="temp2")
    
    document.add_page_break()
    c=add_bookmark(paragraph= document.add_paragraph('3'), bookmark_text="",bookmark_name="temp3")
    document.add_page_break()
    
    document.save('demo.docx')

     

    参考文档

    1. https://stackoverflow.com/questions/57586400/how-to-create-bookmarks-in-a-word-document-then-create-internal-hyperlinks-to-t
    2. https://github.com/python-openxml/python-docx/issues/74
    3. https://www.cnblogs.com/z123zero/p/10770097.html#%E5%AF%B9%E8%B1%A1%E5%85%B3%E7%B3%BB
    展开全文
  • Python word转html

    千次阅读 2019-08-02 13:30:23
    Python word转html from win32com.client import Dispatch def doc2html(input, output): w = Dispatch('Word.Application') try: doc = w.Documents.Open(input, ReadOnly=1) doc.SaveAs(...

    Python word转html

    from win32com.client import Dispatch
    
    
    def doc2html(input, output):
        w = Dispatch('Word.Application')
        try:
            doc = w.Documents.Open(input, ReadOnly=1)
            doc.SaveAs(output, 8)
            return True
        except Exception as e:
            return False
    
    
    def main():
        input = r'/home/python/Desktop/XX.doc'
        output = r'/home/python/Desktop'
        rc = doc2html(input, output)
        if rc:
            print('转换成功')
        else:
            print('转换失败')
    
    
    if __name__ == '__main__':
        main()
    

    貌似pywin32模块只能在Windows上用

    展开全文
  • 今天小编就为大家分享一篇python实现替换word中的关键文字(使用通配符),具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
  • 图片是Word的一种特殊内容,这篇文章主要介绍了关于Python操作word文档,向里面插入图片和表格的相关内容,下面话不多说了,来一起看看详细的代码 实例代码: # -*- coding: UTF8 -*- from docx import Document ...
  • python-docx template项目的代码及word模板。在github上有代码。但现在不太好找之前的源文件了。
  • 主要介绍了python使用Word2Vec进行情感分析解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
  • 1.Word文档如下: 2.代码 # -*- coding: UTF-8 -*- from docx import Document def readSpecTable(filename, specText): document = Document(filename) paragraphs = document.paragraphs allTables = ...
  • Python docx module for Word or WPS processing 本文是通过docx把word中的表格中的某些已填好的内容提取出来,存入excel表格。 首先安装docx的python模块: pip install python-docx 由于处理的为中文和符号,...
  • 这个写的很简单,比之前上传的那个vba的简单,逻辑如下,给定目录,遍历所有doc转换成docx,然后循环读取所有docx里的第一个表格,进行重复值筛选,然后写入到excel里,用到了几个模块,需要提前导入
  • 主要介绍了Python复制Word内容并使用格式设字体与大小实例代码,小编觉得还是挺不错的,具有一定借鉴价值,需要的朋友可以参考下
  • python实现了情感分析的完整项目,包含训练样本,训练好的模型,完整代码。python实现了情感分析的完整项目,包含训练样本,训练好的模型,完整代码。python实现了情感分析的完整项目,包含训练样本,训练好的模型,...
  • doc文件转docx文件 根目录文件自动读取 批量处理word文件中指定关键词后的表格导入excel
  • 主要介绍了在python下实现word2vec词向量训练与加载实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
  • python word转pdf

    千次阅读 2019-04-29 17:30:00
    使用python win32 库 调用word底层vba,将word转成pdf 安装pywin32 pip install pywin32 python代码 from win32com.client import gencache from win32com.client import constants, gencache def createPdf...

    原理

    使用python win32 库 调用word底层vba,将word转成pdf

    安装pywin32

    pip install pywin32 

    python代码

    from win32com.client import gencache
    from win32com.client import constants, gencache
    
    def createPdf(wordPath, pdfPath):
        """
        word转pdf
        :param wordPath: word文件路径
        :param pdfPath:  生成pdf文件路径
        """
        word = gencache.EnsureDispatch('Word.Application')
        doc = word.Documents.Open(wordPath, ReadOnly=1)
        doc.ExportAsFixedFormat(pdfPath,
                                constants.wdExportFormatPDF,
                                Item=constants.wdExportDocumentWithMarkup,
                                CreateBookmarks=constants.wdExportCreateHeadingBookmarks)
        word.Quit(constants.wdDoNotSaveChanges)

    转载于:https://www.cnblogs.com/jokerBi/p/10791760.html

    展开全文
  • 主要为大家详细介绍了python实现word 2007文档转换为pdf文件,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
  • python实现批量生成word文档,批量生成随机计算机,可随机生成试卷。此文件包,包含源码,模板,和数据库备份包,需有点python基础的同仁使用,
  • 主要介绍了Python实现批量将word转html并将html内容发布至网站的方法,涉及Python调用第三方接口进行文件转换及操作数据库等相关技巧,具有一定参考借鉴价值,需要的朋友可以参考下
  • 基于pythonword助手(双击即启动).rar
  • python3实现word转txt

    2018-10-29 12:27:27
    pip相应模块以后,直接可以用,输入路径就行,记得路径文件夹不要有doc、docx以外的文件
  • python实现word内容 excel内容 文件名 文件夹名字的查找与替换。可以以当前路径为基础深度优先搜索各级文件夹,进行内容和文件名字的查找与替换
  • 主要为大家详细介绍了python批量实现Word文件转换为PDF文件的方法,具有一定的参考价值,感兴趣的小伙伴们可以参考一下

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 166,217
精华内容 66,486
关键字:

pythonword

python 订阅