精华内容
下载资源
问答
  • Python自动化测试之Selenium

    万人学习 2019-08-07 15:57:44
    本课程详细介绍了Selenium Python版本的自动化测试方法和实践,通过本课程的学习你将掌握如下内容:Selenium 测试环境搭建单元测试、生成测试报告、定位元素、WebDriver属性和方法、WebElement属性和方法、操作form...
  • Python自动化测试开发

    千人学习 2020-07-20 20:26:52
    Python自动化测试/开发教程,全栈自动化教学课程,接口测试,面试训练营,抓包工具的使用编程基础都会有讲到,软件测试,与你同行!
  • Appium+Python自动化测试

    千人学习 2020-05-10 15:12:25
    学习Appium+Python自动化测试 帮助你快速搭建Appium自动化测试框架,包括PO模型框架和关键字模型框架,用最少的时间,达成最大的效果。
  • Python自动化测试九章经

    千人学习 2019-09-28 09:36:11
    Python自动化测试 系统教学+实战分析 简单易上手 课程使用的是语法简洁、提供丰富的测试库和框架的Python语言,并从测试人员的角度,梳理当前最热门的自动化测试框架和常用库,并通过...
  • python自动化办公之python操作PPT

    千次阅读 多人点赞 2020-05-29 08:48:36
    python自动化文章一直深受广大python爱好者的青睐。基于此,我花了整整一周时间真理出来的python自动化文档手册,涉及到五个章节(如下图所示),① python使用openpyxl操作excel;② python使用PyPDF2和pdfplumber...

    python自动化文章一直深受广大python爱好者的青睐。基于此,我花了整整一周时间真理出来的python自动化文档手册,涉及到六个章节(如下图所示):
    ① python使用openpyxl操作excel;
    ② python使用PyPDF2和pdfplumber操作pdf;
    ③ python使用python-docx操作word;
    ④ python使用python-pptx操作PPT;
    ⑤ python如何自动收发邮件;
    ⑥ python制作电话号码归属地查询工具。
    由于文档获取人数太多,大家如有需求,请关注公众号:【数据分析与统计学之美】,回复关键词:【自动化数据】!

    目录

      1、python-pptx模块简介
      2、模块的安装与导入
       1)模块的安装
       2)模块的导入
      3、python读取PPT文档中的内容
       1)PPT的结构说明
       2)获取Slide
       3)获取Shape形状
       4)判断每个Shape中是否存在文字
       5)获取某一页Slide中的内容
       6)获取Shape中的某个Paragraph
      4、利用python像PPT中写入内容
       1)幻灯片模板及占位符的概念
       2)怎么自定义母版?
       3)什么是版式?
       4)添加Slide和内容
         ① 占位符id的确认
         ② PPT内容的填写
       5)添加段落
         ① 占位符id的确认
         ② 段落的添加
         ③ 给段落设定层级关系
         ④ 添加一个文本框
         ⑤ 添加一个图片
         ⑥ 添加表格
      5、PPT文档内容样式批量调整
       1)文本框位置的调整
       2)文本框背景颜色调整
       3)文本框边框样式调整
       4)段落对其调整
       5)字体样式调整

    1、python-pptx模块简介

    使用python操作PPT,需要使用的模块就是python-pptx,下面来对该模块做一个简单的介绍。这里提前做一个说明:python操作PPT,最好是我们提前设计好自己的一套样式,然后利用进行python进行内容的获取和填充(最主要的功能!),最好是不用使用python代码操作PPT的格式,格式的修改肯定不如我们直接在PPT中修改方便。

    2、模块的安装与导入

    1)模块的安装
    "Windows用户命令行下输入"
    pip install python-pptx
    "Mac用户命令行下输入"
    pip3 install python-pptx
    
    2)模块的导入

    这里有一点需要注意的是:安装的库是python-pptx,但是导入的时候却有点不同。

    import pptx
    

    3、python读取PPT文档中的内容

    1)PPT的结构说明

    在使用python操作PPT之前,首先应该清楚PPT的结构,这个对于之后代码的编写很有帮助。
    在这里插入图片描述
    注意:关于run块儿的概念,可以参考我的另外一篇文章https://blog.csdn.net/weixin_41261833/article/details/106028038

    2)获取Slide
    from pptx import Presentation
    
    prs = Presentation("统计学习方法PPT.pptx")
    for slide in prs.slides:
        print(slide)
    

    结果如下:
    在这里插入图片描述

    3)获取Shape形状
    import pptx
    from pptx import Presentation
    
    prs = Presentation("统计学习方法PPT.pptx")
    for slide in prs.slides:
        for shape in slide.shapes:
            print(shape)
    """
    注意:这里得到的Shape对象,并不能看出什么,接着往下看。
    """
    

    结果如下:
    在这里插入图片描述

    4)判断每个Shape中是否存在文字
    • shape.has_text_frame :是否有文字
    • shape.text_frame :获取文字框
    import pptx
    from pptx import Presentation
    
    prs = Presentation("统计学习方法PPT.pptx")
    for slide in prs.slides:
        for shape in slide.shapes:
            if shape.has_text_frame:
                text_frame = shape.text_frame
                print(text_frame.text)
    

    结果如下:
    在这里插入图片描述

    5)获取某一页Slide中的内容
    import pptx
    from pptx import Presentation
    
    prs = Presentation("统计学习方法PPT.pptx")
    
    for i,slide in enumerate(prs.slides):
        if i == 5:
            for shape in slide.shapes:
                if shape.has_text_frame:
                    text_frame = shape.text_frame
                    print(text_frame.text)
    

    结果如下:
    在这里插入图片描述

    6)获取Shape中的某个Paragraph
    import pptx
    from pptx import Presentation
    
    prs = Presentation("统计学习方法PPT.pptx")
    
    for i,slide in enumerate(prs.slides):
        if i == 5:
            for shape in slide.shapes:
                if shape.has_text_frame:
                    text_frame = shape.text_frame
                    for paragraph in text_frame.paragraphs:
                        print(paragraph.text)
    """
    注意:该方法和上述4)中的方法一摸一样。上述方法是直接获取Shpae中的文字内容;
    下面这个更灵活,先获取每个Shape,然后在获取每个Shape中的paragraph;
    下面方式更好:因为我们可以针对paragraph,写一个判断条件,只获取第几个paragraph;
    """
    

    结果如下:
    在这里插入图片描述

    4、利用python像PPT中写入内容

    1)幻灯片模板及占位符的概念

    在这里插入图片描述

    2)怎么自定义母版?

    https://jingyan.baidu.com/article/925f8cb8b5dfe7c0dce05671.html

    3)什么是版式?

    这个概念在下面的效果中,会得以体现。其中prs.slide_layouts[]传入0表示获取的是第一个版式,传入1表示获取的是第二个版式,以此类推下去。
    在这里插入图片描述

    4)添加Slide和内容

    这里就需要使用上述的自定义母版。因为毕竟是使用python操作PPT,我们可以定义好自己想要展示的PPT母版,然后借助代码完成PPT的内容写入操作。

    ① 占位符id的确认
    import pptx
    from pptx import Presentation
    
    prs = Presentation("空白.pptx")
    # prs.slide_layouts[]表示的是ppt中不同的版式
    slide = prs.slides.add_slide(prs.slide_layouts[0])
    for shape in slide.placeholders:
        phf = shape.placeholder_format
        print(f"{phf.idx}--{shape.name}--{phf.type}")
        shape.text = f"{phf.idx}--{shape.name}--{phf.type}"
    # 注意:做完这个操作,一定要记得保存一下!
    prs.save("电子奖状模板.pptx")
    """
    上述打印结果如下:
    0--Title 1--TITLE (1)  这个表示标题占位符,id为0
    13--Picture Placeholder 2--PICTURE (18)  这个表示图片占位符,id为13
    14--Text Placeholder 3--BODY (2)  这个表示正文内容占位符,id为14
    15--Text Placeholder 4--BODY (2)  这个表示正文内容占位符,id为15
    我们一定要先知道每个空格的占位符id,才可以进行下面内容的填充。
    """
    

    效果如下:
    在这里插入图片描述

    ② PPT内容的填写
    import pptx
    from pptx import Presentation
    
    prs = Presentation("空白.pptx")
    slide = prs.slides.add_slide(prs.slide_layouts[0])
    name = slide.placeholders[14]
    why = slide.placeholders[15]
    
    name.text = "黄同学"
    why.text = "学习太积极"
    prs.save("内容填充.pptx")
    

    效果如下:
    在这里插入图片描述

    5)添加段落
    ① 占位符id的确认
    import pptx
    from pptx import Presentation
    
    prs = Presentation("finall.pptx")
    slide = prs.slides.add_slide(prs.slide_layouts[0])
    for shape in slide.placeholders:
        phf = shape.placeholder_format
        print(f"{phf.idx}--{shape.name}--{phf.type}")
        shape.text = f"{phf.idx}--{shape.name}--{phf.type}"
    print("-------------------------------------------")
    slide = prs.slides.add_slide(prs.slide_layouts[1])
    for shape in slide.placeholders:
        phf = shape.placeholder_format
        print(f"{phf.idx}--{shape.name}--{phf.type}")
        shape.text = f"{phf.idx}--{shape.name}--{phf.type}"
    
    prs.save("哈哈.pptx")
    

    效果如下:
    在这里插入图片描述

    ② 段落的添加
    import pptx
    from pptx import Presentation
    
    prs = Presentation("finall.pptx")
    slide = prs.slides.add_slide(prs.slide_layouts[0])
    name = slide.placeholders[14]
    why = slide.placeholders[15]
    name.text = "黄同学"
    why.text = "学习太积极"
    # --------------------------------------------------- #
    prs1 = Presentation("finall.pptx")
    slide1 = prs.slides.add_slide(prs.slide_layouts[1])
    shapes = slide1.shapes
    title_shape = shapes.title  # 这句代码可以改为title_shape = shapes.placeholders[0]
    body_shape = shapes.placeholders[1]
    
    title_shape.text = "这是一个标题"
    
    tf = body_shape.text_frame
    # 这句代码就是给body占位符添加内容!
    tf.text = "带圆点的符号1"
    
    p = tf.add_paragraph()
    # 这个代码表示在原来的基础上,添加第一个段落!
    p.text = "带圆点的符号2"
    
    p = tf.add_paragraph()
    # 这个代码表示在原来的基础上,添加第二个段落!
    p.text = "带圆点的符号3"
    
    prs.save("嘿嘿.pptx")
    

    效果如下:
    在这里插入图片描述

    ③ 给段落设定层级关系
    import pptx
    from pptx import Presentation
    
    prs = Presentation("finall.pptx")
    slide = prs.slides.add_slide(prs.slide_layouts[0])
    name = slide.placeholders[14]
    why = slide.placeholders[15]
    name.text = "黄同学"
    why.text = "学习太积极"
    # --------------------------------------------------- #
    prs1 = Presentation("finall.pptx")
    slide1 = prs.slides.add_slide(prs.slide_layouts[1])
    shapes = slide1.shapes
    title_shape = shapes.title  # 这句代码可以改为title_shape = shapes.placeholders[0]
    body_shape = shapes.placeholders[1]
    
    title_shape.text = "这是一个标题"
    
    tf = body_shape.text_frame
    tf.text = "带圆点的符号1"
    
    p = tf.add_paragraph()
    p.text = "带圆点的符号2"
    # 原始内容的层级相当于是0,因此这个段落我设置为层级1,下面的段落设置为层级2
    p.level = 1
    
    p = tf.add_paragraph()
    p.text = "带圆点的符号3"
    p.level = 2
    
    prs.save("嘻嘻.pptx")
    

    效果如下:
    在这里插入图片描述

    ④ 添加一个文本框
    • slide.shapes.add_textbox(left, top, width, height)
    from pptx import Presentation
    from pptx.util import Cm, Pt
    
    prs = Presentation()
    # 使用第一个版式
    black_slide_layout = prs.slide_layouts[0]
    slide = prs.slides.add_slide(black_slide_layout)
    
    left = top = width = height = Cm(3)
    text_box = slide.shapes.add_textbox(left, top, width, height)
    tf = text_box.text_frame
    tf.text = "这是一段文本框里面的文字"
    
    p = tf.add_paragraph()
    p.text = "这是第二段文字,加粗,字号40"
    p.font.bold = True
    p.font.size = Pt(40)
    
    prs.save("添加一个文本框0.pptx")
    

    效果如下:
    在这里插入图片描述

    ⑤ 添加一个图片
    • slide.shapes.add_picture(图片路径, 距离左边, 距离顶端, 宽度, 高度)

    第一种展示:

    from pptx import Presentation
    from pptx.util import Cm
    
    prs = Presentation()
    # 使用第七个版式
    black_slide_layout = prs.slide_layouts[6]
    slide = prs.slides.add_slide(black_slide_layout)
    
    left = top = Cm(3)
    pic = slide.shapes.add_picture("孙悟空.png", left, top)
    
    prs.save("添加图片1.pptx")
    

    效果如下:
    在这里插入图片描述
    第二种展示:

    from pptx import Presentation
    from pptx.util import Cm
    
    prs = Presentation()
    # 使用第七个版式
    black_slide_layout = prs.slide_layouts[6]
    slide = prs.slides.add_slide(black_slide_layout)
    
    left = top = Cm(3)
    height = Cm(5.5)
    pic = slide.shapes.add_picture("孙悟空.png", left, top, height=height)
    
    prs.save("添加图片2.pptx")
    

    效果如下:
    在这里插入图片描述

    ⑥ 添加表格
    • shapes.add_table(rows, cols, left, top, width, height)
    from pptx import Presentation
    from pptx.util import Cm, Pt
    
    prs = Presentation()
    # 使用第七个版式
    black_slide_layout = prs.slide_layouts[6]
    slide = prs.slides.add_slide(black_slide_layout)
    shapes = slide.shapes
    
    rows, cols = 5, 3
    left = top = Cm(5)
    width = Cm(18)
    height = Cm(3)
    
    table = shapes.add_table(rows, cols, left, top, width, height).table
    table.columns[0].width = Cm(6)
    table.columns[1].width = Cm(2)
    table.columns[2].width = Cm(2)
    table.rows[0].height = Cm(2)
    
    data = [
        ["姓名","性别","成绩"],
        ["张三","男",96],
        ["李四","女",87],
        ["王五","女",90],
        ["赵六","男",78]
    ]
    
    for row in range(rows):
        for col in range(cols):
            table.cell(row,col).text = str(data[row][col])
    prs.save("插入表格.pptx")  
    

    结果如下:
    在这里插入图片描述

    5、PPT文档内容样式批量调整

    1)文本框位置的调整

    上面我们已经知道怎么添加文本框,现在我们需要做的就是,怎么调整文本框的位置。

    from pptx import Presentation
    from pptx.util import Cm, Pt
    from pptx.enum.text import MSO_ANCHOR, MSO_AUTO_SIZE
    
    prs = Presentation()
    # 使用第七个版式
    black_slide_layout = prs.slide_layouts[6]
    slide = prs.slides.add_slide(black_slide_layout)
    
    left = top = width = height = Cm(3)
    text_box = slide.shapes.add_textbox(left, top, width, height)
    tf = text_box.text_frame
    tf.text = "这是一段文本框里面的文字"
    # ----------------------------------------- #
    tf.margin_bottom = Cm(0.1) # 下边距
    tf.margin_left = 0 # 下边距
    # 一定要导入MSO_ANCHOR这个库
    tf.vertical_anchor = MSO_ANCHOR.BOTTOM # 对齐文本方式:底端对齐
    tf.word_wrap = True # 框中的文字自动换行
    
    prs.save("文本框样式的调整.pptx")  
    

    结果如下:
    在这里插入图片描述

    2)文本框背景颜色调整
    from pptx import Presentation
    from pptx.util import Cm, Pt
    from pptx.enum.text import MSO_ANCHOR, MSO_AUTO_SIZE
    from pptx.dml.color import RGBColor
    
    prs = Presentation()
    # 使用第七个版式
    black_slide_layout = prs.slide_layouts[6]
    slide = prs.slides.add_slide(black_slide_layout)
    
    left = top = width = height = Cm(3)
    text_box = slide.shapes.add_textbox(left, top, width, height)
    tf = text_box.text_frame
    tf.text = "这是一段文本框里面的文字"
    # -------------------------------------- #
    tf.margin_bottom = Cm(0.1) # 下边距
    tf.margin_left = 0 # 下边距
    tf.vertical_anchor = MSO_ANCHOR.BOTTOM  
    tf.word_wrap = True # 框中的文字自动换行
    # -------------------------------------- #
    fill = text_box.fill
    fill.solid()
    # 使用之前一定要导入RGBColor这个库
    fill.fore_color.rgb = RGBColor(247, 150, 70)
    
    prs.save("文本框背景色的调整.pptx")  
    

    结果如下:
    在这里插入图片描述

    3)文本框边框样式调整
    from pptx import Presentation
    from pptx.util import Cm, Pt
    from pptx.enum.text import MSO_ANCHOR, MSO_AUTO_SIZE
    from pptx.dml.color import RGBColor
    
    prs = Presentation()
    # 使用第七个版式
    black_slide_layout = prs.slide_layouts[6]
    slide = prs.slides.add_slide(black_slide_layout)
    
    left = top = width = height = Cm(3)
    text_box = slide.shapes.add_textbox(left, top, width, height)
    tf = text_box.text_frame
    tf.text = "这是一段文本框里面的文字"
    # -------------------------------------- #
    tf.margin_bottom = Cm(0.1) # 下边距
    tf.margin_left = 0 # 下边距
    tf.vertical_anchor = MSO_ANCHOR.BOTTOM  
    tf.word_wrap = True # 框中的文字自动换行
    # -------------------------------------- #
    fill = text_box.fill
    fill.solid()
    # 使用之前一定要导入RGBColor这个库
    fill.fore_color.rgb = RGBColor(247, 150, 70)
    # -------------------------------------- #
    line = text_box.line
    line.color.rgb = RGBColor(255, 0, 0)
    line.width = Cm(0.3)
    
    prs.save("文本框边框样式调整.pptx")  
    

    结果如下:
    在这里插入图片描述

    4)段落对其调整
    from pptx import Presentation
    from pptx.enum.text import PP_ALIGN
    
    prs = Presentation()
    # 使用第七个版式
    black_slide_layout = prs.slide_layouts[6]
    slide = prs.slides.add_slide(black_slide_layout)
    
    left = top = width = height = Cm(3)
    text_box = slide.shapes.add_textbox(left, top, width, height)
    tf = text_box.text_frame
    # ---------------------------- #
    p = tf.add_paragraph()
    p.text = "这是第二段文字"
    p.alignment = PP_ALIGN.LEFT
    
    prs.save("段落对其调整.pptx")  
    

    当然这里还有一些其他样式的调整,和word很类似,就不一一叙述了。
    在这里插入图片描述

    5)字体样式调整

    在这里插入图片描述
    代码如下:

    from pptx import Presentation
    from pptx.util import Cm, Pt
    from pptx.enum.text import MSO_ANCHOR, MSO_AUTO_SIZE
    from pptx.dml.color import RGBColor
    from pptx.enum.text import PP_ALIGN
    
    prs = Presentation()
    # 使用第七个版式
    black_slide_layout = prs.slide_layouts[6]
    slide = prs.slides.add_slide(black_slide_layout)
    
    left = top = width = height = Cm(3)
    text_box = slide.shapes.add_textbox(left, top, width, height)
    tf = text_box.text_frame
    # ---------------------------- #
    p = tf.add_paragraph()
    p.text = "这是第二段文字"
    p.alignment = PP_ALIGN.LEFT
    # ------------------------------------- #
    p.font.bold = True
    p.font.name = "宋体"
    p.font.color.rgb = RGBColor(247, 150, 70)
    p.font.size = Pt(30)
    
    prs.save("字体样式调整.pptx")  
    

    结果如下:
    在这里插入图片描述

    展开全文
  • 适合自动化测试,以及对于动态加载页面的网页进行爬虫代码的编写 这里以Chrome浏览器为例,只选择下载其中的一张图片为例,后面还可以优化再批量下载以及爬取全站数据等 运行结果演示: 完整代码(附详细注释): #...

    selenium的作用就是操控浏览器模拟人的动作进行访问网页的操作
    适合自动化测试,以及对于动态加载页面的网页进行爬虫代码的编写

    这里以Chrome浏览器为例,只选择下载其中的一张图片为例,后面还可以优化再批量下载以及爬取全站数据等

    运行结果演示:
    在这里插入图片描述
    完整代码(附详细注释):

    #!/usr/bin/env python
    # -*- coding: utf-8 -*-
    # @Time    : 2020/11/20 18:22
    # @Author  : huni
    # @File    : selenium自动化爬壁纸.py
    # @Software: PyCharm
    
    from selenium import webdriver
    from time import sleep
    from selenium.webdriver import ActionChains     #导入动作链类
    
    
    #实例化浏览器对象,传入浏览器对象的驱动程序
    dri = webdriver.Chrome(executable_path='./chromedriver.exe')
    # dri.maximize_window()     #窗口最大化
    
    #让浏览器发起一个指定url的请求
    dri.get('https://bz.zzzmh.cn/')
    
    sleep(3)
    
    #找到二次元按钮
    dri.find_element_by_xpath('//*[@id="app"]/div[1]/div[2]/ul[1]/li[3]/a').click()
    
    sleep(8)
    #找到其中的一个图片
    right = dri.find_element_by_xpath('//*[@id="838kmo"]')
    #找到保存按钮
    save = dri.find_element_by_xpath('//*[@id="app"]/div[5]/ul[1]/li[3]')
    
    #实例化动作链对象
    action = ActionChains(dri)
    
    #右键点击图片
    action.context_click(on_element=right).perform()
    sleep(2)
    #点击保存
    action.click(save).perform()
    
    sleep(30)
    
    print('完成')
    
    #释放动作链
    action.release()
    
    sleep(3)
    dri.quit()
    
    
    展开全文
  • python自动化测试

    千次阅读 2018-11-09 21:24:34
    三、Python自动化测试学习路线 第一步:先学python ------- python不过关,别谈自动化。 第二步:Selenium框架 第三步:unittest框架 第四步:项目 第五步:Robot Framwork框架 如果只学习Robot Framwork,...

     

     

    web自动化和selenium自动化

    三、Python自动化测试学习路线

    • 第一步:先学python ------- python不过关,别谈自动化。
    • 第二步:Selenium框架
    • 第三步:unittest框架
    • 第四步:项目
    • 第五步:Robot Framwork框架
      如果只学习Robot Framwork,通过这个来做自动化,别以为不要学习Selenium跟python了, 因为Robot Framework中的关键字可能不够用,不能满足你们的需求,那么我们需要自定义关键字,这个时候就必须自己得通过python+selenium来编写了。

     

    展开全文
  •   章节一:python使用openpyxl操作excel     1、openpyxl库介绍     2、python怎么打开及读取表格内容?        1)Excel表格述语        2)打开Excel表格并获取表格名称        3...

    本文是鉴于有些粉丝的工作需求,有时候需要遇到这些文件的处理。因此,我写了一个文章集合,供大家参考,整篇文章已经整理成册(如下图所示)。由于文档获取人数太多,大家如有需求,请关注公众号:【数据分析与统计学之美】,回复关键词:【自动化文档】!
    在这里插入图片描述

    目录

      章节一:python使用openpyxl操作excel
        1、openpyxl库介绍
        2、python怎么打开及读取表格内容?
           1)Excel表格述语
           2)打开Excel表格并获取表格名称
           3)通过sheet名称获取表格
           4)获取表格的尺寸大小
           5)获取表格内某个格子的数据
             ① sheet[“A1”]方式
             ② sheet.cell(row=, column=)方式
           6)获取某个格子的行数、列数、坐标
           7)获取一系列格子
             ① sheet[]方式
             ② .iter_rows()方式
             ③ sheet.rows()
        3、python如何向excel中写入某些内容?
           1)修改表格中的内容
             ① 向某个格子中写入内容并保存
             ② .append():向表格中插入行数据
             ③ 在python中使用excel函数公式(很有用)
             ④ .insert_cols()和.insert_rows():插入空行和空列
             ⑤ .delete_rows()和.delete_cols():删除行和列
             ⑥ .move_range():移动格子
             ⑦ .create_sheet():创建新的sheet表格
             ⑧ .remove():删除某个sheet表
             ⑨ .copy_worksheet():复制一个sheet表到另外一张excel表
             ⑩ sheet.title:修改sheet表的名称
             ⑪ 创建新的excel表格文件
             ⑫ sheet.freeze_panes:冻结窗口
             ⑬ sheet.auto_filter.ref:给表格添加“筛选器”
        4、批量调整字体和样式
           1)修改字体样式
           2)获取表格中格子的字体样式
           3)设置对齐样式
           4)设置边框样式
           5)设置填充样式
           6)设置行高和列宽
           7)合并单元格
      章节二:python使用PyPDF2和pdfplumber操作pdf
        1、PyPDF2和pdfplumber库介绍
        2、python提取PDF文字内容
           1)利用pdfplumber提取文字
           2)利用pdfplumber提取表格并写入excel
        3、PDF合并及页面的排序和旋转
           1)分割及合并pdf
             ① 合并pdf
             ② 拆分pdf
           2)旋转及排序pdf
             ① 旋转pdf
             ② 排序pdf
        4、pdf批量加水印及加密、解密
           1)批量加水印
           2)批量加密、解密
             ① 加密pdf
             ② 解密pdf并保存为未加密的pdf
      章节三:python使用python-docx操作word
        1、python-docx库介绍
        2、Python读取Word文档内容
           1)word文档结构介绍
           2)python-docx提取文字和文字块儿
             ① python-docx提取文字
             ② python-docx提取文字块儿
           3)利用Python向Word文档写入内容
             ① 添加段落
             ② 添加文字块儿
             ③ 添加一个分页
             ④ 添加图片
             ⑤ 添加表格
             ⑥ 提取word表格,并保存在excel中(很重要)
        3、利用Python调整Word文档样式
           1)修改文字字体样式
           2)修改段落样式
             ① 对齐样式
             ② 行间距调整
             ③ 段前与段后间距

    章节一:python使用openpyxl操作excel

    1、openpyxl库介绍

    • openpyxl最好用的python操作excel表格库,不接受反驳;
    • openpyxl官网链接:openpyxl官网
    • openpyxl只支持【.xlsx / .xlsm / .xltx / .xltm】格式的文件;

    2、python怎么打开及读取表格内容?

    1)Excel表格述语

    这里需要大家仔细查看图中的每一项内容,知道什么是“行(row)、列(column)”?什么是“格子(cell)”?什么是“sheet表”?
    在这里插入图片描述

    2)打开Excel表格并获取表格名称
    from openpyxl import load_workbook
    workbook = load_workbook(filename = "test.xlsx")
    workbook.sheetnames
    

    结果如下:
    在这里插入图片描述

    3)通过sheet名称获取表格
    from openpyxl import load_workbook
    workbook = load_workbook(filename = "test.xlsx")
    workbook.sheetnames
    sheet = workbook["Sheet1"]
    print(sheet)
    

    结果如下:
    在这里插入图片描述

    4)获取表格的尺寸大小
    • 这里所说的尺寸大小,指的是excel表格中的数据有几行几列,针对的是不同的sheet而言。
    sheet.dimensions
    

    结果如下:
    在这里插入图片描述

    5)获取表格内某个格子的数据
    ① sheet[“A1”]方式
    workbook = load_workbook(filename = "test.xlsx")
    sheet = workbook.active
    print(sheet)
    cell1 = sheet["A1"]
    cell2 = sheet["C11"]
    print(cell1.value, cell2.value)
    
    """
    workbook.active 打开激活的表格;
    sheet["A1"] 获取A1格子的数据;
    cell.value 获取格子中的值;
    """
    

    结果如下:
    在这里插入图片描述

    ② sheet.cell(row=, column=)方式
    • 这种方式更简单,大家可以对比这两种方式;
    workbook = load_workbook(filename = "test.xlsx")
    sheet = workbook.active
    print(sheet)
    cell1 = sheet.cell(row = 1,column = 1)
    cell2 = sheet.cell(row = 11,column = 3)
    print(cell1.value, cell2.value)
    

    结果如下:
    在这里插入图片描述

    6)获取某个格子的行数、列数、坐标
    workbook = load_workbook(filename = "test.xlsx")
    sheet = workbook.active
    print(sheet)
    cell1 = sheet["A1"]
    cell2 = sheet["C11"]
    print(cell1.value, cell1.row, cell1.column, cell1.coordinate)
    print(cell2.value, cell2.row, cell2.column, cell2.coordinate)
    """
    .row 获取某个格子的行数;
    .columns 获取某个格子的列数;
    .corordinate 获取某个格子的坐标;
    """
    

    结果如下:
    在这里插入图片描述

    7)获取一系列格子
    ① sheet[]方式
    workbook = load_workbook(filename = "test.xlsx")
    sheet = workbook.active
    print(sheet)
    # 获取A1:C2区域的值
    cell = sheet["A1:C2"]
    print(cell)
    for i in cell:
        for j in i:
            print(j.value)
    

    结果如下:
    在这里插入图片描述
    特别的:如果我们只想获取“A列”,或者获取“A-C列”,可以采取如下方式:

    sheet["A"]    --- 获取A列的数据
    sheet["A:C"]    --- 获取A,B,C三列的数据
    sheet[5]   --- 只获取第5行的数据
    
    ② .iter_rows()方式
    • 当然有.iter_rows()方式,肯定也会有.iter_cols()方式,只不过一个是按行读取,一个是按列读取。
    workbook = load_workbook(filename = "test.xlsx")
    sheet = workbook.active
    print(sheet)
    # 按行获取值
    for i in sheet.iter_rows(min_row=2, max_row=5, min_col=1, max_col=2):
        for j in i:
            print(j.value)
    # 按列获取值
    for i in sheet.iter_cols(min_row=2, max_row=5, min_col=1, max_col=2):
        for j in i:
            print(j.value)      
    

    结果如下:
    在这里插入图片描述

    ③ sheet.rows()
    • 帮助我们获取所有行
    workbook = load_workbook(filename = "test.xlsx")
    sheet = workbook.active
    print(sheet)
    for i in sheet.rows:
            print(i)
    

    结果如下:
    在这里插入图片描述

    3、python如何向excel中写入某些内容?

    1)修改表格中的内容
    ① 向某个格子中写入内容并保存
    workbook = load_workbook(filename = "test.xlsx")
    sheet = workbook.active
    print(sheet)
    sheet["A1"] = "哈喽" # 这句代码也可以改为cell = sheet["A1"] cell.value = "哈喽"
    workbook.save(filename = "哈喽.xlsx")
    """
    注意:我们将“A1”单元格的数据改为了“哈喽”,并另存为了“哈喽.xlsx”文件。
    如果我们保存的时候,不修改表名,相当于直接修改源文件;
    """
    

    结果如下:
    在这里插入图片描述

    ② .append():向表格中插入行数据
    • .append()方式:会在表格已有的数据后面,增添这些数(按行插入);
    • 这个操作很有用,爬虫得到的数据,可以使用该方式保存成Excel文件;
    workbook = load_workbook(filename = "test.xlsx")
    sheet = workbook.active
    print(sheet)
    data = [
        ["唐僧","男","180cm"],
        ["孙悟空","男","188cm"],
        ["猪八戒","男","175cm"],
        ["沙僧","男","176cm"],
    ]
    for row in data:
        sheet.append(row)
    workbook.save(filename = "test.xlsx")
    

    结果如下:
    在这里插入图片描述

    ③ 在python中使用excel函数公式(很有用)
    # 这是我们在excel中输入的公式
    =IF(RIGHT(C2,2)="cm",C2,SUBSTITUTE(C2,"m","")*100&"cm")
    # 那么,在python中怎么插入excel公式呢?
    workbook = load_workbook(filename = "test.xlsx")
    sheet = workbook.active
    print(sheet)
    sheet["D1"] = "标准身高"
    for i in range(2,16):
        sheet["D{}".format(i)] = '=IF(RIGHT(C{},2)="cm",C{},SUBSTITUTE(C{},"m","")*100&"cm")'.format(i,i,i)
    workbook.save(filename = "test.xlsx")
    

    结果如下:
    在这里插入图片描述
    此时,你肯定会好奇,python究竟支持写哪些“excel函数公式”呢?我们可以使用如下操作查看一下。

    import openpyxl
    from openpyxl.utils import FORMULAE
    print(FORMULAE)
    

    结果如下:
    在这里插入图片描述

    ④ .insert_cols()和.insert_rows():插入空行和空列
    • .insert_cols(idx=数字编号, amount=要插入的列数),插入的位置是在idx列数的左侧插入;
    • .insert_rows(idx=数字编号, amount=要插入的行数),插入的行数是在idx行数的下方插入;
    workbook = load_workbook(filename = "test.xlsx")
    sheet = workbook.active
    print(sheet)
    sheet.insert_cols(idx=4,amount=2)
    sheet.insert_rows(idx=5,amount=4)
    workbook.save(filename = "test.xlsx")
    

    结果如下:
    在这里插入图片描述

    ⑤ .delete_rows()和.delete_cols():删除行和列
    • .delete_rows(idx=数字编号, amount=要删除的行数)
    • .delete_cols(idx=数字编号, amount=要删除的列数)
    workbook = load_workbook(filename = "test.xlsx")
    sheet = workbook.active
    print(sheet)
    # 删除第一列,第一行
    sheet.delete_cols(idx=1)
    sheet.delete_rows(idx=1)
    workbook.save(filename = "test.xlsx")
    

    结果如下:
    在这里插入图片描述

    ⑥ .move_range():移动格子
    • .move_range(“数据区域”,rows=,cols=):正整数为向下或向右、负整数为向左或向上;
    # 向左移动两列,向下移动两行
    sheet.move_range("C1:D4",rows=2,cols=-1)
    

    演示效果如下:
    在这里插入图片描述

    ⑦ .create_sheet():创建新的sheet表格
    • .create_sheet(“新的sheet名”):创建一个新的sheet表;
    workbook = load_workbook(filename = "test.xlsx")
    sheet = workbook.active
    print(sheet)
    workbook.create_sheet("我是一个新的sheet")
    print(workbook.sheetnames)
    workbook.save(filename = "test.xlsx")
    

    结果如下:
    在这里插入图片描述

    ⑧ .remove():删除某个sheet表
    • .remove(“sheet名”):删除某个sheet表;
    workbook = load_workbook(filename = "test.xlsx")
    sheet = workbook.active
    print(workbook.sheetnames)
    # 这个相当于激活的这个sheet表,激活状态下,才可以操作;
    sheet = workbook['我是一个新的sheet']  
    print(sheet)
    workbook.remove(sheet)
    print(workbook.sheetnames)
    workbook.save(filename = "test.xlsx")
    

    结果如下:
    在这里插入图片描述

    ⑨ .copy_worksheet():复制一个sheet表到另外一张excel表
    • 这个操作的实质,就是复制某个excel表中的sheet表,然后将文件存储到另外一张excel表中;
    workbook = load_workbook(filename = "a.xlsx")
    sheet = workbook.active
    print("a.xlsx中有这几个sheet表",workbook.sheetnames)
    sheet = workbook['姓名']  
    workbook.copy_worksheet(sheet)
    workbook.save(filename = "test.xlsx")
    

    结果如下:
    在这里插入图片描述

    ⑩ sheet.title:修改sheet表的名称
    • .title = “新的sheet表名”
    workbook = load_workbook(filename = "a.xlsx")
    sheet = workbook.active
    print(sheet)
    sheet.title = "我是修改后的sheet名"
    print(sheet)
    

    结果如下:
    在这里插入图片描述

    ⑪ 创建新的excel表格文件
    from openpyxl import Workbook
    
    workbook = Workbook()
    sheet = workbook.active
    sheet.title = "表格1"
    workbook.save(filename = "新建的excel表格")
    

    结果如下:
    在这里插入图片描述

    ⑫ sheet.freeze_panes:冻结窗口
    • .freeze_panes = “单元格”
    workbook = load_workbook(filename = "花园.xlsx")
    sheet = workbook.active
    print(sheet)
    sheet.freeze_panes = "C3"
    workbook.save(filename = "花园.xlsx")
    """
    冻结窗口以后,你可以打开源文件,进行检验;
    """
    

    结果如下:
    在这里插入图片描述

    ⑬ sheet.auto_filter.ref:给表格添加“筛选器”
    • .auto_filter.ref = sheet.dimension 给所有字段添加筛选器;
    • .auto_filter.ref = “A1” 给A1这个格子添加“筛选器”,就是给第一列添加“筛选器”;
    workbook = load_workbook(filename = "花园.xlsx")
    sheet = workbook.active
    print(sheet)
    sheet.auto_filter.ref = sheet["A1"]
    workbook.save(filename = "花园.xlsx")
    

    结果如下:
    在这里插入图片描述

    4、批量调整字体和样式

    1)修改字体样式
    • Font(name=字体名称,size=字体大小,bold=是否加粗,italic=是否斜体,color=字体颜色)
    from openpyxl.styles import Font
    from openpyxl import load_workbook
    
    workbook = load_workbook(filename="花园.xlsx")
    sheet = workbook.active
    cell = sheet["A1"]
    font = Font(name="微软雅黑",size=20,bold=True,italic=True,color="FF0000")
    cell.font = font
    workbook.save(filename = "花园.xlsx")
    """
    这个color是RGB的16进制表示,自己下去百度学习;
    """
    

    结果如下:
    在这里插入图片描述

    2)获取表格中格子的字体样式
    from openpyxl.styles import Font
    from openpyxl import load_workbook
    
    workbook = load_workbook(filename="花园.xlsx")
    sheet = workbook.active
    cell = sheet["A2"]
    font = cell.font
    print(font.name, font.size, font.bold, font.italic, font.color)
    

    结果如下:
    在这里插入图片描述

    3)设置对齐样式
    • Alignment(horizontal=水平对齐模式,vertical=垂直对齐模式,text_rotation=旋转角度,wrap_text=是否自动换行)
    • 水平对齐:‘distributed’,‘justify’,‘center’,‘leftfill’, ‘centerContinuous’,‘right,‘general’;
    • 垂直对齐:‘bottom’,‘distributed’,‘justify’,‘center’,‘top’;
    from openpyxl.styles import Alignment
    from openpyxl import load_workbook
    
    workbook = load_workbook(filename="花园.xlsx")
    sheet = workbook.active
    cell = sheet["A1"]
    alignment = Alignment(horizontal="center",vertical="center",text_rotation=45,wrap_text=True)
    cell.alignment = alignment
    workbook.save(filename = "花园.xlsx")
    

    结果如下:
    在这里插入图片描述

    4)设置边框样式
    • Side(style=边线样式,color=边线颜色)
    • Border(left=左边线样式,right=右边线样式,top=上边线样式,bottom=下边线样式)
    • style参数的种类: 'double, ‘mediumDashDotDot’, ‘slantDashDot’,‘dashDotDot’,‘dotted’,‘hair’, 'mediumDashed, ‘dashed’, ‘dashDot’, ‘thin’,‘mediumDashDot’,‘medium’, 'thick’from openpyxl.styles import Side,Borderfrom
    openpyxl import load_workbook
    
    workbook = load_workbook(filename="花园.xlsx")
    sheet = workbook.active
    cell = sheet["D6"]
    side1 = Side(style="thin",color="FF0000")
    side2 = Side(style="thick",color="FFFF0000")
    border = Border(left=side1,right=side1,top=side2,bottom=side2)
    cell.border = border
    workbook.save(filename = "花园.xlsx")
    

    结果如下:
    在这里插入图片描述

    5)设置填充样式
    • PatternFill(fill_type=填充样式,fgColor=填充颜色)
    • GradientFill(stop=(渐变颜色1,渐变颜色2……))
    from openpyxl.styles import PatternFill,GradientFill
    from openpyxl import load_workbook
    
    workbook = load_workbook(filename="花园.xlsx")
    sheet = workbook.active
    cell_b9 = sheet["B9"]
    pattern_fill = PatternFill(fill_type="solid",fgColor="99ccff")
    cell_b9.fill = pattern_fill
    cell_b10 = sheet["B10"]
    gradient_fill = GradientFill(stop=("FFFFFF","99ccff","000000"))
    cell_b10.fill = gradient_fill
    workbook.save(filename = "花园.xlsx")
    

    结果如下:
    在这里插入图片描述

    6)设置行高和列宽
    • .row_dimensions[行编号].height = 行高
    • .column_dimensions[列编号].width = 列宽
    workbook = load_workbook(filename="花园.xlsx")
    sheet = workbook.active
    # 设置第1行的高度
    sheet.row_dimensions[1].height = 50
    # 设置B列的宽度
    sheet.column_dimensions["B"].width = 20
    workbook.save(filename = "花园.xlsx")
    """
    sheet.row_dimensions.height = 50
    sheet.column_dimensions.width = 30
    这两句代码,是将整个表的行高设置为50,列宽设置为30;
    """
    

    结果如下:
    在这里插入图片描述

    7)合并单元格
    • .merge_cells(待合并的格子编号)
    • .merge_cells(start_row=起始行号,start_column=起始列号,end_row=结束行号,end_column=结束列号)
    workbook = load_workbook(filename="花园.xlsx")
    sheet = workbook.active
    sheet.merge_cells("C1:D2")
    sheet.merge_cells(start_row=7,start_column=1,end_row=8,end_column=3)
    workbook.save(filename = "花园.xlsx")
    

    结果如下:
    在这里插入图片描述
    当然,也有“取消合并单元格”,用法一致。

    • .unmerge_cells(待合并的格子编号)
    • .unmerge_cells(start_row=起始行号,start_column=起始列号,end_row=结束行号,end_column=结束列号)

    章节二:python使用PyPDF2和pdfplumber操作pdf

    1、PyPDF2和pdfplumber库介绍

    • PyPDF2官网: PyPDF2官网 ,可以更好的读取、写入、分割、合并PDF文件;
    • pdfplumber官网:pdfplumber官网,可以更好地读取PDF文件内容和提取PDF中的表格;
    • 这两个库不属于python标准库,都需要单独安装;

    2、python提取PDF文字内容

    1)利用pdfplumber提取文字
    import PyPDF2
    import pdfplumber
    
    with pdfplumber.open("餐饮企业综合分析.pdf") as p:
        page = p.pages[2]
        print(page.extract_text())
    

    结果如下:
    在这里插入图片描述

    2)利用pdfplumber提取表格并写入excel
    • extract_table():如果一页有一个表格;
    • extract_tables():如果一页有多个表格;
    import PyPDF2
    import pdfplumber
    from openpyxl import Workbook
    
    with pdfplumber.open("餐饮企业综合分析.pdf") as p:
        page = p.pages[4]
        table = page.extract_table()
        print(table)
        
        workbook = Workbook()
        sheet = workbook.active
        for row in table:
            if not "".join() == ""
                sheet.append(row)
        workbook.save(filename = "新pdf.xlsx")
    

    结果如下:
    在这里插入图片描述
    缺陷:可以看到,这里提取出来的表格有很多空行,怎么去掉这些空行呢?
    判断:将列表中每个元素都连接成一个字符串,如果还是一个空字符串那么肯定就是空行。

    import PyPDF2
    import pdfplumber
    from openpyxl import Workbook
    
    with pdfplumber.open("餐饮企业综合分析.pdf") as p:
        page = p.pages[4]
        table = page.extract_table()
        print(table)
        
        workbook = Workbook()
        sheet = workbook.active
        for row in table:
            if not "".join([str(i) for i in row]) == "":
                sheet.append(row)
        workbook.save(filename = "新pdf.xlsx")
    

    结果如下:
    在这里插入图片描述

    3、PDF合并及页面的排序和旋转

    1)分割及合并pdf
    ① 合并pdf

    首先,我们有如下几个文件,可以发现这里共有三个PDF文件需要我们合并。同时可以发现他们的文件名都是有规律的(如果文件名,没有先后顺序,我们合并起来就没有意义了。)
    在这里插入图片描述
    代码如下:

    from PyPDF2 import PdfFileReader, PdfFileWriter
    
    pdf_writer = PdfFileWriter()
    for i in range(1,len(os.listdir(r"G:\6Tipdm\7python办公自动化\concat_pdf"))+1):
        print(i*50+1,(i+1)*50)
        pdf_reader = PdfFileReader("G:\\6Tipdm\\7python办公自动化\\concat_pdf\{}-{}.pdf".format(i*50+1,(i+1)*50))
        for page in range(pdf_reader.getNumPages()):
            pdf_writer.addPage(pdf_reader.getPage(page))
            
    with open("G:\\6Tipdm\\7python办公自动化\\concat_pdf\merge.pdf", "wb") as out:
        pdf_writer.write(out)
    

    结果如下:
    在这里插入图片描述

    ② 拆分pdf

    这里有一个“时间序列.pdf”的文件,共3页,我们将其每一页存为一个PDF文件。
    在这里插入图片描述
    代码如下:

    from PyPDF2 import PdfFileReader, PdfFileWriter
    
    pdf_reader = PdfFileReader(r"G:\6Tipdm\7python办公自动化\concat_pdf\时间序列.pdf")
    for page in range(pdf_reader.getNumPages()):
        pdf_writer = PdfFileWriter()
        pdf_writer.addPage(pdf_reader.getPage(page))
        with open(f"G:\\6Tipdm\\7python办公自动化\\concat_pdf\\{page}.pdf", "wb") as out:
            pdf_writer.write(out)
    

    结果如下:
    在这里插入图片描述

    2)旋转及排序pdf
    ① 旋转pdf
    • .rotateClockwise(90的倍数):顺时针旋转90度
    • .rotateCounterClockwise(90的倍数):逆时针旋转90度
    from PyPDF2 import PdfFileReader, PdfFileWriter
    
    pdf_reader = PdfFileReader(r"G:\6Tipdm\7python办公自动化\concat_pdf\时间序列.pdf")
    pdf_writer = PdfFileWriter()
    for page in range(pdf_reader.getNumPages()):
        if page % 2 == 0:
            rotation_page = pdf_reader.getPage(page).rotateCounterClockwise(90)
        else:
            rotation_page = pdf_reader.getPage(page).rotateClockwise(90)
        pdf_writer.addPage(rotation_page)
        with open("G:\\6Tipdm\\7python办公自动化\\concat_pdf\\旋转.pdf", "wb") as out:
            pdf_writer.write(out)
    """
    上述代码中,我们循环遍历了这个pdf,对于偶数页我们逆时针旋转90°,对于奇数页我们顺时针旋转90°;
    注意:旋转的角度只能是90的倍数;
    """
    

    其中一页效果展示如下:
    在这里插入图片描述

    ② 排序pdf

    需求:我们有一个PDF文件,我们需要倒序排列,应该怎么做呢?
    首先,我们来看python中,怎么倒叙打印一串数字,如下图所示。
    在这里插入图片描述
    那么倒序排列一个pdf,思路同上,代码如下:

    from PyPDF2 import PdfFileReader, PdfFileWriter
    
    pdf_reader = PdfFileReader(r"G:\6Tipdm\7python办公自动化\concat_pdf\时间序列.pdf")
    pdf_writer = PdfFileWriter()
    for page in range(pdf_reader.getNumPages()-1, -1, -1):
        pdf_writer.addPage(pdf_reader.getPage(page))
    with open("G:\\6Tipdm\\7python办公自动化\\concat_pdf\\倒序.pdf", "wb") as out:
            pdf_writer.write(out)
    

    结果如下:
    在这里插入图片描述

    4、pdf批量加水印及加密、解密

    1)批量加水印
    from PyPDF2 import PdfFileReader, PdfFileWriter
    from copy import copy
    
    water = PdfFileReader(r"G:\6Tipdm\7python办公自动化\concat_pdf\水印.pdf")
    water_page = water.getPage(0)
    
    pdf_reader = PdfFileReader(r"G:\6Tipdm\7python办公自动化\concat_pdf\aa.pdf")
    pdf_writer = PdfFileWriter()
    
    for page in range(pdf_reader.getNumPages()):
        my_page = pdf_reader.getPage(page)
        new_page = copy(water_page)
        new_page.mergePage(my_page)
        pdf_writer.addPage(new_page)
    with open("G:\\6Tipdm\\7python办公自动化\\concat_pdf\\添加水印后的aa.pdf", "wb") as out:
            pdf_writer.write(out)  
    """
    这里有一点需要注意:进行pdf合并的时候,我们希望“水印”在下面,文字在上面,因此是“水印”.mergePage(“图片页”)
    """
    

    结果如下:
    在这里插入图片描述

    2)批量加密、解密
    • 这里所说的“解密”,是在知道pdf的密码下,去打开pdf,而不是暴力破解;
    ① 加密pdf
    from PyPDF2 import PdfFileReader, PdfFileWriter
    
    pdf_reader = PdfFileReader(r"G:\6Tipdm\7python办公自动化\concat_pdf\时间序列.pdf")
    pdf_writer = PdfFileWriter()
    for page in range(pdf_reader.getNumPages()):
        pdf_writer.addPage(pdf_reader.getPage(page))
    # 添加密码
    pdf_writer.encrypt("a123456")
    with open("G:\\6Tipdm\\7python办公自动化\\concat_pdf\\时间序列.pdf", "wb") as out:
            pdf_writer.write(out)  
    

    结果如下:
    在这里插入图片描述

    ② 解密pdf并保存为未加密的pdf
    from PyPDF2 import PdfFileReader, PdfFileWriter
    
    pdf_reader = PdfFileReader(r"G:\6Tipdm\7python办公自动化\concat_pdf\时间序列.pdf")
    # 解密pdf
    pdf_reader.decrypt("a123456")
    pdf_writer = PdfFileWriter()
    for page in range(pdf_reader.getNumPages()):
        pdf_writer.addPage(pdf_reader.getPage(page))
    with open("G:\\6Tipdm\\7python办公自动化\\concat_pdf\\未加密的时间序列.pdf", "wb") as out:
            pdf_writer.write(out)  
    

    结果如下:
    在这里插入图片描述

    章节三:python使用python-docx操作word

    1、python-docx库介绍

    • 该模块儿可以创建、修改Word(.docx)文件;
    • 此模块儿不属于python标准库,需要单独安装;
    • python-docx使用官网: python-docx官网
    • 我们在安装此模块儿使用的是pip install python-docx,但是在导入的时候是import docx;

    2、Python读取Word文档内容

    • 注意:每进行一个操作,必须保存一下,否则等于白做;
    1)word文档结构介绍

    在这里插入图片描述

    2)python-docx提取文字和文字块儿
    ① python-docx提取文字

    有一个这样的docx文件,我们想要提取其中的文字,应该怎么做?
    在这里插入图片描述
    代码如下:

    from docx import Document
    
    doc = Document(r"G:\6Tipdm\7python办公自动化\concat_word\test1.docx")
    print(doc.paragraphs)
    for paragraph in doc.paragraphs:
        print(paragraph.text)
    

    结果如下:
    在这里插入图片描述

    ② python-docx提取文字块儿
    from docx import Document
    
    doc = Document(r"G:\6Tipdm\7python办公自动化\concat_word\test1.docx")
    print(doc.paragraphs)
    paragraph = doc.paragraphs[0]
    runs = paragraph.runs
    print(runs)
    for run in paragraph.runs:
        print(run.text)
    ------------------------------
    paragraph = doc.paragraphs[1]
    runs = paragraph.runs
    print(runs)
    for run in paragraph.runs:
        print(run.text)
    

    结果如下:
    在这里插入图片描述

    3)利用Python向Word文档写入内容
    ① 添加段落
    from docx import Document
    
    doc = Document(r"G:\6Tipdm\7python办公自动化\concat_word\test1.docx")
    # print(doc.add_heading("一级标题", level=1))   添加一级标题的时候出错,还没有解决!
    paragraph1 = doc.add_paragraph("这是一个段落")
    paragraph2 = doc.add_paragraph("这是第二个段落")
    doc.save(r"G:\6Tipdm\7python办公自动化\concat_word\test1.docx") 
    """
    添加段落的时候,赋值给一个变量,方便我们后面进行格式调整;
    """
    

    结果如下:
    在这里插入图片描述

    ② 添加文字块儿
    from docx import Document
    
    doc = Document(r"G:\6Tipdm\7python办公自动化\concat_word\test1.docx")
    # 这里相当于输入了一个空格,后面等待着文字输入
    paragraph3 = doc.add_paragraph()
    paragraph3.add_run("我被加粗了文字块儿").bold = True
    paragraph3.add_run(",我是普通文字块儿,")
    paragraph3.add_run("我是斜体文字块儿").italic = True
    doc.save(r"G:\6Tipdm\7python办公自动化\concat_word\test1.docx") 
    

    结果如下:
    在这里插入图片描述

    ③ 添加一个分页
    from docx import Document
    
    doc = Document(r"G:\6Tipdm\7python办公自动化\concat_word\test1.docx")
    doc.add_page_break()
    doc.save(r"G:\6Tipdm\7python办公自动化\concat_word\test1.docx") 
    

    结果如下:
    在这里插入图片描述

    ④ 添加图片
    from docx import Document
    from docx.shared import Cm
    
    doc = Document(r"G:\6Tipdm\7python办公自动化\concat_word\test1.docx")
    doc.add_picture(r"G:\6Tipdm\7python办公自动化\concat_word\sun_wu_kong.png",width=Cm(5),height=Cm(5))
    doc.save(r"G:\6Tipdm\7python办公自动化\concat_word\test1.docx") 
    """
    Cm模块,用于设定图片尺寸大小
    """
    

    结果如下:
    在这里插入图片描述

    ⑤ 添加表格
    from docx import Document
    
    doc = Document(r"G:\6Tipdm\7python办公自动化\concat_word\test1.docx")
    
    list1 = [
        ["姓名","性别","家庭地址"],
        ["唐僧","男","湖北省"],
        ["孙悟空","男","北京市"],
        ["猪八戒","男","广东省"],
        ["沙和尚","男","湖南省"]
    ]
    list2 = [
        ["姓名","性别","家庭地址"],
        ["貂蝉","女","河北省"],
        ["杨贵妃","女","贵州省"],
        ["西施","女","山东省"]
    ]
    
    table1 = doc.add_table(rows=5,cols=3)
    for row in range(5):
        cells = table1.rows[row].cells
        for col in range(3):
            cells[col].text = str(list1[row][col])
    doc.add_paragraph("-----------------------------------------------------------")
    table2 = doc.add_table(rows=4,cols=3)
    for row in range(4):
        cells = table2.rows[row].cells
        for col in range(3):
            cells[col].text = str(list2[row][col])
            
    doc.save(r"G:\6Tipdm\7python办公自动化\concat_word\test1.docx") 
    

    结果如下:
    在这里插入图片描述

    ⑥ 提取word表格,并保存在excel中(很重要)
    from docx import Document
    from openpyxl import Workbook
    
    doc = Document(r"G:\6Tipdm\7python办公自动化\concat_word\test2.docx")
    t0 = doc.tables[0]
    
    workbook = Workbook()
    sheet = workbook.active
    
    for i in range(len(t0.rows)):
        list1 = []
        for j in range(len(t0.columns)):
            list1.append(t0.cell(i,j).text)
        sheet.append(list1)
    workbook.save(filename = r"G:\6Tipdm\7python办公自动化\concat_word\来自word中的表.xlsx")
    

    结果如下:
    在这里插入图片描述

    3、利用Python调整Word文档样式

    1)修改文字字体样式
    from docx import Document
    from docx.shared import Pt,RGBColor 
    from docx.oxml.ns import qn
    
    doc = Document(r"G:\6Tipdm\7python办公自动化\concat_word\test2.docx")
    for paragraph in doc.paragraphs:
        for run in paragraph.runs:
            run.font.bold = True
            run.font.italic = True
            run.font.underline = True
            run.font.strike = True
            run.font.shadow = True
            run.font.size = Pt(18)
            run.font.color.rgb = RGBColor(255,255,0)
            run.font.name = "宋体"
            # 设置像宋体这样的中文字体,必须添加下面2行代码
            r = run._element.rPr.rFonts
            r.set(qn("w:eastAsia"),"宋体")
    doc.save(r"G:\6Tipdm\7python办公自动化\concat_word\_test1.docx")
    

    结果如下:
    在这里插入图片描述

    2)修改段落样式
    ① 对齐样式
    from docx import Document 
    from docx.enum.text import WD_ALIGN_PARAGRAPH
    
    doc = Document(r"G:\6Tipdm\7python办公自动化\concat_word\test1.docx")
    print(doc.paragraphs[0].text)
    doc.paragraphs[0].alignment = WD_ALIGN_PARAGRAPH.CENTER
    # 这里设置的是居中对齐
    doc.save(r"G:\6Tipdm\7python办公自动化\concat_word\对齐样式.docx")
    """
    LEFT,CENTER,RIGHT,JUSTIFY,DISTRIBUTE,JUSTIFY_MED,JUSTIFY_HI,JUSTIFY_LOW,THAI_JUSTIFY
    """
    

    结果如下:
    在这里插入图片描述

    ② 行间距调整
    from docx import Document 
    from docx.enum.text import WD_ALIGN_PARAGRAPH
    
    doc = Document(r"G:\6Tipdm\7python办公自动化\concat_word\test1.docx")
    for paragraph in doc.paragraphs:
        paragraph.paragraph_format.line_spacing = 5.0
    doc.save(r"G:\6Tipdm\7python办公自动化\concat_word\行间距.docx")
    

    结果如下:
    在这里插入图片描述

    ③ 段前与段后间距
    • 这里提供代码,自行下去检验

    在这里插入图片描述

    展开全文
  • python自动化:实现自动回复QQ消息

    千次阅读 2021-01-17 17:56:19
    python自动化:实现自动回复QQ消息 前言 近段时间,看了一下运用python实现app自动化的视频,觉得那上面的讲的不错,于是就用所学的知识做了一个程序,实现自动回复QQ消息。 文章目录python自动化:实现自动回复QQ...
  • Python自动化完成tb喵币任务

    万次阅读 多人点赞 2019-10-24 23:12:26
    2019双十一,tb推出了新的活动,商店喵币,看了一下每天都有几个任务来领取喵币,从而升级店铺赚钱,然而我既想赚红包又不想干苦力,遂使用python来进行手机自动化操作,目测全网首发! 用到的库: re os time ...
  • python 自动化框架

    千次阅读 2017-02-04 17:05:00
    python 自动化框架 自己从2016年11月开始下定决心学习自动化python ,现在每周进行一篇,自己的一些思路和遇到的一些问题,怎么解决的,下面是大致的一些目录框架,接下来会按照这个开始进行 1、打开浏览器 2...
  • Python 自动化测试面试题目汇总

    万次阅读 2019-03-20 11:12:20
    Python 自动化测试面试题目 1、super 是干嘛用的?在 Python2 和 Python3 使用,有什么区别?为什么要使用 super?请举例说明。答: super 用于继承父类的方法、属性。 super 是新式类中才有的,所以 Python2 中...
  • python自动化学习

    千次阅读 多人点赞 2018-03-14 15:40:45
    python自动化框架学习路线 上学期间,学习编程课程,接触编程语言C语言、C++,JAVA,QT,因为上学期间,学习不是很好,掌握的内容不是很精通,故而对工作中遇到的问题,不能解决。 第一次工作是外派到华为,面试...
  • Python自动化测试框架

    千次阅读 2019-10-27 14:02:15
    Python自动化测试框架 1 什么自动化测试框架 什么是工具——工具(Tools)类似框架,只是工具屏蔽了底层的代码,提供单独的操作界面,以此供用户操作,比如:Selenium IDE、Postman、QTP、Jmeter、LoadRunner等自动...
  • Python自动化运维相关总结

    千次阅读 2017-10-13 21:34:58
    Python自动化运维相关总结
  • Python自动化视频

    千次阅读 2017-09-20 20:46:09
    Python自动化高级运维第十期 地址:http://www.lthack.com/thread-12336-1-1.html 链接:http://pan.baidu.com/s/1kTNksMN 密码:  详情请到www.lthack.com咨询。 咱们论坛之前已经...
  • 一起学python自动化(第四天)

    千次阅读 热门讨论 2020-12-13 15:27:38
    本系列文默认各位有一定的测试...一起学python自动化(第一天) 一起学python自动化(第二天) 一起学python自动化(第三天 下面是一个简单的打开百度搜索: import unittest from time import sleep from selenium.
  • 第一个python自动化脚本

    万次阅读 2019-01-29 14:26:12
    第一个python自动化脚本-测试页面pageid # -*- coding : utf-8 -*-__authon__ = 'test'import requestsimport xlrdfrom pyquery import PyQuery as pqfrom xlutils3 import copyimport osimport timefrom ...
  • Python自动化测试实战之博客浏览量

    万次阅读 2019-09-27 02:48:10
    首先自己刷自己博客浏览量不光彩,仅仅是学习实践目的,学习python. 都是实践干货,本帖的浏览量就是实践的展示。 2019/09.26: 0 访问记录。 目录 1. 怎么获得多个IP 2. 怎么用这些IP去访问页面 3. 怎么...
  • Python实现简单自动升级exe程序版本并自动运行,适合Python自动化运维。一、此教程是使用bat脚本+NFS实现自动更新。(也可以使用FTP或者使用html实现自动更新)1、编写version.ini文件2、编写update.py3、修改主程序...
  • python自动化工具之pywinauto(一)

    万次阅读 多人点赞 2017-10-07 16:14:19
    python自动化工具之pywinauto(一)python自动化工具之pywinauto一 pywinauto使用 一 判断程序的backend 二确定自动化入口点 三连接到进程 四 选择菜单项pywinauto使用首先,导入这个模块from pywinauto.application ...
  • 安装python环境,下载源码包,解压源码包,安装配置,编译以及编译安装 python自动化安装用户指定版本的python环境 python3.6.2
  • 本已收会围绕整个开发过程,从配置和规划到自动化测试和创建不同的命令行工具。本书涵盖了基础脚本到标准库Python包使用都所有常用知识。通过本书的学习,你将了解如何基于理想的资源规划、实施和发...
  • 零基础Python自动化办公(漫画版)

    万人学习 2020-05-22 11:13:20
  • 近期对python自动化测试模板进行了优化,有以下几点变更: 1、在前辈基础上,将失败&错误进行拆分成俩个单独项 2、增加了样式初始化函数,对样式,交互进行了调整 以下是优化后的效果: 改进后的...
  • python自动化xmind to testcase详解

    千次阅读 热门讨论 2019-06-27 22:33:34
    python自动化xmind to testcase详解 前文: 看过一些文章写得xmind2testlink,比较简单化对于初学者来说还是比较花时间去理解其中的一些步骤,所以整理下了前辈们的操作再加入一些改造可以实现自动导入testlink...
  • Python自动化脚本 for循环+数字拼接

    千次阅读 2019-01-28 11:35:38
    Python自动化脚本 for循环+数字拼接 在写Python自动化脚本时,在执行多个重复操作时遇到的,需将字符串和数字进行拼接,使用for循环,进行操作。
  • python自动化运维开发入门

    千人学习 2017-02-16 11:32:19
    您观看课程学习后 免费入群领取【超全Python资料包+17本学习电子书】 学神Python课程由CSDN全程把关,学神严格考核;秉承打造从入门到Python运维开发的实战课程,
  • eNSP中玩转Python自动化——解锁网工新姿势

    千次阅读 多人点赞 2021-01-23 11:33:34
    Python自动化一、安装Paramiko模块二、搭建实验环境1、桥接电脑网卡2、配置交换机IP地址交换机配置测试ensp的交换机与电脑的连通性:交换机配置SSHXshell验证三、Python脚本1、执行python脚本2、同步成功 ...
  • Python 自动化 selenium 移动窗口

    千次阅读 2017-10-20 18:02:14
    Python 自动化 selenium 移动窗口导入需要的模块:from selenium import webdriver import time具体代码:# 打开浏览器 要注意浏览器版本和驱动版本,要对应 driver = webdriver.Firefox() # 浏览器窗口最大化 ...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 51,770
精华内容 20,708
关键字:

python自动化

python 订阅