精华内容
下载资源
问答
  • 利用Python合并两个PDF文件

    千次阅读 2019-09-04 08:47:41
    在许多情况下,您需要获取两个或更多PDF并将它们合并为一个PDF。例如,您可能有一个标准封面页,需要继续处理多种类型的报表。您可以使用Python来帮助您完成这类工作。 # pdf_merging.py from PyPDF2 import ...

    在许多情况下,您需要获取两个或更多PDF并将它们合并为一个PDF。例如,您可能有一个标准封面页,需要继续处理多种类型的报表。您可以使用Python来帮助您完成这类工作。

     

    # pdf_merging.py
    
    from PyPDF2 import PdfFileReader, PdfFileWriter
    
    def merge_pdfs(paths, output):
        pdf_writer = PdfFileWriter()
    
        for path in paths:
            pdf_reader = PdfFileReader(path)
            for page in range(pdf_reader.getNumPages()):
                # Add each page to the writer object
                pdf_writer.addPage(pdf_reader.getPage(page))
    
        # Write out the merged PDF
        with open(output, 'wb') as out:
            pdf_writer.write(out)
    
    if __name__ == '__main__':
        paths = ['document1.pdf', 'document2.pdf']
        merge_pdfs(paths, output='merged.pdf')

    要合并的PDF列表时,可以使用merge_pdfs()。需要知道保存结果的位置,因此该函数采用输入路径列表和输出路径。然后循环输入并为每个输入创建PDF阅读器对象。接下来,将迭代PDF文件中的所有页面,并用于.addPage()将每个页面添加到自身。一旦完成对列表中所有PDF的所有页面的迭代,将在结尾处输出结果。

    展开全文
  • python合并个pdf文件

    千次阅读 2019-03-21 19:14:17
    python合并个pdf文件 假设您有个无聊的工作,将几十个PDF文档合并成一个PDF文件。 他们每个都有封面页作为第一页,但你不希望在最终结果中重复覆盖表。 即使有有很多免费的程序来组合PDF,其中许多只是合并整个...

    python合并多个pdf文件

    假设您有个无聊的工作,将几十个PDF文档合并成一个PDF文件。 他们每个都有封面页作为第一页,但你不希望在最终结果中重复覆盖表。 即使有有很多免费的程序来组合PDF,其中许多只是合并整个文件在一起。 让我们编写一个Python程序来自定义哪些页面你想要的是组合PDF。从高层次来看,这是程序将要做的事情:

    • 查找当前工作目录中的所有PDF文件。
    • 对文件名进行排序,以便按顺序添加PDF。
    • 将每个PDF的每个页面(不包括第一页)写入输出文件。
      在实现方面,您的代码需要执行以下操作:
    • 调用 os.listdir() 来查找工作目录中的所有文件,删除所有非PDF文件。
    • 调用Python的sort()列表方法来按字母顺序排列文件名。
    • 为输出PDF创建PdfFileWriter对象。
    • 遍历每个PDF文件,为其创建PdfFileReader对象。
    • 在每个PDF文件中循环遍历每个页面(第一页除外)。
    • 将页面添加到输出PDF。
    • 将输出PDF写入名为allminutes.pdf的文件。
      对于此项目,请打开一个新的文件编辑器窗口并将其另存为 “combinePdfs.py

    Step 1:找到所有的PDF文件

    首先,您的程序需要获取所有扩展名为.pdf的文件的列表
    当前的工作目录并对它们进行排序。 让你的代码看起来像
    以下:

    在这里插入代码片
    

    在shebang线和关于什么的描述性评论之后程序没有,这段代码导入了os和PyPDF2模块。该
    os.listdir(’.’) 调用将返回当前工作中的每个文件的列表目录。 代码循环遍历此列表,并仅添加带有.pdf扩展的那些文件pdfFiles。之后,此列表按字母顺序排序,使用key = str.lower关键字参数对sort() 进行排序。创建PdfFileWriter对象以保存组合的PDF页面。最后,一些评论概述了该计划的其余部分。

    #! /usr/bin/python3
    # combinePdfs.py - Combines all the PDFs in the current working directory into
    # a single PDF.
    
    import PyPDF2, os
    
    # Get all the PDF filenames.
    pdfFiles = []
    for filename in os.listdir('.'):
        if filename.endswith('.pdf'):
            pdfFiles.append(filename)
    pdfFiles.sort(key = str.lower)
    
    pdfWriter = PyPDF2.PdfFileWriter()
    
    # TODO: Loop through all the PDF files.
    
    # TODO: Loop through all the pages (except the first) and add them.
    
    # TODO: Save the resulting PDF to a file.
    
    

    第二步:打开每一个 PDF 文件

    现在程序必须读取pdfFiles中的每个PDF文件。 添加以下内容:

    #! /usr/bin/python3
    # combinePdfs.py - Combines all the PDFs in the current working directory into
    # a single PDF.
    
    import PyPDF2, os
    
    # Get all the PDF filenames.
    pdfFiles = []
    for filename in os.listdir('.'):
        if filename.endswith('.pdf'):
            pdfFiles.append(filename)
    pdfFiles.sort(key = str.lower)
    
    pdfWriter = PyPDF2.PdfFileWriter()
    
    # Loop through all the PDF files.
    for filename in pdfFiles:
        pdfFileObj = open(filename, 'rb')
        pdfReader = PyPDF2.PdfFileReader(pdfFileObj)
        # TODO: Loop through all the pages (except the first) and add them.
    
    # TODO: Save the resulting PDF to a file.
    
    

    对于每个PDF,循环通过以读二进制模式(以’rb’作为第二个参数)调用open() 。 open()调用返回一个File对象,它被传递给PyPDF2.PdfFileReader() 。

    第三步: 添加每一页

    对于每个PDF,您都希望遍历除第一个页面之外的每个页面。 加上这个代码到你的程序:

    #! /usr/bin/python3
    # combinePdfs.py - Combines all the PDFs in the current working directory into
    # a single PDF.
    
    import PyPDF2, os
    
    # Get all the PDF filenames.
    pdfFiles = []
    for filename in os.listdir('.'):
        if filename.endswith('.pdf'):
            pdfFiles.append(filename)
    pdfFiles.sort(key = str.lower)
    
    pdfWriter = PyPDF2.PdfFileWriter()
    
    # Loop through all the PDF files.
    for filename in pdfFiles:
        pdfFileObj = open(filename, 'rb')
        pdfReader = PyPDF2.PdfFileReader(pdfFileObj)
        # Loop through all the pages (except the first) and add them.
        for pageNum in range(1, pdfReader.numPages):
            pageObj = pdfReader.getPage(pageNum)
            pdfWriter.addPage(pageObj)
    
    
    
    # TODO: Save the resulting PDF to a file.
    

    for循环中的代码将每个Page对象分别复制到PdfFileWriter对象。 请记住,您想跳过第一页。 以来
    PyPDF2认为0是第一页,你的循环应该从1 开始,然后转到但不包括pdfReader.numPages中的整数。

    第四步: 保存结果

    在这些嵌套的for循环完成循环之后,pdfWriter变量将会循环包含PdfFileWriter对象,其中包含所有PDF的页面。最后一步是将此内容写入硬盘驱动器上的文件。 将此代码添加到你程序中:

    #!/usr/bin/python3
    # combinePdfs.py - Combines all the PDFs in the current working directory into
    # a single PDF.
    
    import PyPDF2, os
    
    # Get all the PDF filenames.
    pdfFiles = []
    for filename in os.listdir('/home/hux/books/python'):
        if filename.endswith('.pdf'):
            pdfFiles.append('/home/hux/books/python/'+filename)
    pdfFiles.sort(key = str.lower)
    
    pdfWriter = PyPDF2.PdfFileWriter()
    
    # Loop through all the PDF files.
    for filename in pdfFiles:
        pdfFileObj = open(filename, 'rb')
        pdfReader = PyPDF2.PdfFileReader(pdfFileObj, strict=False)
        for pageNum in range(1, pdfReader.numPages):
            pageObj = pdfReader.getPage(pageNum)
            pdfWriter.addPage(pageObj)
    
    pdfOutput = open('allminutes.pdf', 'wb')
    pdfWriter.write(pdfOutput)
    pdfOutput.close()
    
    
    展开全文
  • python把多个PDF文件合并成一个

    千次阅读 2020-04-07 22:51:40
    例如要把下面这几个PDF文件合并成同一个: 先加载包,如没有安装,则先进行安装,pip install PyPDF2 ;完整代码如下: import PyPDF2 filenames=['Python数据科学速查表 - Jupyter Notebook.pdf','Python数据科学...

    例如要把下面这几个PDF文件合并成同一个:
    在这里插入图片描述
    先加载包,如没有安装,则先进行安装,pip install PyPDF2 ;完整代码如下:

    import PyPDF2
    filenames=['Python数据科学速查表 - Jupyter Notebook.pdf','Python数据科学速查表 - Matplotlib 绘图.pdf','Python数据科学速查表 - Numpy 基础.pdf','Python数据科学速查表 - Pandas 基础.pdf','Python数据科学速查表 - Pandas 进阶.pdf','Python数据科学速查表 - Python 基础.pdf']
    merger=PyPDF2.PdfFileMerger()
    for filename in filenames:
        merger.append(PyPDF2.PdfFileReader(filename))
    merger.write('整合速查表.pdf')
    

    显示合并成功
    在这里插入图片描述
    在这里插入图片描述

    展开全文
  • 使用Python合并任意多个PDF文件

    千次阅读 2019-12-22 10:27:22
    封面图片:《Python可以这样学》,ISBN:9787302456469,董付国,清华大学出版社图书详情(京东):用书老师可以联系董老师获取配套PPT、源码。=============...

    封面图片:《Python可以这样学》,ISBN:9787302456469,董付国,清华大学出版社

    图书详情(京东)

    用书老师可以联系董老师获取配套PPT、源码。

    =================

    近期会议、培训通知:

    培训通知|第12届高校师资培训班(Python数据采集、分析与可视化)

    会议通知|第九届高等学校计算机程序设计课程论坛

    会议通知|2019全国青少年STEAM创客教育论坛

    ==================

    在工作中,经常会遇到合并pdf文件的需求,这时候你会发现不是一件很容易完成的任务。包括WPS、福昕阅读器在内的很多软件都有合并pdf文件的功能,但是只有交钱变成会员之后才能使用,否则只能合并3页。有不少网站提供了在线合并pdf文件的功能,但也是必须交钱才能用。还有的显示合并成功,但就是无法下载。如果你会一点Python,就会发现这是一件很容易的事,并且不用花一分钱。

    功能描述:

    使用Python合并任意多个PDF文件。

    详细步骤:

    1、安装扩展库PyPDF2。

    2、编写代码。

    3、把代码中pdf_files的内容改成自己要合并pdf文件名,运行代码,一眨眼,合并完成。

    温馨提示

    关注本公众号“Python小屋”,通过菜单“最新资源”==>“历史文章”可以快速查看分专题的900篇技术文章列表(可根据关键字在页面上搜索感兴趣的文章),通过“最新资源”==>“微课专区”可以免费观看400节Python微课,通过“最新资源”==>“培训动态”可以查看近期Python培训安排,通过“最新资源”==>“教学资源”可以查看Python教学资源。

    ---董付国老师Python系列图书---

    友情提示:不建议购买太多,最好先通过京东、当当、天猫查阅图书了解目录和侧重点,然后再选择购买适合自己的书。

    (1)《Python程序设计(第2版)》(ISBN:978-7-302-43651-5),清华大学出版社,2016年8月

    (2)《Python可以这样学》(ISBN:978-7-302-45646-9),清华大学出版社,2017年2月

    (3)《Python程序设计基础(第2版)》(ISBN:978-7-302-49056-2)清华大学出版社,2018年1月

    (4)《中学生可以这样学Python》(ISBN:978-7-302-48039-6)清华大学出版社,配套微课:《中学生可以这样学Python》84节微课免费观看地址

    (5)《Python程序设计开发宝典》(ISBN:978-7-302-47210-0)清华大学出版社,2018年10月

    (6)《玩转Python轻松过二级》(ISBN:978-7-302-49916-9)清华大学出版社,2018年5月

    (7)《Python程序设计基础与应用》(ISBN:978-7-111-60617-8),机械工业出版社,2018年9月

    (8)《Python程序设计实验指导书》(ISBN:9787302525790),清华大学出版社,2019年4月

    (9)《Python编程基础与案例集锦(中学版)》(ISBN:978-7-121-35539-4),电子工业出版社,2019年4月

    (10)《大数据的Python基础》(ISBN:978-7-111-62455-4),机械工业出版社,预计2019年5月出版

    (11)译作《Python程序设计》,机械工业出版社(华章),2018年11月出版

    (12)繁体版《Python也可以这样学》,台湾博硕文化股份有限公司,2017年10月出版,本书为《Python可以这样学》在台湾发行的繁体版,两本书内容一样,不建议重复购买。

    (13)《Python程序设计实例教程》(ISBN:978-7-111-63198-9),机械工业出版社

    (14)《Python数据分析、挖掘与可视化》(ISBN:978-7-115-52361-7),人民邮电出版社,2019年12月

    《中学生可以这样学Python》84节微课免费观看地址

    Python课程期末考试编程题自动批卷原理与实现模板

    “Python小屋”免费资源汇总(截至2018年11月28日)

    Python课堂上我与学生斗智斗勇已8个学期

    技术要点|Python监控学生端电脑屏幕自动识别学习状态

    课后习题答案

    《Python程序设计基础(第2版)》习题答案

    《Python程序设计基础与应用》课后习题答案

    实验指导书

    《Python程序设计》实验指导书(30个实验)

    Python实验项目1例:使用进程池统计指定范围内素数的个数

    教学大纲

    非计算机专业《Python程序设计基础》教学参考大纲

    计算机相关专业“Python程序设计”教学大纲(参考)

    课件

    1900页Python系列PPT分享一:基础知识(106页)

    1900页Python系列PPT分享二:Python序列(列表、元组、字典、集合)(154页)

    1900页Python系列PPT分享三:选择与循环结构语法及案例(96页)

    1900页Python系列PPT分享四:字符串与正则表达式(109页)

    1900页Python系列PPT分享五:函数设计与应用(134页)

    1900页Python系列PPT分享六:面向对象程序设计(86页)

    1900页Python系列PPT分享七:文件操作(132页)

    1900页Python系列PPT分享八:异常处理结构与程序调试、测试(70页)

    2000页Python系列PPT分享九:(GUI编程)(122页)

    报告PPT

    报告PPT(163页):基于Python语言的课程群建设探讨与实践

    报告PPT(123页):Python编程基础精要

    (PPT)Python程序设计课程教学内容组织与教学方法实践

    报告PPT|Python编程之美(45页)

    PPT|Python程序设计基础教学要点、常见错误与案例分享(55页,配音频)

    直播、回放

    免费直播课|Python程序设计教学要点与教学方法

    免费直播课|使用Python操作Word、Excel、PowerPoint文件

    展开全文
  • 假定你有一个很无聊的任务,需要将几十个PDF文件合并成一个PDF文件。每一个文件都有一个封面作为第一页,但你不希望合并后的文件中重复出现这些封面。即使有许多免费的程序可以合并PDF,很多也只是简单的将文件合并...
  • Python实现多个pdf文件合并背景具体实现效果 背景 由于工作原因,经常需要将多个pdf文件合并后打印,有时候上网找免费合并工具比较麻烦(公司内网不能访问公网),于是决定搞个小工具。 具体实现 需要安装 PyPDF2 ...
  • 这些文件主要有三种类型,分别为PDF,word(.doc和.docx),我决定把他们全部变为PDF文件,然后再合并所有的pdf文件为一个PDF文件,分两个步骤完成! 1.把所有word转化为PDF from win32com.client import Dispatch ...
  • 使使用用 Python合并并多多个个格格式式一一致致的的 Excel 文文件件(推推荐荐) 这篇文章主要介绍了使用 Python 合并格式一致的 Excel 文件,本文给大家介绍的非常详细具有一定的参考 借鉴 值需要的朋友可以...
  • Python实现PDF文件合并

    2020-09-10 11:48:52
    PDF是我们目前办公处理的一种重要文件格式,目前商用PDF浏览器一般对合并PDF功能有权限限制,下面介绍利用Python实现多个PDF合并的方法,以实现更高效便捷的PDF文件合并需求。 实现步骤分成三步: 准备好文件,...
  • 电脑上Adobe Acrobat Pro软件出了问题:能够正常生成pdf文件,对单个pdf文件中内容进行顺序调整,但合并个pdf文件时一直提示: 经过一番搜索后,既无法找到解决问题的方法,也没有找到合适的替代软件。于是,想到...
  • 问题描述:编写程序,接收两个记事本文件名字,然后交替把两个记事本文件中的行合并到result.txt文件中,你一行来我一行,最后把行数较多的文件剩余内容全部写入目标文件。参考代码:----...
  • import PyPDF2,os pdflist=...pdfwriter.addPage(pagepdf)#添加页面 pdfoutput=open('C:/Users/Admin/Desktop/hebin/hebing.pdf','wb') pdfwriter.write(pdfoutput) pdfoutput.close() 图解Python数据结构与算法-实战篇
  • # 请拉到最底下,修改这两个变量 # 请修改需要合并文件的文件夹路径:file_dir # 请修改输出文件名: outfile import os import sys try: from PyPDF2 import PdfFileReader, PdfFileWriter except: os.system...
  • 实现两个文本内容去重,输出两个文本不重复的结果 两个测试文本内容如下 1.txt中内容为 1 2 3 4 5 6 7 8 2.txt中内容为 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 分别读取两个文本的内容 读取1.txt的内容,具体实现...
  • python 从多 PDF合并选择的页面

    千次阅读 2018-09-20 18:53:12
    假定你有一很无聊的任务,需要将几十 PDF 文件合并成一 PDF 文件。 每一个文件都有一封面作为第一页,但你不希望合并后的文件中重复出现这些封面。即使有许多免费的程序可以合并 PDF,很多也只是简单的将...
  • 胡兄今天早上突然问我会不会把pdf拆开和合并,原来是ren老师要提交...这个需求比较简单,把一个PDF的首页末页成另一个PDF的封皮和末页 from PyPDF2 import PdfFileReader, PdfFileWriter 被拆开的叫 检索结果扫描2021.
  • 只能写脚本了,卑微0.0),把这些合并成一,仅供参考吧 脚本实现 其实实现挺简单的,就是一打开文件,再写入,遍历一下就差不多了,直接上代码 # python3 # author: Aloneme import os # path = os.getcwd() ...
  • python】实用的文件操作–根据目录按顺序合并pdf文件-NLP技术的简单应用 网上下载很多pdf有时候不是完整,需要多文件合并才能组成一完整的pdf文件。 # -*- coding:utf-8*- # 利用PyPDF2模块合并同一文件夹下的...
  • python PDF文件合并、图片处理

    千次阅读 2018-06-11 16:15:06
    合并个PDF文件实例:#导入模块import codecs import os import PyPDF2 as PyPDF2 #建立一个装pdf文件的数组 files = list()#遍历该目录下的所有文件 for filename in os.listdir("C:\Python27\第二十八课 ...
  • Python将多张图片合并成一PDF文件

    千次阅读 2020-02-06 16:11:50
    需要安装库:fpdf、PIL pip install fpdf pip install PIL 放码过来 from fpdf import FPDF from PIL import Image import os def makePdf(pdfFileName, listPages): cover = Image.open(listPages[0]) ...
  • 合并个pdf文件Article Update 13-March-2020: I removed the source code. The article that remains should act as a "design roadmap" for members who want to write the code in the programming language of...
  • 今天的例子以廖雪峰老师的Python教程网站为例:...1. PyPDF2的安装使用(用来合并PDF): PyPDF2版本:1.25.1 https://pypi.python.org/pypi/PyPDF2/1.25.1 或 https://github.com/mstamy2/PyPDF2 安装: 1
  • python实现合并个pdf文件为一个文件 用python实现对txt目录文件排版的改变(未完成) 用python实现多个txt目录文件的合并(未完成) 二、具体功能实现 文件夹结构框图 function1:为PDF文件添加书签 所需...
  • Python操作pdf文件

    2020-11-28 14:43:25
    针对新建的pdf文件 pip install portlab 创建新的pdf文件,并且注册字体 #注册字体 因为 默认不支持中文 from reportlab.pdfbase import pdfmetrics #导入库用来注册字体 #pdfmetrics 导入的字体 #上面注册字体...
  • 今天这篇文章,我们不谈热点,毕竟最近谈论的热点有点多了,也有点腻了,我们来讲一些Python运用实践当中的小技巧,用Python来操作和处理PDF文件,通过本篇文章,读者朋友大概会学会1....
  • 如何将多个PDF文件合并/转换为一个大PDF文件? 我尝试了以下操作,但是目标文件的内容不符合预期: convert file1.pdf file2.pdf merged.pdf 我
  • pdf_playground 该项目包含两个python脚本,可帮助合并pdf以及在pdf上添加水印。 PDF合并 要使用PDF合并,只需将要合并的所有pdf放入源文件夹。 然后使用终端运行脚本,后跟要合并PDF文件的名称。
  • Python 多图片合并生成PDF

    千次阅读 2020-03-27 12:50:50
    from fpdf import FPDF from PIL import Image import os def makePdf(pdfFileName, listPages): """图片转PDF""" cover = Image.open(listPages[0]) width, height = cover... pdf = FPDF(unit = "pt", format ...
  • # 使用os模块walk函数,搜索出某目录下的全部pdf文件 ###获取同一文件夹下的所有PDF文件名### import os import os.path from PyPDF2 import PdfFileReader, PdfFileWriter import time from os import listdir ...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 6,327
精华内容 2,530
关键字:

python合并两个pdf文件

python 订阅