精华内容
下载资源
问答
  • oracle学习文档 笔记 全面 深刻 详细 通俗易懂 doc word格式 清晰 第一章 Oracle入门 一、 数据库概述 数据库(Database)是按照数据结构来组织、存储和管理数据的仓库,它产生于距今五十年前。简单来说是本身可视...
  • 如果你是一个翻译爱好者,来试试这个软件,一定会让你爱不释手,在下一版中将增加的随时随地注解功能,你可以在任何地方,增加注解,来解释你对一句或是一个单词的看法,你可以把自己译过的文章在网上发布,共享给网友,...
  • 今天有一个问题,就是需要实现提取某个pdf文档某几页,合并到另外一个pdf文档中,想用我的pdf编辑工具实现此功能,发现需要收费,那怎么能行。想到之前用Python处理过word和excel,此时萌生了另外一个想法,那就是...

    今天有一个问题,就是需要实现提取某个pdf文档的某几页,合并到另外一个pdf文档中,想用我的pdf编辑工具实现此功能,发现需要收费,那怎么能行。想到之前用Python处理过word和excel,此时萌生了另外一个想法,那就是万能的Python有没有对应的库呢?网上一查还真的有,那就是PyPDF2  直接pip install pypdf2。很快便实现了我想要的结果,特此记录!

     

    #coding=utf-8
    """
    利用python对pdf进行切分和合并
    2019/4/18
    @Zjh
    """
    from PyPDF2 import PdfFileReader, PdfFileWriter
    #拆分一个pdf文档,提取其中特定的页数,input为输入文件的路径,out为输出
    def split_pdf(input,out):
        pdf_open = open(input, 'rb')
        read_pdf = PdfFileReader(pdf_open)
        n1 = read_pdf.getNumPages()  # 计算此PDF文件中的页数
        print("文档共有%s页"%n1)
        writer = PdfFileWriter()
        start=1 #起始页数
        end=10 #终止页数 可修改为自己想要的
        #page1 = read_pdf.getPage(0)  ##首页下标为0
        #page1.extractText()
        #print(page1)
        for i in range(start,end):
            writer.addPage(read_pdf.getPage(i))
        pdf_write = open(out, "wb")
        writer.write(pdf_write)
        pdf_open.close()
        pdf_write.close()
        print("切分完毕!提取源文档第{}-{}页".format(start,end))
    
    #合并两个pdf文档,input2加在input1后面
    def merge(input1,input2,out):
        pdf_open1 = open(input1, 'rb')
        pdf_open2 = open(input2, 'rb')
        read_pdf1 = PdfFileReader(pdf_open1)
        read_pdf2 = PdfFileReader(pdf_open2)
        n1 = read_pdf1.getNumPages()  # 计算此PDF文件中的页数
        n2 = read_pdf2.getNumPages()  # 计算此PDF文件中的页数
        writer = PdfFileWriter()
        for i in range(n1):
            writer.addPage(read_pdf1.getPage(i))
        for j in range(n2):
            writer.addPage(read_pdf2.getPage(j))
        writer.encrypt("666666")  #为pdf设置密码
        pdf_write = open(out, "wb")
        writer.write(pdf_write)
        pdf_open1.close()
        pdf_open2.close()
        pdf_write.close()
    
    if __name__ == '__main__':
        split_pdf('test.pdf','out.pdf')
        #merge('1.pdf','2.pdf','result.pdf')
    

     

    本人在调试程序中还是遇到了一些小问题,如下图所示:

    网上查了下,是编码问题,定位到对应的utils.py文件

    源文件如下:

    修改为:

    重新运行,问题解决!不得不说,Python真的很强大!

     

    展开全文
  • PDF格式扫描版,全书分为6篇25章,共888。2011年1月出版。 注:原电子版图书无书签,为阅读方便,本人重新排列页码并添加了详细完整的书签。 全书体积较大,压缩打包成3部分,这是第1部分。 注:本系列图书的第I...
  • PDF格式扫描版,全书分为6篇25章,共888。2011年1月出版。 注:原电子版图书无书签,为阅读方便,本人重新排列页码并添加了详细完整的书签。 全书体积较大,压缩打包成3部分,这是第2部分。 注:本系列图书的第I...
  • PDF格式扫描版,全书分为6篇25章,共888。2011年1月出版。 注:原电子版图书无书签,为阅读方便,本人重新排列页码并添加了详细完整的书签。 全书体积较大,压缩打包成3部分,这是第3部分。 注:本系列图书的第I...
  • 实例045 批量替换一类字符串 58 实例046 对字符串进行加密与解密 59 3.3 常用数字处理技术 61 实例047 判断输入的货币值是否为数字 61 实例048 对计算结果进行四舍五入 62 实例049 商品金额的大小写转换 63 实例...
  •  实例045 批量替换一类字符串 58  实例046 对字符串进行加密与解密 59 3.3 常用数字处理技术 61  实例047 判断输入的货币值是否为数字 61  实例048 对计算结果进行四舍五入 62  实例049 商品金额的大小...
  • @Left 从左到右搜索字符串,并返回字符串中最左边的个字符 @LeftBack 从右至左搜索字符串并返回子串 @Length 返回文本字符串中字符的个数 @Like 将字符串和样本串进行匹配将字符串和样本串进行匹配 @Ln 返回一个以...
  • Excel新增工具集

    2011-12-20 09:30:27
    1、Word转Excel:把若干个Word文档中的表合并到Excel工作簿中的一个工作表中,可用于对下属填写的报名表(登记表)的汇总统计。 2、Excel转Word:把Excel工作簿的某个工作表中记录逐一拆分到对应的若干个Word文档中...
  • JavaScript网页特效范例宝典源码

    千次下载 热门讨论 2013-09-04 10:40:38
    实例296 打开指定的Word文档并打印 467 实例297 在JSP中利用Word自动打印指定格式的会议记录 468 实例298 在ASP中利用Word自动打印指定格式的会议记录 470 实例299 在PHP中调用Word自动打印指定格式的会议记录 472 ...
  • 实例231 计算一天是星期 实例232 显示长日期格式的系统时间 实例233 实时显示系统时间 实例234 倒计时 9.4 使用JavaScript控制DOM 实例235 创建节点 实例236 添加节点 实例237 为下拉列表增加选项 实例...
  • 实例231 计算一天是星期 实例232 显示长日期格式的系统时间 实例233 实时显示系统时间 实例234 倒计时 9.4 使用JavaScript控制DOM 实例235 创建节点 实例236 添加节点 实例237 为下拉列表增加选项 实例...
  • 从具有音频/字幕的在线视频创建自动语音识别(ASR)语料库、构建医疗实体识别的模型(包含词典和语料标注)、单文档非监督的关键词抽取、Kashgari中使用gpt-2语言模型、开源的金融投资数据提取工具、文本自动摘要库...
  • sql2005全文检索.doc

    2009-09-09 10:31:46
     筛选器可从特定的文档格式(如 Microsoft Word 文档或文本文件)中提取文本化信息。例如,Microsoft 提供了 Microsoft Office 筛选器,此筛选器可以从 Word、Microsoft Excel 和 Microsoft PowerPoint 文件中提取...
  • gensim之Word2vec使用 心得:多动手,别只看 机器学习及深度学习篇 机器学习网站及教程 机器学习入门教程与实例-SofaSofa scikit-learn: Python 中的机器学习 — scikit-learn 0.19.0 中文文档 - ApacheCN ...
  • Python Cookbook

    2013-07-31 22:33:26
    2.27 从微软Word文档中抽取文本 97 2.28 使用跨平台的文件锁 98 2.29 带版本号的文件名 100 2.30 计算CRC-64循环冗余码校验 102 第3章 时间和财务计算 105 引言 105 3.1 计算昨天和明天的日期 111 3.2 寻找...
  • asp.net知识库

    2015-06-18 08:45:45
    页面一postback,它就显示页面的最顶端,怎样让它定位在一位置? 如何保证页面刷新后的滚动条位置 清除网页历史记录,屏蔽后退按钮! 如何传值在2个页面之间 :要求不刷新父页面,并且不能用Querystring传值 Asp...
  • PDF格式扫描版,全书分为24章,共817。2011年1月出版。 全书压缩打包成4部分,这是第3部分 注:本系列图书的第I、II卷再版时均相应改名为《xxx开发实例大全》(基础卷)及(提高卷),但内容基本无变化,需要的童鞋可...
  • PDF格式扫描版,全书分为24章,共817。2011年1月出版。 全书压缩打包成4部分,这是第1部分 注:本系列图书的第I、II卷再版时均相应改名为《xxx开发实例大全》(基础卷)及(提高卷),但内容基本无变化,需要的童鞋可...
  • PDF格式扫描版,全书分为24章,共817。2011年1月出版。 全书压缩打包成4部分,这是第2部分 注:本系列图书的第I、II卷再版时均相应改名为《xxx开发实例大全》(基础卷)及(提高卷),但内容基本无变化,需要的童鞋可...
  • PDF格式扫描版,全书分为24章,共817。2011年1月出版。 全书压缩打包成4部分,这是第4部分 注:本系列图书的第I、II卷再版时均相应改名为《xxx开发实例大全》(基础卷)及(提高卷),但内容基本无变化,需要的童鞋可...
  • 交警电子笔录 1.61

    2011-11-17 12:53:17
     16、修正在一存在行的行首自动插入语句时会产生一空白行的现象以及最后一行如果是一个半角字符将不会出现在word文档中的现象;  17、完善预设提问与界面; (以下是2007年9月3日更新内容)  18、应广大网友...
  • 实例206——实现定制打印多页文档 实例207——实现定制打印的页眉和页脚 实例208——为对话框控件添加ToolTip提示框 实例209——使用AppWizard自动创建WinHelp帮助 实例210——制作WinHelp帮助文件 实例211...
  • 实例206——实现定制打印多页文档 实例207——实现定制打印的页眉和页脚 实例208——为对话框控件添加ToolTip提示框 实例209——使用AppWizard自动创建WinHelp帮助 实例210——制作WinHelp帮助文件 ...
  • C++范例大全(400)

    2013-06-29 21:23:07
    实例206——实现定制打印多页文档 实例207——实现定制打印的页眉和页脚 实例208——为对话框控件添加ToolTip提示框 实例209——使用AppWizard自动创建WinHelp帮助 实例210——制作WinHelp帮助文件 实例211...
  • 实例206——实现定制打印多页文档 实例207——实现定制打印的页眉和页脚 实例208——为对话框控件添加ToolTip提示框 实例209——使用AppWizard自动创建WinHelp帮助 实例210——制作WinHelp帮助文件 实例211...
  • VC++6.0示例程序光盘

    热门讨论 2012-03-18 13:40:03
    实例206——实现定制打印多页文档 实例207——实现定制打印的页眉和页脚 实例208——为对话框控件添加ToolTip提示框 实例209——使用AppWizard自动创建WinHelp帮助 实例210——制作WinHelp帮助文件 实例211...

空空如也

空空如也

1 2 3
收藏数 52
精华内容 20
关键字:

word文档提取某几页