精华内容
下载资源
问答
  • 分割 PDF 文件

    2018-02-01 17:15:19
    分割 PDF 文件 增加依赖 dependency> groupId>org.apache.pdfboxgroupId> artifactId>pdfboxartifactId> version>2.0.4version> dependency> 编写代码 package wang.ronnie.pdf; import org.apache....

    个人公众号,欢迎关注
    在这里插入图片描述

    分割 PDF 文件

    增加依赖

    <dependency>
      <groupId>org.apache.pdfbox</groupId>
      <artifactId>pdfbox</artifactId>
      <version>2.0.4</version>
    </dependency>
    

    编写代码

    package wang.ronnie.pdf;
    
    import org.apache.pdfbox.multipdf.Splitter;
    import org.apache.pdfbox.pdmodel.PDDocument;
    
    import java.io.File;
    import java.io.IOException;
    import java.util.List;
    
    public class PdfSplitter {
    
        public static void main(String[] args) throws IOException {
    
            File file = new File("/Users/xxx/Downloads/Psychology and Life(20ed)-Gerrig.pdf");
            PDDocument book = PDDocument.load(file);
            Splitter splitter = new Splitter();
            List<PDDocument> pages = splitter.split(book);
    
            splitToChapter(pages, 31, 50, "chapter1.pdf");
            splitToChapter(pages, 50, 68, "chapter2.pdf");
            splitToChapter(pages, 68, 76, "statistical_supplement.pdf");
            splitToChapter(pages, 76, 109, "chapter3.pdf");
            splitToChapter(pages, 109, 150, "chapter4.pdf");
            splitToChapter(pages, 150, 174, "chapter5.pdf");
            splitToChapter(pages, 174, 203, "chapter6.pdf");
            splitToChapter(pages, 203, 236, "chapter7.pdf");
            splitToChapter(pages, 236, 269, "chapter8.pdf");
            splitToChapter(pages, 269, 290, "chapter9.pdf");
            splitToChapter(pages, 290, 327, "chapter10.pdf");
            splitToChapter(pages, 327, 352, "chapter11.pdf");
            splitToChapter(pages, 352, 386, "chapter12.pdf");
            splitToChapter(pages, 386, 415, "chapter13.pdf");
            splitToChapter(pages, 415, 448, "chapter14.pdf");
            splitToChapter(pages, 448, 476, "chapter15.pdf");
            splitToChapter(pages, 476, 512, "chapter16.pdf");
    
            book.close();
        }
    
        private static void splitToChapter(List<PDDocument> pages, int startPage, int endPage, String chapterName) throws IOException {
    
            PDDocument chapterPdf = new PDDocument();
            for (int i = startPage; i < endPage; i++) {
                chapterPdf.addPage(pages.get(i).getPage(0));
            }
            chapterPdf.save(new File("/Users/xxx/psychology_and_life/" + chapterName));
            chapterPdf.close();
        }
    }
    

    Done

    搞定

    展开全文
  • 分割PDF文档中的页面可以使用Splitter类将给定的PDF文档分割为多个PDF文档。 该类用于将给定的PDF文档分成几个其他文档。以下是拆分现有PDF文档的步骤第1步:加载现有的PDF文档使用PDDocument类的静态方法load()加载...

    在前一章中,我们已经看到了如何将JavaScript添加到PDF文档。 现在来学习如何将给定的PDF文档分成多个文档。

    分割PDF文档中的页面

    可以使用Splitter类将给定的PDF文档分割为多个PDF文档。 该类用于将给定的PDF文档分成几个其他文档。

    以下是拆分现有PDF文档的步骤

    第1步:加载现有的PDF文档

    使用PDDocument类的静态方法load()加载现有的PDF文档。 此方法接受一个文件对象作为参数,因为这是一个静态方法,可以使用类名称调用它,如下所示。

    File file = new File("path of the document")

    PDDocument document = PDDocument.load(file);

    第2步:实例化Splitter类

    这个Splitter类包含了分割给定的PDF文档的方法,因此实例化这个类,如下所示。

    Splitter splitter = new Splitter();

    第3步:分割PDF文档

    使用Splitter类的Split()方法来分割给定的文档。 该方法接受PDDocument类的一个对象作为参数。

    List Pages = splitter.split(document);

    split()方法将给定文档的每个页面分割为单独的文档,并以列表的形式返回所有这些文档。

    第4步:创建一个迭代器对象

    要遍历文档列表,需要获取上述步骤中获取的列表的迭代器对象,使用listIterator()方法获取列表的迭代器对象,如下所示。

    Iterator iterator = Pages.listIterator();

    第5步:关闭文档

    最后,使用PDDocument类的close()方法关闭文档,如下所示。

    document.close();

    示例

    假设在目录:F:\worksp\pdfbox 中有一个名称为mypdf.pdf的PDF文档,并且该文档包含两个页面 - 一个页面包含图像,另一个页面包含文本,如下所示。

    a4e5a6de590f86876ba8c8e074800e30.png

    这个例子演示了如何分割上面提到的PDF文档。 在这里,将把名称为mypdf.pdf的PDF文档分成两个不同的文档:sample1.pdf和sample2.pdf。 将此代码保存在名为SplitPages.java的文件中。

    package com.yiibai;

    import org.apache.pdfbox.multipdf.Splitter;

    import org.apache.pdfbox.pdmodel.PDDocument;

    import java.io.File;

    import java.io.IOException;

    import java.util.List;

    import java.util.Iterator;

    public class SplitPages {

    public static void main(String[] args) throws IOException {

    //Loading an existing PDF document

    File file = new File("F:/worksp/pdfbox/mypdf.pdf");

    PDDocument document = PDDocument.load(file);

    //Instantiating Splitter class

    Splitter splitter = new Splitter();

    //splitting the pages of a PDF document

    List Pages = splitter.split(document);

    //Creating an iterator

    Iterator iterator = Pages.listIterator();

    //Saving each page as an individual document

    int i = 1;

    while(iterator.hasNext()) {

    PDDocument pd = iterator.next();

    pd.save("F:/worksp/pdfbox/sample"+ i +".pdf");

    i = i + 1;

    }

    System.out.println("Multiple PDF’s created");

    document.close();

    }

    }

    执行上面示例代码,得到以下结果 -

    Multiple PDF’s created

    生成的两个文件,打开效果如下 -

    358f37864c67ba6e2d637fd6c53106f0.png

    第二个PDF文件:

    4d6bd40081f07e63f25b98e0d6bbfc63.png

    ¥ 我要打赏

    纠错/补充

    收藏

    加QQ群啦,易百教程官方技术学习群

    注意:建议每个人选自己的技术方向加群,同一个QQ最多限加 3 个群。

    展开全文
  • python分割pdf文档

    2020-01-04 13:51:43
    需要将一个pdf文档分割成一页一页的pdf 代码 可以使用PyPDF2库 from PyPDF2 import PdfFileReader, PdfFileWriter import os def split_pdf(infile, out_path): """ :param infile: 待拆分的pdf文件 :param ...

    python -V 3.7

    需求

    需要将一个pdf文档分割成一页一页的pdf

    代码

    可以使用PyPDF2库
    
    from PyPDF2 import PdfFileReader, PdfFileWriter
    import os
    
    
    def split_pdf(infile, out_path):
        """
        :param infile: 待拆分的pdf文件
        :param out_path: 拆分成单页的pdf文件的存储路径
        :return: 无
        """
    
        if not os.path.exists(out_path):
            os.makedirs(out_path)
        with open(infile, 'rb') as infile:
    
            reader = PdfFileReader(infile)
            number_of_pages = reader.getNumPages()  # 计算此PDF文件中的页数
    
            for i in range(number_of_pages):
                writer = PdfFileWriter()
                writer.addPage(reader.getPage(i))
                out_file_name = out_path + str(i + 1) + '.pdf'
                with open(out_file_name, 'wb') as outfile:
                    writer.write(outfile)
    
    
    if __name__ == '__main__':
        # in_File = r'./11.pdf'
        in_File = 'D:/JBK/aa.pdf' # D:\JBK\task\zwx
    
        out_Path = './a/'  # 生成输出文件夹
        split_pdf(in_File, out_Path)
    
    展开全文
  • 去网上下载资料的时候会发现,基本上都是PDF格式的。...进行相关操作之前,可以选择新建一个文件夹并且命名为PDF文件,将需要进行分割PDF文件添加到该文件夹中; 接着需要借助到PDF文件分割工具...

    去网上下载资料的时候会发现,基本上都是PDF格式的。因为PDF移植性强、不存在兼容性问题。

    PDF虽好,但有一个问题不知道大家有没有遇到:PDF文件过大,导致存储不便或者上传网站附件受限,怎么解决这个问题呢?可以选择将PDF压缩,接下来简述下PDF分割技巧!

    PDF文件分割技巧:如何快速分割PDF文件?
    进行相关操作之前,可以选择新建一个文件夹并且命名为PDF文件,将需要进行分割的PDF文件添加到该文件夹中;
    PDF文件分割技巧:如何快速分割PDF文件?

    接着需要借助到PDF文件分割工具,进入到浏览器或应用商店即可进行下载。在工具的界面中可以选择到栏目【PDF操作】,在PDF的其他操作中包含了“PDF分割”;
    PDF文件分割技巧:如何快速分割PDF文件?

    选择移动鼠标选择到【添加文件/添加文件夹】,通过点击它来完成文件的添加,通过使用拖拽文件的方式也可以实现PDF文件的添加;

    PDF文件分割技巧:如何快速分割PDF文件?
    在页面下选择到【输出目录——浏览】处可以为文件设置文件的路径问题;
    PDF文件分割技巧:如何快速分割PDF文件?

    页面选择有个全部字样,点击它可以勾选需要分割的页面(非会员用户仅支持前五页);
    PDF文件分割技巧:如何快速分割PDF文件?

    文件添加错误可以通过点击‘清空列表’进行删除文件;下面鼠标移动到‘更多选项’选择【开始转换】进入到PDF文件分割的过程;状态栏进度条完成‘100%’表示操作成功。

    PDF文件分割技巧:如何快速分割PDF文件?

    转载于:https://blog.51cto.com/13968378/2366187

    展开全文
  •   如今网上大部分电子文档数据都是PDF,如何对PDF进行有效的编辑,能够非常有效的提高工作效率,本文介绍采用开源库来自定义分割PDF,亲测可用: # encoding:utf-8 from PyPDF2 import PdfFileReader, PdfFile...
  • 打开微博发现有一个微友发来一招电脑知识——如何将PDF文件分割成若干个文件,起初搜索了很多的软件,可惜大多是需要靠虚拟打印机才能完成,经过辛苦的搜寻终于找到了一个pdf分割软件,300页的文件,仅需短短10秒钟...
  • 教你怎么分割PDF文档

    2015-04-01 10:39:03
    有时因为办公需要要把一个较大的PDF文件分割成多个文件,同时保留原电子书的排版形式,可以通过下面的操作实现。  拆分软件:pdf分割软件  这是官方最新的PDF文件编辑器,肯定是我们处理PDF文件的首选。它的功能...
  • 分割 PDF 文件的 Python 代码: # -*- coding: utf-8 -*- import os import sys from PyPDF2 import PdfFileReader, PdfFileWriter def splitPdf(filename, page): print("src file [{0}], page [{1}-{2}], sub...
  • 为了能方便地浏览,经常要把几十甚至几百页的PDF文件...也就是说下载一个好用点的pdf分割软件就可把原10页的PDF文档,复制成3页,然后我们可以继续运用。  做起来非常容易,但要讲清楚还需要一步步说明:  第一步
  • 动机:使用Java将PDF论文分割成一个个4页大小的PDF,便于使用有道翻译免费翻译PDF文档(因为每次只免费翻译4页,使用了不少翻译软件,还是有道翻译好用,翻译质量好,就是收费);顺便练习下写代码。使用的idea平台...
  • 使用itextpdf,对PDF文件进行分割 maven依赖 <!-- https://mvnrepository.com/artifact/com.itextpdf/itextpdf --> <dependency> <groupId>com.itextpdf</groupId> <artifactId>...
  • 1、获取原始pdf文件; 2、将要分割的PDF内容格式化; 3、实例一个 PDF文件编写器; 4、把3到4页放到PDF文件编写器; 5、PDF文件输出 运行结果: 生成文件“内容.PDF”: 分割后的内容: 具体实现代码如下: # -- ...
  • 现在网上下载的文件经常都是以PDF格式...1、分割PDF文件总的来说要分为六大块,打开转换器,点击分割PDF,添加文件,保存位置,开始转换,查看转换后文件,这六大步结下来由小编详细介绍一下吧。2、PDF最大的缺点就...
  • 使用pyPdf分割pdf文档

    2017-05-08 15:27:11
    d# -*- coding: utf-8 -*-from PyPDF2 import PdfFileReader, PdfFileWriter import sys,getopt,ostry: opts,args=getopt.getopt(sys.argv[1:],"i:o:p:",["page="]) except getopt.GetoptError: print 'arg e
  • 或者公司要将每个员工的工作业绩发给他们本人,而公司业绩管理系统导出的文件中,所有人都在同一个PDF文件里,需要将他们一一拆分出来。  这种情况下,可以借助迅捷pdf分割软件实现文件的批量操作,大大提高办公...
  • 比如说一个pdf有20页,分成5个pdf文件,每个pdf文件包含4页。设计函数实现? Python代码 from PyPDF2 import PdfFileReader, PdfFileWriter # 分割 pdf 函数定义 def splitPDF(input_pdf, out_num, split_site): ...
  • python 使用PyPDF2依据页码分割pdf文件 分割pdf文件,去网上找了挺多软件的,但都不尽如人意,有的是需要收费,有点软件会出问题,这里如果有免费好用的软件也希望可以推荐一下,靴靴~ 有点气不过,就想着用python写...
  • 业务需求上传一张有8张发票合起来的pdf格式的文件,现在要把8张发票都扫描出来,而腾讯云只支持一个个pdf格式扫描,这样需要把文件切割成8张pdf格式发票. 需要用到apache的pdfbox 在pom中加入 <dependency> <...
  • PDF文件分割合并

    2013-09-06 00:42:41
    PDF文件分割合并器可以合并及分割PDF文件,盐分方便!
  • PDF文件分割

    2013-02-05 10:10:14
    可以任意分割PDF文件,分割方式有:单页,奇数页,偶数页,每N页,每个文件大小. 非常实用,运行时需要JAVA运行环境JVM,关于这个JRE的搭建,就请大家百度啦.
  • pdf分割的小工具,把pdf文件按照自己喜欢的页面进行分割处理。把一份大的pdf文件截取自己想要的部分。pdf精准拆分使用。

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 25,940
精华内容 10,376
关键字:

如何分割pdf文档