精华内容
下载资源
问答
  • 分割PDF文档中的页面可以使用Splitter类将给定的PDF文档分割为多个PDF文档。 该类用于将给定的PDF文档分成几个其他文档。以下是拆分现有PDF文档的步骤第1步:加载现有的PDF文档使用PDDocument类的静态方法load()加载...

    在前一章中,我们已经看到了如何将JavaScript添加到PDF文档。 现在来学习如何将给定的PDF文档分成多个文档。

    分割PDF文档中的页面

    可以使用Splitter类将给定的PDF文档分割为多个PDF文档。 该类用于将给定的PDF文档分成几个其他文档。

    以下是拆分现有PDF文档的步骤

    第1步:加载现有的PDF文档

    使用PDDocument类的静态方法load()加载现有的PDF文档。 此方法接受一个文件对象作为参数,因为这是一个静态方法,可以使用类名称调用它,如下所示。

    File file = new File("path of the document")

    PDDocument document = PDDocument.load(file);

    第2步:实例化Splitter类

    这个Splitter类包含了分割给定的PDF文档的方法,因此实例化这个类,如下所示。

    Splitter splitter = new Splitter();

    第3步:分割PDF文档

    使用Splitter类的Split()方法来分割给定的文档。 该方法接受PDDocument类的一个对象作为参数。

    List Pages = splitter.split(document);

    split()方法将给定文档的每个页面分割为单独的文档,并以列表的形式返回所有这些文档。

    第4步:创建一个迭代器对象

    要遍历文档列表,需要获取上述步骤中获取的列表的迭代器对象,使用listIterator()方法获取列表的迭代器对象,如下所示。

    Iterator iterator = Pages.listIterator();

    第5步:关闭文档

    最后,使用PDDocument类的close()方法关闭文档,如下所示。

    document.close();

    示例

    假设在目录:F:\worksp\pdfbox 中有一个名称为mypdf.pdf的PDF文档,并且该文档包含两个页面 - 一个页面包含图像,另一个页面包含文本,如下所示。

    a4e5a6de590f86876ba8c8e074800e30.png

    这个例子演示了如何分割上面提到的PDF文档。 在这里,将把名称为mypdf.pdf的PDF文档分成两个不同的文档:sample1.pdf和sample2.pdf。 将此代码保存在名为SplitPages.java的文件中。

    package com.yiibai;

    import org.apache.pdfbox.multipdf.Splitter;

    import org.apache.pdfbox.pdmodel.PDDocument;

    import java.io.File;

    import java.io.IOException;

    import java.util.List;

    import java.util.Iterator;

    public class SplitPages {

    public static void main(String[] args) throws IOException {

    //Loading an existing PDF document

    File file = new File("F:/worksp/pdfbox/mypdf.pdf");

    PDDocument document = PDDocument.load(file);

    //Instantiating Splitter class

    Splitter splitter = new Splitter();

    //splitting the pages of a PDF document

    List Pages = splitter.split(document);

    //Creating an iterator

    Iterator iterator = Pages.listIterator();

    //Saving each page as an individual document

    int i = 1;

    while(iterator.hasNext()) {

    PDDocument pd = iterator.next();

    pd.save("F:/worksp/pdfbox/sample"+ i +".pdf");

    i = i + 1;

    }

    System.out.println("Multiple PDF’s created");

    document.close();

    }

    }

    执行上面示例代码,得到以下结果 -

    Multiple PDF’s created

    生成的两个文件,打开效果如下 -

    358f37864c67ba6e2d637fd6c53106f0.png

    第二个PDF文件:

    4d6bd40081f07e63f25b98e0d6bbfc63.png

    ¥ 我要打赏

    纠错/补充

    收藏

    加QQ群啦,易百教程官方技术学习群

    注意:建议每个人选自己的技术方向加群,同一个QQ最多限加 3 个群。

    展开全文
  • Split and Merge PDF DocumentsMaster PDF editor is very simple and impressively fast solutionfor splitting big multipage PDF files to separate pages or mergingseveral files to one.In order to do it, it...

    Split and Merge PDF Documents

    Master PDF editor is very simple and impressively fast solution

    for splitting big multipage PDF files to separate pages or merging

    several files to one.

    In order to do it, it is not required to install Adobe Acrobat, and

    all the work can be done with just a few mouse clicks.

    Often users need to merge multiple PDF files to one or split a file

    to pages. Sometimes it’s required just to remove a couple of pages.

    So, on this page we’ll explain how to do it with Master PDF

    Editor.

    For example, you have to split 20-page PDF file to two 10 page

    documents.

    Press: Document->Extract Pages… to PDF.

    Choose range from 1 to 10 as on screenshot.

    a4c26d1e5885305701be709a3d33442f.png

    That’s it! The first file is created.

    Create the second one the same way, just choose 11 to 20

    range.

    Also that function has Extract pages as a single file which

    allows to extract each page as separate PDF file.

    This function is required if you need to split one document per

    page.

    For example, you have PDF file of 43 pages. Choose 1-43 range,

    check Extract pages as a single file and you’ll get 43 PDF

    files with a page in each.

    Insert Pages… function to merge several documents to one

    file.

    Choose PDF file, which pages you need to insert to current

    document. Also you have to choose pages range and position to

    insert.

    a4c26d1e5885305701be709a3d33442f.png

    Available variants are all the possible:

    Before current page – inserts before current page

    After current page – inserts after current page

    Before first page – inserts to the beginning of the

    document

    After last page – inserts to the end of the document

    Click OK and the pages are merged.

    Of course, if you need to merge several documents, you’ll have

    to repeat these actions for each one.

    Delete PDF pages

    Suppose, you have PDF file containing several dozens of

    pages,

    and you need only few of them to be in the final document.

    It’s enough to press Alt+Del and choose pages range to delete.

    Click OK and Master PDF Editor will remove them.

    a4c26d1e5885305701be709a3d33442f.png

    You can use Pages tab to select multiple files.

    Use left mouse button + Ctrl for it. Then you can drag and drop to

    other position with mouse or remove them.

    a4c26d1e5885305701be709a3d33442f.png

    展开全文
  • linux下的pdf分割软件

    千次阅读 2010-07-30 14:18:00
    找找linux下的pdf处理软件吧。今天找到了pdftk的软件,可以分割PDF文件。可以上他的网页上看看去。http://www.accesspdf.com/pdftk/更妙的是,从这个页中还看到了VIM的PDF插件,偷着乐吧。Vim users can also ...

    想把PDF文件放在手机里看,但手机中的软件限制了500K的文件大小,无奈啊。

    找找linux下的pdf处理软件吧。

    今天找到了pdftk的软件,不仅仅可以分割PDF文件。可以上他的网页上看看去。
    http://www.accesspdf.com/pdftk/

     

    更妙的是,从这个页中还看到了VIM的PDF插件,偷着乐吧。
    Vim

    Vim users can also install my plug-in for easily editing PDF code. When you open a PDF in Vim, the plug-in calls pdftk to uncompress the page streams, so they are editable. When you save the PDF, the plug-in uses pdftk to repair and re-compress the PDF.

    Download pdftk.vim.zip , unpack, and then move pdftk.vim into your Vim plug-ins directory (e.g., C:/vim/vim63/plugin ). Restart Vim to source the new plug-in.

    太懒了,不翻译了。有需要的可以自己去看。

     

    看来写插件的那个家伙是在windows下用的,如果你用的是linux,vim的脚本路径一般情况下应该在/usr/share/vim/vim72/plugin

     

     

    下面写一个分割的例子

    pdftk A=ARM-Architecture-Reference-Manual-v5-and-v6.pdf  cat A39-108 output 1.pdf

    A=表是要分割的PDF文件名

    cat 后跟A39-108表示从39页到108页需要分割

    output表示输出的那些页, 后面跟输出的文件名。

     

     

    我自己写了个bash脚本,可以自己设定项,自动分割,默认情况下每一个分割后的文件为50页。

     

     

     

    展开全文
  • 发现一个Linux分割、合并PDF的工具,记录一下。 官网是:https://www.pdflabs.com/tools/pdftk-server/#download 官方介绍如下: PDFtk服务器 PDFtk Server是我们用于处理PDF的命令行工具。它通常用于客户端脚本或...

    发现一个Linux下分割、合并PDF的工具,记录一下。
    官网是:https://www.pdflabs.com/tools/pdftk-server/#download

    官方介绍如下:

    在这里插入图片描述

    安装方式很简单

    sudo apt-get install pdftk
    

    常用命令

    #提取1-15页为一个文件
    pdftk input.pdf cat 1-15 output new.pdf
     
    #提取第1至3,第5,第6至10页,并合并为一个pdf文件
    pdftk input.pdf cat 1-3 5 6-10 output combined.pdf
     
    #合并(concatenate) 前面所有的pdf为output.pdf
    pdftk file1.pdf file2.pdf ... cat output new.pdf
     
    #拆分PDF的每一页为一个新文件 并按照指定格式设定文件名
     pdftk input.pdf burst output new_%d.pdf
     
    #按照通配符,合并大量PDF文件
     pdftk *.pdf cat output combined.pdf
     
    #去除第 13 页,其余的保存为新PDF
     pdftk in.pdf cat 1-12 14-end output out1.pdf
     
    #扫描一本书,odd.pdf 为书的全部奇数页,even.pdf 为书的全部偶数页,下面的命令可以将两个 pdf 合并成页码正常的书
     pdftk A=odd.pdf B=even.pdf shuffle A B output collated.pdf
     
    #按180°旋转所有页面
     pdftk input.pdf cat 1-endsouth output output.pdf
     
    #按顺时针90°旋转第三页,其他页不变
    pdftk input.pdf cat 1-2 3east 4-end output output.pdf
     
    #输入密码转换成无密码PDF
    pdftk secured.pdf input_pw foopass output unsecured.pdf
    
    展开全文
  • linux下的pdf分割脚本,方便于那些在移动设备上读取PDF文件的技术人员。 下载之后只需要加可执行权限即可。 如果有任何问题请留言
  • Linux分割、合并PDF(pdftk)

    万次阅读 2016-07-18 13:00:42
    pdftk ...pdftk 1.pdf 2.pdf 3.pdf cat output 123.pdfpdftk *.pdf cat output all.pdf 多个不同页面合并 pdftk A=1.pdf B=2.pdf C=pdf cat A1-2 B2-3 C3 output abc.pdf 旋转第一页
  • 经常处理一些pdf格式的比赛题目,有时候只需要里面不连续的几个题目,这时候就想到了pdf分割合并。 于是找到了pdftk,可以去它的主页看看http://www.pdflabs.com/tools/pdftk-the-pdf-toolkit/ 还有vim的插件,...
  • pdf分割,每一个pdf为一个章节,想要阅读指定章节只需打开该章节的pdf文档即可,再也不用使用鼠标拖半天了。
  • A B 两个文件页码交叉合并PDF : pdftk A=even.pdf B=odd.pdf shuffle A B output collated.pdf 或者B文件的反序: pdftk A=even.pdf B=odd.pdf shuffle A Bend-1 output collated.pdf 解密一个PDF pdftk ...
  • 本软件具有对PDF文件进行分割、结合、加密、解密、添加水印、设定有效期限等多种功能,提供丰富的C++/.NET/Java语言的各种功能的API函数接口,本软件可以运行在Windows和Linux操作系统平台上。
  • Linux压缩包分割、合并、解压

    千次阅读 2020-01-29 13:23:34
    应用场景:某些文件太大不能直接上传为邮箱附件或者直接上传网盘,需要压缩,压缩之后大小仍然超过限制,那就分割压缩包...现有文件input.pdf,首先对其进行分卷压缩,然后进行合并解压: # ----- 分卷压缩 -----...
  • 1:将需要处理的PDF文件分割为10页的多个PDF 2:使用冰蓝的包(spire)对分割后的PDF进行处理 本人处理的是pdf按照当前纸张规则进行PDF缩放 3:将处理的PDF文件进行合并 代码如下: ClassName{ public ...
  • linux 合并PDF

    2019-02-14 10:09:00
    经常需要将多个 PDF 合并为一个文件,这里收集了网上给出的一些方案,并总结一下。 推荐使用cpdf cpdf命令行工具 cpdf全称是 Coherent PDF Command Line Tools,是一个强大的 PDF 处理工具。PDF 合并...
  • 导读:使用 qpdf 和 poppler-utils 来分割、修改和合并 PDF 文件。 本文字数:1497,阅读时长大约:2分钟https://linux.cn/a...
  • Linux导出PDF文件很容易,而且,我平常看到的文档大部分也是PDF格式。使用PDF,可以避免用libreOffice打开win的doc,ppt了。虽然libreOffice可以兼容它们,但是我讨厌这样做,直接将原来的doc,ppt导出为pdf。但是...
  • 实现思路:将原pdf中第m页和第n页的内容复制到目标... 2 * 复制(分割)pdf 3 * 4 * @param sourceFilePath 源文件地址 5 * @param targetFilePath 目标文件地址 6 * @param ranges 分割点(用页数设置):有三种形...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 8,145
精华内容 3,258
关键字:

linuxpdf分割

linux 订阅