精华内容
下载资源
问答
  • 导出pdf书签到excel
    千次阅读 多人点赞
    2021-07-24 18:30:11

    日常工作中,我们经常需要将 office 三件套,Word、Excel和PPT转换成PDF。当然办公软件自身都带有这样的功能,但当我们需要一次性转换大量的office文件时,还是用程序批量处理比较方便。

    其实这类代码有其他作者写过,但是呢,要么每个组件用一个库,用么代码没法正常跑。今天呢,我将带大家完全只使用 win32 调用 VBA 的 API 来完成这个转换。

    另外,将完成 PDF 书签的写入和提取操作以及批量加水印的操作。关于水印我们可以加背景底图水印或悬浮文字水印。

    本文目录:

    文章目录

    • office三件套转换为 PDF 格式
      • 将 Word 文档转换为 PDF
      • 将 Excel 表格转换为 PDF
      • 将 PowerPoint 幻灯片转换为 PDF
      • 批量转换成PDF
    • PDF书签的提取与写入
      • PDF书签提取
      • PDF书签保存到文件
      • 从文件读取PDF书签数据
      • 向PDF写入书签数据
    • 给PDF加水印
      • 生成水印PDF文件
      • PyPDF2库批量加水印
      • 拷贝书签
      • 加水印同时复制书签
      • PyMuPDF给PDF加文字水印
      • PyPDF2库压缩PDF

    office三件套转换为 PDF 格式

    off

    更多相关内容
  • PDF电子书是最流行的格式,可以注释可以带书签目录方便阅读。本文介绍使用 PDFBookmark-Exchanger软件实现 PDF书签的导入、导出、交换。

    PDFBookmark-Exchanger 2020-01 更新: (ver 1.0.2-final):
    ---- 修正PDF书签指向的页面位置为相对位置,而不再使用绝对位置。

    此软件需要操作系统安装有JDK或者JRE方能运行, Oracle的官方下面地址 点这里JDK

    1.前言

    PDF文件全称portable document format,就是便携文档格式,是所有平台都支持浏览的文档格式。无论你用什么系统,你的屏幕显示和打印输出就是发布者想要的样子。此即“输出一致”。
    在文档打印、论文撰写、信息交流,已经电子书阅读方面,PDF文档使用的越来越普遍。
    PDF文件的书签(或者大纲-Outline) 提供了文档的组织结构,阅读文档时非常方便。
    然而,很多PDF书籍没有书签,而书签功能又是如此重要,比如:

    • 书签导入:我们经常可以在amazon, JD或者出版社网站上浏览到相应书籍的书签,怎么将这些书签导入相应的PDF文件呢?
    • 书签导出: 从已经有书签的PDF文件中导出书签
    • 书签交换: 同一本书籍的2个不同PDF文件,清晰的文件没有书签,而不清晰的文件则带有书签,怎么方便的在PDF文件之间转移书签呢?

    对于上述的三个简单功能,在网上始终未找到软件能较好提供这些功能,因此自己实现了下述软件: PDFBookmark-Exchanger

    2. PDFBookmark-Exchanger

    软件基于Java进行开发,可以实现跨平台使用。运行软件必须安装有JRE(Java运行时环境)。软件界面如下:

    1) Load: 加载PDF文件并导出书签
    2) Save: 将书签导入到PDF文件中
    3) Open: 打开Text(文本文件)中的书签内容
    4) Store: 保存当前书签内容到文本文件中
    5)书签页码对应关系设定: 设定书签的页码和实际PDF文件页码的对应关系,默认为1对1

    在这里插入图片描述

    3.书签的格式

    欲导入和导出的书签格式规定如下:

    1. 每一行代表一个书签
    2. 空行#字符开头的部分做为注释,被自动忽略
    3. 每行书签的格式为: 【0或者多个缩进】【书签名】【多个空白字符】【页码】
    • 书签缩进: 以Tab键或者连续4个空格键或者中文全角空格作为一个子书签缩进,依次类推
    • 书签名: 不能含有3个及以上空格或者Tab键或者#字符
    • 书签名和页码的分隔: 至少一个Tab键或者连续4个空格或者连续2个全角空格及以上做为分隔标记
    1. 如果书签内容保存到Text(文本文件)中,则文件必须以UTF-8编码存储

    在这里插入图片描述

    4.操作建议

    以导入书签到PDF文件中为例。

    1. 首先从网上找到到书签内容, 如果有页码最好,否则需要自己输入页码。
    2. 输入页码:将书签内容拷贝到Excel文件中,每行代表一个书签,然后在另外的列中输入书签对应页码
    3. 将书签及页码拷贝到文本编辑器中,例如: Editplus, Notepad++等,使用这些编辑器提供的列选模式,调整缩进和分隔符合上节中的书签格式
    4. 书签的页面往往从1开始,而实际的PDF文件因为包含书籍封面等信息,真实页面和书签页码之间有偏移,打开PDF文件,看看书签中的页面和对应的实际页码是多少,填入软件中。
    5. 点击”Save”按钮即可导入PDF文件中。

    5.软件下载及使用实例

    书签缩进: PDFBookmark-Exchanger 链接:https://pan.baidu.com/s/1jIeTsUy 密码: i5un
    (下载后,windows环境点击“run.bat”, Linux环境运行 “run.sh ”即可启动软件)·

    csdn下载: https://download.csdn.net/download/jhsword/12266856

    1.导出书签

    load -> open (选择文件) 此时在下面的文本区域显示选中文件的目录。
    在这里插入图片描述
    在这里插入图片描述
    如果需要将导出的目录存储在文件中,点击右上角的 “store”,选择存储位置,输入文件名,点击 “save” 即可.
    在这里插入图片描述

    2.导入书签

    在这里插入图片描述
    这时显示书签内容,设定书签的页码和实际PDF文件页码的对应关系:
    在这里插入图片描述
    然后点击 save,选择导入书签的pdf文件:
    在这里插入图片描述
    导入成功提示:
    在这里插入图片描述
    打开pdf文件,查看导入成功的书签:
    在这里插入图片描述

    展开全文
  • 1)将功能选择为从PDF书签 2)对相应pdf进行选择 3)点击开始 备注: 3.去掉相应的页码 1)按键盘上的CTRL+A全选,然后按CTRL+C进行复制。​ 2)打开微软的Office软件Excel或者WPS的电子表格进行粘贴(CTRL+...

    目录

    所用软件工具:

    应用场景:

    使用步骤:

    1.打开软件并点击

    2.弹出次级页面窗口进行操作

    1)将功能选择为从PDF取书签

    2)对相应pdf进行选择

    3)点击开始

    备注:

    3.去掉相应的页码

    1)按键盘上的CTRL+A全选,然后按CTRL+C进行复制。​

    2)打开微软的Office软件Excel或者WPS的电子表格进行粘贴(CTRL+V)。​

    3)然后选择整列,并按Delete进行部分页码的删除。

    4)进行剩余部分的页码进行删除

    5)然后在Excel里进行全选,将整理后的书签内容复制到新的txt文件中,即可获得pdf书签目录的完美提取。


    所用软件工具:

    FreePic2Pdf 可关注微信公众号(会熟精绝化)并回复pdf书签即可获得软件的下载地址。

    应用场景:

    在有带书签的PDF,但是想提取相关内容做一个目录的时候。

    使用步骤:

    1.打开软件并点击

    2.弹出次级页面窗口进行操作

    1)将功能选择为从PDF取书签

    2)对相应pdf进行选择

    3)点击开始

    备注:

           点击绿色箭头所指按钮可以选择输出文件夹,也可忽略。操作后在pdf的同目录下会生成一个同名文件夹,txt文件内即为所提取的书签内容,如图所示:

    3.去掉相应的页码

    在进一步操作,由于生成书签内容是按层级生成的并且含有书签所在的页码,若要去掉相应的页码可以在打开txt文本的情况下

    1)按键盘上的CTRL+A全选,然后按CTRL+C进行复制。

    2)打开微软的Office软件Excel或者WPS的电子表格进行粘贴(CTRL+V)。

    3)然后选择整列,并按Delete进行部分页码的删除。

    4)进行剩余部分的页码进行删除

    5)然后在Excel里进行全选,将整理后的书签内容复制到新的txt文件中,即可获得pdf书签目录的完美提取。

     

    感谢您的观看,如果感觉对您有帮助请您点赞并支持一下,为了防止下次找不到本资源可以将本博客收藏到浏览器或者关注本博主,本人爱好学习和分享知识,期待与大家一起进步。

    展开全文
  • 参考链接 [教程] PDF 能一键生成书签,PdgCntEditor了解一下~ 【简书】

    参考链接

    改进

      参考上面的链接,可以发现最为复杂的地方在于如何将页码和书签匹配起来。书签可以去买书网站上复制得到,但是页码只能从已有的pdf得到,按照上面那位博主的方法,是单独复制页码,但是我尝试的时候发现这个很难,最为简单的就是复制整个目录,然后将其粘贴到Excel的一列单元格中,然后再利用快捷键Ctrl + E实现快速提取页码。
      使用方法很简单,就是先在书签列右边一列写上几个对应的页码,然后选中这一列,按快捷键Ctrl+E,实现快速智能填充。

    正则表达式

    学习使用

      汇总一下学习链接

    替换实现

    有缘再写

    PDF目录调整 //2022.4.20

      最近遇到一个问题,有一个PDF文件,有目录,但不是分级的目录,这样对于查找和整书的概览带来一定麻烦,因此想要调整一下目录的等级。我一开始的思路是先把原目录导出,然后放到上文提到的软件PdgCntEditor中,进行调整。
      于是我接下来就是去找有没有可以导出PDF目录的软件或方法,但是很遗憾,没找到,最后无意间发现,其实PdgCntEditor这个软件本身就提供目录自动调整的功能。具体操作如下。

    • 首先,打开软件,再打开需要调整目录的pdf文件
      在这里插入图片描述
      在这里插入图片描述
    • 进入编辑模式,全选标签,然后点击自动缩进即可。
      在这里插入图片描述
      在这里插入图片描述
    • 自动调整缩进之后的目录
      在这里插入图片描述
    • 如果还需要继续调整,可以点击上面那几个手动调整缩进的按钮。
    展开全文
  • 在线快速将 PDF 转换为 Excel。Acrobat 中 PDF 导出的文件格式选项在使用 Acrobat 中的“导出 PDF”工具将 PDF 导出为不同的文件格式时,每个文件格式都包含唯一的转换设置。要查看可在 Acrobat 中导出 PDF 的各种...
  • Office三件套批量转PDF以及PDF书签读写与加水印

    万次阅读 多人点赞 2021-07-24 00:49:13
    日常工作中,我们经常需要将office三件套,Word、Excel和PPT转换成PDF。...另外,将完成PDF书签的写入和提取以及加水印的操作。 office三件套转换为 PDF 格式 office三件套包括Word、Excel、PowerPoint ,为了调用
  • PDF Reader Pro v2.7.7

    2021-04-28 17:12:39
    PDF Reader Pro 提供更多功能 – 直接编辑PDF本文文字、合并多个文档、将PDF拆分为多个文件、从另一个PDF文件插入页面、插入图片注释、页眉页脚、链接、手绘、导出注释、打印、本地离线PDF转Word / Excel / PPT等...
  • -导出PDF页面或者整个文件任意一种支持的图形格式,包括BMP,JPEG,TIFF,PNG等等等等… -从PDF页面/文件里提取文本面 -易于导航,让你浏览大型或者复制的PDF文件变得简单而有乐趣——通过我们的扩展功能:放大镜...
  • 1、导入需要的jar包:itext-asian-5.2.0.jaritextpdf-5.5.11.jar。2、新建word文档,创建模板,将文件另存为pdf,并用Adobe Acrobat DC打开编辑,点击右侧...4、保存文件,将文件放项目中。生成pdf代码如下:p...
  • 目录PDF书签PDF怎么电子签名PDF文件压缩修改PDF内的文字PDF删除某页多个PDF合并 软件链接在上篇:怎么免费转PDFPDF怎么转WORD、EXCEL、PPT? PDF书签 看电子书时加个书签下次就可以直接打开这一页 下次再...
  • 但其导出PDF文档没有书签。在Office 2007 SP2中,微软加入了该功能,对应的接口是ExportAsFixedFormat。该方法不仅适用于Word,而且也适用于Excel。 一个简单的Python脚本来展示如何转换DOC为PDF。该脚本需要Of
  • 《C#开发实例大全(基础卷)》筛选、汇集了C#开发从基础知识高级应用各个层面约600个实例及源代码,每个实例都按实例说明、关键技术、设计过程、详尽注释、秘笈心法的顺序进行了分析解读。全书分6篇共25章,主要...
  • PPT VBA:批量转PDF

    2022-07-20 19:24:05
    关于具体的操作方法和Word批量导出PDF的方法,请关注我之前的专栏文章。然后遍历这个数组,获取每个文件夹下的PPT文件,存入另一个数组drr。遍历前面的drr,同时把拼接出导出的PDF文件的路径fName。完成,关闭打开的...
  • https://github.com/kayalshri/tableExport.jquery.plugin https://github.com/kayalshri/ tableExport.jquery.plugin Export HTML Table to JSON XML PNG CSV ...Ms-Excel Ms-Powerp...
  • 简易PDF电子书书签制作

    千次阅读 2020-07-04 00:59:19
    pdf书签制作
  • 前面分别总结了导出数据为 PDFExcel 的实现方式,有时候需要在导出文件后进行编辑,那么这时候仅仅导出 PDF 文件是不够的。 下面的实战是基于之前导出数据库表结构为 Word 用到的,后面有 一键导出PostgreSQL...
  • 教程简介Adobe Acrobat XI Pro是一款可以...Adobe AcrobatXIPro深度整合了Microsoft Office套件,实现了PDF与Word、Excel以及PowerPoint等文档间的无缝相互转换。软件安装教程及安装包免费下载点击:PDF(Adobe Acro...
  • java导出生成word

    2021-02-12 10:12:43
    最近做的项目,需要将一些信息导出到word中。在网上找了好多解决方案,现在将这几天的总结分享一下。目前来看,java导出word大致有6种解决方案:1:Jacob是Java-COMBridge的缩写,它在Java与微软的COM组件之间构建一...
  • java生成pdfexcel的方法

    千次阅读 2012-12-15 14:50:36
    这段时间接手一个项目,java生成pdf和word,随便在网上找了点比较好的资料,放在这里,以便学习。 一、前言  在企业的信息系统中,报表处理一直占比较重要的作用,本文将介绍一种生成PDF报表的Java组件--iText...
  • 当前,对报表工具来说,支持导出基本算是标配功能,除了开源报表工具在支持的文件类型上有限制外,对于商业报表工具来说,常用的文件类型,几乎没什么区别,比如都支持导出 word、excelpdf、txt 等。 至于使用的...
  • 本方法是针对word导出操作,需要制作好的模板文件 模板.doc 引入应用Microsoft.Office.Interop.Word 11.0 (office2003) 导出文件注意:有时候迅雷会在浏览器中安装插件,下载时会默认使用迅雷下载,导致下载的文档...
  •  这些服务包括: 打开文档、新建文档、查找文字、替换文字,插入文字、插入图片、插入表格,在书签处插入文字、插入图片、插入表格等。填充数据表格中读取表格数据 ,1.1版增强的功能: 指定文本样式,指定...
  • 利用python分析量化投资问题是现在研究的热点,推荐两份资料用于学习《Python与量化投资:从基础实战》主要讲解如何利用Python进行量化投资,包括对数据的获取、整理、分析挖掘、信号构建、策略构建、回测、策略...
  • doc转pdf之aspose

    2020-12-31 10:38:54
    } } } /** * excelpdf. */ public void excelToPdf(String excelFilePath, String pdfFilePath) { FileOutputStream fos = null; if (!getLicense(DEF_CELLS)) { return; } try { // pdf输出路径 File pdfFile ...
  • 最近做的项目,需要将一些信息导出到word中。在网上找了好多解决方案,现在将这几天的总结分享一下。目前来看,java导出word大致有6种解决方案:1、Jacob是Java-COM Bridge的缩写,它在Java与微软的COM组件之间构建...
  • PDF-XChange Viewer 能够利用任何Windows的软件,比如说 Word、Excel、AutoCad来制作与Adobe相兼容的PDF文件。它具有丰富的配置和功能选项,而且非常的简单易用。它还能够当作打印机使用,以代替传统的纸质输出。 ...
  • Office Server Document Converter (OSDC) 将Word、Excel 和 Powerpoint 批量转换为易于共享且在任何屏幕上看起来都准确的高质量 PDF 或图像格式。在任何工作流程中都可以轻松使用 OSDC,无论是按需转换文件还是高速...
  • PDF

    2021-05-15 19:42:11
    本计划纯翻译《最佳免费PDF工具软件(via)》,但发现内容有很多可改进之处,故改为编译。鸣谢:techsupportalert、朝露昙花、天毅。一、细说PDF编辑功能PDF格式的产生,是为了“发布”——即文档在不同平台看起来尽...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 691
精华内容 276
热门标签
关键字:

导出pdf书签到excel