精华内容
下载资源
问答
  • 如何使用python 给PDF生成目录 主要步骤: 步骤1. 准备目录的txt,如果PDF是图片无法复制出来,可以使用qq图文识别提取目录内容。 目录txt 格式: 关于QQ图片文字提取: (1)利用qq聊天框中的屏幕识图 (2)转为...

    如何使用python 给PDF生成目录

    主要步骤:
    步骤1.
    准备目录的txt,如果PDF是图片无法复制出来,可以使用qq图文识别提取目录内容。
    目录txt 格式:
    在这里插入图片描述
    关于QQ图片文字提取:
    (1)利用qq聊天框中的屏幕识图
    (2)转为在线文档
    在这里插入图片描述
    (3)复制目录内容生成一个txt 文件
    把页面前面的点去掉
    在这里插入图片描述
    步骤2
    执行python 脚本生成目录,会生成一个原文件名-new的PDF文件

    
    
    import re
    import sys
    
    from distutils.version import LooseVersion
    from os.path import exists, splitext
    from PyPDF2 import PdfFileReader, PdfFileWriter
    
    
    is_python2 = LooseVersion(sys.version) < '3'
    
    
    def _get_parent_bookmark(current_indent, history_indent, bookmarks):
        '''The parent of A is the nearest bookmark whose indent is smaller than A's
        '''
        assert len(history_indent) == len(bookmarks)
        if current_indent == 0:
            return None
        for i in range(len(history_indent) - 1, -1, -1):
            # len(history_indent) - 1   ===>   0
            if history_indent[i] < current_indent:
                return bookmarks[i]
        return None
    
    def addBookmark(pdf_path, bookmark_txt_path, page_offset):
        if not exists(pdf_path):
            return "Error: No such file: {}".format(pdf_path)
        if not exists(bookmark_txt_path):
            return "Error: No such file: {}".format(bookmark_txt_path)
    
        # with open(bookmark_txt_path, 'r', encoding='utf-8') as f:
        with open(bookmark_txt_path, 'r', encoding='gbk') as f:
            bookmark_lines = f.readlines()
        reader = PdfFileReader(pdf_path)
        writer = PdfFileWriter()
        writer.cloneDocumentFromReader(reader)
    
        maxPages = reader.getNumPages()
        bookmarks, history_indent = [], []
        # decide the level of each bookmark according to the relative indent size in each line
        #   no indent:          level 1
        #     small indent:     level 2
        #       larger indent:  level 3
        #   ...
        for line in bookmark_lines:
            line2 = re.split(r'\s+', unicode(line.strip(), 'utf-8')) if is_python2 else re.split(r'\s+', line.strip())
            if len(line2) == 1:
                continue
    
            indent_size = len(line) - len(line.lstrip())
            parent = _get_parent_bookmark(indent_size, history_indent, bookmarks)
            history_indent.append(indent_size)
            title, page = ' '.join(line2[:-1]), int(line2[-1]) - 1
            if page + page_offset >= maxPages:
                return "Error: page index out of range: %d >= %d" % (page + page_offset, maxPages)
            new_bookmark = writer.addBookmark(title, page + page_offset, parent=parent)
            bookmarks.append(new_bookmark)
    
        out_path = splitext(pdf_path)[0] + '-new.pdf'
        with open(out_path,'wb') as f:
            writer.write(f)
    
        return "The bookmarks have been added to %s" % out_path
    
    if __name__ == "__main__":
        import sys
        args = sys.argv
        print(args)
        pdf_path='./Hive.pdf'
        bookmark_txt_path='./format.txt'
        page_offset=22
        addBookmark(pdf_path,bookmark_txt_path,page_offset)
    

    生成新的带目录的pdf 文件
    在这里插入图片描述

    参考https://www.zhihu.com/question/344805337/answer/819338479

    展开全文
  • pdf生成目录教程

    2021-03-05 09:22:33
    1 pdf生成目录教程 https://zhuanlan.zhihu.com/p/47271995 (1)如何用FreePic2Pdf和PdgCntEditor制作目录

    1 pdf生成目录教程

    https://zhuanlan.zhihu.com/p/47271995

    (1)如何用FreePic2Pdf和PdgCntEditor制作目录

    展开全文
  • 一个能够自动给pdf生成目录的东西

    千次阅读 2014-09-05 00:01:53
    我需要一个能够给pdf生成

        我需要一个能够给pdf生成目录的工具。就类似iReader做到的那样。

        首先:pdf是非扫描版的->扫描的页面范围,标记。

                   pdf 是扫描版的-->如何识别出扫描的字体。

    展开全文
  • FreePic2Pdf提取目录,拷贝修改后的文本 PdgCntEditor编辑目录 拷贝目录txt vim打开文本,进行格式修改 打开方式: 用vim.exe打开txt文档,用Esc改变模式:命令模式、编辑模式(insert键更改替换和插入),输入...

    工具:
    GVim
    FreePic2Pdf,密码:at9e
    PdgCntEditor,密码:m34bkv
    如果pdf被锁更改pdf失败,可用这个网站解密

    主要流程

    • 找到目录;搜索例如douban,书的原版网站,google books以及最差的情况哪里也找不到就只能OCR
    • Vim修改目录格式
    • FreePic2Pdf提取目录,拷贝修改后的文本
    • PdgCntEditor编辑目录
    1. 拷贝目录txt
      在这里插入图片描述
    2. vim打开文本,进行格式修改
      打开方式:右键使用vim打开
      在这里插入图片描述

    用vim.exe打开txt文档,用Esc改变模式:命令模式、编辑模式(insert键更改替换和插入),输入进入命令(右键即为拷贝)
    在这里插入图片描述

    目标格式:

    一级目录A   页码
        二级目录a   页码
        	三级目录	页码
    一级目录B   页码
        二级目录b   页码
    

    PdgCntEditor 中对目录的分级是根据缩进(Tab)来确定的,因此一级目录不用缩进,二级目录行首应该有一个缩进,三级目录有两个缩进。
    页码跟在目录名之后,中间用一个 Tab 隔开。

    • 三级目录添加两个tab。命令:%s/\v^\ze(\d+\.\d+\.)/\t\t/
    • 所以这里给二级目录添加一个缩进,命令 :%s/\v^\ze(\d+\.\d+)/\t/
    • 然后将目录名和页码中间的字符串替换为 Tab,命令 :%s/\v(\s\.)+\s/\t/
      (此步我操作失败,改用idea利用ctrl+shift+alt+J进行相同字符选择手动将页码前两个空格变成tab)
      在这里插入图片描述
    • 页码重定位,加上一个偏移量,命令::%s/\d\+$/\=submatch(0)+22/
    • 保存,或使用命令:wq保存并退出

    3.目录导入pdf
    制作好目录之后,我们打开 FreePic2Pdf 程序,点击“更改PDF”:
    在这里插入图片描述
    接着选择“从 PDF 取书签”,这步是为了得到接口文件,即使 PDF 本身并没有书签:在这里插入图片描述
    然后选择“往 PDF 挂书签”,点击图中标号 2 处,会打开 PdgCntEditor 让你编辑目录信息:
    在这里插入图片描述
    将上面生成的目录文本粘贴进来,保存后关闭:
    在这里插入图片描述
    最后点击“开始”完成书签目录的导入:
    在这里插入图片描述
    最终效果:
    在这里插入图片描述

    参考:
    PDF 没有书签目录?自己动手五分钟生成!
    如何用FreePic2Pdf和PdgCntEditor制作目录

    展开全文
  • word 生成目录.pdf

    2021-09-14 14:47:32
    word 生成目录.pdf
  • PDF生成目录导航

    2010-03-02 09:53:17
    使用pdfcreator或pdffactory-pro打印生成PDF文档,默认情况下不会生成pdf文档的导航目录。 经阅读软件帮助文档,生成导航目录的方法有2种,一通过手动添加页面标签实现;另一种是通过获取标题的字体格式自动生成PDF...
  • ThinkPHP自动生成目录.pdf
  • itext 生成pdf 目录

    2017-12-19 16:54:29
    itext 生成pdf 目录,itext 生成pdf 目录,itext 生成pdf 目录
  • Javascript生成pdf目录

    2011-09-28 22:24:24
    利用Javascript自己的pdf书籍生成目录
  • gradle 模块化生成目录.pdf
  • PDF文件生成PDF目录生成PDF多文件合并,PDF浏览
  • PDF批量目录生成器(ePDF)是一款非常实用、便捷的PDF文件目录制作工具,具有一键批量生成PDF文件目录、合并多个PDF文件并自动生成目录PDF文件加密、PDF文件拆分等功能。
  • PDF目录)自动生成PDF书签目录

    千次阅读 2020-10-30 10:37:12
    手动指定特定的标题样式,然后利用PDF补丁丁软件,自动匹配并生成PDF书签目录。哦吼,起飞!从此快人一步!
  • 利用aspose-word for java和aspose-pdf for java完成word转pdf并且生成目录 1. jacob 2. aspose 2.1 利用aspose-word for java将word转为pdf 2.2利用aspose-word for java提取word中的标题 2.3利用aspose-pdf...
  • itext生成pdf目录

    2017-12-06 11:15:50
    用itext方法生成 与Word一样的目录
  • PDF补丁丁0.6.1.3498 测试版,发布于2018.05.24,重大更新有:为文本PDF文档自动生成目录书签!官网 https://pdfpatcher.cnblogs.com/ 。
  • word生成目录pdf

    2019-09-27 13:21:29
    注意:待转换Word中应该有目录,可以用Word中的标题来自动生成目录。 我用的office2016,但功能都差不多 1、文件另存时,选择另存为PDF或者XPS 2、在扩展设置中,选择红框中的“选项” 3、打开“选项”设置...
  • 简单粗暴,用python生成目录树.pdf
  • 使用itext7为已有pdf生成目录

    千次阅读 2018-05-10 16:21:31
    package ... //需要导入的包 import com.itextpdf.io.font.PdfEncodings; import com.itextpdf.kernel.font.PdfFont; import com.itextpdf.kernel.font.PdfFontFactory; import com.ite...
  • 那么有什么方法能生成目录呢? 方法一:使用福昕pdf编辑器 福昕pdf编辑器使用PRC识别pdf文件,能将pdf文件转换为office文件,更是有目录制作的功能。 但是,亲测后发现: 也是最关键的问题,他需要money,.....
  • 生成目录_将word转换成PDF

    千次阅读 2013-09-30 15:14:27
    word2010生成目录_将word转换成PDF.doc 一, 概要 1.1 在 Microsoft Word2010 中 自动 生成目录 1.2 在 WPS 中 将 word 转换 成 PDF 1.3 在 Microsoft Word2010 中 将 word 转换 成 PDF   二, 自动生成目录 2.1 ...
  • 为扫描版PDF一键生成目录

    千次阅读 2020-05-10 19:53:33
    最近找了些pdf书籍看,但是没有目录(导航,一点就去对应页码)很是苦恼,怎么才能添加目录呢???以下是我的解决这个问题的过程。 2. 直奔主题 2.1 尝试1:pdf合并 试图将图片文档的目录转出成word,然后再生产pdf...
  • 首先我们到网上下载一个小工具“PDF批量目录生成器(ePDF)”,是一款绿色软件,不需要安装,解压后即可使用。 二、整理文件 把需要合并的PDF文件统一放在同一个文件夹中,因为将下来要把每个PDF文件的文件名作为...
  • word2010生成目录_将word转换成PDF.doc
  • pdf根据目录生成书签

    千次阅读 2018-10-05 21:46:56
    目录1 准备2 得到书签标准文件2.1 bookmarks.txt标准文件2.2 正则转换示例3使用插件自动生成4 其他 1 准备 ①Adobe Acrobat ②Autobookmark插件 Step1 下载链接 Step2 关闭Adobe Acrobat后,直接安装 (使用说明) ...
  • PDF文件如何自动生成目录书签

    千次阅读 2020-10-29 14:45:11
    我们在制作完成一个PDF文档后,需要文件添加目录便于快速查看内容,但如果手动一条一条添加太浪费时间,也容易出错,那么如何才能给PDF文件自动添加目录呢? 首先用极速PDF编辑器打开我们需要添加目录PDF文件后...
  • 很多时候 , 大家在网上下的电子书籍 , 因为是扫描版本 , 所以根本没有目录 , 尽管pdf阅读器它提供了添加目录的方法 , 但是 , 需要自己一个一个去手动添加 , 这样效率太低了.没有目录的书籍基本没有人看的下去 , 这个...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 72,943
精华内容 29,177
关键字:

怎样给pdf生成目录