精华内容
下载资源
问答
  • 扫描版PDF文件通过软件处理,可以识别成文字并作为新的一层在图片层上面,该文字可选择、可复制、可搜索。本文对比了双层可搜索PDF的两大制作软件的OCR效果:Adobe Acrobat Pro DC 2020连续版 2020.009.20067和ABBYY...
  • C#制作PDF文件

    2017-09-12 17:23:43
    专门制作PDF文件的控件,使用textsharp.dll和ICSharpCode.SharpZipLib.dll可将html、word等文件转换为pdf文件
  • 本文章可以解决以下三个问题: 第一部分:什么是PDF文件? 第二部分:如何生成一个比较完整的包含一个链接目录的PDF文件? 第三部分:如何快速生成一个简单的PDF文件
  • PDF文件是目前比较流行的电子文档格式,在办公自动化(OA)等软件的开发中,经常要用到该格式,但介绍如何制作PDF格式文件的资料非常少,在网上搜来搜去,都转贴的是同一段“暴力”破解的方法
  • pdf文件制作工具

    2018-11-08 14:31:02
    PDF24 Creator是一款简单易用,功能独特的一款pdf文件制作工具,可以将其他格式的文件转换成PDF格式,再利用虚拟打印机打印出来!甚至可以将截图下来的图片,保存成为PDF文件!  PDF24 Creator 是一个免费的pdf...
  • pdf文档制作工具

    2019-04-26 21:47:35
    pdf文档制作工具,能够有效地解决部分office文档另存时图片缺失的问题。
  • word文档、PDF文档、图片如何快速制作成供电脑阅读的可执行文件翻页电子书或电子画册,网页式可在微信上分享的电子画册,安卓手机安装包apk形式的翻页电子书,查看该文档即可
  • HTML生成PDF文件

    2018-01-09 11:34:38
    在项目中实现HTML页面转PDF文件输出,HTML生成PDF文件,HTML生成PDF文件
  • 双层PDF是指将标准资料通过扫描仪快速录入后,经过去污、纠偏和OCR识别,然后可以直接生成可以检索的PDF文件,这个PDF文件是双层的,上层是原始图像,下层是识别结果,这样可以100%保留原始版面效果,并且支持选择/...
  • java多个PDF文件合并为一个PDF文件源码。PS:工程目录PDF文件夹用来放要合并的文件。
  • Java 各种pdf文档

    2017-10-09 12:58:43
    文档具体内容如下: Java Platform Standard Edition Deployment Guide.pdf Java Platform Standard Edition Installation Guide.pdf Java Platform Standard Edition Core Libraries.pdf Java Platform Standard ...
  • 如何制作PDF文档.pdf

    2021-10-05 22:56:13
    如何制作PDF文档.pdf
  • Java 读取PDF文件

    2019-07-04 16:11:49
    使用Java 读取PDF,利用JFrame和JPanel做成一个窗口,把读取的PDF文本显示到界面
  • DELPHI PDF文件打印

    2017-11-07 11:23:08
    DELPHI 正确打印PDF文件,解决PDF文件打印顺序问题。好用请帮忙给个5星
  • Adobe的PDF参考告诉我们一个PDF文件可以通过下面4个方面来理解: 1. 对象, 一个PDF文档是由一个由基本数据类型组成的数据结构。2. 文件(物理结构), 决定对象是如何存放在一个PDF文件中的, 它们是如何被访问的,...
  • pdf文档转ofd文档国标

    2020-09-05 23:21:01
    命令行运行ofd xxx.pdf xxx.ofd 有问题联系我qq:466143682 支持转换所有页面,可能有些字体不支持,目前还在测试
  • 双层PDF制作软件

    2018-07-19 00:28:12
    人工OCR识别,3秒钟一页,准确度可达99%,适合工厂大规模生产。加入制作高清双层PDF功能)
  • 用C#来解析PDF文件

    2021-01-20 06:52:21
    PDF文件的格式标准文档可以从Adobe那儿获取到. 这个项目基于“PDF指南,第六版,Adobe便携文档格式1.7 2006年11月”. 它是一个恐怕有1310页的大部头. 本文提供了对这份文档的简洁概述. 与此相关的项目定义了用来...
  • 制作可检索的PDF文档

    千次阅读 2019-10-23 15:40:27
    好友让我帮忙把一本纸质书制作成可检索的PDF文档,他想在公交地铁上使用,于是便开始了以下步骤 一 拍照 把书本和手机固定一个位置,一页页拍照下来,确保照片像素一致,方便后期处理。 二 照片预处理 1 安装...

    好友发了个链接
    怎样快速扫描一本书并做成电子版?
    让我帮忙看看怎么把一本纸质书制作成可检索的PDF文档,他想用移动工具学习那本书,于是实践后整理出下面步骤。
    操作系统:win10+ubuntu16.04

    一 拍照

    把书本和手机固定一个位置,一页页拍照下来。
    这里需要注意照片像素要保持一致,图片命名按照书籍页面顺序排列,方便后期处理。

    二 照片预处理

    1 安装ScanTailor工具

    ScanTailor下载链接
    可以在Linux,Windows,macOS等等系统安装使用,这里我们选择了win10。
    下载并安装 64-bit installer 0.9.11.1 ,然后打开ScanTailor。

    2 使用ScanTailor对照片预处理

    打开ScanTailor——New Project,然后导入你想处理的照片
    图1
    图2
    按照下图的1-4点击,这里选择的是600x600。
    如果照片像素不一致,会显示在“Need Fixing”里面,如图3840x5120的两张图片和其他不一致,需要更换才能进入下一步。
    图3
    图4

    可以对图片进行以下6种方式的处理:

    1 调整方向
    2 调整页面
    3 调整倾斜度
    4 选择主要内容
    5 边距设置
    6 自动调整页面斜度和输出文件
    图5
    这6种方式的操作大同小异,接下来介绍下常用的设置操作:
    如图每种处理方式都可以选择应用到全部页面或者单页,
    一般都选择自动优化,应用于All pages,
    自动处理如果有些不满意的可以微调。
    图6
    然后滚动回到第一页处理的照片,点击下图的开始按钮,即可自动处理,6种方式有6个启动按钮,需要一个个按顺序点击操作:
    图7
    依次 调整方向 调整页面 调整倾斜度 选择主要内容 边距设置 后就到了最后一步:自动调整页面斜度和输出文件,这里隐藏一个强大的功能,可以把照片上倾斜的文字自动调正!下面是一张文字弯曲的照片:
    图8
    按照下图步骤设置后点击启动按钮:
    图9
    刚刚那页就变成这个效果,挺赞!
    图10
    图片全部处理完毕就准备输出了,选择你喜欢的页面样式,有黑白,原图和混合模式,一般选择原图,按照下图设置后启动操作,就可以在project目录下的相应out目录,看到处理完成的格式为.tif的图片!
    图11

    三 使用Tesseract-OCR识别图片中的文字并生成PDF

    1 配置Tesseract-OCR环境

    Tesseract-OCR这个工具可以在Linux,Windows,macOS等等系统上安装使用,详见官网:
    tesseract-ocr官网
    这里我们选择在Ubuntu16.04上配置安装,之后使用一条命令就能输出可检索的PDF文档了!

    安装依赖包(Ubuntu 16.04/14.04):

    sudo apt-get install g++ # or clang++ (presumably)
    sudo apt-get install autoconf automake libtool
    sudo apt-get install pkg-config
    sudo apt-get install libpng-dev
    sudo apt-get install libjpeg8-dev
    sudo apt-get install libtiff5-dev
    sudo apt-get install zlib1g-dev
    sudo apt-get install libicu-dev
    sudo apt-get install libpango1.0-dev
    sudo apt-get install libcairo2-dev

    安装开源图像处理分析库Leptonica

    sudo apt-get install libleptonica-dev

    安装tesseract

    wget https://github.com/tesseract-ocr/tesseract/archive/3.04.00.tar.gz
    tar -zxvf 3.04.00.tar.gz
    cd tesseract-3.04.00
    sudo ./autogen.sh
    ./configure
    make
    make install
    ldconfig

    语言包下载预置

    tesseract语言包下载链接
    这里我们需要英文eng.traineddata和中文chi_sim.traineddata,然后拷贝到tessdata里面:
    cp chi_sim.traineddata /usr/local/share/tessdata
    cp eng.traineddata /usr/local/share/tessdata

    环境配置完毕!

    2 输出可检索PDF

    先学习两个简单命令

    (1) 处理一张中文图片:
    a.jpg是要处理的图片,生成文件名为result0的PDF文档,如果pdf不写,默认输出.txt格式文档,注意命令的 result pdf之间是有空格的:
    tesseract -l chi_sim a.jpg result0 pdf

    (2) 处理一张中文+英文图片:
    这里输出result1.txt
    tesseract sss.png result1 -l chi_sim+eng

    把ScanTailor处理后的图片制作成可检索PDF:

    把刚Window上ScanTailor输出的多张.tif格式图片放入Ubuntu上文件夹booktest,然后
    cd booktest
    ls . > photo_list.txt
    vi photo_list.txt 把里面的“photo_list.txt“删除
    tesseract ./photo_list.txt book pdf
    tesseract ./photo_list.txt -l chi_sim booktest pdf

    大功告成,输出可检索PDF!!识别有一定的误差,但是基本可以满足需要。遇到问题,欢迎留言讨论!

    展开全文
  • 内容索引:JAVA源码,综合应用,iText,制作PDF iText是一个JAVA中快速制作PDF文件的类库,如果你想用JAVA制作PDF文档,这个源码包可不要错过哟。
  • VC++.NET解析PDF文件。VC++.NET源码项目,05年时候写的,又翻出来了,有需要的可参考下。现在PDF文档是常用的文档格式,让你的程序中支持PDF的相关操作,可以参考下。 运行环境:Windows/Visual C/C++
  • 完全免费,真正的物超所值,摆脱收费束缚,想怎么转就怎么
  • Adobe Acrobat dc是Acrobat新的版本,在新版中提供了更完善的Microsoft Office格式转换功能,让用户可以轻易地在 PDF、doc、xls 或是 ppt 等格式...睿鱼教育出品的dc版本课程,轻松易学,让你3天掌握顶级PDF制作流程!
  • 如今手机的功能越来越强大,日常的一些办公操作我们可以用手机替代,比如怎么在手机里创建新的PDF文档?下面一起来看看具体步骤。 首先我们需要下载极速PDF(阅读器)APP,安装后打开阅读器点击页面最下方的“扫描”...

    如今手机的功能越来越强大,日常的一些办公操作我们可以用手机替代,比如怎么在手机里创建新的PDF文档?下面一起来看看具体步骤。

    首先我们需要下载极速PDF(阅读器)APP,安装后打开阅读器点击页面最下方的“扫描”进入制作。
    在这里插入图片描述

    方式1:拍照获取并生成PDF

    进入页面后,点击拍照按钮进行拍摄,然后点击页面右上角的“创建PDF”;
    在这里插入图片描述

    方式2:已有图片生成PDF

    进入页面后点击左下方的相机左侧的图片进入,可获取相册和手机文件夹中的图片,选择后右侧会实时显示已添加张数,然后点击右上角的“创建PDF”。
    在这里插入图片描述

    以上任一方式点击创建PDF后,即可进入PDF编辑页面,下方有一排工具可进行相应的操作后,点击右上角的“生成PDF”,最后再输入PDF文档的名称后,点击确定,这个PDF文件就创建好了。
    在这里插入图片描述

    PS:这5个工具分别的作用:

    (1). 新增:可添加多张图片创建文件。点底部工具栏新增,可选择“再拍一张或从相册中选择”添加;

    (2). 排序:对于多张图片创建文件时,点工具栏排序,对图片进行 重新排序操作。长按高亮覆盖图片后 – 拖动图片 – 完成;

    (3). 旋转:生成 PDF 文件时,点工具栏旋转,可对图片进行顺时针90°旋转;

    (4). 裁剪:创建文件时调整图片大小。点工具栏裁剪 ,可拖动裁剪框,对图片进行任意大小的裁剪;

    (5). 删除:点击,删除正在创建的图片。

    展开全文
  • 本文主要介绍通过引用Adobe reader提供的COM组件,以实现在WinForm程序中显示PDF文件的功能。
  • PDF文件转WORD文档

    2018-10-30 15:52:26
    支持PDF文件转换WORD文件,亲测可用。
  • C#网页导出PDF文件

    2018-12-22 11:44:46
    用wkhtmltopdf把网页导为PDF文件,代码测试过了,下载用VS2010可以直接运行使用。
  • 使用PDFLib生成PDF文档(C语言版)--使用指导............................................................
  • Java实现word转PDF文件

    2018-07-02 19:14:28
    java实现将word文件转成PDF文件,支持doc后缀文件和docx文件,使用时jar文件手动加入,dll文件copy到jdk的bin目录下。dll文件一定要放到jdk目录下!!!
  • 打开pdf文件控件

    2018-09-20 18:39:30
    YCanPDF PDFView OCX 是 YCanPDF 开发的显示 PDF 文件的标准控件,可以在任何支持标准 OCX 的开发语言里面使用。

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 597,638
精华内容 239,055
关键字:

怎样制作pdf文档