精华内容
下载资源
问答
  • php读取pdf
    2021-05-07 11:35:21

    想了解PHP简单读取PDF页数的实现方法的相关内容吗,lee在本文为您仔细讲解PHP读取PDF页数的相关知识和一些Code实例,欢迎阅读和指正,我们先划重点:PHP,读取,PDF页数,下面大家一起来学习吧。

    本文实例讲述了PHP简单读取PDF页数的实现方法。分享给大家供大家参考,具体如下:

    还是老外比较厚道, 在老外的网站找到了这样一个方法,

    我写成了一个函数, 再将函数写进自己的LeeLib库里的PdfUtil类.

    很简单的方式, 速度还不错.

    /**

    * 获取PDF的页数

    */

    function getPageTotal($path){

    // 打开文件

    if (!$fp = @fopen($path,"r")) {

    $error = "打开文件{$path}失败";

    return false;

    }

    else {

    $max=0;

    while(!feof($fp)) {

    $line = fgets($fp,255);

    if (preg_match('/\/Count [0-9]+/', $line, $matches)){

    preg_match('/[0-9]+/',$matches[0], $matches2);

    if ($max

    }

    }

    fclose($fp);

    // 返回页数

    return $max;

    }

    }

    希望本文所述对大家PHP程序设计有所帮助。

    相关文章

    更多相关内容
  • 最近领导拍脑袋想出了一个需求,要我读取PDF里面的内容,并且入库存为正文,用来搜索,需要的朋友可以了解下
  • php读取pdf文字内容

    2022-05-10 15:09:54
    安装第三方库 composer require smalot/pdfparser ...下载后引入 alt_autoload.php-dist 文件 开始使用 <?php // Parse PDF file and build necessary objects. $parser = new \Smalot\PdfParser\...$pdf = $pars

    安装第三方库

    composer require smalot/pdfparser
    

    如果没有安装composer可以在GitHub下载 下载地址https://github.com/smalot/pdfparser

    下载后引入 alt_autoload.php-dist 文件

    开始使用

    <?php
    
    // Parse PDF file and build necessary objects.
    $parser = new \Smalot\PdfParser\Parser();
    $pdf = $parser->parseFile('/path/to/document.pdf');
    
    $text = $pdf->getText();
    //打印内容
    echo $text;
    
    展开全文
  • PHP读取PDF文件, 仅支持 Thread Safety 版本的 PHP 5.5.x / 5.6.x / 7.0.x / 7.1.x / 7.2.x, 将对应的版本 php_xpdf.dll 复制到 PHP ext 目录下。 编译采用版本分别为 5.5.38 / 5.6.40 / 7.0.33 / 7.1.26 / 7.2.14 ...
  • php读取pdf文件

    2021-02-26 16:20:58
    1.compoer安装相关的包 ...php namespace app\controller; use app\BaseController; use Smalot\PdfParser\Parser; class Pdf extends BaseController { public function index() { $filename ='./shell.pdf';

    1.compoer安装相关的包

     composer require smalot/pdfparser
    

    2.代码

    <?php
    namespace app\controller;
    use app\BaseController;
    use Smalot\PdfParser\Parser;
    
    class Pdf extends BaseController
    {
        public function index()
        {
            $filename ='./shell.pdf';
            $parser = new Parser();
            $pdf = $parser->parseFile($filename);
            $text = $pdf->getText(); //将所有内容读取到一个字符串中
            return show(1,"ok",$text);
        }
    }
    

    3.结果
    在这里插入图片描述

    注意:读取的pdf文件不全

    展开全文
  • PHP读取PDF内容方法

    千次阅读 2021-04-24 10:50:42
    PHP读取PDF内容方法读取PDF工具安装教程windows下安装windows下使用方法 读取PDF工具安装教程 我这边使用的是 xpdf工具,是使用最好的一个读取工具,读取的中文不会有乱码出现。 xpdf安装配置 下载: 根据系统选择...

    读取PDF工具安装教程

    我这边使用的是 xpdf工具,是使用最好的一个读取工具,读取的中文不会有乱码出现。

    xpdf安装配置
    下载:
    根据系统选择下载 https://www.xpdfreader.com/download.html
    下载xpdf和中文字体,分别解压缩。
    在这里插入图片描述
    文件名: xpdf-tools-win-4.03.zip
    中文支持库名:xpdf-chinese-simplified.tar.gz

    windows下安装

    建立 xpdf 根目录 d:\tool\xpdf

    (1)并将xpdf-tools-win-4.03\bin64目录下所有文件复制到 d:\xpdf 下。
    (2)将xpdf-chinese-simplified直接解压出的 整个文件夹复制到 d:\xpdf 下。
    (3) 复制 xpdf-tools-win-4.03\doc 路径下的 sample-xpdfrc 文件到 d:\tool\xpdf 下,并改名为 xpdfrc。
    (4)修改文件 xpdfrc 第73行,将 textEncoding UTF-8 注释打开,指定编码为UTF-8,
    (5)并在下面增加 textPageBreaks no 参数,意思是在pdf文档的两页间不加入分行符。
    (6)在此文件最后增加以下内容,声明中文字体文件

    #----- begin Chinese Simplified support package (2011-sep-02)
    cidToUnicode Adobe-GB1 D:/tool/xpdf/xpdf-chinese-simplified/Adobe-GB1.cidToUnicode
    unicodeMap ISO-2022-CN D:/tool/xpdf/xpdf-chinese-simplified/ISO-2022-CN.unicodeMap
    unicodeMap EUC-CN D:/tool/xpdf/xpdf-chinese-simplified/EUC-CN.unicodeMap
    unicodeMap GBK D:/tool/xpdf/xpdf-chinese-simplified/GBK.unicodeMap
    cMapDir Adobe-GB1 D:/tool/xpdf/xpdf-chinese-simplified/CMap
    toUnicodeDir D:/tool/xpdf/xpdf-chinese-simplified/CMap
    #displayCIDFontTT Adobe-GB1 D:/xpdf/xpdf-chinese-simplified/CMap/gkai00mp.ttf
    #fontFileCC Adobe-GB1 /usr/…/gkai00mp.ttf
    #----- end Chinese Simplified support package

    windows下使用方法

    windows使用命令:

    D:\tool\xpdf\pdftopng.exe -f 1 -l 1 D:\test.pdf D:\testpng

    说明:进入D:\tool\xpdf 文件夹中,运行 pdftopng.exe -f 1 -l 1 D:\test.pdf D:\testpng。-f 1 是指从第一页开始。 -l 1 是指第一页结束,最后一个是生成的图片名前缀叫testpng 最终会以testpng-000001.png的形式生成。
    如果要导出文本用 pdftotext.exe命令。

    php调用方法

    
    <?
    $filename="D:/11/02261390000606560259.pdf ";//文件名称及路径
    $content = shell_exec ( 'D:/tool/xpdf/pdftotext '.$filename .'-');
    echo $content;
    
    ?>
    

    还是看不明白的,可以加我QQ沟通,有需要爬取要求的也可以加我详聊。

    QQ: 315 987 20

    展开全文
  • pdfparser,一个独立的php库,提供了多种工具来从pdf文件提取数据,不支持加密的pdf文件官方文档:使用composer安装依赖包:composer require smalot/pdfparser安装成功后如下图:创建index.php文件,引入autoload....
  • 这篇文章主要为大家详细介绍了PHP读取PDF页数的实现方法,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,有需要的朋友可以收藏方便以后借鉴。给用户做的一个网站中,遇到这样一个问题:用户的网站上有很多的PDF...
  • 使用php读取pdf文件

    2021-07-16 15:01:15
    Hi,I have a bulk of pdf ... I want to read that using php script. I searched a lot, but everyone is about creating pdf files. Here I dont want to create pdf file but I want to read it. Is there...
  • 主要介绍了PHP简单读取PDF页数的实现方法,涉及php针对文件的读取及正则运算等相关操作技巧,需要的朋友可以参考下
  • 本文实例讲述了PHP读取文件,解决中文乱码UTF-8的方法。分享给大家供大家参考,具体如下: $opts = array( 'file' => array( 'encoding' => "utf-8" ) ); $opts = array('http' => array('encoding' => 'utf-8'))...
  • # 获取PDF的页数 function getPageTotal($path) { // 打开文件 if (!$fp = @fopen($path, "r")) { $error = "打开文件{$path}失败"; return false; } else { $max = 0; while (!feof($fp)) { $line = fgets...
  • PHP 读取PDF文档页数

    2015-04-14 22:03:00
    2019独角兽企业重金招聘Python工程师... // 在这里放置成功读取后的处理代码  }else{  // 在这里放置失败的处理代码  } ?> 转载于:https://my.oschina.net/u/214052/blog/401569
  • PHP读取或者建立txt,doc,xls,pdf各个类型文件的方法.php读取(文本.txt)文件:php通常是使用fopen、fgets的方法,例如:$fp=fopen('文件名.txt','r');for ($i=1;$i<100;$i++) fgets($fp);//跳过前99行$arr=array();...
  • php 在线读取PDF文件

    2020-11-01 17:16:16
    <meta charset="utf-8"> <?php $fp = fopen("http://www.81.com/upload/file/1512243302.pdf", "r"); header("Content-type: application/pdf"); fpassthru($fp); fclose($fp); ?>
  • PHP读取或者创建txt,doc,xls,pdf各个类型文件的方法.php读取(文本.txt)文件:一般是使用fopen、fgets的方法,例如:$fp=fopen('文件名.txt','r');for ($i=1;$i<100;$i++) fgets($fp);//跳过前99行$arr=array();//...
  • 我的一个客户有这样的需求:上传文件,可以是doc,docx,xls,pdf,txt格式,现需要用php读取这些文件的内容,然后计算文件里面字数.1.PHP读取DOC格式的文件首先介绍一下如何在windows下使用:2.将下载下来的文件解压到C盘根...
  • pdf转化为text: 将php-manual.pdf 转化为 php-manual.txt: pdftotext php-manual.pdf php-manual.txt 只转化前 5 页和后 10 页: pdftotext -f 5 -l 10 php-manual.pdf php-manual.txt 转化加密过的pdf文件...
  • poi读取doc生成pdfOne of my customers has an insane amount of PDF and Microsoft Word DOC files on their website. It's core to their online services so it's not as though they're garbage files up on the...
  • php 5 的流读取函数好像默认编码是 UTF-8 以前在 php 4 里直接 file_get_contents) 读取 gb2312 编码的正常到了 5 就乱码了网上的解决办法说抓取后用 iconv) 转码看后我就 觉 得不对劲一个是不一定编译了 iconv 库更...
  • php 读取文件乱码问题

    2021-01-21 15:44:30
    看后我就觉 得不对劲:一个是不一定编译了iconv库,更大的问题是编码都跟流转换的时候有关(如果用了iconv实际上php转了两次码:流 -> UTF-8 -> GB2312):这不是白忙乎了吗? 仔细看了下php的文档(不知道大家都是...
  • pdfbox2.0.12读取pdf.zip

    2021-04-01 13:49:30
    利用pdfbox读取pdf内容 ,对于大部分未加过密或不是用图片生成的pdf能读出来. 引入pdfbox-app-2.0.12, IKVM.Runtime, IKVM.OpenJDK.Util, IKVM.OpenJKD.Text IKVM.OpenJKD.SwingAWT IKVM.OpenJKD.Core 后运行按照...
  • 主要介绍了PHP使用imagick读取PDF第一页生成png缩略图的两种方法,使用了PHP扩展php_imagick,需要的朋友可以参考下
  • PHP读取PDF页数的方法

    2016-04-30 12:19:00
    2019独角兽企业重金招聘Python工程师标准>>> ... * 获取PDF的页数 ...http://www.9958.pw/post/php_pdf_totalpage 转载于:https://my.oschina.net/u/1179286/blog/668406
  • PHP中使用Imagick读取pdf并生成png缩略图实例pdf生成png首页缩略图 (服务器需要支持Imagick)/*** PDF2PNG* @param $pdf 待处理的PDF文件* @param $path 待保存的图片路径* @param $page 待导出的页面 -1为全部 0为第...
  • php上传pdf文件及读取其内容

    千次阅读 2020-07-01 20:34:49
    $fp = fopen("test.pdf", "r"); header("Content-type: application/pdf"); fpassthru($fp); fclose($fp);

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 17,090
精华内容 6,836
关键字:

php读取pdf