精华内容
下载资源
问答
  • 网页显示PDF文件

    千次阅读 2014-07-04 16:51:57
    如何直接在网页显示PDF文件 1、 通过的浏览器:360、Firefox、IE、Chrome  2、      下面这个完整点:                  通过的浏览器:360、IE  未通过...

    如何直接在网页中显示PDF文件

    1、
    <iframe src="test.pdf" width="800" height="600"></iframe>
        通过的浏览器:Firefox、IE、Chrome

    2、
    <object classid="clsid:CA8A9780-280D-11CF-A24D-444553540000" width="100%" height="100%" border="0"><!--IE-->  
          <param name="_Version" value="65539">  
          <param name="_ExtentX" value="20108">  
          <param name="_ExtentY" value="10866">  
          <param name="_StockProps" value="0">  
          <param name="SRC" value="test.pdf">  
    <embed src="test.pdf" width="100%" height="800" href="test.pdf"></embed><!--FF-->  
    </object>  

    通过的浏览器:Firefox、Chrome
    未通过的浏览器: IE

    3、
    <embed width="800" height="600" src="test.pdf"> </embed>
    通过的浏览器:Firefox、Chrome

    展开全文
  • 网页显示PDF文档的方法

    千次阅读 2016-03-30 16:16:16
    想要在网页显示PDF文档,可以这么做: ================HTML========================== PDFObject example window.onload = function (){ var success = new PDFObject({ url: "Visual_C_6.0开发与

    想要在网页中显示PDF文档,可以这么做:

    ================HTML==========================

    <html>
      <head>
        <title>PDFObject example</title>
        <script type="text/javascript" src="pdfobject.js"></script>
        <script type="text/javascript">
          window.onload = function (){
            var success = new PDFObject({ url: "Visual_C_6.0开发与实例.pdf" }).embed();
          };
        </script>
      </head> 
      <body>
        <p>It appears you don't have Adobe Reader or PDF support in this web
        browser. <a href="Visual_C_6.0开发与实例.pdf">Click here to download the PDF</a></p>
      </body>
    </html>
    ================PDFObject.js==========================
    /* PDFObject, copyright (C) 2008 Philip Hutchison (pipwerks.com). Documentation and examples are at www.pdfobject.com. Version 1.2, April 2011. MIT style license */
    var PDFObject=function(y){if(!y||!y.url){return false;}var w="1.2",b=y.id||false,i=y.width||"100%",z=y.height||"100%",r=y.pdfOpenParams,a,x;var v=function(){var c=null;if(window.ActiveXObject){c=new ActiveXObject("AcroPDF.PDF");if(!c){c=new ActiveXObject("PDF.PdfCtrl");}if(c!==null){return true;}}return false;};var u=function(){var c,f=navigator.plugins,d=f.length,e=/Adobe Reader|Adobe PDF|Acrobat/gi;for(c=0;c<d;c++){if(e.test(f[c].name)){return true;}}return false;};var t=function(){var c=navigator.mimeTypes["application/pdf"];return(c&&c.enabledPlugin);};var s=function(){var c=null;if(u()||v()){c="Adobe";}else{if(t()){c="generic";}}return c;};var q=function(){var e=document.getElementsByTagName("html");if(!e){return false;}var c=e[0].style,d=document.body.style;c.height="100%";c.overflow="hidden";d.margin="0";d.padding="0";d.height="100%";d.overflow="hidden";};var p=function(d){var c="",e;if(!d){return c;}for(e in d){if(d.hasOwnProperty(e)){c+=e+"=";if(e==="search"){c+=encodeURI(d[e]);}else{c+=d[e];}c+="&";}}return c.slice(0,c.length-1);};var o=function(d){var c=null;switch(d){case"url":c=a;break;case"id":c=b;break;case"width":c=i;break;case"height":c=z;break;case"pdfOpenParams":c=r;break;case"pluginTypeFound":c=x;break;case"pdfobjectversion":c=w;break;}return c;};var n=function(d){if(!x){return false;}var c=null;if(d){c=(d.nodeType&&d.nodeType===1)?d:document.getElementById(d);if(!c){return false;}}else{c=document.body;q();i="100%";z="100%";}c.innerHTML='<object	data="'+a+'" type="application/pdf" width="'+i+'" height="'+z+'"></object>';return c.getElementsByTagName("object")[0];};a=encodeURI(y.url)+"#"+p(r);x=s();this.get=function(c){return o(c);};this.embed=function(c){return n(c);};return this;};
    =======================END========================

    更多的例子可以看 PDFObject 的主页

    展开全文
  • wkhtmltopdf 网页转换为pdf

    千次阅读 2020-04-21 17:15:28
    wkhtmltopdf主要用于把网页转换为pdf,用于复杂的图文导出pdf 一般的模板渲染根本做不到 wkhtmltopdf.rpm centos7下载地址 链接:https://pan.baidu.com/s/1EaXjTgk7jXyJdJMUlNUIEQ 提取码:5omp centos7安装 rpm -...

    wkhtmltopdf主要用于把网页转换为pdf,用于复杂的图文导出pdf 一般的模板渲染根本做不到

    wkhtmltopdf.rpm centos7下载地址

    链接:https://pan.baidu.com/s/1EaXjTgk7jXyJdJMUlNUIEQ
    提取码:5omp

    centos7安装

      rpm -ivh wkhtmltox-0.12.5-1.centos7.x86_64.rpm
    

    如果报错的话需要安装以下依赖

    yum install -y fontconfig libX11 libXext libXrender libjpeg libpng xorg-x11-fonts-75dpi xorg-x11-fonts-Type1
    

    安装成功后测试一下

    wkhtmltopdf https://www.baidu.com  /temp/baidu.pdf
    

    会发现中文乱码 显示 方框 是因为没有这个字体

    原因:主要是缺少中文字体。
    处理方法:windows系统C:\Windows\Fonts下获取simsun.ttc(宋体)
    复制到centos下的/usr/share/fonts
    重新生成,正常!

    参数选项

    wkhtmltopdf 参数介绍

    wkhtmltopdf [OPTIONS]… [More input files]
    常规选项
    –allow 允许加载从指定的文件夹中的文件或文件(可重复)
    –book* 设置一会打印一本书的时候,通常设置的选项
    –collate 打印多份副本时整理
    –cookie 设置一个额外的cookie(可重复)
    –cookie-jar 读取和写入的Cookie,并在提供的cookie jar文件
    –copies 复印打印成pdf文件数(默认为1)
    –cover* 使用HTML文件作为封面。它会带页眉和页脚的TOC之前插入
    –custom-header 设置一个附加的HTTP头(可重复)
    –debug-javascript 显示的javascript调试输出
    –default-header* 添加一个缺省的头部,与页面的左边的名称,页面数到右边,例如: --header-left ‘[webpage]’ --header-right ‘[page]/[toPage]’ --header-line
    –disable-external-links* 禁止生成链接到远程网页
    –disable-internal-links* 禁止使用本地链接
    –disable-javascript 禁止让网页执行JavaScript
    –disable-pdf-compression* 禁止在PDF对象使用无损压缩
    –disable-smart-shrinking* 禁止使用WebKit的智能战略收缩,使像素/ DPI比没有不变
    –disallow-local-file-access 禁止允许转换的本地文件读取其他本地文件,除非explecitily允许用 --allow
    –dpi 显式更改DPI(这对基于X11的系统没有任何影响)
    –enable-plugins 启用已安装的插件(如Flash
    –encoding 设置默认的文字编码
    –extended-help 显示更广泛的帮助,详细介绍了不常见的命令开关
    –forms* 打开HTML表单字段转换为PDF表单域
    –grayscale PDF格式将在灰阶产生
    –help Display help
    –htmldoc 输出程序HTML帮助
    –ignore-load-errors 忽略claimes加载过程中已经遇到了一个错误页面
    –lowquality 产生低品质的PDF/ PS。有用缩小结果文档的空间
    –manpage 输出程序手册页
    –margin-bottom 设置页面下边距 (default 10mm)
    –margin-left 将左边页边距 (default 10mm)
    –margin-right 设置页面右边距 (default 10mm)
    –margin-top 设置页面上边距 (default 10mm)
    –minimum-font-size 最小字体大小 (default 5)
    –no-background 不打印背景
    –orientation 设置方向为横向或纵向
    –page-height 页面高度 (default unit millimeter)
    –page-offset* 设置起始页码 (default 1)
    –page-size 设置纸张大小: A4, Letter, etc.
    –page-width 页面宽度 (default unit millimeter)
    –password HTTP验证密码
    –post Add an additional post field (repeatable)
    –post-file Post an aditional file (repeatable)
    –print-media-type* 使用的打印介质类型,而不是屏幕
    –proxy 使用代理
    –quiet Be less verbose
    –read-args-from-stdin 读取标准输入的命令行参数
    –readme 输出程序自述
    –redirect-delay 等待几毫秒为JS-重定向(default 200)
    –replace* 替换名称,值的页眉和页脚(可重复)
    –stop-slow-scripts 停止运行缓慢的JavaScripts
    –title 生成的PDF文件的标题(第一个文档的标题使用,如果没有指定)
    –toc* 插入的内容的表中的文件的开头
    –use-xserver* 使用X服务器(一些插件和其他的东西没有X11可能无法正常工作)
    –user-style-sheet 指定用户的样式表,加载在每一页中
    –username HTTP认证的用户名
    –version 输出版本信息退出
    –zoom 使用这个缩放因子 (default 1)

    页眉和页脚选项
    –header-center* (设置在中心位置的页眉内容)
    –header-font-name* (default Arial) (设置页眉的字体名称)
    –header-font-size* (设置页眉的字体大小)
    –header-html* (添加一个HTML页眉,后面是网址)
    –header-left* (左对齐的页眉文本)
    –header-line* (显示一条线在页眉下)
    –header-right* (右对齐页眉文本)
    –header-spacing* (设置页眉和内容的距离,默认0)
    –footer-center* (设置在中心位置的页脚内容)
    –footer-font-name* (设置页脚的字体名称)
    –footer-font-size* (设置页脚的字体大小default 11)
    –footer-html* (添加一个HTML页脚,后面是网址)
    –footer-left* (左对齐的页脚文本)
    –footer-line* 显示一条线在页脚内容上)
    –footer-right* (右对齐页脚文本)
    –footer-spacing* (设置页脚和内容的距离)
    ./wkhtmltopdf --footer-right ‘[page]/[topage]’ http://www.baidu.com baidu.pdf
    ./wkhtmltopdf --header-center ‘报表’ --header-line --margin-top 2cm --header-line http://192.168.212.139/oma/ oma.pdf
    表内容选项中
    –toc-depth* Set the depth of the toc (default 3)
    –toc-disable-back-links* Do not link from section header to toc
    –toc-disable-links* Do not link from toc to sections
    –toc-font-name* Set the font used for the toc (default Arial)
    –toc-header-font-name* The font of the toc header (if unset use --toc-font-name)
    –toc-header-font-size* The font size of the toc header (default 15)
    –toc-header-text* The header text of the toc (default Table Of Contents)
    –toc-l1-font-size* Set the font size on level 1 of the toc (default 12)
    –toc-l1-indentation* Set indentation on level 1 of the toc (default 0)
    –toc-l2-font-size* Set the font size on level 2 of the toc (default 10)
    –toc-l2-indentation* Set indentation on level 2 of the toc (default 20)
    –toc-l3-font-size* Set the font size on level 3 of the toc (default 8)
    –toc-l3-indentation* Set indentation on level 3 of the toc (default 40)
    –toc-l4-font-size* Set the font size on level 4 of the toc (default 6)
    –toc-l4-indentation* Set indentation on level 4 of the toc (default 60)
    –toc-l5-font-size* Set the font size on level 5 of the toc (default 4)
    –toc-l5-indentation* Set indentation on level 5 of the toc (default 80)
    –toc-l6-font-size* Set the font size on level 6 of the toc (default 2)
    –toc-l6-indentation* Set indentation on level 6 of the toc (default 100)
    –toc-l7-font-size* Set the font size on level 7 of the toc (default 0)
    –toc-l7-indentation* Set indentation on level 7 of the toc (default 120)
    –toc-no-dots* Do not use dots, in the toc
    轮廓选项
    –dump-outline 转储目录到一个文件
    –outline 显示目录(文章中h1,h2来定)
    –outline-depth 设置目录的深度(默认为4)
    页脚和页眉

    • [page] 由当前正在打印的页的数目代替
    • [frompage] 由要打印的第一页的数量取代
    • [topage] 由最后一页要打印的数量取代
    • [webpage] 通过正在打印的页面的URL替换
    • [section] 由当前节的名称替换
    • [subsection] 由当前小节的名称替换
    • [date] 由当前日期系统的本地格式取代
    • [time] 由当前时间,系统的本地格式取代
      ./wkhtmltopdf --footer-right ‘[page]/[topage]’ http://www.baidu.com baidu.pdf
      ./wkhtmltopdf --header-center ‘报表’ --outline --header-line --margin-top 2cm --header-line http://www.hao123.com/ hao123.pdf
      ./wkhtmltopdf --header-left ‘[webpage]’ --footer-center ‘测试([page]/[toPage])’ http://www.baidu.com baidu.pdf
    展开全文
  • Python-在线网页导出图片或pdf

    千次阅读 2020-04-08 17:55:12
    而图片是由一堆二进制数据组成的,我们该如何将网页显示的内容导出我们想要的图片或者pdf呢?博主闲极无聊逛遍github,发现了一个有趣的库pyppeteer,它实现了我所需要导出需求。接下来我们来看看它是怎么操作的...

    我们都知道一个正常的网页,是由html+css+js组成,而其本质是一段段代码编写编译而来的。而图片是由一堆二进制数据组成的,我们该如何将网页上显示的内容导出为我们想要的图片或者pdf呢?博主闲极无聊逛遍github,发现了一个有趣的库pyppeteer,它实现了我所需要导出需求。接下来我们来看看它是怎么操作的:

    安装所需要的库

    pip install pillow
    pip install reportlab
    pip install pyppeteer
    

    导出为图片

    import os
    import asyncio
    from pyppeteer import launch
    
    async def save_image(url, img_path):
        """
        导出图片
        :param url: 在线网页的url
        :param img_path: 图片存放位置
        :return: 
        """
        browser = await launch()
        page = await browser.newPage()
        # 加载指定的网页url
        await page.goto(url)
        # 设置网页显示尺寸
        await page.setViewport({'width': 1920, 'height': 1080})
        '''
        path: 图片存放位置
        clip: 位置与图片尺寸信息
            x: 网页截图的x坐标
            y: 网页截图的y坐标
            width: 图片宽度
            height: 图片高度
        '''
        await page.screenshot({'path': img_path, 'clip': {'x': 457, 'y': 70, 'width': 730, 'height': 2600}})
        await browser.close()
        
    if __name__ == '__main__':
        url = "https://www.jianshu.com/p/13dadc463f40"
        img_path = os.path.join(os.getcwd(), "example.png")
        loop = asyncio.get_event_loop()
        loop.run_until_complete(save_image(url, img_path))
    

    执行完毕之后,不出意外的情况下,将会在当前目录下生成一个名为example.png的文件,那就是我们导出的图片文件!

    整页导出为pdf

    import os
    import asyncio
    from pyppeteer import launch
    
    async def save_pdf(url, pdf_path):
        """
        导出pdf
        :param url: 在线网页的url
        :param pdf_path: pdf存放位置
        :return: 
        """
        browser = await launch()
        page = await browser.newPage()
        # 加载指定的网页url
        await page.goto(url)
        # 设置网页显示尺寸
        await page.setViewport({'width': 1920, 'height': 1080})
        '''
        path: 图片存放位置
        width: 纸张宽度,带单位的字符串
        height: 纸张高度,带单位的字符串
        '''
        await page.pdf({'path': pdf_path, 'width': '730px', 'height': '2600px'})
        await browser.close()
        
    if __name__ == '__main__':
        url = "https://www.jianshu.com/p/13dadc463f40"
        pdf_path = os.path.join(os.getcwd(), "example.pdf")
        loop = asyncio.get_event_loop()
        loop.run_until_complete(save_pdf(url, pdf_path))
    

    执行完毕之后,不出意外的情况下,将会在当前目录下生成一个名为example.pdf的文件,那就是我们导出的pdf文件!不过这种导出有一种弊端,它是将整个网页导出为pdf,无法像图片那样支持位置参数,可以截取部分区域进行导出!因此,我对代码进行修改了一下,请看下面的"区域导出为pdf"!

    区域导出为pdf

    import os
    import asyncio
    from io import BytesIO
    from PIL import Image
    from pyppeteer import launch
    from reportlab.pdfgen.canvas import Canvas
    from reportlab.lib.utils import ImageReader
    
    async def save_pdf(url, pdf_path):
        """
        导出pdf
        :param url: 在线网页的url
        :param pdf_path: pdf存放位置
        :return: 
        """
        browser = await launch()
        page = await browser.newPage()
        # 加载指定的网页url
        await page.goto(url)
        # 设置网页显示尺寸
        await page.setViewport({'width': 1920, 'height': 1080})
        '''
        clip: 位置与图片尺寸信息
            x: 网页截图的x坐标
            y: 网页截图的y坐标
            width: 图片宽度
            height: 图片高度
        '''
        img_data = await page.screenshot({'clip': {'x': 457, 'y': 70, 'width': 730, 'height': 2600}})
        im = Image.open(BytesIO(img_data))
        page_width, page_height = im.size
        c = Canvas(pdf_path, pagesize=(page_width, page_height))
        c.drawImage(ImageReader(im), 0, 0)
        c.save()
        
    if __name__ == '__main__':
        url = "https://www.jianshu.com/p/13dadc463f40"
        pdf_path = os.path.join(os.getcwd(), "example.pdf")
        loop = asyncio.get_event_loop()
        loop.run_until_complete(save_pdf(url, pdf_path))
    

    如此,我们就可以进行区域截取导出pdf文件了!

    值得注意的时,由于网络、配置以及一切不可控因素,上面几种方法都会有一定程度的出现导出错误,所以建议加上重试机制!

    更多pyppeteer操作请看:https://github.com/miyakogi/pyppeteer

    自此,Over~~~

    展开全文
  • Python抓取网页并保存为PDF

    万次阅读 2017-03-31 14:00:37
    抓取HTML文档,转化成PDF文档
  • 在浏览CSDN上某些干货满满的文章时,我们经常会想将其下载至本地然后反复学习,这时便可以通过浏览器自带的打印功能进行网页保存,但是往往在保存时得不到想要的效果。 问题描述: 本来想以PDF格式将自己的博文保存...
  • 使用wkhtmltopdf把网页转换为pdf

    千次阅读 2018-07-09 13:49:40
    最近项目上需要做一个在线合同的功能,合同有电子版,需要把网页版的合同直接生产pdf,要求样式不能乱,有页码有页眉页脚等等,在网上搜索一段时间后,找到了一个工具叫: wkhtmltopdf ,这应该是国外的一款免费软件...
  • 使用wkhtmltopdf把网页转换为pdf的经验总结

    万次阅读 热门讨论 2017-03-02 14:32:12
    最近项目上需要做一个在线合同的功能,合同有电子版,需要把网页版的合同直接生产pdf,要求样式不能乱,有页码有页眉页脚等等,在网上搜索一段时间后,找到了一个工具叫: wkhtmltopdf ,这应该是国外的一款免费软件,...
  • 还有其它经常设置的文件类型:Application/msword Microsoft Word Document application/pdf PDF Documentapplication/wordperfect6.0 WordPerfect 6.0 Documentapplication/zip ZIP archiveaudio/x-wav WAV audio ...
  • Swift 显示浏览 pdf 文件

    千次阅读 2017-10-17 11:21:17
    webView显示pdf文件在开发中,我们可以用文本view加载pdf文件,这个直接加就可以了。使用CoreGraphics绘制pdf内容 import UIKit import CoreGraphics class PDFView: UIView { var document:CGPDFDocument! var ...
  • 一、前言 在开发PDF电子签名时,需要在用pdf.js显示pdf文件,用shu'bi
  • pdf页面显示兼容问题

    2019-05-31 15:13:32
    没有测兼容的时候用的是HTML5标签 embed 但是问也也就出现了,在IE和360浏览器中不现实pdf文件,所以只能作罢,换了另一种方式,引入插件vue-pdf 兼容问题解决。 首先引入插件, npm install --save vue-pdf 在...
  • Python抓取HTML网页并以PDF保存

    万次阅读 2017-03-27 16:36:33
    今天介绍将HTML网页抓取下来,然后以PDF保存,废话不多说直接进入教程。 今天的例子以廖雪峰老师的Python教程网站例:http://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000 二...
  • linux PPT(X)转PDF

    千次阅读 2016-11-29 16:58:13
    PPT转PDF是很常见的需求,可以用于将PPT转化成PDF显示网页之中 (PDF转JPG:点击打开链接) 使用libreoffice可以很好的解决这个问题 # yum install libreoffice然后通过命令 # soffice --headless --convert...
  • 300操作说明pdf,西门子以太网交换机SCALANCE X-300操作说明:本下载的主要介绍内容有以太网交换机SCALANCE X-300的安全说明、简介、网络拓扑,交换机SCALANCE X-300的设备描述、安装、连接、组态、显示显示元件,...
  • 应项目需求要把PDF内嵌到网页显示,其中有了很多办法,比如用元素放入PDF文件,但是效果不理想,浏览器兼容不理想,在ie9/8(其他版本没有测试)显示会提示下载pdf文件。当然这不是我想要的效果,这种做法可以轻易...
  • PDF-XChange Editor能替代Adobe Reader功能,比任何其他免费的PDF阅读器、查看器和编辑器更小,但功能更加丰富,支持用户在评价模式尝试使用PDF-Xchange免费提供的扩展功能。 点击下载最新版的PDF-XChange Editor ...
  • Python 爬取网页内容,转成PDF

    千次阅读 2017-05-03 13:59:07
    将廖雪峰的学习教程转换成PDF文件,代码只适合该网站,如果需要其他网站的教程,可靠需要进行稍微的修改。# coding=utf-8 import os import re import time import pdfkit import requests from bs4 import ...
  • 今天用 VSCode Markdown 写笔记导出 PDF 后发现编译时正常格式的公式导出后却无法显示出来,这是什么原因呢,上网浏览了一圈,找到了解决方法。 解决办法 1. 找到如下位置的 template.html 文件 Mac: /Users/...
  • 在 Vue 中,将 html 内容导出 PDF 为了使横向滚动条的内容全部展示,需要指定 width: document.getElementById(id).scrollWidth。 <div ref="myContainer"> <!-- 我是需要导出的内容 --> </div&...
  • wkhtmltopdf,wkhtmltoimage是开源命令行工具,使用Qt WebKit渲染引擎将HTML呈现为PDF和各种图像格式。 官网: https://wkhtmltopdf.org/ github: https://github.com/wkhtmltopdf/wkhtmltopdf/issues 2、前端...
  • 如何减少PDF文件的大小,为pdf瘦身?

    万次阅读 2014-04-30 10:45:42
    如何减少PDF文件的大小,为pdf瘦身? WORD转换成PDF后发现pdf挺大的,为了不改变pdf内容,且尽量不改变质量,使用Adobe Acrobat的“另存”功能,可能减少PDF的大小,这是个非常实用的技巧,可以避免我们的PDF...
  • mvc在页面上显示PDF

    千次阅读 2014-05-08 15:25:44
    天看到需求要在页面上显示pdf,自己整了半天,啥效果都没有,偶尔有效果还各种不兼容,很无语的说。捣鼓了半天,没办法了,去谷歌了下,介绍了各种插件,各种方法,但是都挺繁琐的,本人不是一个很喜欢使用插件的,...
  • 最近Microsoft Edge 打不开PDF文件和网页,用了一个简单高效的方法。 1.键盘操作Win+X,或右击【开始】键; 2.选择“命令提示符(管理员)”; 3.在弹出的框中输入下列代码:“Netsh winsock reset” ,回车,按提示...
  • 本文实例讲述了Python实现抓取HTML网页并以PDF文件形式保存的方法。分享给大家供大家参考,具体如下: 一、前言 今天介绍将HTML网页抓取下来,然后以PDF保存,废话不多说直接进入教程。 二、准备工作 PyPDF2的安装...
  • 本文主要介绍小程序中从后台返回显示pdf文件的两种方法 情况一:后台直接给了一个pdf地址 使用wx.downloadFile会发起get请求,下载文件资源到本地,wx.openDocument打开 // An highlighted block export const ...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 19,681
精华内容 7,872
热门标签
关键字:

网页pdf显示为x