精华内容
下载资源
问答
  • python 网页转pdf

    2019-02-21 20:29:00
    主要使用的是wkhtmltopdf的Python封装——pdfkit centos环境 安装:Install python-pdfkit pip install pdfkit 安装:Install wkhtmltopdf yum intsall wkhtmltopdf windows环境下安装wkhtmltopdf参考...

    主要使用的是wkhtmltopdf的Python封装——pdfkit

    centos环境

    安装:Install python-pdfkit

    pip install pdfkit

    安装:Install wkhtmltopdf

    yum intsall wkhtmltopdf

    windows环境下安装wkhtmltopdf参考这篇文章:

    http://blog.csdn.net/qq_14873105/article/details/51394026


    Linux环境下安装wkhtmltopdf参考这篇文章:
    http://blog.csdn.net/mr_zing/article/details/52833461


    使用:
    import   pdfkit
    pdfkit.from_string('hello,python','out.pdf') #通过文本直接进行转换
    pdfkit.from_url('http://baidu.com','out.pdf') #通过网址进行转换
    pdfkit.from_file('test.html', 'out.pdf') #通过html文件进行转换

    我们也可以传递一个url或者文件名列表:

    pdfkit.from_url(['google.com', 'yandex.ru', 'engadget.com'], 'out.pdf') pdfkit.from_file(['file1.html', 'file2.html'], 'out.pdf')

    也可以传递一个打开的文件:

    with open('file.html') as f:
        pdfkit.from_file(f,'out.pdf') 

    如果想对生成的PDF作进一步处理,我们可以将其读取到一个变量中:

    #设置输出文件为False,将结果赋给一个变量
    pdf = pdfkit.form_url('http://google.com', False)

    我们可以制定所有的 wkhtmltopdf 选项 http://wkhtmltopdf.org/usage/wkhtmltopdf.txt. 我们可以移除选项名字前面的 '--' .如果选项没有值, 使用None, Falseor * 作为字典值:

    options = {
     'page-size': 'Letter',
     'margin-top': '0.75in',
     'margin-right': '0.75in',
     'margin-bottom': '0.75in',
     'margin-left': '0.75in',
     'encoding': "UTF-8",
     'no-outline': None
     } 
    pdfkit.from_url('http://google.com', 'out.pdf', options=options)

    默认情况下, PDFKit 将会显示所有的 wkhtmltopdf 输出. 如果不想看到这些信息,你需要传递一个 quiet 选项:

    options = {
     'quiet': ''
     } 
     pdfkit.from_url('google.com', 'out.pdf', options=options)

     

    由于wkhtmltopdf的命令语法 , TOC 和 Cover 选项必须分开指定:

    toc = {
     'xsl-style-sheet': 'toc.xsl'
     } 
    cover = 'cover.html' 
    pdfkit.from_file('file.html', options=options, toc=toc, cover=cover)

    当我们转换文件、或字符串的时候,可以通过css选项指定扩展的 CSS 文件。

    # 单个 CSS 文件 
    css = 'example.css' 
    pdfkit.from_file('file.html', options=options, css=css) 
    # Multiple CSS files 
    css = ['example.css', 'example2.css'] 
    pdfkit.from_file('file.html', options=options, css=css)

    也可以通过HTML中的meta tags传递任意选项:

    body = """
            <html>
              <head>
                <meta name="pdfkit-page-size" content="Legal"/>
                <meta name="pdfkit-orientation" content="Landscape"/>
              </head>
              Hello World!
              </html>
            """ 
    pdfkit.from_string(body, 'out.pdf') #with --page-size=Legal and --orientation=Landscape

     


    转载地址:https://www.jianshu.com/p/44ec7a83adcb


    转载于:https://www.cnblogs.com/yc-c/p/10415058.html

    展开全文
  • python网页转PDF

    2017-05-27 10:28:57
    下载wkhtmltopdf(wkhtmltox-0.12.4_msvc2015-win32.exe)并安装,下载地址:https://wkhtmltopdf.org/downloads.html(ps:注意选择跟python版本位数一致的下载) 2.利用pdfkit进行转换操作: import pdfk

    1.前期准备:

    使用pip install pdfkit安装pdfkit第三方依赖库;

    下载wkhtmltopdf(wkhtmltox-0.12.4_msvc2015-win32.exe)并安装,下载地址:https://wkhtmltopdf.org/downloads.html(ps:注意选择跟python版本位数一致的下载)

    2.利用pdfkit进行转换操作:

    import pdfkit
    
    pdfkit.from_url('http://google.com', 'out.pdf') # 从地址
    pdfkit.from_file('test.html', 'out.pdf') # 从文件
    pdfkit.from_string('Hello!', 'out.pdf') # 从字符串
    展开全文
  • python网页转pdf

    2020-05-29 22:56:23
    文章目录1、安装pdfkit2、安装wkhtmltopdf.exe3、配置环境变量3、代码区 1、安装pdfkit 我用的是pycharm直接setting里面,点右侧的加号,搜索pdfkit,安装即可 2、安装wkhtmltopdf.exe ...pdf ...

    1、安装pdfkit

    • 我用的是pycharm直接setting里面,点右侧的加号,搜索pdfkit,安装即可

    在这里插入图片描述
    在这里插入图片描述

    2、安装wkhtmltopdf.exe

    快速下载地址

    3、配置环境变量

    在系统变量的path中添加安装路径
    在这里插入图片描述

    4、代码区

    import pdfkit
    
    path_wk = r'D:\ProgramFiles\wkpdf\wkhtmltopdf\bin\wkhtmltopdf.exe' #安装位置
    config = pdfkit.configuration(wkhtmltopdf = path_wk)
    url='https://wenku.baidu.com/view/d4c214b802d8ce2f0066f5335a8102d277a26154'
    pdfkit.from_url( url,r'D:\study.pdf', configuration=config)
    

    运行结果如下:
    在这里插入图片描述

    在这里插入图片描述

    小妙招:cmd命令中直接输入wkhtmltopdf+url+位置+文件名(如下,注意有空格哦)
    在这里插入图片描述
    Nothing is diffcult if you put your heart into it !

    展开全文
  • 主要为大家详细介绍了python爬取网页转换为PDF文件,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
  • Python 2 and 3 wrapper for wkhtmltopdf utility to convert HTML to PDF using Webkit. 安装: pip install pdfkit 即可安装(https://blog.csdn.net/qq_35865125/article/details/106176741 )。 Note: 该...


    Pdfkit

    (https://pypi.org/project/pdfkit/ )

    Python 2 and 3 wrapper for wkhtmltopdf utility to convert HTML to PDF using Webkit. pdfkit只是对wkhtmltopdf 的包装,其会去调用可执行文件wkhtmltopdf 来完成任务处理。

    安装:

    pip install pdfkit 即可安装(https://blog.csdn.net/qq_35865125/article/details/106176741 )。

    如果你用的是python3,则pip3 install pdfkit

    Note:

    该工具包是对wkhtmltopdf 的wrapper, 调用该包的函数时,例如 pdfkit.from_url('http://google.com', 'out.pdf'),需要依赖于wkhtmltopdf ,

    需要在系统中安装wkhtmltopdf(https://wkhtmltopdf.org/downloads.html), 安装后需要添加到系统路径中。windows下可以直接下载安装包,linux下可以直接 sudo apt-get install wkhtmltopdf . 

    新增环境变量后重启一下pyCharm或命令行窗口哦

     

    例子:
    https://pypi.org/project/pdfkit/ :

    import pdfkit
    
    pdfkit.from_url('http://google.com', 'out.pdf')
    pdfkit.from_file('test.html', 'out.pdf')
    pdfkit.from_string('Hello!', 'out.pdf')

    关于wkhtmltopdf

    https://wkhtmltopdf.org/

    wkhtmltopdf and wkhtmltoimage are open source (LGPLv3) command line tools to render HTML into PDF and various image formats using the Qt WebKit rendering engine. These run entirely "headless" and do not require a display or display service.

    There is also a C library, if you're into that kind of thing.

     

    pdfkit的python代码

    pdfkit是对可执行文件的wrapper,从而可以提供一种调用第三方可执行文件的方案啊。

    查看源码:

    打开python终端,执行:

    import pdfkit

    help(pdfkit)

    通过FILE可以定位到代码目录:

    api.py文件中定义了经常调用的函数:

     from_string,  from_file等。

    def from_file(input, output_path, options=None, toc=None, cover=None, css=None,
                  configuration=None, cover_first=False):
        """
        Convert HTML file or files to PDF document
    
        :param input: path to HTML file or list with paths or file-like object
        :param output_path: path to output PDF file. False means file will be returned as string.
        :param options: (optional) dict with wkhtmltopdf options, with or w/o '--'
        :param toc: (optional) dict with toc-specific wkhtmltopdf options, with or w/o '--'
        :param cover: (optional) string with url/filename with a cover html page
        :param css: (optional) string with path to css file which will be added to a single input file
        :param configuration: (optional) instance of pdfkit.configuration.Configuration()
        :param configuration_first: (optional) if True, cover always precedes TOC
    
        Returns: True on success
        """
    
        r = PDFKit(input, 'file', options=options, toc=toc, cover=cover, css=css,
                   configuration=configuration, cover_first=cover_first)
    
        return r.to_pdf(output_path)

    该函数内部先生成一个PDGKit类的对象,然后使用该对象完成操作。

    class PDFKit定义位于pdfkit.py,如下图,该类的成员wkhtmltopdf应该就是对应被wrapp的whtmltopdf。 成员configuration负责找到whtmltopdf.

     

    class Configuration类使用subproess函数启用电脑中已经安装的wkhtmltopdf可执行文件::


    python subprocess函数

    从python2.4版本开始,可以用subprocess这个模块来产生子进程,并连接到子进程的标准输入/输出/错误中去,还可以得到子进程的返回值。
    subprocess意在替代其他几个老的模块或者函数,比如:os.system os.spawn* os.popen* popen2.* commands.*

    展开全文
  • python之html网页转PDF

    千次阅读 2019-08-01 09:49:21
    接上一篇,博主目前所要做的任务,除了要将图片pdf外,可能还需要根据爬去站点的内容来合成一篇pdf格式文章, python中是能够做到这一点的,当然这个前提你要手写html的head,然后将爬取下的内容(注:内容为...
  • 1 import pdfkit 2 import requests 3 from bs4 import BeautifulSoup 4 from PIL import Image ... 5 from pdf2image import convert_from_path 6 7 8 def main(): 9 header={ 10 ...
  • Python的第三方库pdfkit,可以将网页、html文件以及字符串生成pdf文件。 安装相关依赖库 1.python版本 3.x,在命令行输入pip install pdfkit 2.安装wkhtmltopdf.exe文件 下载地址:wkhtmltopdf 选择自己电脑的符合...
  • gitbook2pdf:一个轻量级gitbook网页转pdf的小工具
  • PS:如果你处于想学Python或者正在学习PythonPython的教程不少了吧,但是是最新的吗?说不定你学了可能是两年前人家就学过的内容,在这小编分享一波2020最新的Python教程。获取方式,私信小编 “ 资料 ”,即可...
  • 主要为大家详细介绍了python爬取网页内容转换为PDF文件,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
  • 前言 本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们...度娘搜了下,很多博客推荐Python的第三方库pdfkit,可以将网页、html文件以及字符串生成pdf文...
  • 保存网页手动生成一下,需要图片转PDF的小工具。 结果搜半天,搜到一个一次只支持5张图片,有这功夫我放word里就转了。 我文件夹下有600多张图片,生产PDF。全选放word里,竟然是倒序,不知道怎么排序,也许可以...
  • 主要介绍了Python中使用PyQt把网页转换成PDF操作代码实例,本文直接给出实现代码,需要的朋友可以参考下
  • 解决办法: 代码中设置参数: path_wk = r‘D:\Program Files\wkhtmltopdf\bin\wkhtmltopdf.exe‘ #wkhtmltopdf安装位置 config = pdfkit....最后执行转pdf操作 pdfkit.from_string("hello world","...
  • 在windows下: 第一步:pip install pdfkit 第二步:wkhtmltopdf ...pdfkit.from_url(url,'不告而取即为偷,当面强拿则为抢.pdf')  测试成功!              
  • python将HTML转PDF

    千次阅读 2016-02-28 11:59:08
    使用python网页转PDF。 想学习python某个模块,但是官网并不提供PDF版本,只有在线的网页说明文档,于是想将这些网页都下载下来然后转成pdf保存。这里主要用到pdfkit包,前提是电脑安装了wkhtmltox软件。也就是说...
  • python 实现html转pdf

    2021-04-13 11:24:45
    将 HTML 网页转换为 PDF 是很多人常见的一个需求,在浏览器上,我们可以通过浏览器的“打印”功能直接将网页打印输出为 PDF。 但是如果有多个网页就不好办了。 二进制软件 网络上存在很多将 HTML 转换为 PDF 的软件...
  • 表格或者图表后截图保存为PDF或图片,发送到通讯软件中 GEO程序的开发,可以把地图和上面的自定义标记截图下来,以图片形式嵌入到自己应用中,这样就不需要集成地图SDK了 网站的定期自动化快照,可以保留网站变化...
  • Python爬取网页转为PDF

    2018-05-31 09:55:45
    爬虫的起因官方文档或... 全篇的实现思路分析网页学会使用BeautifulSoup库爬取并导出参考资料: * 把廖雪峰的教程转换为PDF电子书 * Requests文档 * Beautiful Soup文档配置在Ubuntu下使用Pycharm运行成功 ...
  • 教程链接: https://my.oschina.net/liuzhijun/blog/835268 代码: github: https://github.com/lzjun567/crawler_html2pdf
  • Python 转换HTML到PDF

    2021-04-15 14:13:38
    可以从网页、文件、字符串转换。 import pdfkit pdfkit.from_url('http://google.com', 'out.pdf') pdfkit.from_file('test.html', 'out.pdf') pdfkit.from_string('Hello!', 'out.pdf') 批量转换 pdfki
  • 有的网页查看起来不是很方便,于是就想到了,pdf转下来慢慢看? 先看下成果图哈 最终效果就是这样子,感觉是不是很炫酷,哈哈哈 一、安装必要软件 wkhtmltopdf,这个工具的下载网站是:点这里 感觉下载慢
  • Python 更合适了,Python 社区提供的爬虫工具多得让你眼花缭乱,各种拿来就可以直接用的 library 分分钟就可以写出一个爬虫出来,今天就琢磨着写一个爬虫,将廖雪峰的 Python 教程 爬下来做成 PDF 电子书方便大家...
  • Python 爬取网页内容,PDF

    千次阅读 2017-05-03 13:59:07
    将廖雪峰的学习教程转换成PDF文件,代码只适合该网站,如果需要其他网站的教程,可靠需要进行稍微的修改。# coding=utf-8 import os import re import time import pdfkit import requests from bs4 import ...

空空如也

空空如也

1 2 3 4 5 ... 9
收藏数 169
精华内容 67
关键字:

python网页转pdf

python 订阅