-
2021-01-21 23:25:41
最近任务要实现将在线简历导出生成PDF文件下载,get了新知识点,记录下。
将网页内容导出成PDF可以从两个方面实现:
1、前端实现
前端实现在github上搜索后,找到了一个还不错的例子,使用的是jsPDF这些工具包实现的。
有一篇写的不错的博文,详细介绍了前端控制页面生成pdf的方式:html导出pdf的四种方式 - 谁将新樽辞旧月,今月曾经照古人 - 博客园 (cnblogs.com)
github上也有一个可以跑起来的例子,感觉还不错,说明也很完整:linwalker/render-html-to-pdf: render the webpages to pdf and downlowd (github.com)
2、后端实现
我使用的是php后台,所以这里只查阅了相关php后台生成pdf的方法,比较常用的是tcpdf和mpdf两个工具包,但总的来说,mpdf对于网页表格的支撑更好一些,所以选择了使用mpdf
关于mpdf的具体使用,在我的另外一篇博文里已经记录了(mpdf使用踩坑总结_进阶的博客-CSDN博客),这里不再赘述。
记录一下原理:前端将要生成pdf的html节点传给后台php,php再调用mpdf的方法,将html写入pdf中,并实现保存、打印、下载等功能。mpdf还支持单独引入网页的css文件,总体来说使用比较方便,调用语句简单,只不过css样式支持时好时坏,有些支持有些就无效,应该是mpdf本身仍然存在的bug导致,但现在看github上还有人在提issue,估计这些bug以后会逐步得到解决。
更多相关内容 -
C#网页导出PDF文件
2018-12-22 11:44:46用wkhtmltopdf把网页导为PDF文件,代码测试过了,下载用VS2010可以直接运行使用。 -
网页导出为PDF插件(html2canvas 和 jsPDF)
2021-11-01 16:50:52网页导出为PDF插件(html2canvas 和 jsPDF)网页导出为PDF插件(html2canvas 和 jsPDF)网页导出为PDF插件(html2canvas 和 jsPDF)网页导出为PDF插件(html2canvas 和 jsPDF) -
js网页表格导出excel文件代码
2021-07-24 23:44:54js网页表格导出excel文件代码是一款基于js实现的网页table表格导出Excel文件代码。 -
print-demo:前端开发打印当前网页的指定区域内容,或将网页导出为多页的PDF
2021-05-31 09:14:22功能:网页打印插件,支持打印或不打印指定区域,同时支持将网页导出为pdf。 已实现: 原生js书写,不依赖其他库 可指定打印(或不打印)的区域 支持定制css,内联、外联均可 支持select、input(text、redio、... -
PHP中将网页导出为Word文档的代码
2020-10-28 01:26:16今天要探讨的是PHP网页导出Word文档的方法,使用其他语言的朋友也可以参考,因为原理是差不多的 -
(将html网页导出excel表格数据库)如何将网页表格导出到excel
2021-06-28 08:26:19如何把Html网页格式转成Excel表格1、单击数据--导入外部数据--新建Web查询。2、勾选我识别此内容,允许播放,单击继续...怎样将html表格导出到excel中啊?我用的是asp.net。一下这个,哈哈http://www.php100.com/ht...如何把Html网页格式转成Excel表格
1、单击数据--导入外部数据--新建Web查询。
2、勾选我识别此内容,允许播放,单击继续按钮。
3、址栏输入网站地址,转到此网站里面。
4、跳转到指定网页,点击箭头按钮,然后导入数据到Excel。
Excel表格生成数据,至此完成全部过程。
怎样将html表格导出到excel中啊?我用的是asp.net。
一下这个,哈哈
http://www.php100.com/html/webkaifa/javascript/2009/0418/1528.html
如何将网页中的表格快速复制到EXCEL中
这个程序吧,
htt==ps://it365.gitlab.io/zh-cn/table-to-excel/?d59568
上面的链接有点问题,你先复制了,粘贴到浏览器地,把前面的htt==ps改为https再进去。
怎呢?
简单的说:
1、把网页的全选(Ctrl A)、复制、粘贴到这个程序
2、在这个程序中就能直接下载Excel电子表格文件了(实际上就是快速把网页表格转换成Excel文件)
截图:
比如,把示例数据,复制到程序的输入框:
程序自动检测到表格内容,会显示下载按钮:
就是这么简答了。
网页表格已经转换为Excel了,想快速复制或者插入到另一个Excel,也是非常简单了。
希望能帮到你。
如何将网页表格导出到excel
小编这个例子是网页中关2014年高考投档情况的一个汇总表过在网页中,如图,我们可到共计是分成了17个网页,看着就有些烦躁。
如图,我们可以直接把鼠标放到表格处,右击,选择导出到excel中即可。
如图,这就是导出的excel,一直导出。
将导出的经验进行整理,如图,整理到一个文件夹中。
然后就可以参照小编的这一篇经验将所有的excel工作薄合并成一个即可。
当然,至于弄成word版的就直接复制excel里面粘贴就好了,记得粘贴的时候在excel中提前准备规划好,别学小编下图中弄的这么丑就行。
当然,小编举得这个例子中,还有个更便捷有效的法子,就是Ctrl A,Ctrl C,Ctrl V,不过这个法子貌似不够高大上嘛。
图解看经验http://jingyan.baidu.com/article/cb5d61050c90e6005d2fe054.html
-
《网页 导出到 excel表格数据》 如何将网页表格导出到excel
2021-06-27 12:33:50如何将网页数据输出为Excel或Word文件1、保页在浏览器中访标网页,执行菜单“文件”→“另”,文件类型“网页,全部”。2、用WPS文字打开html文件执行“文件”→“打开”,文件类型选择“网页文件”或“所有文件”,...如何将网页数据输出为Excel或Word文件
1、保页
在浏览器中访标网页,执行菜单“文件”→“另”,文件类型“网页,全部”。
2、用WPS文字打开html文件
执行“文件”→“打开”,文件类型选择“网页文件”或“所有文件”,以打开刚才下载得到的《[征稿八]怎样用WPS制作PDF》html文件。
3、去掉不需要的部分
注:表格形式出现的正文,可以选中后执行“表格”→“转换”→“表格转换为文本”去除表格外框。
4、最后另存为WPS文档或WORD文档即可。
怎么才能把网页上的表格完整的复制到excel表格中
按,文件→使用word编辑,就可以打开他的网页了.
如果还不行,你就按,文件→另存为,然后回到保存的目录去编辑他就可以了.
如何将网页表格导出到excel
1、首先,在我们的电脑开excel2007这件,其主界面如下图,我以看到格式栏和2003版有很大的
2、之后就会跳转到新的页面,我们可以在此网页的地址栏输入要导出数据的网站地址,系统默认的是当前浏览器的默认主页地址
3、然后我们依旧在此页面下,分别点击网站左上角的右箭头图标,然后选择右下角的“导入”
4、然后点击确定,过几秒钟时间,该网站的所有文字内容就全部导入到此excel表格了,接下来我们可以自行复制或者编辑
如何把网页数据保存到EXCEL
首先,在我们的电脑上打开excel2007这款软件,其面如下图
然后依次点击工具栏的“数据”——“获取外部数据”,然后在选项里我们选择“自网站”,如下图。
之后就会跳转到新的页面,我们可以在此网页的地址栏输入要导出数据的网站地址,系统默认的是当前浏览器的默认主页地址
然后我们依旧在此页面下,分别点击网站左上角的右箭头图标,然后选择右下角的“导入”
然后会要求我们选择导入到的表格位置,可以使目前默认的表格,也可以新建一个表格,如果当前的表格时空白的,选择“现有工作表”即可
然后点击确定,过几秒钟时间,该网站的所有文字内容就全部导入到此excel表格了,接下来我们可以自行复制或者编辑
-
Python-在线网页导出为图片或pdf
2020-04-08 17:55:12而图片是由一堆二进制数据组成的,我们该如何将网页上显示的内容导出为我们想要的图片或者pdf呢?博主闲极无聊逛遍github,发现了一个有趣的库pyppeteer,它实现了我所需要导出需求。接下来我们来看看它是怎么操作的...我们都知道一个正常的网页,是由html+css+js组成,而其本质是一段段代码编写编译而来的。而图片是由一堆二进制数据组成的,我们该如何将网页上显示的内容导出为我们想要的图片或者pdf呢?博主闲极无聊逛遍github,发现了一个有趣的库
pyppeteer
,它实现了我所需要导出需求。接下来我们来看看它是怎么操作的:安装所需要的库
pip install pillow pip install reportlab pip install pyppeteer
导出为图片
import os import asyncio from pyppeteer import launch async def save_image(url, img_path): """ 导出图片 :param url: 在线网页的url :param img_path: 图片存放位置 :return: """ browser = await launch() page = await browser.newPage() # 加载指定的网页url await page.goto(url) # 设置网页显示尺寸 await page.setViewport({'width': 1920, 'height': 1080}) ''' path: 图片存放位置 clip: 位置与图片尺寸信息 x: 网页截图的x坐标 y: 网页截图的y坐标 width: 图片宽度 height: 图片高度 ''' await page.screenshot({'path': img_path, 'clip': {'x': 457, 'y': 70, 'width': 730, 'height': 2600}}) await browser.close() if __name__ == '__main__': url = "https://www.jianshu.com/p/13dadc463f40" img_path = os.path.join(os.getcwd(), "example.png") loop = asyncio.get_event_loop() loop.run_until_complete(save_image(url, img_path))
执行完毕之后,不出意外的情况下,将会在当前目录下生成一个名为
example.png
的文件,那就是我们导出的图片文件!整页导出为pdf
import os import asyncio from pyppeteer import launch async def save_pdf(url, pdf_path): """ 导出pdf :param url: 在线网页的url :param pdf_path: pdf存放位置 :return: """ browser = await launch() page = await browser.newPage() # 加载指定的网页url await page.goto(url) # 设置网页显示尺寸 await page.setViewport({'width': 1920, 'height': 1080}) ''' path: 图片存放位置 width: 纸张宽度,带单位的字符串 height: 纸张高度,带单位的字符串 ''' await page.pdf({'path': pdf_path, 'width': '730px', 'height': '2600px'}) await browser.close() if __name__ == '__main__': url = "https://www.jianshu.com/p/13dadc463f40" pdf_path = os.path.join(os.getcwd(), "example.pdf") loop = asyncio.get_event_loop() loop.run_until_complete(save_pdf(url, pdf_path))
执行完毕之后,不出意外的情况下,将会在当前目录下生成一个名为
example.pdf
的文件,那就是我们导出的pdf文件!不过这种导出有一种弊端,它是将整个网页导出为pdf,无法像图片那样支持位置参数,可以截取部分区域进行导出!因此,我对代码进行修改了一下,请看下面的"区域导出为pdf"!区域导出为pdf
import os import asyncio from io import BytesIO from PIL import Image from pyppeteer import launch from reportlab.pdfgen.canvas import Canvas from reportlab.lib.utils import ImageReader async def save_pdf(url, pdf_path): """ 导出pdf :param url: 在线网页的url :param pdf_path: pdf存放位置 :return: """ browser = await launch() page = await browser.newPage() # 加载指定的网页url await page.goto(url) # 设置网页显示尺寸 await page.setViewport({'width': 1920, 'height': 1080}) ''' clip: 位置与图片尺寸信息 x: 网页截图的x坐标 y: 网页截图的y坐标 width: 图片宽度 height: 图片高度 ''' img_data = await page.screenshot({'clip': {'x': 457, 'y': 70, 'width': 730, 'height': 2600}}) im = Image.open(BytesIO(img_data)) page_width, page_height = im.size c = Canvas(pdf_path, pagesize=(page_width, page_height)) c.drawImage(ImageReader(im), 0, 0) c.save() if __name__ == '__main__': url = "https://www.jianshu.com/p/13dadc463f40" pdf_path = os.path.join(os.getcwd(), "example.pdf") loop = asyncio.get_event_loop() loop.run_until_complete(save_pdf(url, pdf_path))
如此,我们就可以进行区域截取导出pdf文件了!
值得注意的时,由于网络、配置以及一切不可控因素,上面几种方法都会有一定程度的出现导出错误,所以建议加上重试机制!
更多
pyppeteer
操作请看:https://github.com/miyakogi/pyppeteer自此,Over~~~
-
网页导出表格的Excel打不开
2021-06-18 01:05:16上班族们在工作中是否遇到过从自己工作的平台或者某个系统里面向外导出表格材料时,明明导了出来,看着也是表格格式,却打不开。。。抓狂,这里给大家分享下如何去解决这个问题。1、首先看下大家遇到的是不是这种... -
网页导出pdf不完整_3种方法导出公众号文章数据
2020-10-22 22:19:57每晚7点,陪你充电!(↑听燕哥说)今天咱们来说...不过导出的数据很有限,或者说没必要导出,因为导出的内容跟网页上的内容是一毛一样的,你可以直接在网页上看呀。导出后的EXCEL内容2/ 第三方网页插件/新媒体管家壹... -
网页导出pdf不完整_网站中的页面如何转成PDF文档?
2020-11-20 07:15:20在我们浏览网站时,需要保存网页以供日后离线浏览,或是想要分享或打印网页,那就可以考虑把网页转换成PDF文件来简化整个操作。那么应该如何将网页转成PDF呢?网页上的信息如何保存成PDF,操作方法是什么?相信很多... -
C# ASP.NET - 将Web网页导出至Word文档
2011-11-24 07:37:06说明: 用C#实现“将Web网页导出至Word文档”^_^ -
ipad使用--网页导出pdf
2020-10-11 09:17:33解决网页导出PDF格式和长网页截取不全的问题 (感觉在ipad上做笔记很实用) Safari选择阅读视图 点击分享 选择分享格式 选择PDF 确定后最好选择先保存到文件(选择打印会导致比较长的网页截取不全!!... -
java代码-网页导出pdf清晰版
2021-07-15 03:08:42java代码-网页导出pdf清晰版 -
jQuery网页文字导出word格式插件.zip
2019-07-04 21:52:55jQuery网页文字导出word格式插件是一款基于jquery.wordexport插件实现的简单WORD导出代码。 -
网页导出pdf不完整_怎样将PDF文件中的图片提取出来并保存?
2020-11-04 18:26:02可勾选当前页面即可 然后点击“导出页面”窗口右下角的“格式”(默认是将页面以网页和图片导出,如无特殊要求,该步骤可省略) 最后在“导出格式”窗口中设置导出后图片的分辨率或大小后,点击确定即可。 -
网页导出pdf不完整_网页文本无法复制?学会这3个套路,一分钟帮你突破限制...
2020-11-20 07:15:23今天就来教大家3种方法,学会这些套路,网页文本随意复制。☀☀☀一、保存为文本1、当你需要某个段落中的文本,首先鼠标拖动并选中你需要的内容,右击虽然无法复制,但我们可以选择【保存为文本】。2、选择好... -
网页导出pdf不完整_网页怎么打印成PDF文件?使用这款工具轻松实现
2020-10-24 22:43:42平时不管我们是在网上浏览网页,还是查找资料时,我们都会在遇到一些自己感兴趣的内容,而将这些内容保存下来,才能够方便日后我们有时间的时候进行查看。 尤其是在需要打印考证时的准考证、资格证书,又或者是查看... -
网页导出Word几种方法简介
2019-04-18 09:25:54class="word-export" href="javascript:void(0)"> 导出 <div id="page-content"> test js jQuery(document).ready(function($) { $("a.word-export").click(function(event) { $("#page-content").... -
html2biblatex:一个很小的书签,用于将网页导出到BibLaTeX(所有浏览器均未安装)
2021-02-04 15:04:16html2biblatex是用于将网页导出到BibLaTeX的轻型书签。 小-灵活-魔术! 只需单击html2biblatex书签按钮,然后将收集的内容粘贴到BibLaTeX代码中即可。 安装 在浏览器的书签面板中创建一个新书签。 命名(“ :... -
jQuery网页表格导出Excel文件.zip
2019-07-04 21:17:49jQuery网页表格导出Excel文件是一款一键导出Excel文件表格代码。 -
网页导出文件时的文件名乱码问题
2020-07-16 14:40:36web导出文件时遇到文件名中的中文变成了下划线,header头部不能直接写入中文,还需要进行转码,通过new String("记录-".getBytes("gb2312"), "8859_1")将中文转化为 "8859_1"编码。 try { OutputStream output ... -
ipad使用--网页导出pdf方法2
2020-10-15 01:43:28电脑端导出PDF再转入pad 方法原帖地址...spm=1001.2101.3001.4242 软件Typora 直接复制网页内容粘贴至Typora后导出PDF即可 ... -
简单实用网页表格数据导出Excel电子表格文件jQuery插件
2018-08-23 10:18:55简单实用网页表格数据导出Excel电子表格文件jQuery插件 -
C# 网页导出PDF
2017-09-19 09:15:52// 获取网页上的数据 byte[] buf = sc.Convert(new Uri(@"http://www.csdn.net/")); // pdf 保存的路径 string fn = @"D:\PechkinTest.pdf"; FileStream fs = new FileStream(fn, FileMode.Create); fs.Write(buf, ... -
.net网页内容自动导出成word文档
2018-08-02 10:27:29.net网页内容自动导出成word文档 .net网页内容自动导出成word文档 .net网页内容自动导出成word文档 -
网页excel导出
2018-02-25 10:32:28网页excel导出,网页excel导出,网页excel导出,网页excel导出 -
jQuery网页表格导出Excel文件
2021-06-24 11:53:13jQuery网页表格导出Excel文件是一款一键导出Excel文件表格代码。