精华内容
下载资源
问答
  • 我知道要修改其中styles但是我改了怎么还和网页内容格式不一样,需要怎么改!
  • 里面的内容导出保存为word.该怎么做呢,求高手指点。万分感谢! ```真心求解,如有解决问题者,定当重谢! 我又作了这样的尝试, ``` protected void Page_Load(object sender, EventArgs e) ...
  • response.addHeader("Content-disposition","attchment;filename=jyt.xls"); response....这两个语句只能将网页中静态的内容导出,但是用ajax从数据库取出来的数据不能导出,怎么办呢?? 各路大虾!!
  • 有时我们想把收藏网址导入或导出到其他浏览器或者导出用来备份书签,那火狐浏览器怎么实现收藏网址导入导出呢?一起来看IEfans小编今天给大家带来火狐浏览器书签导入导出方法吧。火狐浏览器导入书签方...

    IE问题解决办法文章由小编整理发出,内容真实有效,欢迎提出您的意见IE系列文章由小编在互联网中整理并且发出,内容保障真实健康.

    火狐浏览器是目前非常流行的网页浏览器,使用人数非常多,尤其是从事IT行业人员。有时我们想把收藏的网址导入或导出到其他浏览器或者导出用来备份书签,那火狐浏览器怎么实现收藏网址导入导出呢?一起来看IEfans小编今天给大家带来的火狐浏览器书签导入导出方法吧。

    火狐浏览器导入书签方法:

    打开火狐浏览器,点击左上角“书签”

    再点击管理所有书签

    在弹出的界面中,再点击“导入和备份”

    如要导入书签就选择“从HTML文件导入书签”或者选择“从其他浏览器导入数据”

    选择了“从HTML文件导入书签”后,在打开的页面中选择要导入的文件位置,然后导入就可以了。

    选择了“从其他浏览器导入数据”后,在打开的页面中,选择要导入的浏览器,再点击下一步,就可以成功导入书签了。

    火狐浏览器导出书签方法:

    如要导出书签就选择“导出书签到HTML”

    在打开的页面中选择要导出的文件保存位置就可以了。

    以上就是IEfans小编今日为大家带来的火狐浏览器导入及导出书签方法详解,更多游戏攻略请收藏和关注IE浏览器中文网站!

    还有更多的IE类办法指南,需要用户多多的发掘,可以在搜索框进行搜索查找,如果您觉得文章解决不了您的问题,可以加入QQ群,帮您解决问题。

    展开全文
  • Python-在线网页导出为图片或pdf

    千次阅读 2020-04-08 17:55:12
    而图片是由一堆二进制数据组成的,我们该如何将网页上显示的内容导出为我们想要的图片或者pdf呢?博主闲极无聊逛遍github,发现了一个有趣的库pyppeteer,它实现了我所需要导出需求。接下来我们来看看它是怎么操作的...

    我们都知道一个正常的网页,是由html+css+js组成,而其本质是一段段代码编写编译而来的。而图片是由一堆二进制数据组成的,我们该如何将网页上显示的内容导出为我们想要的图片或者pdf呢?博主闲极无聊逛遍github,发现了一个有趣的库pyppeteer,它实现了我所需要导出需求。接下来我们来看看它是怎么操作的:

    安装所需要的库

    pip install pillow
    pip install reportlab
    pip install pyppeteer
    

    导出为图片

    import os
    import asyncio
    from pyppeteer import launch
    
    async def save_image(url, img_path):
        """
        导出图片
        :param url: 在线网页的url
        :param img_path: 图片存放位置
        :return: 
        """
        browser = await launch()
        page = await browser.newPage()
        # 加载指定的网页url
        await page.goto(url)
        # 设置网页显示尺寸
        await page.setViewport({'width': 1920, 'height': 1080})
        '''
        path: 图片存放位置
        clip: 位置与图片尺寸信息
            x: 网页截图的x坐标
            y: 网页截图的y坐标
            width: 图片宽度
            height: 图片高度
        '''
        await page.screenshot({'path': img_path, 'clip': {'x': 457, 'y': 70, 'width': 730, 'height': 2600}})
        await browser.close()
        
    if __name__ == '__main__':
        url = "https://www.jianshu.com/p/13dadc463f40"
        img_path = os.path.join(os.getcwd(), "example.png")
        loop = asyncio.get_event_loop()
        loop.run_until_complete(save_image(url, img_path))
    

    执行完毕之后,不出意外的情况下,将会在当前目录下生成一个名为example.png的文件,那就是我们导出的图片文件!

    整页导出为pdf

    import os
    import asyncio
    from pyppeteer import launch
    
    async def save_pdf(url, pdf_path):
        """
        导出pdf
        :param url: 在线网页的url
        :param pdf_path: pdf存放位置
        :return: 
        """
        browser = await launch()
        page = await browser.newPage()
        # 加载指定的网页url
        await page.goto(url)
        # 设置网页显示尺寸
        await page.setViewport({'width': 1920, 'height': 1080})
        '''
        path: 图片存放位置
        width: 纸张宽度,带单位的字符串
        height: 纸张高度,带单位的字符串
        '''
        await page.pdf({'path': pdf_path, 'width': '730px', 'height': '2600px'})
        await browser.close()
        
    if __name__ == '__main__':
        url = "https://www.jianshu.com/p/13dadc463f40"
        pdf_path = os.path.join(os.getcwd(), "example.pdf")
        loop = asyncio.get_event_loop()
        loop.run_until_complete(save_pdf(url, pdf_path))
    

    执行完毕之后,不出意外的情况下,将会在当前目录下生成一个名为example.pdf的文件,那就是我们导出的pdf文件!不过这种导出有一种弊端,它是将整个网页导出为pdf,无法像图片那样支持位置参数,可以截取部分区域进行导出!因此,我对代码进行修改了一下,请看下面的"区域导出为pdf"!

    区域导出为pdf

    import os
    import asyncio
    from io import BytesIO
    from PIL import Image
    from pyppeteer import launch
    from reportlab.pdfgen.canvas import Canvas
    from reportlab.lib.utils import ImageReader
    
    async def save_pdf(url, pdf_path):
        """
        导出pdf
        :param url: 在线网页的url
        :param pdf_path: pdf存放位置
        :return: 
        """
        browser = await launch()
        page = await browser.newPage()
        # 加载指定的网页url
        await page.goto(url)
        # 设置网页显示尺寸
        await page.setViewport({'width': 1920, 'height': 1080})
        '''
        clip: 位置与图片尺寸信息
            x: 网页截图的x坐标
            y: 网页截图的y坐标
            width: 图片宽度
            height: 图片高度
        '''
        img_data = await page.screenshot({'clip': {'x': 457, 'y': 70, 'width': 730, 'height': 2600}})
        im = Image.open(BytesIO(img_data))
        page_width, page_height = im.size
        c = Canvas(pdf_path, pagesize=(page_width, page_height))
        c.drawImage(ImageReader(im), 0, 0)
        c.save()
        
    if __name__ == '__main__':
        url = "https://www.jianshu.com/p/13dadc463f40"
        pdf_path = os.path.join(os.getcwd(), "example.pdf")
        loop = asyncio.get_event_loop()
        loop.run_until_complete(save_pdf(url, pdf_path))
    

    如此,我们就可以进行区域截取导出pdf文件了!

    值得注意的时,由于网络、配置以及一切不可控因素,上面几种方法都会有一定程度的出现导出错误,所以建议加上重试机制!

    更多pyppeteer操作请看:https://github.com/miyakogi/pyppeteer

    自此,Over~~~

    展开全文
  • 前端时间需要实现一个能设计固定文档的格式的系统,系统目的是想实现一个类似于在线office的功能,但是要预设文档格式。 开始的第一步就是先确定要...因为直接导出网页内容的话,那就只需要考虑添加前端网页的功...

    前端时间需要实现一个能设计固定文档的格式的系统,系统目的是想实现一个类似于在线office的功能,但是要预设文档格式。

    开始的第一步就是先确定要怎么样才可以导出.doc文档,根据我的了解大概有以下几种方式:

    1. jQuery-Word-Export插件可以将目标网页区域导出成文档,可以保留表格和一些简单的css样式,这个方式是我一开始选择的。因为直接导出网页内容的话,那就只需要考虑添加前端网页的功能和样式,能有更好的用户体验。但是这个插件生成的文档有个很大的问题在于没办法生成文档标题,我查阅了很多博客和网页还是没有找到解决的方法,但是这个要求是又是系统必须的,没办法只好放弃这种方式了。
    2. WebOffice控件,这个插件应该是能够实现网页在线编辑word要求的,但是这个插件我从一开始就没打算用,也没怎么去了解,主要还是感觉和系统的目的有点出入,而且要是用这个插件的话总感觉有点偷懒的感觉,但是挺好用也说不定。
    3. 通过VB来生成文档。这个是我在实习的时候,公司里有用这种方法来生成excel表格,我想应该也能够生成word文档,但是我对VB的语法实在是不熟悉,时间又比较赶没办法只能放弃了。
    4. 通过Freemarker来生成文档,这个也是我最终采用的方法。这种方法能够预设文档格式,刚刚好满足系统的要求,但其实这种方法也不能完全符合我一开始的设想,具体原因我会在接下来的内容里说明。

    项目结构

    因为Deadline在即,这个项目结构的层次说实话我自己也觉得有点乱七八糟。。。

      

    大概总结一下在这个项目中的几个功能,代码和演示页面我会在结尾贴出来。

    ·生成文档

         用Freemarker输出文档的话首先需要先准备一个.ftl的模板文件。首先先打开word,将文字的样式先设置好,然后需要接收参数的地方用${参数名}来替换,就像下图这样:

         然后把这个文档保存为.xml格式,用文本编辑器打开,要确保${参数名}不能被隔开,否则参数内容没办法正常替换。然后如果要插入图片的话可以在插入位置预先随便放一张图片,然后在xml中把<pkg:binaryData></pkg:binaryData>这个里面的那些字符删除,替换成${图片名},就大概这样像图里的这样:     这里其实有个问题就是只能在指定位置插入图片,这个真的很影响文档的灵活性。我仍然没有找到一个比较好的解决方案来实现灵活的在文档内随意插入图片,想要更换图片或者文字位置,就只能够重新修改模板文件。有个想法就是让用户自己来设置模板,这样可以满足用户的个性化需求。这个方法需要足够了解word.xml的语法标签,能够解析网页模板,生成对应的word.xml格式文件。感觉这个方法有点呆,但我也没想到什么更好的方法来解决这个问题,而受限于时间,这个由用户自己生成模板的功能我还没有去完成,也仅仅是一个想法而已。。。

       将改好的.xml文件后缀名改成.ftl放在项目路径下,我是在resources里面新建了一个template1来放这个模板文件。写一个用于导出的工具类ExportUtil。

    package com.homewin.util;
    
    import java.io.BufferedWriter;
    import java.io.FileOutputStream;
    import java.io.IOException;
    import java.io.InputStream;
    import java.io.OutputStreamWriter;
    import java.io.Writer;
    import java.util.Map;
    
    import freemarker.template.Configuration;
    import freemarker.template.Template;
    import sun.misc.BASE64Encoder;
    
    public class ExportUtil {
    	 private  Configuration configuration;
    	    private  String encoding;
    	    
    	    public ExportUtil(String encoding) {
    	    	this.encoding= encoding;
    	        configuration = new Configuration(Configuration.VERSION_2_3_22);
    	        configuration.setDefaultEncoding(encoding);
    	        
    	        configuration.setClassForTemplateLoading(this.getClass(), "/template1");
    	    }
    	    //载入模板文件
    	    public  Template getTemplate(String name) throws Exception {
    	        return configuration.getTemplate(name);
    	    }
    	    //将图片转化成BASE64编码类型
    	    public  String getImageStr(InputStream is) throws IOException {
    	        BASE64Encoder encoder = new BASE64Encoder();
    	        byte[] data = new byte[is.available()];
    	        is.read(data);
    	        
    	        is.close();
    	        return encoder.encode(data);
    	    }
    
    	    //生成文档
    	    public  void   exportDoc(String doc, String name,Map<String, Object> dataMap) throws Exception {
    	        Writer writer = new BufferedWriter(new OutputStreamWriter(new FileOutputStream(doc), encoding));
    	        getTemplate(name).process(dataMap, writer);
    	        writer.flush();
    	        writer.close();
    	    }
    	    
    	
    }
    

           要调用的话就可以这样写

    		ExportUtil exportUtil = new ExportUtil("UTF-8");
    		File image1 = new File("D:/test/cover.jpg");
    		Map<String, Object> dataMap = new HashMap<>();
    		dataMap.put("title","你想要插入的标题");
    		try {
    			dataMap.put("image1", exportUtil.getImageStr(new FileInputStream(image1)));
    		} catch (IOException e) {
    			e.printStackTrace();
    		}
    		String path = "D:/test/";
    		exportUtil.exportDoc(path + word_name + ".doc", "templatez.ftl", dataMap);

           就能够在对应路径下创建出新的文档,要注意的是,同名文档的话会直接覆盖原文档。还有就是如果传入的字符串内有换行符的情况下,想要文档内容也换行的话可以这样写。

    //这个a1_1是一个带换行符的字符串
    dataMap.put("a1_1", a1_1.replaceAll("\r\n", "</w:t></w:r></w:p><w:p><w:r><w:t>"));

            还有就是网页想要预览上传图片的话可以这样写

     <input id="file" name="e_r" class="filepath" onchange="changepic(this)" type="file" style="opacity: 0;"><br>
       	<label class="pic " for="file" id="show1">
    <script>
        function changepic() {
            var reads= new FileReader();
            f=document.getElementById('file').files[0];
            reads.readAsDataURL(f);
            reads.onload=function (e) {
                $("#show1").css("background-image","url("+this.result+")")
    	        };
        }
    </script>

    这样上传图片可以在label这个标签里显示,效果大概是这样。

     

    上传之后:

    ·短信验证码

    因为之前有写过一个邮箱验证的demo,这次就试一下短信验证码,这种短信发送平台其实很多,也不太知道差别在哪里,就选了一个注册送180条短信的平台——云之讯全能力通讯开发平台。不知道现在还有没有这个活动,建议如果是自己玩的话可以选个优惠一些的平台。各个平台会提供对应的api和demo等等,上手也很简单。

    项目代码我放在了github上:https://github.com/homewin21/ExportWord,只需要改一下数据库用户名密码就可以正常使用,数据库表字段和entity内的User类和Word类的属性映射一致。如果也是云之讯平台的话,修改config.properties内的属性,要是其他短信平台的话可以重写一下MailUtil这个类,然后在调用验证码的地方改一下就可以了。

    运行页面我放在了服务器上,有的改动还没有同步上去,效果其实是差不多就这样了。

    总结

    很久都没有写博客了,在写项目的时候有遇到不少问题,看了不少前人写的博客,都给了我很多帮助和启发。说实话现在这个水平还没办法写出那种技术性强,结构整洁清楚的博客,但是我希望以后如果接触比较有意思的东西或者学到一些新知识都能够有时间写一个博客总结一下。虽然说实话整个文章都很抽象,还是留着吧,希望以后自己能看到这篇博客!

    展开全文
  • PDF相对于其他的文件格式来说,更加稳定,不受格式的限制,集成度和安全可靠性都比较高,日常的生活中我们经常会使用到PDF文件,那么你知道,在iPhone上要怎么网页的内容导出成PDF吗?不知道也没关系,今天就来...

    PDF相对于其他的文件格式来说,更加稳定,不受格式的限制,集成度和安全可靠性都比较高,日常的生活中我们经常会使用到PDF文件,那么你知道,在iPhone上要怎么把网页的内容导出成PDF吗?

    不知道也没关系,今天就来告诉你方法。

    一、网页导出成PDF

    1.创建PDF

    其实很简单,我们只需要打开自己想要的网页,可以是长网页,或者重要的文章等等,然后点击【更多】按钮,找到【创建PDF】后点击即可。这样就会进入创建的界面了。

    8b37f336e5aed3ae5cfd5affaa9f604b.png

    2.保存文件

    接着我们可以点击上方的【画笔】对PDF内容进行标注,ok之后点击【更多】-【存储到文件】后即可轻松保存PDF文件了。

    fd21d4f195ad6dd7b52415dc12062d85.png

    二、PDF压缩

    如果网页导出来的PDF文件太大的话,我们可以使用小程序功能来进行压缩。

    1.迅捷压缩

    很简单,在微信的搜索框输入【迅捷压缩】小程序,这是一款可以完成PDF压缩、图片压缩、PPT压缩等操作的小程序,只需简单几步即可完成压缩,无需下载安装,非常方便的说!

    0b610b4f0950352449b5fa3719f886b6.png

    2.操作步骤

    点击【迅捷压缩】进入,首先上传我们的PDF文件,选择压缩的类型,例如清晰优先、常规压缩、缩小优先等,然后开始点击【立即压缩】,等待压缩,压缩成功后点击【复制链接】到浏览器进行粘贴保存即可。

    0cef7875c092eb7437d185895fb849ac.png

    好啦~以上就是今天要跟大家分享的内容,如果你有更好的方法解决的话,欢迎在评论区留言回复,等你哦!

    164c1612f4936f1453062ec3a59f1972.gif
    展开全文
  • 本文主要介绍如何使用后羿采集器智能模式,免费采集同花顺圈子首页短评发布时间、发布内容、作者及阅读量等信息。采集工具简介:后羿采集器是一款基于人工智能技术网络爬虫软件,只需要输入网址就能够自动识别...
  • 1、如果您是新手,请务必先看一下官网视频讲解教程。...官网视频讲解教程中我们已经介绍过,后羿采集器是一款通用网页采集软件,只要是有网址,可以通过网页浏览,您能看得见的内容,大多都是可以...
  • 如果您已经看完了后羿采集器智能模式第一个采集案例,想必您对其已经有了初步了解...更多详情内容,请参考以下教程:2、选择页面类型及设置分页在智能模式下,后羿采集器会自动识别网页,如果出现识别不准确情...
  • 有时为了方便我们一般会通过截图快速进行信息传送,但查看虽然方便但修改起来就比较复杂,比如有些图片中的内容是表格数据,如果用Excel汇总计算就比较快,那么如何将手机图片中的表格导出来呢?目前有一些工具可以...
  • Response是Asp.net的服务器响应对象,其中可以指定输出的内容,可以用它来导出网页或控件(如GridView)等,也可以用来下载文件(用Response下载的好处是文件在网站中的目录结构不会被暴露) 下面就简要介绍下怎么...
  • 1.webscraper抓取数据,导出的excel文档内容是乱码,怎么解决?造成原因:电脑编码不同。百度搜索“excel打开是乱码解决方案”百度经验。2.抓取数据无序怎么解决?安装couchDB工具。3.如何抓取大部分...
  • 有助于目录生成如何改变文本样式插入链接与图片如何插入一段漂亮代码片生成一个适合你列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少KaTeX数学...
  • 今天有人问我,怎么网页的内容导出到word 或 excel中,很多公司或项目中都会用到该功能,大家解决方案有很多种 首先谈一下关于使用前端技术来完成,使用js去抓取网页中结构和内容,是最好的方式...
  • 有时为了在文档中插入其他内容,我们一般会将内容导出网页后再以超链接形式添加,但有时将PDF转成HTML网页后,原来文档中表格排版却全乱了是怎么回事?比如下图所示,原文档是一个简单含表格PDF文档,转...
  • 有时为了在文档中插入其他内容,我们一般会将内容导出网页后再以超链接形式添加,但有时将PDF转成HTML网页后,原来文档中表格排版却全乱了是怎么回事? 比如下图所示,原文档是一个简单含表格PDF文档,转...
  • 有时为了在文档中插入其他内容,我们一般会将内容导出网页后再以超链接形式添加,但有时将PDF转成HTML网页后,原来文档中表格排版却全乱了是怎么回事?比如下图所示,原文档是一个简单含表格PDF文档,转...
  • 怎么提高PR

    2009-09-14 23:06:06
    PR是google对网页重要性评估,影响PR值有几个重要因素:网页质量(内容原创),导入连接,导出连接,结构,美观,效果,用户体验,热点,噱头等很多众多因素,如果只以为做外部连接就可以提高PR是错误想法。...
  • 什么时候用到自定义视图通常我们所用到视图就是jsp等网页,有些时候,我们会根据我们需求自定义视图。...这里我就不细说怎么导出Excel(其实我暂时还不会,哈哈),只简单说说怎么自定义视图。
  • 6、收录率(收录数/其网站实际内容数)不要太低,在不同搜索引擎收录比例差距不要太大(可参考同行相关数据); 7、网站经常更新,主要关键词排名好和多; 换链注意事项 1、新站起点较可以找个和自已差不多; 2...
  • 说好的要下载数据集进行论文复现的,所以没有百度云盘怎么能行。 我们今天的目的就是在Linux下弄好百度云盘,然后下载...然后把你在文本中的内容复制粘贴走起。 看到最好的小伙伴都是值得奖励的,附上阅后即瞎...
  • ◀ ◀ ◀ 将「VLOOK-plugin-for-Typora.txt」文件的内容粘贴于此! ... </body> 保存,大吉大利。 强烈建议使用 Chrome、Firefox、Edge 浏览器访问 字体风格 VLOOK™ 目前提供「文艺范、小清新」两套...
  • 1.webscraper抓取数据,导出的excel文档内容是乱码,怎么解决?造成原因:电脑编码不同。百度搜索“excel打开是乱码解决方案”百度经验。2.抓取数据无序怎么解决?安装couchDB工具。3.如何抓取大部分(95...
  • 如何将自己写好的MarkDown文件格式转换为我们常用的PDF文档,Word文档或者以HTML网页的形式导出呢? 如果想把在本地写好的Markdown文档,导入到类似CDSN这种个人博客平台,又怎么做呢? 这篇文章为你解答...
  • 我在操作把sql数据库中数据导出到excel时发生错误内容如下 我经过多次测试,发现问题原因:只要把iis中匿名访问勾选,就出现这个错误,可是如果不勾选话,本机操作一切正常,可以正确无误的导出...
  • 在ASP.Net课程一开始,不是直接教学员怎么拖ASP.Net控件进行快速开发,而是通过ashx模式开发原始动态网站,让学员明白“请求—处理—响应模型”、“Http协议、Http无状态”、“c#代码渲染生成浏览器端...

空空如也

空空如也

1 2 3
收藏数 50
精华内容 20
关键字:

怎么导出网页的内容