精华内容
下载资源
问答
  • 网页内容保存到OneNote中???? 在本文,我整理了一些OneNote的使用经验,供读者参考,如果读者有更棒的经验技巧,不妨在文章下方留言。 2. 将网页内容保存到OneNote中???? 1)如果你使用的是Chrome浏览器,增加插件...

    在本文,我整理了一些OneNote的使用经验,供读者参考,如果读者有更棒的经验技巧,不妨在文章下方留言。


    目录

    1. 给一段文字添加边框

    2. 将网页内容保存到OneNote中

    3. 合并两个编辑框、拆分编辑框

    4. 页面等级设置

    5. 快速设置首行缩进

    6. 插入格式化程序代码

    7.一键修改字体样式大小


    2. 将网页内容保存到OneNote中

    1)如果你使用的是Chrome浏览器(新版Edge浏览器插件商店也有,强烈推荐此浏览器,对应浏览器插件安装方法),增加插件:《OneNote Web Clipper for Chrome》《OneNote Web Clipper for Edge》

    此插件可以将当前网页内容以四种形式保存到你的OneNote账户中,分别是:整页保存(网页所有内容,包括广告等)、区域保存(截图)、文章(只有正文部分)、书签(网页概述和网址)。我最常用的是文章,可以将必要信息保存下来,多余的信息不会保存。

    如果去Chrome插件商店有困难的读者,可以试试新版Edge浏览器的插件商店OneNote Web Clipper,登录OneNote并不需要特殊手段。

    实际效果:
    OneNote Web Clipper
    2)如果是非Chrome浏览器的话,可以在微信上绑定【微软云笔记】,绑定相关的OneNote账户(更具体的绑定方法请看公众号的教程菜单)。

    (20200711更新)复制你要保存到的链接(可以使用微信“文件传输助手”、QQ我的电脑等方式发送到手机上),然后将链接发送给微软云笔记即可。

    实际效果:
    微软云笔记保存


    展开全文
  • 当你觉得某网页上内容很不错,想保存下来,另存为下来的时候,存的是 html 页面,存的内容比较多,不好。下面介绍保存为PDF 的方法。 1、Chrome 浏览器 通过下图的方法打开打印页面或者通过右键上面的 “打印(P)...

    当你觉得某网页上的内容很不错,想保存下来,另存为下来的时候,存的是 html 页面,存的内容比较多,不好。下面介绍保存为PDF 的方法。

    1、Chrome 浏览器

    通过下图的方法打开打印页面或者通过右键上面的 “打印(P)...” 来打开打印页面。

    选择 “更改..” -->另存为PDF(推荐)/ Microsoft Print to PDF -->“保存”

    2、Firefox 浏览器

    通过下图的方法打开打印页面

    打印(P)... --> Microsoft Print to PDF -->确定

    3、为 PDF 创建多级书签

    我用的是 福昕pdf阅读器领鲜版,方法是针对这个PDF阅读器的。(图是从网上copy来的,自己懒得截了)

    ①添加一个书签

    ②给书签排序

    ③创建子书签
    与给书签排除的差别在于:前者是同级的,所以平移。创建子书签是往父书签的左下方移动来创建的。

    展开全文
  • 用Xpath方法提取网页内容保存为json格式 今天分享一下爬取知名技术网站的内容。网站地址:http://top.jobbole.com/38569/ 用xpath提取网页内容,最后将爬取的内容保存为json格式。 用Xpath方法提取网页内容...

    用Xpath方法提取网页内容保存为json格式

    今天分享一下爬取知名技术网站的内容。网站地址:http://top.jobbole.com/38569/
    用xpath提取网页内容,最后将爬取的内容保存为json格式。

    看到这个网页,首先分析需要爬取的内容:标题、点赞数、图片……

    打开虚拟环境,在 Scrapy shell 中调试

    提取标题文字

    打开虚拟环境,输入 scrapy shell http://top.jobbole.com/38569/
    这里写图片描述
    在火狐浏览器中,F12调试,复制 xpath 路径
    这里写图片描述
    Scrapy shell 中输入复制的 xpath 路径
    这里写图片描述
    发现返回的值竟然为空。这是什么原因呢?
    因为通过网页展示的页面,是通过JavaScript渲染过的页面,所以复制过的xpath路径,也就是有部分是JavaScript加上去的。通过右击,查看网页源代码,修改一下xpath路径。
    通过把代码复制过来,查找修改为 /html/body/div/div/div/div/div/div/div/ul/li/div/h1/a'
    这里写图片描述
    输入之后得到:
    这里写图片描述
    大家看到这个相信和我的心情一样,这种查找,会非常的恶心。有没有别的方法呢?答案当然是:有的!
    再看一下源代码,发现所提取文字是在 <div class="media-body"> 之下的。所以可以用下面这种写法:response.xpath('//div[@class="media-body"]/h1/a/text()')
    这里写图片描述
    标题文字提取完了,把代码放到PyCharm中就OK了。
    这里写图片描述

    按照上述方法,对文章作者、评论数、点赞数等进行提取。

    这里写图片描述
    debug一下,发现要抓取的内容都可以实现。

    下面把文件配置一下,抓取下来并保存为json格式。

    items的编写

    文件中有 items.py ,这个里面是用来封装爬虫所爬取的字段,如:标题、作者、时间等

    import scrapy
    class ArticleSpiderItem(scrapy.Item):
        title = scrapy.Field()
        create_data = scrapy.Field()
        author = scrapy.Field()
        praise_num = scrapy.Field()
        comment_num = scrapy.Field()
        content = scrapy.Field()
    

    这里写图片描述

    Spider的编写

    Spider是用户编写从网站爬取数据的类。其中包含了用于下载的初始化URL,网页中的链接及分析网页中的内容,提取生成 item的方法。

    # -*- coding: utf-8 -*-
    import re
    import scrapy
    from ArticleSpider.items import ArticleSpiderItem
    
    class JobboleSpider(scrapy.Spider):
        name = "jobbole"
        allowed_domains = ["blog.jobbole.com"]
        start_urls = ['http://top.jobbole.com/38569/']
    
        def parse(self, response):
            article_item = ArticleSpiderItem()
    
            #标题:
            title = response.xpath('//div[@class="media-body"]/h1/a/text()').extract_first()
            #发布日期:
            create_data = response.xpath('//div[@class="media-body"]/p/span[1]/text()').extract_first()
            #文章作者:
            author = response.xpath('//div[@class="media-body"]/p/span[3]/a[2]/text()').extract_first()
            #点赞数:
            praise_num = response.xpath('//div[@class="post-adds"]/span[1]/h10/text()').extract_first()
            #评论数:
            comment_num = response.xpath('//div[@class="media-body"]/p/span[4]/a/text()').extract_first()
            #用正则表达式只提取数字。
            match_re = re.match(".*?(\d+).*", comment_num)
            if match_re:
                comment_num = match_re.group(1)
            #提取正文内容
            content = response.xpath('//div[@class = "p-entry"]').extract_first()
    
            article_item["title"] = title
            article_item["create_data"] = create_data
            article_item["author"] = author
            article_item["praise_num"] = praise_num
            article_item["comment_num"] = comment_num
            article_item["content"] = content
            yield article_item

    这里写图片描述

    pipelines 的设置

    对所抓取的内容进行 json 格式保存。

    import json
    import codecs
    
    class JsonWithEncodingPipeline(object):
        #自定义json文件的导出
        def __init__(self):
            self.file = codecs.open('Article.json', 'w', encoding="utf-8")
        def process_item(self, item, spider):
            lines = json.dumps(dict(item), ensure_ascii=False) + "\n"
            self.file.write(lines)
            return item
        def spider_closed(self, spider):
            self.file.close()

    这里写图片描述

    settings 的编写

    主要是配置文件。

    ITEM_PIPELINES = {
       'ArticleSpider.pipelines.JsonWithEncodingPipeline': 300,
    }

    这里写图片描述

    编写 main 函数

    在PyCharm中运行爬虫

    from scrapy.cmdline import execute
    
    import sys
    import os
    
    sys.path.append(os.path.dirname(os.path.abspath(__file__)))
    execute(["scrapy", "crawl", "jobbole"])

    这里写图片描述
    运行爬虫,文件生成。
    这里写图片描述
    编写代码已托管到Gitee上。
    https://gitee.com/shengshengshiwo/YongXpathFangFaTiQuWangYeNaRongBaoCunWeijsonGeShi.git

    展开全文
  • 如何保存网页并编辑

    千次阅读 2013-03-15 10:23:18
    浏览网页那是必然,作为一个IT工作者,经常会浏览一下编程网站,看一些技术文档(很多也是全英文的),在学习的过程中,有些知识点是需要记录或者注释,一般以后再看时方便,所以想将碰到的网站的各种文档原样的保存...

    前言:在网络如此发达是时代,浏览网页那是必然,作为一个IT工作者,经常会浏览一下编程网站,看一些技术文档(很多也是全英文的),在学习的过程中,有些知识点是需要记录或者注释,一般以后再看时方便,所以想将碰到的网站上的各种文档原样的保存下来(一般来说,网页中的文本布局什么的是非常合理和舒服的,给人一种愉快的感觉),之前也在一直寻找方法,但也一直没有找到。由于最近开始学习一些网页/网站制作的技术,这两天有在网上看一些全英文文档,由于自己英语水平不是很好,所以想做一些注释,并将重点标记下来等。于是开始不断的查找方法,最终算是找到了,所以跟大家分享一下,希望对大家有所帮助!

    方法步骤:

    第一步:下载IE浏览器(本人系统为Win8,自带了IE10,浏览器,先前一直用的IE9,但基本上差不多,IE浏览器个人一直觉得最舒服,非常简洁!)Chrome浏览器(Google的啦)Firefox浏览器(Mozilla的啦)等;注:IE浏览器现实的页面比较舒服,其他的浏览器显示的字体什么的感觉小一点,看着不是很舒服,所以浏览网页我都是用IE浏览器,其他的用于一些其他用途。在此,必须下载Chrome或者Firefox中的一个(因为IE保存后打开会布局混乱,对这点有点失望),中国的那些浏览器应该还可以,没试过。

    【下面以Chrome为例说明】

    第二步:用Chrome打开要保存的网页,直接Ctrl+S保存,弹出“另存为”对话框,在对话框下面的“保存类型”选择“网页,全部”(这个很重要,因为你要讲网页中的所有东西全部保存,例如各种图片,css等等)(一般不会选择“网页,仅HTML”的,因为那样只是保存了HTML的东西,那么就只显示文字和仅有的内部CSS样式,不建议使用!),选择好保存路径后,确定即可!保存成功后会得到1个网页文件和1个文件夹,文件夹中保存了调用的资源,它们两个是关联的,一般删除一个的话就会删除另一个。这时你就可以打开网页文件了,你会发现跟原网页一模一样!!

    第三步:编辑网页:用Dreamweaver软件打开网页文件【这现在我只试了Dreamweaver可以正确编辑并保存成功,其他软件,例如WorldWPSVS2010UltraEditKompoZer、记事本等等要么可以可视化打开,但会布局混乱,修改后也乱了;要么不可以可视化打开,修改不方便,阅读页不方便!(如果你用过此软件的话会感觉非常简单啦),然会你就可以可视化的编辑了(选择“查看”菜单,选择“设计”既可以可视化操作,选择“代码”的话可以编辑代码);例如你想输入自己的文字,直接将光标放到相应位置就可以了;

    第四步:编辑网页:这一步的话是我最想用的,就是“设置字体颜色”,将一些重要的知识点标记下来,主要是为了以后方便阅读;用光标选择相应文字,选择“格式”菜单,选择“颜色”,弹出“颜色”对话框,选择颜色后点击“确定”,弹出“新建CSS规则”对话框,“选择器类型”选择“类(可应用于任何HTML元素),“选择器名称”:自己起一个好记的即可,例如:ys_red。以后如果想将其他文字也设置成此种颜色,可以在Dreamweaver软件的下面“属性”中,选择最左侧的HTML,然后在“类”中选择“ys_red即可,你也可以定义多种颜色的。其实“格式”菜单下也有其他一些选项,例如“样式”、“CSS”等,如果你是编程人员的话,这些都不是什么问题啦!

    OK,编辑后保存文件即可,重新打开网页文件,你会发现你修改的东西完全体现在了网页中!Boys and GirlsGood luck to you!

     

    少年班

    2013-3-15 10:14:02

    展开全文
  • 一分钟修改网页中的内容

    万次阅读 2017-10-20 22:43:36
    现在介绍一种小技巧,可以直接在网页上修改内容,简单快捷,真正实现“原生”修改。首先,使用浏览器随便打开一个网站然后调出开发者模式(一般浏览器的快捷键是Ctrl + Shift + i 或者 F12)然后点击标记处的图标再...
  • 欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦: Markdown和扩展Markdown简洁的语法 代码块高亮 图片链接和图片上传 LaTex数学公式 UML序列图和流程图 ...
  • Chrome保存.mhtml网页文件的方法: 在 Chrome 地址栏中键入chrome://flags,回车, 在页面搜索栏输入mhtml 把“Save Page as MHTML”项修改为 Enabled (启用) ,然后重启浏览器就行了 转载于:...
  • 修改网页显示内容的方法

    千次阅读 2016-10-19 14:05:33
    最新办一个手续,需要把一个网页存下来。 但是网页上显示的名称不全,需要补全。 想联系网站修改,第一个人家不一定肯给你改,第二个也不...然后使用记事本打开,搜索你要修改内容修改好以后保存,再用浏览器打开
  • 用过IE浏览器的用户都知道,IE有一个很方便的功能,那就是可以把当前网页的所有内容(包括图片等)保存为一个文件,供以后离线浏览。如果你正在苦恼为什么自己喜欢用的谷歌浏览器为什么没有这样的功能呢?那么你读完...
  • Scrapy爬取网页并保存到数据库中

    千次阅读 2016-11-07 15:45:35
    Scrapy爬取网页并保存到数据库中 一.新建一个Scrapy工程。进入一个你想用来保存代码的文件夹,然后执行: T:\>scrapy startproject fjsen 会生成一堆文件夹和文件: scrapy.cfg: 项目配置文件 tutorial/: 项目python...
  • 修改网页页面内容

    2015-05-13 17:20:08
    1. 打开需要修改的页面 2. 打开页面对应的调试控制台(需要浏览器支持) 3. 在控制台中输入以下命令: javascript:document.body.contentEditable='true';...PS: 该改动只在本地有效,并非更改服务器内容
  • Fiddler默认可以拦截全局http请求,再加上它具备的脚本功能,可以很简单的达到动态修改网页内容的目的。 1、启动Fiddler 2、打开Rules->Customize Rules…,接下来会进入Fiddler ScriptEditor。 3、在脚本中找到...
  • 谷歌浏览器保存网页为PDF

    千次阅读 2020-05-09 16:06:18
    今天在浏览器发现了一篇觉得不错的文章,想将它保存下来,但文章比较长,截长图的话不易翻阅,直接保存网页的话不易保存,偶然发现谷歌浏览器保存网页第三式:将网页存为PDF。 测试页面:...
  • 保存网页为PDF_V1.1

    千次下载 热门讨论 2013-07-08 21:29:18
    版本号:1.1.7.80。更新内容:1、增加检测更新功能...如果你跟我一样,希望有一个只需要点一次鼠标就能将网页保存下来的工具,那么看看我的:一键保存网页为PDF。http://blog.csdn.net/bdstjk/article/details/9208313
  • static function OnBeforeResponse(oSession: Session) 在这个方法中修改Response的内容(对应爬虫来说该方法最常用) show you mine code 如下一段代码实现提取http请求返回的json数据保存至本地文件 通过...
  • 使用Python获取网页内容并生成EPUB格式电子书前言EPUB的介绍思路代码示例 前言 现在的有很多电子书都不能下载了,只能在线看,但是广告又多.所以想编个程序抓取这些内容生成电子书. EPUB的介绍 关于EPUB的介绍已经...
  • 爬虫爬取实时新闻标题、时间及新闻内容并保存

    千次阅读 热门讨论 2019-08-08 18:36:19
    并保存在本地。在爬取文章内容的时候我用到了正则表达式去匹配文字内容,这里在文章中会有一些杂质出现(后续会想解决方法)。 二、软件及应用模块 1、anaconda、pycharm anaconda里面集成了许多python的第三方库,...
  • 一、需求描述 线上的系统,输入手机号的格式验证需要临时修改为“只可以输入数字”,输入座机号可以保存成功...因为是线上的系统,所以代码修改不了,可以网页中借助开发者工具进行临时修改,使其座机号保存成功即可。
  • python爬取多个网页表格并保存为csv

    千次阅读 2019-04-23 14:54:40
    2.目前运行结果保存在程序路径下,如果需要更改路径,可以修改save_content函数 3.文件名也可以传入,添加一个参数就可以了 修改代码如下 # 保存资源 def save_contents(file_path,file_name,urlist): ...
  • 网页上文本框填写内容后,保存后显示无论敲多少空格只保留一个空格,也无法换行,在无法修改源码的情况下,如何实现我填写的内容换行意思是,我只是填写人家网页上的东西,但是我点击保存后,网页上内容显示只是在...
  • 1、切换360浏览器模式为IE模式...您可以在对保存话框中选择保存内容,例如是网页,文字,还是里面的图片等等。 点击保存对话框上面的“更改…”按钮,在出现的菜单中选择您需要保存的项目。 完整网页:完整保存整个
  • Javascript保存网页为图片

    千次阅读 2014-04-15 19:02:34
    Javascript如何把网页中的一部分保存为图片?在一些需求中,需要把网页保存为图片,已知canvas可以保存为图片。本篇幅内容将简单介绍如何把网页保存为图片。
  • 近期的工作学习中使用到了Python,分享一些...本节的内容主要是如何使用python去获取网页的源代码存储到本地文件中,希望通过本节可以让你略微了解到python的神奇。 先代码: import urllib.re
  • NET),将您的资料发布到网络(局域网或者互联网),没有CyberArticle,也可以方便的浏览已经保存网页 软件升级: 现在,各种终端层出不穷,人们在不同场合使用不同的终端,导致人们的信息也分散在各种终端...
  • 问题:修改了JS文件里的一个正则表达式,保存之后打开网页试试好不好用,结果原来的错误还是出现,跟没改一样。 原因:浏览器打开网页没有更新被修改的方法,而是使用了老版本的缓存。 解决方法:清理浏览器...
  • 如果我想将新华网的标志也打印的话,就需要也将这部分选中,再右键打印(注意:将鼠标悬在文字部分右键打印)。但是,我们会发现总会将右边的搜索框也选中: 要是遇到这种情况,我们可以,鼠标右键—...
  • -- 修改 低版本浏览器不支持 h5新标签属性 --> <script src="js/html5shiv.js"></script> <!-- 蓝鸟 适配 promise --> <script src="js/bluebird.js"></script> <script src="js/jquery-3.3.1.js"></script> <!...
  • 前言 以前抓网页都是直接requests+bs4直接刚的,今天想拿一下拉钩的数据,就继续按照以下...于是用浏览器打开网页然后view source,在view source页面点击存储为文件,然后用vscode打开保存网页,进行对比。发现...
  • Java 网页html转为word并保存为doc文件

    万次阅读 2014-04-16 17:32:02
    首先导 入POI的相关jar包。有关word操作的都导入(额,若是不清楚,就所有的导入也行。) public static boolean writeWordFile() { boolean w = false;...但是可以根据这个思路修改下去  

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 185,627
精华内容 74,250
关键字:

如何修改网页上的内容并保存