精华内容
下载资源
问答
  • 网页背景图片提取工具 css背景图片获取器 V1 0 1 单文件绿色版 图片提取工具是小站长的好工具 图片提取工具可以智能提取远程css文件的背景图片 单个预览或者批量下载
  • 本工具为自己使用ASP.NET(C#)开发的一个网页开发辅助工具,可以输入网址之家提取css代码中的背景图片,并且可以自动获取到网页中包含的css文件地址,点击可以直接载入css代码,也可以复制网页源代码黏贴进去查找。...
  • 利用wget 抓取 网站网页 包括css背景图片 wget是一款非常优秀的http/ftp下载工具,它功能强大,而且几乎所有的unix系统上都有。不过用它来dump比较现代的网站会有一个问题:不支持css文件,它不会自动下载、重新链接...
     利用wget 抓取 网站网页 包括css背景图片

    wget是一款非常优秀的http/ftp下载工具,它功能强大,而且几乎所有的unix系统上都有。不过用它来dump比较现代的网站会有一个问题:不支持css文件,它不会自动下载、重新链接css中所指定的图片。这个问题导致的最常见的后果是dump下来的网站看不到背景图片。本文所介绍的这个脚本主要就是用来解决这个缺陷的。

    这里简要介绍一下这个脚本的细节:

        第3行用于设置要下载的网站的地址。
        第10行用于将文件名转换为windows兼容的格式。windows对文件名格式的要求比unix更为苛刻一点,这里指定为windows也可以兼容unix系统。总的来说,wget的这个功能稍微弱了一点,面对一些更苛刻的系统就没有办法了。
        第13行用于忽略robots.txt。很多网站的css、js文件都是在robots.txt中被定义为spider不可访问的。
        第15、16行用于忽略某些目录和文件。因为没有了robots.txt的限制,wget可能会去访问一些不需要的东西。这里可以根据具体情况做限制。
        第19~24行下载css中链接的文件。
        第26~29行修正css中的链接。

    以下是这个脚本的内容

        #!/bin/sh  
          
        ADDR="http://www.EXAMPLE.com/"  
          
        SERVER=${ADDR#http://}  
        SERVER=${SERVER%%/*}  
          
        wget /  
            --html-extension /  
            --restrict-file-names=windows /  
            --convert-links /  
            --page-requisites /  
            --execute robots=off /  
            --mirror /  
            --exclude-directories /comment/reply/,/aggregator/,/user/ /  
            --reject "aggregator*" /  
            "$ADDR"  
          
        find $SERVER -type f -name "*.css" -exec cat {} /; |  
        grep -o 'url(/[^)]*)' |  
        sort |   
        uniq |  
        sed 's/^url(/(.*/))$/http:'$SERVER'/1/' |  
        wget --mirror --page-requisites -i -  
          
        for i in `find $SERVER -type f -name "*.css"`; do  
            PREFIX="$(echo $i | sed 's/[^//]*//g; s///$//; s../g')"  
            sed -i 's/url(///url('$PREFIX'/g' $i  
        done 

    转载于:https://www.cnblogs.com/yisuo/p/9246886.html

    展开全文
  • 在浏览网页时我们通常会看到一些不错的背景图片,于是就想保存下来作为壁纸,但是有的网页不能将图片右键另存为,那我们该怎么办呢? 以Chrome为例,在页面空白的地方右键–>检查,打开开发者工具,其他浏览器...

    在浏览网页时我们通常会看到一些不错的背景图片,于是就想保存下来作为壁纸,但是有的网页不能将图片右键另存为,那我们该怎么办呢?

    在这里插入图片描述

    1. 以Chrome为例,在页面空白的地方右键–>检查(即审查元素,Fn+f12),打开开发者工具,其他浏览器可能是通过 工具–>开发者工具 来打开此界面。
      在这里插入图片描述
    2. 切换到network(网络)
      在这里插入图片描述
    3. 刷新一下页面,点击img找到背景图片
      在这里插入图片描述
    4. 点进去图片右键 Copy image URL粘贴到浏览器地址栏打开,并从此页面即可保存到本地
      在这里插入图片描述
      在这里插入图片描述在这里插入图片描述
      最后,提醒小伙伴们一句:尊重版权,请勿未经作者许可将图片用作商业用途哦~
    展开全文
  • python爬虫抓取必应背景图片 语言:python 3.0 之前每天都在火狐浏览器上查看背景图片存储必应背景图片,或者在谷歌浏览器上查看元素,这样总是觉得太麻烦,所以还是想着用python写一个脚本进行爬虫,废话少说,进入...

    python爬虫抓取必应背景图片

    语言:python 3.0
    之前每天都在火狐浏览器上查看背景图片存储必应背景图片,或者在谷歌浏览器上查看元素,这样总是觉得太麻烦,所以还是想着用python写一个脚本进行爬虫,废话少说,进入正题

    -----------------------------------------------------我是分割线-------------------------------------------------------------------
    首先查看源码,需要先找到背景图片的直链地址,很幸运的是图片的直链被放在了源码开始最为显眼对的地方
    在这里插入图片描述
    其中href的内容便是我们所需要的直链,点开便是我们想要的图片
    在这里插入图片描述
    所以最主要的目的是获得这个链接,自然,有点前端知识的都知道(当然我也只是略知一二),我们要获取这个对象,可以通过其独一无二的Id值来获取,而Id号是不会变化的,那便是 “bgLink”。

    这个问题解决了,直接在python中采取相应的工具就好了。
    -----------------------------------------------------我是分割线-------------------------------------------------------------------

    -----------------------------------------------------我是分割线二号-------------------------------------------------------------------
    我们采用requestsBeautifulSoup两个包(一般python不自带,需要自行安装)

    第一步,先获取目标网页代码

     url='https://cn.bing.com/';
        
        demo=getHTMLText(url)``
    

    这里的getHTMLText是对网页发出请求,并且在相应之后返回网页HTML代码的,具体代码如下:

    def getHTMLText(url):
        '''
    	此函数用于获取网页的html文档
    	'''
        try:
            #获取服务器的响应内容,并设置最大请求时间为6秒
            res = requests.get(url, timeout = 6)
            #判断返回状态码是否为200
            res.raise_for_status()
            #设置该html文档可能的编码
            res.encoding = res.apparent_encoding
            #返回网页HTML代码
            return res.text
        except:
            return'产生异常'
    

    第二步,解析获取的代码,定位Id为“bgLink”的对象,并且获取其href属性的值,取得直链

    soup=BeautifulSoup(demo,'html.parser')
    pic=url+soup.find(id='bgLink').get('href')
    

    第三步,获取图片名字,以便重命名
    图片名字在Id为“sh_cp”中,这是通过观察源码得到的,姓名属性为"title"
    然后还需要把名字中的’/'替换,不然后面存储在本地的时候会出错

    name=soup.find(id='sh_cp').get('title')
    name=name.replace('/','_',5)
    

    第四步,将图片储存在本地

    name='D:/bingpicture/'+name+'.jpg'
        r=requests.get(pic)
        with open(name,'wb')as f:
            f.write(r.content)
    

    大功告成,我们只需要运行脚本就能够直接下载好图片到本地啦
    -----------------------------------------------------我是分割线二号-------------------------------------------------------------------

    最后附上完整代码,请大家多多指教! ^ v ^

    import requests
    from bs4 import BeautifulSoup
    
    
    
    def getHTMLText(url):
        '''
    	此函数用于获取网页的html文档
    	'''
        try:
            #获取服务器的响应内容,并设置最大请求时间为6秒
            res = requests.get(url, timeout = 6)
            #判断返回状态码是否为200
            res.raise_for_status()
            #设置该html文档可能的编码
            res.encoding = res.apparent_encoding
            #返回网页HTML代码
            return res.text
        except:
            return'产生异常'
    
    def main():
        '''
    	主函数
    	'''
        print("执行中....")
        #目标网页
        url='https://cn.bing.com/';
        
        demo=getHTMLText(url)
    
        #解析HTML代码
        soup=BeautifulSoup(demo,'html.parser')
    	#得到图片网址
        pic=url+soup.find(id='bgLink').get('href')
    	#获得图片名字
        name=soup.find(id='sh_cp').get('title')
        #将名字中的/替换
        name=name.replace('/','_',5)
    	#储存在D:/bingpicture/下
        name='D:/bingpicture/'+name+'.jpg'
        r=requests.get(pic)
        with open(name,'wb')as f:
            f.write(r.content)
    
    main()
    	
    
    展开全文
  • 利用java抓取网页上的所有图片: 用两个正则表达式: 1、匹配html中img标签的正则:]*?> 2、匹配img标签中得src中http路径的正则:http:\"?(.*?)(\"|>|\\s+) 实现: package org.swinglife.main; import java.io....

    利用java抓取网页上的所有图片:

    用两个正则表达式:

    1、匹配html中img标签的正则:<img.*src=(.*?)[^>]*?>

    2、匹配img标签中得src中http路径的正则:http:\"?(.*?)(\"|>|\\s+)


    实现:

    package org.swinglife.main;
    
    import java.io.File;
    import java.io.FileOutputStream;
    import java.io.InputStream;
    import java.net.URL;
    import java.net.URLConnection;
    import java.util.ArrayList;
    import java.util.List;
    import java.util.regex.Matcher;
    import java.util.regex.Pattern;
    
    /***
     * java抓取网络图片
     * @author swinglife
     *
     */
    public class CatchImage {
    
    	// 地址
    	private static final String URL = "http://www.csdn.net";
    	// 编码
    	private static final String ECODING = "UTF-8";
    	// 获取img标签正则
    	private static final String IMGURL_REG = "<img.*src=(.*?)[^>]*?>";
    	// 获取src路径的正则
    	private static final String IMGSRC_REG = "http:\"?(.*?)(\"|>|\\s+)";
    
    	
    	public static void main(String[] args) throws Exception {
    		CatchImage cm = new CatchImage();
    		//获得html文本内容
    		String HTML = cm.getHTML(URL);
    		//获取图片标签
    		List<String> imgUrl = cm.getImageUrl(HTML);
    		//获取图片src地址
    		List<String> imgSrc = cm.getImageSrc(imgUrl);
    		//下载图片
    		cm.Download(imgSrc);
    	}
    	
    	
    	/***
    	 * 获取HTML内容
    	 * 
    	 * @param url
    	 * @return
    	 * @throws Exception
    	 */
    	private String getHTML(String url) throws Exception {
    		URL uri = new URL(url);
    		URLConnection connection = uri.openConnection();
    		InputStream in = connection.getInputStream();
    		byte[] buf = new byte[1024];
    		int length = 0;
    		StringBuffer sb = new StringBuffer();
    		while ((length = in.read(buf, 0, buf.length)) > 0) {
    			sb.append(new String(buf, ECODING));
    		}
    		in.close();
    		return sb.toString();
    	}
    
    	/***
    	 * 获取ImageUrl地址
    	 * 
    	 * @param HTML
    	 * @return
    	 */
    	private List<String> getImageUrl(String HTML) {
    		Matcher matcher = Pattern.compile(IMGURL_REG).matcher(HTML);
    		List<String> listImgUrl = new ArrayList<String>();
    		while (matcher.find()) {
    			listImgUrl.add(matcher.group());
    		}
    		return listImgUrl;
    	}
    
    	/***
    	 * 获取ImageSrc地址
    	 * 
    	 * @param listImageUrl
    	 * @return
    	 */
    	private List<String> getImageSrc(List<String> listImageUrl) {
    		List<String> listImgSrc = new ArrayList<String>();
    		for (String image : listImageUrl) {
    			Matcher matcher = Pattern.compile(IMGSRC_REG).matcher(image);
    			while (matcher.find()) {
    				listImgSrc.add(matcher.group().substring(0, matcher.group().length() - 1));
    			}
    		}
    		return listImgSrc;
    	}
    
    	/***
    	 * 下载图片
    	 * 
    	 * @param listImgSrc
    	 */
    	private void Download(List<String> listImgSrc) {
    		try {
    			for (String url : listImgSrc) {
    				String imageName = url.substring(url.lastIndexOf("/") + 1, url.length());
    				URL uri = new URL(url);
    				InputStream in = uri.openStream();
    				FileOutputStream fo = new FileOutputStream(new File(imageName));
    				byte[] buf = new byte[1024];
    				int length = 0;
    				System.out.println("开始下载:" + url);
    				while ((length = in.read(buf, 0, buf.length)) != -1) {
    					fo.write(buf, 0, length);
    				}
    				in.close();
    				fo.close();
    				System.out.println(imageName + "下载完成");
    			}
    		} catch (Exception e) {
    			System.out.println("下载失败");
    		}
    	}
    
    	
    }
    



    展开全文
  • 打开菜单中工具--->页面信息---->媒体 转载于:https://my.oschina.net/hongjiang/blog/3074295...
  • 授人以鱼不如授人以渔,看到网友LYF在论坛某网站首页的网页背景音乐,热心网友Q1628393554真心可爱,将具体操作方法分享了出来,这是帮了我的大忙,可以给自己的网站整理成教程,因为使用Chrome45,操作方法和网友...
  • 做为一个仿站工作者,当遇到网站有版权时甚至加密的时候,WEBZIP也熄火,怎么扣取网页上的图片背景图片呢。有时候,可能会想到用火狐,这款浏览器好像一个强大的BUG,文章有版权,屏蔽右键,火狐丝毫也不会被影响...
  • php提取背景图片

    2016-08-08 10:54:00
    preg_match_all('/background\s*-\s*+image\s*:\s*url\s*\("*([^"]*)"*\)/i', $content,$match) 转载于:https://www.cnblogs.com/loweringye/p/5748421.html
  • ImageBox 不仅仅是把图像文件打包进.EXE文件中并且...输入任一网页地址即可批量抓取和下载网页上所有的图片。 主要功能: 1、支持防盗链图片抓取。 2、支持将抓取图片即时浏览。 3、支持图片自动存储到自已的邮箱中。
  • backgroundimagestags = domUtils.getElementsByTagName(me.document, "section span div p "),//抓取背景图片所在的标签 test = function (src, urls) { if (src.indexOf(location.host) != -1 || /(^\.)|(^\/)/...
  • 关于HTML怎样图片背景

    千次阅读 2011-10-22 15:58:16
    1、网页背景图片: (平铺背景图片) 或者 (背景图片不重复) (背景图片居中不重复) 注释:  style 后双引号部分为CSS样式;  background-image:url(图片路径) 为背景图片  no-repeat 不...
  • 把Bing搜索的背景图片设置为自己网站的背景,实现背景及资讯的每日更新 效果如下: 理一下思路,首先我们要抓取Bing的每日图片及最新资讯,然后保存图片及信息到本地,最后显示图片及资讯到网站首页。 第一步:...
  • 抓取每天必应bing背景图片

    千次阅读 2009-10-27 19:20:00
    虽然我对微软的搜索引擎bing没有太多的使用,但是感觉它的背景图片还是不错,而且每天都在更换,有一次看到一张不错的图片,想下载下来,右键点击竟然下载不下来,没有右键另存为图片的选项,于是网上找到了一个软件...
  • 6、可以保存网页背景音乐、网页中播放过的几乎所有声音和音乐文件; 7、可以保存网页中播放过的几乎所有视频(包括土豆、优酷、6房间、酷6等); 8、可以保存其他基于网页框架的各种音频/视频教材(例如一些网校教程...
  •  2)分析网页引用CSS文件,获取背景图片。 3)批量下载。要点: 1)正则  LINK_PATTERN:获取页面所有连接  BACKGROUND_IMAGE_PATTERN:获取CSS中背景图片地址 CHECK_URL_PATTERN:检测URL是否有效 代码 ...
  • 挖一下网页图片批量下载是一款很实用的工具,帮您快速有效地抓取网页上的图片(包括网页中css背景图片以及内嵌iframe的图片),根据您的需求对图片进行过滤和批量下载,并且支持
  • 日常工作或学习中经常会接触很多PDF文档,有时其中有些图片是我们需要用到的,应该如何将这些图片从PDF文件中提取出来并且保存呢?我们可以用PDF编辑器来实现这个需求,首先用极速PDF编辑器打开我们需要处理的PDF...
  • 做为一个仿站工作者,当遇到网站有版权时甚至加密的时候,WEBZIP也熄火,怎么扣取网页上的图片背景图片呢。有时候,可能会想到用火狐,这款浏览器好像一个强大的BUG,文章有版权,屏蔽右键,火狐丝毫也不会被影响...
  • 但是老板是使用手机查看,故需要将整个Web页面抓取图片,通过邮件自动发送到老板邮箱。调研过程中遇到一下坑,现在梳理一下分析给大家 准备环境: centos 7 python3.7 安装方式:...
  • 基本思路,就是先去找个爬虫框架把链接网页中内容和图片写到word中,后面在将1万个链接通过位除余分组,开几个线程去写。 1.导入maven依赖jar包 <dependency> <groupId>org.jsoup&l...
  • autojs获取手机背景图片,抓取壁纸

    千次阅读 2019-10-09 10:09:33
    说明 本文提供的代码仅供参考。不建议用于生产环境。 可能有些地方在最新版本的Auto.js上面需要做修改,才能运行。 Auto.js简介 Auto.js是利用安卓系统的“辅助功能”实现类似于按键精灵一样,可以通过代码模拟一...
  • 获得网页背景色和字体颜色,方法如下:思想: 通过取得颜色属性值得到的是 rgb 色,不是我们想要的,所以需要将 rgb 色装换为 十六进制色 ,首先获得rgb色 :var rgb = document.getElementById('color').style....
  • 在开发中,我们常常看到这样的效果:数据未请求成功时APP背景显示的是页面的大概轮廓,其实实现这样的效果只需要设置好背景图片即可。 比如,实现如下的效果: 我们需要两张svg图片: 链接:...
  • java抓取网页内容

    万次阅读 2013-05-15 11:18:49
    今天做项目时用到java抓取网页内容,本以为很简单的一件事但是还是让我蛋疼了一会,网上资料一大堆但是都是通过url抓取网页内容,但是我要的是读取本地的html页面内容的方法,网上找不到怎么办我瞬间了! 首先还是...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 24,934
精华内容 9,973
关键字:

怎样提取网页背景图