精华内容
下载资源
问答
  • 我需要从一个网站上获取天气预报的温度值,我选择了新浪网程序如下packagetianqi;importjava.io.File;importjava.io.FileInputStream;importjava.io.FileNotFoundException;importjav...我需要从一个网站上获取天气...

    我需要从一个网站上获取天气预报的温度值,我选择了新浪网程序如下packagetianqi;importjava.io.File;importjava.io.FileInputStream;importjava.io.FileNotFoundException;importjav...

    我需要从一个网站上获取天气预报的温度值,我选择了新浪网

    程序如下

    package tianqi;

    import java.io.File;import java.io.FileInputStream;import java.io.FileNotFoundException;import java.io.IOException;import java.io.InputStream;import java.io.IOException;import java.util.Iterator;

    import org.jsoup.Jsoup;import org.jsoup.nodes.Document;import org.jsoup.nodes.Element;import org.jsoup.select.Elements;

    public class zhuaqutianqi { public static void main(String[] args) throws Exception { String getUrl = "http://www.sina.com.cn/"; Document doc = Jsoup.connect(getUrl).timeout(1000).get(); Element body = doc.body(); Elements el=body.select("span[class]"); Iterator it = el.iterator(); String[]s=new String[100]; int i=0; while( it .hasNext() ) { Element e = (Element) it.next(); s[i]=e.text(); i++; System.out.println(s[i] ); }

    }

    }

    为什么结果为空

    这个是那个网页的标签,我需要那个27~18度,求各位神帮忙修改一下程序

    展开

    展开全文
  • 查了一下获取指定HTML标签的指定属性值很多资源,但是获取指定标签的内容值资源有点少,自己记录一下:我这后台返回的字段数据是这样滴:"tabView": "嘻嘻嘻嘻嘻哈哈哈哈",亲测获取内容是没有问题的。* 获取指定...

    查了一下获取指定HTML标签的指定属性值很多资源,

    但是获取指定标签的内容值资源有点少,自己记录一下:

    我这后台返回的字段数据是这样滴:

    "tabView": "嘻嘻嘻嘻嘻哈哈哈哈",亲测获取内容是没有问题的。

    * 获取指定HTML标签的指定属性的值

    * @param source 要匹配的源文本

    * @param element 标签名称

    * @param attr 标签的属性名称

    * @return 属性值列表

    */

    public static List match(String source, String element, String attr) {

    List result = new ArrayList();

    String reg = "]*?\\s" + attr + "=['\"]?(.*?)['\"]?(\\s.*?)?>";

    Matcher m = Pattern.compile(reg).matcher(source);

    while (m.find()) {

    String r = m.group(1);

    result.add(r);

    }

    return result;

    }

    /**

    * @param source 要匹配的源文本

    * @param element 标签名称

    * @return 内容集合

    */

    public static List getTagContent(String source, String element) {

    List result = new ArrayList();

    String reg = "" + "(.+?)" + element + ">";

    Matcher m = Pattern.compile(reg).matcher(source);

    while (m.find()) {

    String r = m.group(1);

    result.add(r);

    }

    return result;

    }

    展开全文
  • 今天在用W3C检测网页的标签时,发现了一个的html标签,虽然自己的博客模版上也用过这个html标签,但还是仔细的查找了关于它的一些文档说明,记录下来以备后用。html 标签:标签定义公历的时间(24小时制)或日期语法:...

    今天在用W3C检测网页的标签时,发现了一个的html标签,虽然自己的博客模版上也用过这个html标签,但还是仔细的查找了关于它的一些文档说明,记录下来以备后用。

    HTML中的<time> 标签详解

    html 标签

    :标签定义公历的时间(24小时制)或日期

    语法:

    2019-11-19

    属性:

    datetime:规定日期或时间。不定义则由元素的内容给定。

    pubdate:指示 元素中的日期或时间是指文档或的发布日期。

    注:以上两种属性都属于 html5 中新增的属性

    例:标签指定一个时间或日期

    HTML代码:

    请在9:00 之前打卡!

    飞鸟慕鱼博客创建于2016-11-11,已经建站三年了!

    飞鸟慕鱼博客创建于2016/11/11,已经建站三年了!

    例:标签指定文章或文档的发布日期

    指定一篇文章或一个页面的发布日期,要用到 标签的 pubdate 属性!

    本页面修改于:2019/11/18,

    本篇文章发布时间:2019/11/18,

    标签使用注意事项

    1、 标签和普通标签一样,不会在浏览器中呈现任务效果

    2、所有的主流浏览器都不支持 标签

    3、搜索引擎对 标签是友好的,(有待研究)

    展开全文
  • 打开任意的网站,其head标签内都有一列的meta标签一、简介英文版W3school的解释The <meta> tag provides metadata about the HTML document. Metadata will not be displayed on the page, but will be ...

    打开任意的网站,其head标签内都有一列的meta标签

    6cf637883aec268bc1c7dcf7edbabf30.png

    一、简介

    英文版W3school的解释

    The <meta> tag provides metadata about the HTML document. Metadata will not be 
    displayed on the page, but will be machine parsable.

    其中的关键是metadata,中文名叫元数据,是用于描述数据的数据。它不会显示在页面上,但是机器却可以识别。这么一来meta标签的作用方式就很好理解了。

    二、用处

    Meta elements are typically used to specify page description, keywords, author 
    of the document,last modified, and other metadata.

    The metadata can be used by browsers (how to display content or reload page), search engines (keywords), or other web services

    翻译过来就是:meta常用于定义页面的说明,关键字,最后修改日期,和其它的元数据。这些元数据将服务于浏览器(如何布局或重载页面),搜索引擎和其它网络服务。

    三、组成

    meta标签共有两个属性,分别是http-equiv属性和name属性。

    3.1 name属性

    name属性主要用于描述网页,比如网页的关键词,叙述等。与之对应的属性值为content,content中的内容是对name填入类型的具体描述,便于搜索引擎抓取。

    meta标签中name属性语法格式是:

    <meta name="参数" content="具体的描述">。

    其中name属性共有以下几种参数。(A-C为常用属性)

    A. keywords(关键字)

    说明:用于告诉搜索引擎,你网页的关键字。
    举例:

    <meta name="keywords" content="Lxxyx,博客,文科生,前端">

    B. description(网站内容的描述)

    说明:用于告诉搜索引擎,你网站的主要内容。
    举例:

    <meta name="description" content="文科生,热爱前端与编程。目前大二,这是我的前端博客">

    C. viewport(移动端的窗口)


    这个属性常用于设计移动端网页。在用bootstrap,AmazeUI等框架时候都有用过viewport。

    举例(常用范例):

    <meta name="viewport" content="width=device-width, initial-scale=1">

    D. robots(定义搜索引擎爬虫的索引方式)

    说明:robots用来告诉爬虫哪些页面需要索引,哪些页面不需要索引。
    content的参数有all,none,index,noindex,follow,nofollow。默认是all。

    举例:

    <meta name="robots" content="none">

    具体参数如下:

    1.none : 搜索引擎将忽略此网页,等价于noindex,nofollow。
    2.noindex : 搜索引擎不索引此网页。
    3.nofollow: 搜索引擎不继续通过此网页的链接索引搜索其它的网页。
    4.all : 搜索引擎将索引此网页与继续通过此网页的链接索引,等价于index,follow。
    5.index : 搜索引擎索引此网页。
    6.follow : 搜索引擎继续通过此网页的链接索引搜索其它的网页。

    E. author(作者)

    说明:用于标注网页作者
    举例:

    <meta name="author" content="Lxxyx,841380530@qq.com">

    F. generator(网页制作软件)

    说明:用于标明网页是什么软件做的
    举例: (不知道能不能这样写):

    <meta name="generator" content="Sublime Text3">

    G. copyright(版权)

    说明:用于标注版权信息
    举例:

    <meta name="copyright" content="Lxxyx"> //代表该网站为Lxxyx个人版权所有。

    H. revisit-after(搜索引擎爬虫重访时间)

    说明:如果页面不是经常更新,为了减轻搜索引擎爬虫对服务器带来的压力,可以设置一个爬虫的重访时间。如果重访时间过短,爬虫将按它们定义的默认时间来访问。
    举例:

    <meta name="revisit-after" content="7 days" >

    I. renderer(双核浏览器渲染方式)

    说明:renderer是为双核浏览器准备的,用于指定双核浏览器默认以何种方式渲染页面。比如说360浏览器。
    举例:

    <meta name="renderer" content="webkit"> //默认webkit内核
    <meta name="renderer" content="ie-comp"> //默认IE兼容模式
    <meta name="renderer" content="ie-stand"> //默认IE标准模式

    3.2 http-equiv属性

    http-equiv顾名思义,相当于http的文件头作用。

    这个我所认为的http-equiv意思的简介:相当于HTTP的作用,比如说定义些HTTP参数啥的。

    meta标签中http-equiv属性语法格式是:

    <meta http-equiv="参数" content="具体的描述">

    其中http-equiv属性主要有以下几种参数:

    A. content-Type(设定网页字符集)(推荐使用HTML5的方式)

    说明:用于设定网页字符集,便于浏览器解析与渲染页面
    举例:

    <meta http-equiv="content-Type" content="text/html;charset=utf-8">  //旧的HTML,不推荐
    
    <meta charset="utf-8"> //HTML5设定网页字符集的方式,推荐使用UTF-8

    B. X-UA-Compatible(浏览器采取何种版本渲染当前页面)

    说明:用于告知浏览器以何种版本来渲染页面。(一般都设置为最新模式,在各大框架中这个设置也很常见。)
    举例:

    <meta http-equiv="X-UA-Compatible" content="IE=edge,chrome=1"/> //指定IE和Chrome使用最新版本渲染当前页面

    C. cache-control(指定请求和响应遵循的缓存机制)

    用法1.

    说明:指导浏览器如何缓存某个响应以及缓存多长时间。

    举例:

    <meta http-equiv="cache-control" content="no-cache">

    共有以下几种用法:

    1. no-cache: 先发送请求,与服务器确认该资源是否被更改,如果未被更改,则使用缓存。
    2. no-store: 不允许缓存,每次都要去服务器上,下载完整的响应。(安全措施)
    3. public : 缓存所有响应,但并非必须。因为max-age也可以做到相同效果
    4. private : 只为单个用户缓存,因此不允许任何中继进行缓存。(比如说CDN就不允许缓存private的响应)
    5. maxage : 表示当前请求开始,该响应在多久内能被缓存和重用,而不去服务器重新请求。例如:max-age=60表示响应可以再缓存和重用 60 秒。
    参考链接:HTTP缓存link.juejin.im

    用法2.(禁止百度自动转码)

    说明:用于禁止当前页面在移动端浏览时,被百度自动转码。虽然百度的本意是好的,但是转码效果很多时候却不尽人意。所以可以在head中加入例子中的那句话,就可以避免百度自动转码了。
    举例:

    <meta http-equiv="Cache-Control" content="no-siteapp" />

    D. expires(网页到期时间)

    说明:用于设定网页的到期时间,过期后网页必须到服务器上重新传输。
    举例:

    <meta http-equiv="expires" content="Sunday 26 October 2016 01:00 GMT" />

    E. refresh(自动刷新并指向某页面)

    说明:网页将在设定的时间内,自动刷新并调向设定的网址。
    举例:

    <meta http-equiv="refresh" content="2;URL=http://www.lxxyx.win/"> //意思是2秒后跳转向我的博客

    F. Set-Cookie(cookie设定)

    说明:如果网页过期。那么这个网页存在本地的cookies也会被自动删除。

    <meta http-equiv="Set-Cookie" content="name, date"> //格式
    
    <meta http-equiv="Set-Cookie" content="User=Lxxyx; path=/; expires=Sunday, 10-Jan-16 10:00:00 GMT"> 
    //具体范例

    参考:关于 HTML 中 meta 标签的理解和总结

    展开全文
  • 因为分享,我们相遇在SEO路上在网站优化操作中,站长们会接触到很多标签,尤其是、、,是进行关键词布局必用的三个标签。...1、在HTML文件中,标题的标签是2、在HTML文件中,关键词的标签是3、4、在HTML文...
  • 少不了都会用到删除html标签的函数;这里介绍3种不同用途上的方法;$str='这里是p标签这里是a标签';1:删除全部或者保留指定html标签php自带的函数strip_tags即可满足要求,使用方法:strip_tags(string,allow);...
  • 昨天同学反馈的问题主要集中在以下几个:1.内容比较少,很快就学完了。...前面我们讲了 HTML 的基本结构,对于各个标签并没有深入讲解,今天我们学习 head 标签。先看一下 MDN 关于 head 标签的说明:T...
  • 当我的html文本太大时,我的错误高度...(当我的html内容较少但html内容大小不起作用时,它工作正常太大了)对于html内容属性文本,我的大小如下所示我按照以下方式将我的html字符串转换为属性字符串NSDictionary * ...
  • [java]代码库import java.util.ArrayList;import java.util.List;import java.util.regex.Matcher;.../*** 获取指定HTML标签的指定属性的值*/public class MatchHtmlElementAttrValue {/*** 获取指定HTML标签的...
  • package com.lyt.base.util;import java.util.regex.Pattern;public class FilterHtmlUtil {public static String Html2Text(String inputString){String htmlStr = ... //含html标签的字符串String textStr ="";j...
  • 本文实例讲述了Java基于正则表达式获取指定HTML标签指定属性值的方法。分享给大家供大家参考,具体如下:有时可能会有这样的需求,从HTML页面获取指定标签的指定属性值,可以通过第三方库解析来获取,但是这样相对...
  • 如下所示:package com.lyt.base.util;import java.util.regex.Pattern;public class FilterHtmlUtil {public static String Html2Text(String inputString){String htmlStr... //含html标签的字符串String textStr ...
  • 今天小编就为大家分享一篇java过滤html标签获取纯文本信息的实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
  • 1.需要下载Jsoup jar包public final static void parseResume(String fileName) throws IOException {// 获得document对象Document document = Jsoup.parse(new File(fileName), "utf-8");Elements images = ...
  • HTML中从多选下拉框中提取已选中选项的文本内容到后台,被这个问题难倒了。 demo.jsp文件<select id="selecttype" name"type"> <option value="" selected="selected">请选择</option> <c:...
  • jsoup获取meta标签、jsoup获取img标签、jsoup获取a标签、jsoup获取h标签、Java解析HTML标签 主要是对一个网页的meta、a、img等对SEO有有益的标签 主要代码:(熟悉Jsoup的看这块就行了,直接复制除实体对象外即可...
  • Java获取Html文本中的img标签下src中的内容方法如下所示:/*** 得到网页中图片的地址* @param sets html字符串*/public Set getImgStr(String htmlStr) {Set pics = new HashSet();String img = "";Pattern p_image;...
  • 使用UEditor富文本编辑器的话,可以直接通过UEditor提供的两个API将带有HTML标签的内容和没有HTML标签的纯文本内容获取到。 2)Jsoup 将带有HTML标签的内容通过jsoup转换掉,将获取到的纯文本内容存储。 具体代码...
  • java过滤html标签获取纯文本信息

    千次阅读 2018-07-05 00:07:18
    转载自 java过滤html标签获取纯文本信息package com.lyt.base.util; import java.util.regex.Pattern; public class FilterHtmlUtil { public static String Html2Text(String inputString){ String htmlStr ...
  • 在显示新闻的时候,首页 图片和文字 是分开的...给去掉,包含其他的有html标记的都要去掉,在网上查出来的这个能删除html中的标签.public static String Html2Text(String inputString){String htmlStr = inputString; ...
  • public static String Html2Text(String inputString){String htmlStr = ... //含html标签的字符串String textStr ="";java.util.regex.Pattern p_script;java.util.regex.Matcher m_script;java.util.regex.Patte...
  • 这里的获取的是html文件中body中的所有标签以及内容package com.lmt.service.file;import java.io.BufferedReader;import java.io.File;import java.io.FileInputStream;import java.io.InputStreamReader;import ...
  • 1.javajsoup从HTML解析获取标签节点和属性的代码:packagecom.javalm.tester;importorg.jsoup.Jsoup;importorg.jsoup.nodes.Document;importorg.jsoup.nodes.Element;importorg.jsoup.select.Elements;/***从HTML...
  • import java.util.List;import org.dom4j.Document;import org.dom4j.DocumentException;import org.dom4j.Node;import org.dom4j.io.SAXReader;public class Main {public static Document getDocument(final Strin...
  • 如下所示:/*** 得到网页中图片的地址* @param sets html字符串*/public Set getImgStr(String htmlStr) {Set pics = new HashSet();String img = "";Pattern p_image;Matcher m_image; String regEx_img = "]*?>...
  • 今天小编就为大家分享一篇Java 获取Html文本中的img标签下src中的内容方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
  • * 去除html代码中含有的标签 * @param htmlStr * @return */ public static String delHtmlTags(String htmlStr) { //定义script的正则表达式,去除js可以防止注入 String scriptRegex="<script...
  • packagecom.lmt.service....importjava.io.BufferedReader;importjava.io.File;importjava.io.FileInputStream;importjava.io.InputStreamReader;importjava.io.Reader;importorg.springframework.stereotype.Comp...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 933
精华内容 373
关键字:

java获取html标签

java 订阅