精华内容
下载资源
问答
  • java代码,从image标签中正则匹配取出src标签的内容,java代码,从image标签中正则匹配取出src标签的内容
  • 在做项目的过程中,需要将一段html代码中的img标签中的src属性值批量替换成其他对应的值。如下一段代码demoimg{width: 200px;}![]...

    在做项目的过程中,需要将一段html代码中的img标签中的src属性值批量替换成其他对应的值。

    如下一段代码

    demo

    img{

    width: 200px;

    }

    ![](http://upload-images.jianshu.io/upload_images/765812-0c17fe5db8bfa3b9.JPG?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)

    ![](http://upload-images.jianshu.io/upload_images/765812-0c17fe5db8bfa3b9.JPG?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)

    ![](http://upload-images.jianshu.io/upload_images/765812-0c17fe5db8bfa3b9.JPG?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)

    ![](http://upload-images.jianshu.io/upload_images/765812-0c17fe5db8bfa3b9.JPG?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)

    经过处理需要变成如下一段html片段

    demo

    img{

    width: 200px;

    }

    ![](http://dogwhere.b0.upaiyun.com/topic/3b473ccb822f4354823c07a8addf18667.JPG)

    ![](http://dogwhere.b0.upaiyun.com/topic/3b473ccb822f4354823c07a8addf18668.JPG)

    ![](http://dogwhere.b0.upaiyun.com/topic/3b473ccb822f4354823c07a8addf18669.JPG)

    ![](http://dogwhere.b0.upaiyun.com/topic/3b473ccb822f4354823c07a8addf18670.JPG)

    解决这个问题的关键就是一个正则表达式,如下是处理的完整代码

    //匹配img标签的正则表达式

    String regxpForImgTag = "]+/>";

    Pattern pattern = Pattern.compile(regxpForImgTag);

    Matcher matcher = pattern.matcher(result);

    while (matcher.find()) {

    String temp = matcher.group();

    String tempUrl = temp.substring(temp.indexOf("src=") + 5);

    tempUrl =tempUrl.substring(0, tempUrl.indexOf("\""));

    String urlResult = "another url";

    result = result.replace(temp, urlResult);

    }

    展开全文
  • 如果用户在录入文章内容时,录入了前端编辑【我们采用tinymce编辑】提供的表情符号时,该编辑也把表情符号转换成了 img标签。只不过src路径前部分是固定的。 要求: 后台返回文章内容前300字是过滤了html...

    背景

    近期做一个文章管理的模块,里面有个查询文章列表的接口,要求显示文章内容前300个字。由于文章内容可能包含多张图片,附件等。所以在数据库中文章内容存的是blob格式。前端是把文章的html格式传给后台,由后台整体存到blob中

    如果用户在录入文章内容时,录入了前端编辑器【我们采用tinymce编辑器】提供的表情符号时,该编辑器也把表情符号转换成了 img标签。只不过src路径前部分是固定的。

    要求

    后台返回文章内容前300字是过滤了html标签的纯文字,比如<p> <a> <img>等标签替换成空了。但是表情符号不要过滤,前300字中如果有表情符号就显示表情符号,其他图片必须过滤。

    解决办法

    利用正则把文章内容的html标签替换成空,但是不能替换特定img表情符,然后剩余存文字取前300即可。

    //content是文章内容的html
    //static/tinymce4.7.5/plugins/img/01.gif  是表情符路径,所有表情符号前面路径都一样,
    //只有名字不一样
    //正则:(?!<(img|IMG) src=\"static/tinymce4.7.5/plugins/img/.*?/>)<.*?>
    content = content.replaceAll("(?!<(img|IMG) src=\"static/tinymce4.7.5/plugins/img/.*?/>)<.*?>","");
    
    //过滤tab符号、回车、换行html
    content = content.replaceAll("\t|\n|\r","");
    
    //双引号替换为“”
    content = content.replaceAll("&ldquo;","\"");
    content = content.replaceAll("&rdquo;","\"");
    
    //空格去掉
    content = content.replaceAll("&nbsp;","");
    
    if(content.length()>300){
        content = content.substring(0,300);
    }
    System.out.printf("content=" + content);
    
    

     

    展开全文
  • 工具类记录于此,以供参考。 package ... import org.apache.commons.lang3.StringUtils; import java.util.regex.Matcher; import java.util.regex.Pattern; /** * @author hilbert.xu * @date...

    工具类记录于此,以供参考。 

    package com.gccp.translate.biz.util;
    
    import org.apache.commons.lang3.StringUtils;
    
    import java.util.regex.Matcher;
    import java.util.regex.Pattern;
    
    /**
     * @author hilbert.xu
     * @date 2019/5/20
     */
    public class HtmlUtil {
    
        /**
         * 过滤所有以html标签
         */
        private final static String REG_HTML = "<([^>]*)>";
        /**
         * img标签
         */
        private static final String REG_IMG = "(<img\\b.*?(?:\\>|\\/>))";
    
        /**
         * @param htmlStr
         * @return 删除Html标签
         */
        public static String delHTMLTag(String htmlStr) {
            Pattern p_html = Pattern.compile(REG_HTML, Pattern.CASE_INSENSITIVE);
            Matcher m_html = p_html.matcher(htmlStr);
            // 过滤html标签
            htmlStr = m_html.replaceAll("");
            return htmlStr;
        }
    
        /**
         * 获取完整img标签
         *
         * @param html
         * @return
         */
        public static String[] getImgs(String html) {
            Pattern p_image;
            Matcher m_image;
            String str = "";
            String[] images = null;
            p_image = Pattern.compile(REG_IMG, Pattern.CASE_INSENSITIVE);
            m_image = p_image.matcher(html);
            while (m_image.find()) {
                String tempSelected = m_image.group();
                if (StringUtils.isBlank(str)) {
                    str = tempSelected;
                } else {
                    String temp = tempSelected;
                    str = str + "," + temp;
                }
            }
            if (StringUtils.isNotBlank(str)) {
                images = str.split(",");
            }
            return images;
        }
    
    }
    

     

    展开全文
  • MyEclipse6.0 制作的小样例。包含Java特定字符。标签过滤。字符编码转换。代码清晰易懂。方便使用,作为工具非常合适 使用 List 作为 过滤字符库
  • JAVA去除a标签和img标签

    千次阅读 2019-03-19 11:57:10
    String str=""; str=str.replaceAll("<a href[^>]*>", ""); str=str.replaceAll("</a>", ""); str=str.replaceAll("<img[^>]*/>", " ");
    String str="";
    str=str.replaceAll("<a href[^>]*>", "");
    str=str.replaceAll("</a>", "");
    str=str.replaceAll("<img[^>]*/>", " ");
    
    展开全文
  • System.out.println("ss=" + "dddddd baidu ".replaceAll("*img\\s+([^>]*)\\s*>", "E")); System.out.println("ss=" + "dddddd baidu ".replaceAll("", "F")); String qq= "dddddd baidu ".replaceAll("*\\s>", "M...
  • import java.util.ArrayList; import java.util.List; import java.util.regex.Matcher; import java.util.regex.Pattern; public class Test { public static void main(String[] args) ...
  • 主要介绍了java和javascript中过滤img形式的字符串不显示图片的方法,以实例形式分别讲述了采用java和javascript实现过滤img形式字符串的技巧,需要的朋友可以参考下
  • /**过滤HTML里去除img、p、span外的所有标签 * @param str * @return * @throws PatternSyntaxException */ public static String stringFilter(String str)throws PatternSyntaxException { String regEx = "(?!&...
  • /**过滤HTML里去除img、p、span外的所有标签 * @param str * @return * @throws PatternSyntaxException */ public static String stringFilter(String str)throws PatternSyntaxException { String regEx = "(?!&...
  • importjava.util.regex.Matcher;importjava.util.regex.Pattern;/*** * Title: HTML相关的正则表达式工具类* * * Description: 包括过滤HTML标记,转换HTML标记,替换特定HTML标记* * * Copyright: Copyright (c) ...
  • package ... import java.util.ArrayList; import java.util.HashSet; import java.util.List; import java.util.Set; import java.util.regex.Matcher; import java.util.regex.Pa...
  • Java代码import java.util.regex.Matcher;import java.util.regex.Pattern;/*** * Title: HTML相关的正则表达式工具类* * * Description: 包括过滤HTML标记,转换HTML标记,替换特定HTML标记* * * Copyright: ...
  • JAVA去除HTML标签

    2021-02-26 17:40:49
    public static String delHTMLTag(String htmlStr){String regEx_script="]*?>[\\s\\S]*?"; //定义script的正则表达式String regEx_style="]*?>[\\s\\S]*?";... //定义HTML标签的正则表达式Patte...
  • java过滤html标签

    2021-02-28 17:15:42
    import java.util.regex.Matcher;import java.util.regex.Pattern;/*** * Title: HTML相关的正则表达式工具类* * * Description: 包括过滤HTML标记,转换HTML标记,替换特定HTML标记* * * Copyright: Copyright (c) ...
  • Java正则表达式过滤html中的标签

    千次阅读 2019-05-21 18:29:58
    今天在写项目中发现,发布一篇文章包含图片时数据库里存入的包含html标签,在文章列表中会显示这些标签,而不是过滤掉这些标签只展示内容,记录一下后台过滤的方法: package com.util; /**去除内容中html标签*/ ...
  • 获取一个字符串,其实就是HTMLEncode过来的HTML数据, 有一个img标签,但是src属性为空,怎么正则将该img标签去除掉?
  • content = content....img[^&gt;]*?)\\s+width\\s*[:|=]\\s*\\S+","$1"); content = content.replaceAll("(&lt;img[^&gt;]*?)\\s+height\\s*[:|=]\\s*\\S+","$1");
  • 再上传表情或者图片地址时候很多时候不能直接上传,因此在上传评论或者图片之前应该先处理一下img标签。举例如下,希望可以帮助更多的程序猿~//第一步是获取到带有img标签的字符串var str = '图片1图片2图片3';处理...
  • 例:修改某字符串中img标签的src路径/*** @param htmlStr : html字符串* @param tag : 替换img标签上某个属性* @return*/public static String replaceTag(String htmlStr, String tag){//解析传递的字符串 parse ...
  • OWASP HTML Sanitizer 是一个简单快捷的java类库,主要用于放置XSS优点如下:1.使用简单。不需要繁琐的xml配置,只用在代码中少量的编码2.由Mike Samuel(谷歌工程师)维护3.通过了AntiSamy超过95%的UT覆盖4.高性能,...
  • 本文实例讲述了java过滤标签实现将html内容转换为文本的方法。分享给大家供大家参考,具体如下:/*** 把html内容转为文本* @param html 需要处理的html文本* @param filtertags 需要保留的html标签样式* @return*/...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 12,231
精华内容 4,892
关键字:

java过滤img标签

java 订阅