精华内容
下载资源
问答
  • 每次输入数据匹配数据库数据,加载到下拉框中。 边输入边加载,通常我们想到的就是文本框的onChange事件,不过这里用onchange,可以实现,但bug就太多了。 每次点击文本框,就会触发datagrid的行单击事件,...

    效果如图:


    每次输入数据去匹配数据库数据,加载到下拉框中。


    边输入边加载,通常我们想到的就是文本框的onChange事件,不过这里用onchange,可以实现,但bug就太多了。

    每次点击文本框,就会触发datagrid的行单击事件,且每次输入保存后也会触发该事件,处理的东西很多。


    改进,我用了loader属性。

     valueField: 'id',
     textField: 'text',
     url: "xx",
     mode: "remote", //定义文本改变时读取数据,remote为远程,用户输入的数据以参数名为q的数据请求到服务器,
     queryParams: {          
        // test: "123"<span style="font-family: Arial, Helvetica, sans-serif;">//附带查询参数(开启远程默认传递q,就是输入的内容)</span>
     },
     loader: ComboDataLoader, 
    //过滤从远程服务器加载的数据

    loader加载:

    //Combobox过滤从远程服务器加载数据 param:传递的参数,
    function ComboDataLoader(param, success, error) {
        //获取combobox输入的值
        var q = param.q;
        if (q == undefined || q == "" || q == null)
            return false;
        $.ajax({
            url: "/xxxx",
            type: "post",
            data: { searchTxt: q },
            dataType: "json",
            success: function (data) {
                //执行loader的success回调函数(装载数据)
                success(data);
            },
            //异常处理
            error: function (xml, text, msg) {
                error.apply(this, arguments);
            }
        });
    }

    这样处理就很方便,根据输入的文本来匹配下拉框的数据。




    展开全文
  • 使用Sed 匹配字段在其前后添加文本方法:修改文本test.txt中BUGID在其前一行加上just a test for add something ahead BUGIDsed “/匹配字段/i加上想要插入到匹配字段前一行的内容” 文件名dwm@dwm:~/dongwuming/...

    使用Sed 匹配字段后在其前后添加文本方法:

    修改文本test.txt中BUGID在其前一行加上just a test for add something ahead BUGID

    sed “/匹配字段/i加上想要插入到匹配字段前一行的内容” 文件名

    dwm@dwm:~/dongwuming/sed_test$ cat test.txt
    just a test
    BUGID: 11111111
    JiraID:22222222
    例如(三种格式都可以):
    dwm@dwm:~/dongwuming/sed_test$
    sed "/BUGID/i just a test for add something ahead BUGID" test.txt
    just a test
    just a test for add something ahead BUGID
    BUGID: 11111111
    JiraID:22222222
    sed "/BUGID/i\just a test for add something ahead BUGID" test.txt
    just a test
    just a test for add something ahead BUGID
    BUGID: 11111111
    JiraID:22222222
    dwm@dwm:~/dongwuming/sed_test$
    sed "/BUGID/ijust a test for add something ahead BUGID" test.txt
    just a test
    just a test for add something ahead BUGID
    BUGID: 11111111
    JiraID:22222222
    

    修改文本test.txt中BUGID在其后一行加上just a test for add something after BUGID:

    sed “/匹配字段/a加上想要插入到匹配字段后一行的内容” 文件名

    dwm@dwm:~/dongwuming/sed_test$ cat test.txt
    just a test
    BUGID: 11111111
    JiraID:22222222
        例如(三种格式都可以):
    sed "/BUGID/a just a test for add something after BUGID" test.txt
    just a test
    just a test for add something after BUGID
    BUGID: 11111111
    JiraID:22222222
    dwm@dwm:~/dongwuming/sed_test$
    sed "/BUGID/a\just a test for add something after BUGID" test.txt
    just a test
    just a test for add something after BUGID
    BUGID: 11111111
    JiraID:22222222
    dwm@dwm:~/dongwuming/sed_test$
    sed "/BUGID/ajust a test for add something after BUGID" test.txt
    just a test
    BUGID: 11111111
    just a test for add something after BUGID
    JiraID:22222222
    
    展开全文
  • 文本匹配工具正式开源

    千次阅读 2020-06-15 10:31:22
    文本匹配工具 RuleFinder 文本匹配工具是一个用于快速编写匹配规则,提取文本的工具。 ...当前版本号:0.1.12 update: 2020/6/12 ...RulePicker.py 规则提取器,可加载规则从批量文件中提取匹配结果

    文本匹配工具

    RuleFinder 文本匹配工具是一个用于快速编写匹配规则,提取文本的工具。
    源码地址: https://github.com/xmxoxo/RuleFinder

    当前版本号:0.1.12

    update: 2020/6/12

    本工具包括:类库,规则编辑器,批量提取器。

    RuleLib.py	类库,可自行引用到项目中使用;
    
    RuleEditor.py	规则编辑器,基于flask的WEB应用,可在浏览器中编辑规则;
    
    RulePicker.py	规则提取器,可加载规则后从批量文件中提取匹配结果;
    

    工具有什么用?

    在做NLP的前期文本处理工作时,需要对文本进行人工的分析,使用一些关键词或者句式等来匹配查找文本;甚至在一些简单的模型与处理中,也需要使用文本匹配的方式来对文本进行匹配处理,当然我们可以写很多正则表达式,但正则表达式太过复杂,普通情况下不会用到,而且正则表达式多了也不方便管理,于是产生了这个小工具。

    文本匹配工具,使用简便的匹配规则来对文本进行匹配。工具提供了基于WEB的规则编辑器,可快速编辑规则,验证规则的匹配结果。

    案例:按规则提取句子分类

    在这里插入图片描述

    运行以下命令即可启动案例:

    pip install -r requirements.txt
    python RuleEditor.py  -rule_file ./rules/rule3.txt -test_file ./test/test3.txt
    

    然后在浏览器中访问:http://127.0.0.1:8910

    匹配规则

    匹配规则包含以下元素:

    • 中括号("[]") : 代表其中的内容是可选
    • 尖括号("<>") : 代表其中的内容是必选
    • 竖线("|") : 代表或的关系;
    • 任意字符("**"): 匹配任意的字符;
    • 文字字符("??"):匹配汉字字符,区间为:[\u4E00-\u9FA5]
    • 非空字符("++"):匹配一个以上非空字符,非空字符正则为:"(?:[^  ,;;。‘’"“”]+?)"

    匹配规则与正则相似,规则如下:

    • 中括号[]: 代表其中的内容是可选的,比如:

      “不[得]”,能匹配 “不"和"不得”;

    • 尖括号<>: 代表其中的内容是必选的,比如:

      “<经>营”, 能匹配 “经营”

    • 竖线("|"):代表或的关系,即竖线分隔的内容是可替换的,比如:

      “<注册|成立>时间” 能匹配 “注册时间” 和 “成立时间”

    • 括号(): 是可以嵌套的;例如:

      “不[得<少|小>于]” 能匹配: “不”,"不得少于”,“不得小于”

      “[稳定|正常]运营” 能匹配: “稳定运营”,“正常运营”,“运营”

    • 竖线在其所属的括号内,优先级大于括号中的其他括号,比如

      “<注册[登记]|成立>时间” 能匹配: “注册时间”,“注册登记时间”,“成立时间”

    • 竖线可以脱离括号独立存在,比如:

      “在哪里|哪里有” 可以匹配: “在哪里"和"哪里有”

    更新日志

    v 0.1.12

    • 增加了加载数据文件的功能;
    • 各个客户端之间的规则文件及数据分析相互独立,不会干扰。可打开不同浏览器看效果;

    v 0.1.10

    • 可加载规则文件;
    • 可对规则进行增,删,改;

    使用案例

    1. 安装依赖包
    pip install -r requirements.txt
    
    1. ** 启动规则编辑器 **
      运行以下命令,使用默认参数启动启动规则编辑器:
    python RuleEditor.py  
    

    详细参数可见:

    python RuleEditor.py  -h
    

    默认启动时监听0.0.0.0:8910 端口

    默认加载规则文件为:./rules/rule.txt

    默认加载数据文件为: ./test/test.txt

    1. 访问规则编辑器

    使用浏览器打开以下地址访问规则编辑器:http://127.0.0.1:8910

    浏览器界面如下:

    在这里插入图片描述

    在浏览器界面中可以完成:

    • 规则文件加载;
    • 规则文件新建;
    • 规则添加、删除、编辑;
    • 对数据文件测试当前规则文件所有规则;
    1. 使用规则提取器

    完成规则编辑后,可以使用规则提取器,对整个目录下的文件批量提取结果。

    运行以下命令可运行demo:

    python RulePicker.py -rule ./rules/rule.txt 
    

    运行示例如下:

    13:36:55.38|F:>python RulePicker.py -rule ./rules/rule.txt
    正在批量处理,请稍候...
    正在匹配文件:./test/test.txt
    正在匹配文件:./test/test1.txt
    正在匹配文件:./test/test2.txt
    保存结果:./output/result_20200611134436.csv
    匹配用时: 0.03秒
    匹配结果共3个文件:
    =====文件:test 匹配:5条=====
    =====文件:test1 匹配:1条=====
    =====文件:test2 匹配:2条=====
    

    详细参数运行以下命令查看:

    python RulePicker.py -h
    

    参数如下:

    12:01:36.57|F:>RulePicker.py -h
    usage: RulePicker.py [-h] -rule RULE [-data DATA] [-output OUTPUT]
    
    RulePicker v_0.1.10 by xmxoxo
    
    optional arguments:
      -h, --help      show this help message and exit
      -rule RULE      rule file
      -data DATA      data file path, default: ./test/
      -output OUTPUT  output path, default: ./output/
    
    展开全文
  • java 正则匹配提取html纯文本

    千次阅读 2014-07-30 10:08:11
    java 正则匹配提取html纯文本

    本文来自于我的个人博客: java 正则匹配提取html纯文本


    做内容的大家都知道,从html中直接提取纯文本是一个很大的问题,现将我做的正则匹配贴上:


    import java.util.regex.Matcher;
    import java.util.regex.Pattern;
    
    
    public class TestReg {
    	static String reg = "<[a-zA-Z]+.*?>([\s\S]*?)</[a-zA-Z]*>";
    	public static void main(String[] args) {
    		// TODO Auto-generated method stub
    		String str = "<p></p><p>&nbsp;&nbsp;&nbsp;&nbsp;我们以Buffer类开始对java.nio包的浏览历程。"
    				+ "这些类是java.nio的构造基础。这个系列中,我们将跟随《java NIO》书籍一起深入研究缓冲区,"
    				+ "了解各种不同的类型,并学会怎样使用。</p><p>&nbsp;&nbsp;&nbsp;&nbsp;一个Buffer对象"
    				+ "是固定数量的数据容器。其作用是一个存储器,或者分段运输区,在这里数据可被存储并在之后用于检索。"
    				+ "</p><p>&nbsp;&nbsp;&nbsp;&nbsp;Buffer类的家谱:</p><p>&nbsp;&nbsp;&nbsp;&nbsp;"
    				+ "<img src="http://photo.jfq24.com/image/bigger/blog/server/upload/2014-07/user_2/13711406446068247.png" "
    				+ "title="2014-07-27_1527.png"></p><p>&nbsp;&nbsp;&nbsp;&nbsp;<strong>一,缓冲区基础</strong>"
    				+ "</p><p>&nbsp;&nbsp;&nbsp; 1.缓冲区的属性:</p><p>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;"
    				+ "容量(capacity):缓冲区能够容纳的数据元素的最大数量,这一容量是在缓冲区被创建时设置的,并且永远不能被改变</p>"
    				+ "<p>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;上界(limit): 缓冲区的第一个不能被读或写的元素。"
    				+ "或者说,缓冲区中现存元素的计数。</p><p>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;位置(position): "
    				+ "下一个要被读或写的元素的索引,位置会自动由相应的get()和put()函数更新。</p><p>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;"
    				+ "&nbsp;&nbsp;&nbsp;标记(mark): 一个备忘位置,调用mark()来设定mark=position.调用reset()设定position=mark。"
    				+ "标记在设定前是未定义的(undefied)。</p><p>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;这四个属性的关系如下:</p";
    		Pattern p = Pattern.compile(reg, Pattern.MULTILINE);
    		str = str.replace("&nbsp;", "");
    		Matcher m = p.matcher(str);
    		while(m.find()) {
    			String data = m.group(1).trim();
    			if(!"".equals(data)) {
    				System.out.println(data);
    			}
    		}
    	}
    
    }


    展开全文
  • NLP之文本匹配及语义匹配应用介绍

    万次阅读 多人点赞 2019-07-11 18:11:57
    2、文本匹配方法概述2-1 传统文本匹配方法2-2 主题模型2-3 深度语义匹配模型表示型交互型3、语义匹配应用介绍3-1 短文本-短文本语义匹配3-2 短文本-长文本语义匹配案例1-用户查询-广告页面相似度案例2:文档关键词...
  • 文本匹配】交互型模型

    千次阅读 2020-07-21 23:36:47
    表示型的文本匹配模型存在两大问题:(1)对各...(3)匹配层:将文本对的编码层输出进行交互、对比,得到各文本强化的向量表征,或者直接得到统一的向量表征; (4)融合层:对匹配层输出向量进一步压缩、融合; (5
  • 文本匹配(语义相似度/行为相关性)技术综述

    万次阅读 多人点赞 2019-01-13 13:08:39
    NLP 中,文本匹配技术,不像 MT、MRC、QA 等属于 end-to-end 型任务,通常以文本相似度计算、文本相关性计算的形式,在某应用系统中起核心支撑作用,比如搜索引擎、智能问答、知识检索、信息流推荐等。本篇将纵览...
  • 文本匹配文本相似度模型之DSSM

    千次阅读 2019-05-14 18:17:30
    本文是我的匹配模型合集的其中一期,如果你想了解更多的匹配模型,欢迎参阅我的另一篇博文匹配模型合集 所有的模型均采用tensorflow...DSSM也算是深度学习在文本匹配领域中的一个先驱者,接下来我们会先从其结构开...
  • 数据描述以下程序是对如下格式的数据进行合并处理。这个表的每一行表示用户id及用户的特征。其中,一个用户只有一个特征向量,即第一列不会重复。 这张表的第一列,表示用户的id,第二列表示用户所看的电影,第三列...
  • VLOOKUP函数匹配不出数据

    千次阅读 2018-10-26 16:37:06
    今天逛ExcelHome论坛的时候,发现一个关于vlookup函数匹配不出数据的帖子。      提问者想通过订单号 匹配收入 sheet里的收入以确认订单金额是否入账,结果发现并不能匹配出结果。  笔者看见有以下想法:...
  • 深度文本匹配发展总结

    万次阅读 2018-07-28 02:39:15
    文本匹配是自然语言处理中的一个核心问题,很多自然语言处理的任务都可以抽象成文本匹配问题,例如信息检索可以归结成查询项和文档的匹配,问答系统可以归结为问题和候选答案的匹配,对话系统可以归结为对话和回复的...
  • 正则表达式匹配多行文本

    千次阅读 2019-05-02 00:52:00
    简单的都容易匹配,但是如何匹配多行文本?我首先想到的是用\s*匹配空字符(回车、换行、水平制表符等),然后用.*匹配所以非空字符,发现这样只能够一个段落一个段落的匹配,很不方便。想了一晚上没有想出来,最后...
  • 在处理数据时,有时需要找出数据中存在错误的数据或者对数据进行去重。对数据去重,如果存储在数据库中,我想一个sql就可以搞定,可是要找出数据中错误的数据,就比较困难,一般只能人工判断。举例:比如有一批账单...
  • R语言︱词典型情感分析文本操作技巧汇总(打标签、词典与数据匹配等) 笔者寄语:情感分析中对文本处理的数据的小技巧要求比较高,笔者在学习时候会为一些小技巧感到头疼不已。 主要包括以下内容: 1、...
  • 文本匹配文本相似度模型之DRCN

    千次阅读 2019-06-03 18:49:22
    本文是我的匹配模型合集的其中一期,如果你想了解更多的匹配模型,欢迎参阅我的另一篇博文匹配模型合集 所有的模型均采用tensorflow进行了实现,欢迎start,代码地址 简介 DRCN和DIIN的结构十分相似,包括输入层与...
  • 深度文本匹配开源工具(MatchZoo)

    万次阅读 2017-12-10 23:32:04
    博主导言:苦于Deep Learning的baseline太多实现困难?苦于没有好的基于深度学习处理NLP, IR, QA任务的开源...MatchZoo提供了基准数据集(TREC MQ系列数据、WiKiQA数据等)进行开发与测试,整合了当前最流行的深度文本
  • 文本匹配方法系列––BERT匹配模型

    千次阅读 2020-06-03 10:51:35
    在介绍深层次交互匹配方法之前,本文接着多语义匹配方法[1]介绍基于BERT模型实现文本匹配的方法。将其单独介绍主要因为BERT实现文本匹配操作方便且效果优秀,比较适用于工业应用场景。关于bert模型,Dev
  • NLP | 搜索文本匹配算法

    千次阅读 2020-07-17 18:26:13
    搜索即找到跟搜索词句很相似的文本,例如在百度中搜索"人的名",结果如下 那么怎么评价两个文本之间的相似度呢? 余弦相似度 (cosine similiarity) 本文介绍基于VSM(Vector Space Model) 的余弦相似度算法来...
  • 数据挖掘之文本分类的数据预处理

    千次阅读 2013-10-05 15:44:52
    在进行文本分类时,毫无疑问会涉及到对文本数据进行预处理,包括文档切分、文本分词、去停用词(包括标点、数字、单字和其它一些无意义的词)、文本特征提取、词频统计、文本向量化等操作。下面就这几方面作一个概括...
  • 1 grep查找文本(用unix专用的术语是“匹配文本”),非常的方便;从传统而言,有三种程序可以用来查找整个文本文件: grep 最早的文本匹配程序。BRE(Basic Regular Expression),使用POSIX定义的基本正则表达式。...
  • 文本匹配(语义相似度)综述

    千次阅读 2020-04-11 21:34:30
    打卡的任务场景和数据集 一、相似度计算&复述识别(textual similarity¶phrase identification) 二、问答匹配(answer selection) 三、对话匹配(response selection) 四、自然语言推理/文本蕴含识别...
  • 深度文本匹配的基本方法

    千次阅读 2018-07-05 12:02:49
    基于单语义文档表达的深度学习模型主要思路是,首先将单个文本先表达成一个稠密向量(分布式表达),然后直接计算两个向量间的相似度作为文本间的匹配度。 基于多语义文档表达的深度学习模型 基于多语义的文档表达...
  • 匹配字符串 = "燃气经营(汽车加气);天然气项目投资(含天然气汽车加气站投资);道路危险货物运输(凭有效...目的:去掉小括号和括号中的文本 目前尝试过的正则匹配式:1、^\\(\u4e00-\u9fa5^\\) 2、"\\(.*?\\)
  • erlang的正则匹配文本解析

    千次阅读 2015-08-31 19:11:25
    发生了一个bug,为了维护数据,先把内存中的数据到处到日志文本,然后整理好修正算法之后,把日志文本里的数据重新分析,导入内存。 正则匹配: http://langref.org/erlang/pattern-matching 这里讲了很多用法 re...
  • 多模态与图像文本匹配

    万次阅读 2017-12-18 16:05:32
    图像文本匹配,顾名思义,就是度量一幅图像和一段文本的相似性,该技术是多个模式识别任务的核心算法。例如,在图像文本跨模态检索任务中,当给定查询文本,需要依据图像文本的相似性去检索内容相似的图像;
  • 图像文本匹配,顾名思义,就是度量一幅图像和一段文本的相似性,该技术是多个模式识别任务的核心算法。例如,在图像文本跨模态检索任务中,当给定查询文本,需要依据图像文本的相似性去检索内容相似的图像;在图像...
  • 1. 文本相似度问题与应用 2. 文本相似度模型介绍 3. 实战:基于Python实现编辑距离 4. 实战:基于simhash实现相似文本判断 5. 实战:词向量Word AVG 1. 文本相似度问题与应用 文本相似度问题 文本相似度问题...
  • 1 ▌深度文本匹配综述 ... 作者:庞亮 兰艳艳 徐君 郭嘉丰 万圣贤 程学旗  ...摘要:自然语言理解的许多任务,例如信息...最近深度学习自动从原始数据学习特征的思想也影响着文本匹配领域,大量基于深度学习的
  • 文本匹配:语义相关性

    千次阅读 2018-08-19 19:52:46
    语义相关性,比如搜索,查询词和文档如果关键字不一样,但两者是多词一义,则模型不理解语义,做语义上的匹配解决不了问题。在推荐中,商品可以由一个向量来刻画,用户也可以由一系列交互过的商品来表达,两者之间做...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 334,714
精华内容 133,885
关键字:

匹配后的数据变文本