精华内容
下载资源
问答
  • 意图识别

    2021-01-20 12:44:33
    本质是分类任务,多用在搜索引擎和智能问答中。 解决方法 1、基于词典以及模板的规则...2、基于机器学习模型来对用户的意图进行判别 标注语料应用ML或者DL训练模型进行测试。 应用fasttext进行文本分类。 作者:关平安
  • 亚马逊搜索意图识别

    2018-08-09 23:28:11
    亚马逊搜索意图识别,Query Understanding in Amzaon Search
  • 实验三 意图识别.rar

    2021-08-24 19:24:16
    意图识别代码及流程图
  • 战术意图识别是不确定性战场环境中理解战场态势、预测敌军将来行动过程的关键。意图识别模型的构建是作战仿真系统中实体行为建模的难点之一,如何表示不确定的意图元素及其不确定性关系并进行有效推理是意图识别的...
  • 意图识别(规则模板解析、深度学习意图识别

    万次阅读 多人点赞 2019-09-12 12:33:54
    一、意图识别应用领域 1、搜索引擎 2、对话系统:基于意图识别了解用户想要什么 业务 或者 闲聊,并采用不用的子模型来处理 1.1 闲聊 技术:闲聊机器人需要有较高的召回率,因此常常用:seq2seq + attention / ...

     一、意图识别应用领域

    1、搜索引擎
    2、对话系统:基于意图识别了解用户想要什么 业务 或者 闲聊,并采用不用的子模型来处理
        1.1 闲聊
                技术:闲聊机器人需要有较高的召回率,因此常常用:seq2seq + attention  / transformer / bert .... 
        1.2 基于业务,例如 电商、买票、查询天气
                技术:基于上述应用场景需要极高的精确率,因此常常用:① 基于业务规则模板、基于语义匹配 ② 
    3、智能物联网
    4、机器人

    二、意图识别的难点

    1、用户输入不规范,输入方式多样化,甚至非标准的自然语言
    2、表意表现出多意图
           仙剑奇侠传
           游戏?--> 游戏软件?……
           电视剧?--> 电视剧下载?相关新闻?……
    3、意图强度,表述不同表现出不同的需求强度
           天气很好啊-->弱意图(心情,闲聊模式)          今天天气怎么样-->强意图(业务模式)
    4、意图存在时效性变化,就是随着时间的推移相同问题的意图会发生变化      ******* 难点
    5、没有固定的评估的标准
    

    三、意图识别的主要方法

       1、意图识别的类别

    (1)导航型 
           将用户导航到相应的领域或相应的流程中
                例:百度 *** 导入到某个网站
    (2)信息型 
           提供给用户想知道的信息
                例:百度 *** 的个人信息    ----- 类似百度百科
    (3)事务型 
           给用户提供流程中的各个实现环节
                例:百度 *** 坏了         ----- 类似百度知道
    

       2、规则模板意图识别

         (1)词表穷举法

                         特点:必须一一命中才行,因此模型的召回率较低,精确率极高 

       (2)规则模板解析    

                    规则模板解析: 需要基于  分词、词性标注、命名实体识别、依存句法分析、语义分析 的前提下 才能完成

                                               而且数据中使用的也是字典形式(key hash 结构),查询速度较快。

    1、适用于查询非常符合规则的类别,通过规则解析的方式来获取查询的意图。
        例:
            北京到上海今天的机票价格,可以转换为:[地点]到[地点][日期][汽车票/机票/火车票]。
                执行过程:
                        第一步:寻找领域,获取子类模板字典
                        第二步:选取模板,这里面命中模板不是所有的内容都全部命中,只需要命中一部分。
                        第三步:采取 反问模板 与用户沟通缺失了模板的那些内容,并补全这些内容(即上述问句没有日期)
                        第四步:给出 完整的模板信息 并 等待用户确认。
            1吨等于多少公斤,可以转换为:[数字][计量单位]等于[数字][计量单位]。
        对规则性较强的query有较好的识别精度,能够较好的提取准确信息。
        缺点:需要人工参与较多,很难自动化实现。
        实用指数:4★
        场景:搜狗通用搜索、小i智能客服、机器人、智能物联网、支付宝分控系统有10000多个模板。
    

                     特点:规则性较强的query精确率较高,召回率也不错 

    •    案例:搜狗搜索 意图识别

                         规则意图识别的一般技术

                                1. 判断领域:采用实体-主域-模板的整体框架来判别识别领域

                                          注意:主题    ------ 大类别 ;主域  ------- 子类别 ; 模板

                                2. 判断意图:命中主域后,模板采用意图动词(下载、查询等)或意图疑问词(怎么样、为什么等)判别意图

                                3. 区分弱意图和强意图,针对性提供解决方案;判断实体强度

                                    搜索引擎意图识别领域判别表:仙剑奇侠传

                     计算过程 

                              第一步:主体(大类)计算

                              第二步:主域(子类)计算 

    •  规则模板解析优化 
    4.  query改写包括:query纠错,query扩展,query删除,query转换。
             a. 进行同义词扩展     eg:我去旅游   我要旅游       ------- 技术:① word2vec ② 
             b. 删除一些修饰,扩大召回                          ------- 技术:① booststriping信息抽取 ② 语义分析(三元组)
             c. 通过近义或同义转化,扩大召回                    ------- 技术:① word2vec ② 
    

        3、深度学习意图识别

    1、机器学习和深度学习方法
        意图识别可以看做是一个分类问题,针对于垂直产品的特点,定义不同的查询意图类别。
        对于用户输入的query,根据统计分类模型计算出每一个意图的概率,最终给出查询的意图。             
        缺点:主要是数据获取和更新较困难,数据的标注也需要较准确才能训练出较好地模型。
        实用指数:4★
        场景:京东JIMI、美团垂直搜索
    
    2、深度学习 意图识别常见 模型:
        ① LSTM + attention
        ② BERT网络 分类意图识别

                       特点:模型召回率很高 

    •     案例:京东JIMI  意图识别

                          一、 大致结构

                       二、模型网络

    京东JIMI意图识别(baseline)
        深度学习CNN模型,可用于求解一个分类问题,将用户的问题映射到一个具体的分类。最终在算法选型上,采用深度学
        习CNN模型,其中模型参数:
            词向量采用100维
            每个样本限定30个字以内,超出30截断,不足30补充随机向量
            单层CNN网络,第一层卷积核大小3*50
    

     

     

    展开全文
  • 意图识别项目笔记

    千次阅读 2019-02-26 17:53:37
    意图识别分为两个模块:意图分类的识别和当前意图中slot(槽位)的识别。其中槽位的识别可以参考实体的识别,但又与之不同。槽位识别可以看做是对每个意图所需条件的识别,比实体的识别更加多元化。比如有一句话:显示...

    意图识别分为两个模块:意图分类的识别和当前意图中slot(槽位)的识别。其中槽位的识别可以参考实体的识别,但又与之不同。槽位识别可以看做是对每个意图所需条件的识别,比实体的识别更加多元化。比如有一句话:显示从北京到上海的航班。

    意图:航班查询。

    槽位标记:北京(from-city),上海(to-city)

    实体标记:北京(city),上海(city)。

    1.项目流程

    样本格式:采用BIO标记策略,句子+EOS+句子中每个字对应的槽位标签+意图。

    1.数据预处理阶段:。将句子,槽位标签,意图id化并保存至文件中

    2.模型输入:句子的列表,每个句子长度的列表,槽位列表,意图列表。

    3.模型架构:通过模型预测槽位列表、意图列表。

    4.损失计算:通过NLLLoss()函数(只接收log_softmax后的数据)计算槽位、意图和实际的损失。

    5.模型优化:使用Adam函数优化损失。

    2.模型架构

    下面来详细介绍上述流程中的模型架构。

    模型结构图:

     

    该模型是基于seq2seq+attention对齐机制的架构,分为Encoder和Decoder两个阶段。

    Encoder:   加载预训练的语言模型,对输入的数据进行字嵌入得到字向量,通过torch中的pack_padded_sequence将字向量按照句子长度降序、padding、打包作为LSTM的输入,通过双向LSTM进行特征提取。返回每个时刻隐藏层的输出结果hiddens和最后一个时刻隐藏层输出的(h,c)的二元组state。

    Decoder:   该阶段通过Encoder阶段的输出来预测意图和槽位。

    1.将Si-1为decode阶段上一个时刻的输出,将Si-1赋值n份(n为Encoder阶段中的时刻数,也就是句子长度)与hiddens进行加权求和获取Encoder中的权重参数,再与hiddens相乘获取文本向量Ci,并将其添加到一个文本向量列表Cn。

    2.Si为decoder阶段当前时刻的输出状态:Si=Si-1 + yi-1 + Ci。将Si和当前时刻对应Encoder中的时刻的输出ht做拼接,使用单向LSTM提取特征,通过log_softmax提取概率最大的作为yi,并添加值预测槽位列表中。

    3.将文本向量列表Cn与Encoderhiddens拼接,做取均值降维,再使用log_softmax作为输出结果并添加到预测意图列表中。

    展开全文
  • 该方法将微博消费意图识别看作为领域自适应学习问题,利用搜索引擎查询日志中的查询和点击信息,利用共同特征设计分类器,抽取置信度高的伪标注消费意图微博,再利用微博特征训练新的分类器对微博进行消费意图识别。...
  • 针对传统基于模板匹配、关键词共现、人工特征集合等方法的问答机器人存在用户意图识别耗时、费力且扩展性不强的问题,本文结合地质领域文献中结构化知识问答的复杂特点,使用了基于网格记忆网络(LSTM+CRF+Lattice)...
  • 意图识别 11785的意图识别和NLU项目
  • 网络攻击意图识别

    2019-04-28 09:56:49
    1978年,Schmidet在文献中第一次提出规划识别问题(即意图识别,Schmidet不区分规划识别与意图识别),认为“规划识别”是通过观察人的行为去理解他的意图、信念和目标的过程,是心理学和人工智能的交叉问题。意图...

    1978年,Schmidet在文献中第一次提出规划识别问题(即意图识别,Schmidet不区分规划识别与意图识别),认为“规划识别”是通过观察人的行为去理解他的意图、信念和目标的过程,是心理学和人工智能的交叉问题。意图识别的研究最早应用于对自然语言理解、故事理解、语音翻译等,随后逐渐应用到多智能体监测与协作、动态交通监控、冒险游戏、网络入侵检测、机器人、军事等。经过三十多年的发展,出现了很多模型和方法。
    如基于解释的意图识别方法、基于决策理论的意图的识别方法、基于规划图分析的意图识别方法、基于概率推理的意图识别方法等。
    在网络安全领域,多元信息融合领域的态势评估技术和人工智能领域的意图识别技术有强烈的应用需求和良好的发展前景,许多学者开始关注网络安全态势评估和额昂络安全意图识别的研究。Bass提出下一代的入侵检测系统:应用多传感器数据融合理论建立网络空间的态势感知框架,通过推理识别攻击者身份、攻击速度、入侵行为、攻击意图和进行威胁分析等,进而感知网络空间安全态势。
    文献借鉴军事战场意图识别方法开展网络攻防对抗下的入侵意图识别和入侵策略的研究。攻击手段的灵活多变使得通过低层次的系统事件或网络事件分析入侵者的攻击策略变得非常困难,而高层次的意图识别能够提供独立于具体攻击手段的高水平的分析平台。在意图分析的层面上,入侵检测就变成使用各个异构的IDS协同工作去证实或者否定事先定义的各种意图假设。这两篇文献仅仅提出理论和概念的架构,没有提出具体的实现方法,更没有形成实用的原型系统。
    目前国内外对网络攻击意图识别的研究才刚刚开始,还没有见到比较完整的理论方法以及实用的系统。
    国内却有一些非常前沿的安防产品正是利用了这一概念,虽然没有实现完全的自动化的意图识别,但理论引导实践这条路上,云漫又走在了前面。利用攻击意图分析的优势,在安防领域异军突起,迅速占有了大部分的市场。
    当然理论的发展离不开资金的投入,这是一个相辅相成的系统,互相促进,共同发展。
    人工智能为网络攻击意图识别提供思路
    Honeywell实验室的Geib等将人工智能领域的规划识别引入到网络安全的领域中来,并指出网络安全领域中的识别规划与传统得规划识别不同,是一种对抗式的规划识别。因为攻击者总是采取欺骗、隐蔽等手段掩盖自己的行为和意图。该方法将主体所有的 可能的攻击行为作为扩展集。扩展集中概率最大的行为就是主题最可能的攻击规划,但存在一些不足:
    很难构建完备的规划库;为了更新扩展集需要搜索主体所有可能的行为,可能引发搜索空间爆炸。文献在规划识别基础上结合网络攻击的对抗特点提出了基于扩展目标规划图的网络攻击规划识别方法。该方法将观察到的具体动作转化为抽象动作,根据抽象动作之间的关联识别背后蕴藏的攻击规划,这与将报警泛化为超报警的本质是相似的。文献建立了入侵检测的规划识别模型,采用因果告警关联分析和贝叶斯推理网络实现规划识别,以找回因入侵检测自身的检测策略不足和网络覆盖范围脆弱性而丢失的关键告警,重构实际的攻击场景。这三项研究在人工智能了领域中意图识别的经典方法基础上做了相应改进,提出理思路和理论框架。但是这些研究主要还是对已经发生的攻击行为的识别和提炼上,对网络安全领域的复杂特点没有针对性,对不确定的描述和推理攻击者的意图(最终目标)识别以及威胁分析等的研究还没有开展。
    基于攻击行为的报警关联、攻击场景构建
    Cuppens等在MIRADOR项目中通过报警关联分析来提炼攻击者的入侵策略。对攻击行为的前提、后果进行建模,根据后续行为的前提与先前行为的后果是否匹配来对两个行为进行关联。当检测到攻击行为时,搜索满足匹配条件的攻击路径来构造攻击者的规划。当有多条攻击路径对应着不同的攻击目标时,选择最短的攻击路径对应的攻击目标作为攻击者的入侵意图。随着事件数量的增多,关联搜索空间急剧增大,不适合大规模的在线处理。而且,当攻击者的行为对应着多个攻击目标时,选择最短路径显然不能达到最佳效果。Qin等将攻击树转化为因果网络,并关联孤立的攻击场景,利用专家知识给出因果网络的先验概率分布,推理攻击者的意图和攻击行为。该方法需要先验知识来构建因果网络和条件概率。Ning等提出通过报警关联报警自动自动生成攻击策略的方法。攻击策略通过攻击策略图来描述,节点代表攻击行为,边代表攻击的时间顺序,边与节点的约束关系将攻击行为关联起来。该方法将一些形式不同但本质相同的报警泛化成超报警后再经行关联,简化攻击策略分析。

    展开全文
  • 查询的意图识别

    千次阅读 2014-05-03 00:33:37
    什么是意图识别

    什么是意图识别


    通用搜索 VS 垂直搜索
    通用搜索特点:
    抓取互联网上一切有价值的页面,统一建立索引,以关键
    字匹配为基本检索方式,以网页title和summary为展现
    方式。
    目前以google,百度,搜狗,搜搜,有道为代表。
     
    垂直搜索特点:
    以一特定类别为主题,只抓取不主题相关信息,根据主题
    特点有针对性的建立相应的索引检索方式,筛选方式,以
    及展现方式。
    目前以机票搜索,地图搜索,购物搜索,招聘搜索,房产
    搜索,软件搜索,知识搜索,学术搜索等为代表。
     
    通用搜索 VS 垂直搜索
    通用搜索:搜狗输入法下载
     
    软件搜索:搜狗输入法下载
     

    为什么要识别搜索意图


    由于通用搜索的展示方式的局限性,对于某些需求的查询并
    丌能得到很好地满足,而这些查询的在其对应的垂直搜索中
    却有很好的结果,所以我们需要识别出查询词对应的垂直搜
    索,并从中获取结果嵌入到通用搜索引擎中。
     
    意图搜索的难点
    输入丌规范:自然语言,非标准自然语言,堆砌关键词等
    意图太多:一条查询有可能同时命中多意图
    多意图的顺序:命中多意图的查询如何组织顺序
    语料难以获取:意图的分类模型语料难以获取
    搜索结果的可靠性:搜索来自中小网站,搜索质量难保障
    时效性问题:类别的内容时时刻变化的


    搜索意图识别方法
    词表穷举法:
    最简单直接的方法,通过词表的直接匹配来获取查询意图,
    也可加入适用于较为简单且查询较为集中的类别,比如电
    视台节目查询,节假日查询,餐馆查询等。
     
    实现方法:
    建立白名单系统,人工添加展现词
    建立词表扩展系统,按规则生成展现词表
     
    优缺点:
    简单易实现,能很好的解决高频词,但召回比较低,人工
    比例较高,且无法解决长尾查询词。

    规则解析法:
    适用于一些查询虽然丌集中但非常符合规则的类别,通过
    规则解析查询来做意图识别和关键信息提取的,比如汇率
    查询,计算器,度量衡等。
     
    实现方法:
    通过建立规则解析查询(词表,正则等)
    使用黑白名单来提升精度
     
    优缺点:
    信息提取准确,配合简单类别识别模型可以得到较丌错的
    识别精度,只适用规则性较强的类别。

    统计模型分类法:
    一般有两种方法,一种是基于查询词本身的分类,另一种
    是基于查询词结果迚行分类。这种方法适用于一些查询较
    为分散,且规则丌明确的类别,比如:软件下载查询,地
    图查询,招聘查询等。
     
    实现方法:
    意图模型的语料整理和分类模型建立
    通过查询扩展分类模型来辅助判断
     
    优缺点:
    实现较为复杂,数据获取困难,数据更新困难,但效果较
    好,稳定性好,通用性好,在持续更新语料的条件下,可
    以通过流程自动更新。


    意图识别的特殊类别:
    在搜索引擎意图识别的具体应用中,还存在一部分特殊的
    查询类别,无法使用上述的方法统一解决,就需要我们根
    据具体情况具体分析。
     
    微博类意图识别:
    通过在通用搜索引擎中嵌入微博搜索结果,来帮助用户获
    得比较实效的信息。
     
    微博类意图识别实现方法:
    对搜索结果做实效性判断(发表时间,来源类型等信息)
    建立流程监控搜索查询日志的变化
    搜索意图识别数据获取

    分类模型数据获取问题:
    对于意图识别分类模型的训练和更新,数据是非常重要的
    部分,但是现实中很难持续得到大批量的高质量的训练语
    料,特别是对于中小型企业更是通过合作来获得数据。
     
    手工标注:效率差,准确度丌稳定(类别相关)
    自建垂直搜索:成本高,效率低,成效慢
    不垂搜合作:除了极个别大牛公司,一般都搞丌定
     
    分享一种有效地方法(自己解决):
    1.获取种子查询集合
    2.通过搜索引擎获取行业网站的集合
    3.以行业网站为评判标准来获取新的类别查询
    4.反复迭代

    搜索意图识别未来

    无类别概念的意图识别
    基于垂搜的分类模型,而非基于类别的分类模型,帮助用
    户获取想要的内容而丌限定类别
     
    个性化意图上下文分析
    根据用户特征建立个性化的信息,获取用户的短期兴趣和
    长期兴趣,准对性的优化意图识别
     
    精准意图理解
    更加精准的意图理解,所有价值信息的解析,目前的展现
    多为整体展现,可以再迚一步来生成个性展现
     
    语音应用的意图理解
    针对语音类应用的特点优化,比如语音纠错,个性信息的
    辅助意图识别等。


    展开全文
  • Query意图识别分析

    千次阅读 2019-07-02 15:05:55
    outline 近段时间在研究搜索的相关技术,在工作中主要涉及到资讯搜索功能的实现。...意图识别 query改写 什么是搜索 一个搜索引擎的技术构建主要包含三大部分: (1) 对query的理解 (2) 对内容(文档)...
  • 下肢外骨骼机器人意图识别算法研究.pdf
  • 聊天机器人中用户就医意图识别方法.pdf
  • 基于深度神经网络的空中目标作战意图识别
  • 基于用户意图识别的元搜索组推荐机制
  • 知识图谱与KBQA——意图识别

    千次阅读 2019-04-01 14:35:20
    意图识别是通过分类的办法将句子或者我们常说的query分到相应的意图种类。 在做这个工作之前,我们首先得想好意图的划分问题,这种划分业界有很多叫法,比如技能。 意图识别的基本方法 1.基于词典以及模版的规则方法...
  • 面向问题意图识别的深度主动学习方法.pdf
  • 意图识别资料纪录

    2019-11-13 18:50:39
    今天搞意图识别貌似这个资料的介绍很不错 不知道怎么转载,放到这https://blog.csdn.net/zengNLP/article/details/94657099
  • 意图识别的三篇博文

    千次阅读 2018-09-07 11:53:59
    搜索引擎的查询意图识别(query理解) by 张帆(自然语言处理组@搜狗)  https://blog.csdn.net/zhoubl668/article/details/7857756 如何使用padlepadle 进行意图识别-开篇  ...
  • 预测作品。 是一个开放的预测引擎集合,旨在满足当今广泛的... 意图识别引擎是开放集成的九个成员之一,旨在揭示人类行为的意图并达到最终的客户理解。 它基于经过批准的科学算法来揭示和利用人类行为中的隐藏数据。
  • HarmonyOS之AI能力·助手类意图识别.pdf
  • HarmonyOS之AI能力·IM类意图识别.pdf
  • 口语理解是人机对话系统的重要组成部分,而意图识别是口语理解中的一个子任务,而且至关重要。意图识别的准确性直接关系到语义槽填充的性能并且有助于后续对话系统的研究。考虑到人机对话系统中意图识别的困难,传统...
  • 意图识别和槽位填充

    2021-07-08 14:50:35
    以下项目以ERNIE为例,介绍如何将预训练模型多任务学习同时完成意图识别和槽位填充任务。 本例中的意图识别和槽位填充本质上是一个句子分类任务和一个序列标注任务。将两者的loss结合即可实现多任务学习。 ...
  • 基于fastText的问答系统用户意图识别与关键词抽取研究_代令令.caj,讲述如何用fastText来实现问答系统和用户的意图识别
  • 基于表面肌电的运动意图识别方法研究及应用综述

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 34,443
精华内容 13,777
关键字:

意图识别