精华内容
下载资源
问答
  • 对话式背景图
    2018-05-24 10:00:19
    作者 | 阿里巴巴智能语音交互团队
    编辑 | Sean
    一、对话式交互技术

    以智能音箱、智能电视为代表的对话式交互,是时下非常火热的、且能够走近我们生活的人工智能子领域。从本篇开始,我们将一起走进对话式交互。

    什么是对话式交互呢?我们首先从一个例子开始。贾维斯,电影《钢铁侠》中那位钢铁侠的 AI 管家,他能独立思考、可以实时帮钢铁侠处理各种事情,包括计算海量数据。其中最让观众印象深刻的就是,贾维斯可以随时随地像人一样进行口语交流,来解决钢铁侠的问题。

    贾维斯能听、会说,能实时理解主人的对话意图并根据实际场景进行下一步的对话,如果在对话过程中碰到有歧义的情况,他还会追问钢铁侠,让他提供更多的信息来消除歧义。贾维斯的这些能力就是对话式交互要提供的,其中的核心是 VUI (Voice User Interface,语音用户界面)的设计。相对于 GUI(Graphical User Interface,图形用户界面),VUI 解放了人的双手,某些场景下,简单的一句语音命令就能代替 GUI 下鼠标 / 遥控器的多次点击,这带来的不只是方便,还节省了时间。一个好的 VUI 系统,能够让用户尽可能通过最少轮次的对话实现既定意图的执行。贾维斯总能在危机时刻帮到钢铁侠,他是一个具有完美 VUI 的语音助手。

    嗯,我们不要入戏过深,贾维斯是一部电影里的虚拟系统。那么,现实生活中,我们能创造出来一个接近贾维斯的对话式交互系统吗?我们该怎么做呢?呃,很遗憾,以当前的科技发展水平,我们还做不到电影里那么智能,更不用说让机器有意识。但人机交互并不是昨天才发明出来的,人类在这个领域已经探索了几十年,我们可以实现钢铁侠与贾维斯的交互方式,并用这种方式来帮我们处理一些数据或控制我们身边的一些硬件设备(比如让语音助手根据天气提供穿衣建议或者控制厨房和卧室的各个家电),这就是我们要聊的对话式交互技术。

    对话式交互技术包括了语音识别 / 合成、语义理解和对话管理三个部分。当下的对话式交互产品主要分两类:以微软小冰为代表的开放域(Open Domain)对话系统和以亚马逊 Alex 为代表的任务导向(Task Oriented)对话系统。以现在的技术能力,在开放域聊天中,准确理解用户的话并给出正确答案的难度是很大的,因为面对用户千奇百怪的提问,机器对意图的理解很可能出现错误,知识库也可能涵盖不了那么广。开放域聊天更像是一个信息检索系统,基于已有知识库,为用户的输入匹配到一个答案。这样的对话能力是十分有限的,构造一个完善的知识库更是困难重重。而任务导向的对话系统旨在帮助用户完成特定领域的任务,比如”查询天气“、“订酒店”,这种领域特定的对话系统的最大优势是实现起来相对有效并且易于产品化。本系列的后续文章,我们将深入 Amazon、Google 和 Microsoft 三家任务导向的对话平台。在此之前,我们先一起领略对话式交互技术流程的各个环节。

    二、对话式交互流程

    回顾一下钢铁侠和贾维斯的交互过程,我们以钢铁侠询问贾维斯当前装备的损伤状况为例,他们的对话可以概括如下:钢铁侠向贾维斯询问,贾维斯接收到钢铁侠的话并理解他的意图,然后去查询相关数据,最后把数据展示在屏幕上或读出相关数据给钢铁侠听。这个交互的过程可以总结成下面这张图:

    • 钢铁侠向贾维斯询问:钢铁侠的语音流发送给贾维斯。

    • 贾维斯接收到钢铁侠的话:贾维斯将语音识别为对应的文字,并将口语化的文本归一、纠错,并书面化。

    • 理解他的意图:贾维斯进行语义理解,并进入对话管理。这里省去了多轮对话的示意,当意图相关信息不明确时,贾维斯会发起确认对话,钢铁侠也可以根据贾维斯的反馈,继续问其他相关内容,这些都是语义理解和对话管理服务的范畴。

    • 然后去查询相关数据:在对话式交互服务中,这个流程的提供者我们称其为内容服务。

    • 最后把数据展示在屏幕上:对话结束,产生执行动作。

    • 或读出相关数据给钢铁侠听:对话结束,语言生成文本经过语音合成服务,转换为语音流,播报给用户。

    我们一般称将这样的对话式交互系统为语音对话系统(Spoken Dialog System)。这里简单描述下各个组件。

    语音识别 ASR

    ASR(Automatic Speech Recognition)直译为自动语音识别,是一种通过声学模型和语言模型,将人的语音识别为文本的技术。近年来,随着深度学习在语音识别中的广泛使用,识别的准确率大大提高,让这项技术能被广泛地应用于语音输入、语音搜索、实时翻译、智能家居等领域,让人与机器的语音交互变为可能。

    语义理解 NLU

    语音识别只是知道我们说了什么,但真正要理解我们说的是什么,就需要依靠 NLU 这项技术。NLU(Natural Language Understand)直译为自然语言理解,是 NLP(Natural Language Processing,自然语言处理)的一个子集,专注于“口语表达和对话”方向的自然语言处理。我们首先快速了解一下 NLP,NLP 研究主要用来解决下面这些问题:

    • 分词:中文的书写词语之间不会用空格等符号来分割,分词就是将汉字序列切分成词序列,因为在汉语中,词是承载语义的基本单元。比如从北京飞上海这句话的分词为:从 北京 飞 上海。

    • 词性标注:词性用来描述一个词在上下文中的作用,如名词、动词、形容词等,词性标注就是识别这些词的词性,来确定其在上下文中的作用。

    • 命名实体识别:在句子中定位并识别人名、地名、机构名、数字、日期等实体。

    • 文本分类:文本分类就是将一篇文档归入预定义类别中的一个或几个,比如将某一类邮件归类为垃圾邮件,区分不同新闻的类型等。

    • 情感分析:情感分析是找出说话者或文本作者对某个话题的两极性观点(积极或消极)、情绪(高兴、悲伤、喜欢、厌恶等)。

    自然语言理解通过使用上述技术,完成指代消解、否定判断、语句泛化、口语归一化、ASR 纠错等工作,识别人机对话中的领域和意图,获得对话任务的语义信息。我们可以通过下面几个例子感受一下:

    1. 第 45 任美国总统是谁?

      他是哪里出生的?他 = 唐纳德·特朗普

    2. 感觉怎么样?

      不太好 不要紧 没问题 有问题 没有问题 没没没 没事

    3. 我要看温情的电影 来个柔情的片子 我想看看暖心的影片

    语义表示有多种形式,本系列使用的是最常见也是目前为止最成功的"框架语义(Frame Semantics)",即采用领域(Domain)、意图(Intent)和词槽(Slot)来表示语义结果。

    • 领域(Domain):领域是指同一类型的数据或资源,以及围绕这些数据或资源提供的服务。比如“天气”、“音乐”、“酒店”等。

    • 意图(Intent):意图是指对于领域数据的操作,一般以动宾短语来命名,比如音乐领域有“查询歌曲”、“播放音乐”、“暂停音乐”等意图。

    • 词槽(Slot):词槽用来存放领域的属性,比如音乐领域有“歌曲名”、“歌手”等词槽。

    举个例子,从“北京明天天气怎么样”这句话中,NLU 可以得到以下语义结果:

    • 领域(Domain):天气

    • 意图(Intent):查询天气

    • 词槽(Slot):

      • 城市(city) = 北京

      • 时间(date) = 明天

    对话管理 DM

    DM(Dialog Management)直译为对话管理,是对话式交互系统的核心,负责控制整个对话过程。主要包括对话上下文(Dialog Context)、对话状态跟踪(Dialog State Tracking)和对话策略(Dialog Policy)几部分。

    • 对话上下文:记录对话的领域、意图和词槽数据,每个领域可能包含多个意图的数据, 一般以队列的形式存储。

    • 对话状态跟踪:每轮对话开始后,会结合本轮对话提供的语义信息和上下文数据,确定当前对话状态,同时会补全或替换词槽。

    • 对话策略:根据对话状态和具体任务决定要执行什么动作,比如进一步询问用户以获得更多的信息、调用内容服务等。

    同样以天气场景的对话举例说明:

    Q:明天天气怎么样?(

    intent=query_weather,date= 明天,city=null

    A:您要查询哪个城市的天气?(

    action= 询问查询哪个城市

    Q:北京的 (

    intent=query_weather,date= 明天,city= 北京

    A:北京明天晴(

    action= 调用天气服务

    Q:那杭州呢?(

    intent=query_weather,date= 明天,city= 杭州

    A:杭州明天小雨(

    action= 调用天气服务

    Q:后天天气(

    intent=query_weather,date= 后天,city= 杭州

    A:杭州后天小雪(

    action= 调用天气服务

    假设我们要查询天气信息。查询天气这个意图需要两个必选词槽,城市和日期。也就是说,只有当这两个词槽都有数据时才能查询天气服务,得到天气数据。从上面对话场景中可以看到,对话管理模块会维护多轮对话上下文数据(包含意图和词槽等),跟踪对话状态,填补或替换词槽数据,并决定如何与用户交互或执行什么样的动作。比如缺少必选词槽时,对话系统会追问用户,以补全词槽。

    对话生成 NLG

    NLG(Natural Language Generation)直译为自然语言生成,即对话生成的技术。对于任务导向的对话来说,NLG 基本以模板形式来实现。模板中的回复信息可由词槽或通过内容服务得到的数据来替换。对话生成的原则是符合自然语言交互的习惯,易于用户理解,最快完成对话。此外,NLG 还可以用于引导用户的交流习惯,比如 NLG 的内容为"已经为你开启导航",可以引导用户在希望导航时,说"开启导航"。

    语音合成 TTS

    TTS(Text To Speech)是指语音合成技术。对话系统的输出是文本形式的 NLG 或者指令,当对话返回的内容是 NLG 时,通过 TTS 技术能将这些文本转换成流畅的语音,播放给用户。TTS 技术提供语速、音调、音量、音频码率上的控制,打破 GUI 中传统的文字式人机交互方式,让人机沟通更自然。

    讲完了对话式交互的流程和关键技术,接下来来我们再深入思考下对话式交互的产品化。

    三、VUI 语音用户界面

    GUI(Graphical User Interface),即图形用户界面,是我们最熟悉的人机交互方式。我们每天面对的 PC 和手机,无论是使用鼠标点击还是手指操作触摸屏,我们早已习惯了这种无声的图形界面交流方式。随着 AI 技术的发展,对话式交互逐渐走近我们的生活,我们和机器之间的交互从 GUI 迈向了 VUI(Voice User Interface),即语音用户界面。VUI 是语音应用 / 设备的入口,当你说"Hey Google"的时候,Google Home 的音箱就会被唤醒,进而与你交流。语音成为了 VUI 世界的连接者,就像 GUI 时代的鼠标和手指。

    相比 GUI 需要用户动手触发某个动作后结果只能以视觉形式展现给用户,VUI 有自己独特的优点,它可以解放用户的双手和双眼,无需手持或者紧盯着设备,用说话这种更自然的方式去触发动作,而返回结果则以语音方式播放给用户听。这在一些像驾驶、做饭、跑步等无法动手操作的场景下特别有用。设计良好的 VUI,会以最少的交互完成用户的意图,能极大地提升用户体验。比如,通过学习用户习惯从而为用户提供"条件反射式"的服务、更口语化的交流、引导用户收敛话题,通过询问纠正异常情况(当用户不按套路出牌时)等。

    在 GUI 中,用户的行为流程是预先设计好的,比如在某个界面能触发什么动作都是固定的,或者有个一级一级的引导关系,用户只能按照设定好的流程去做。而在 VUI 中,用户的行为则是无法预测的,不同用户在不同的场景下的行为可能完全不一样,而且语音交互需要用户高度集中注意力去听系统说了什么。在一些场景下反而会带来不便,比如在电视上想看一个节目列表,用图形界面展示的方式会更直观一点,用户可以慢慢看,但用语音播报的话,数据量大的时候,用户很可能听了后面的忘记前面的,效果反而不如 GUI 好。所以设计 VUI 时千万不要让用户有认知负荷,不要挑战人类短暂的记忆力。

    声音是自然的交互方式,但却不能完全取代 GUI,它们是一个互补协作的关系。所以在设计语音交互界面时,可以把 VUI 和 GUI 结合起来,以实现多模态的智能交互。通过上面的描述,我们对 VUI 有了大致的了解,趁热打铁,我们来设计一个对话式交互产品。一起体会下对话平台要注意哪些问题。

    四、对话式交互产品的设计

    设计一个好的对话式交互产品首先要突破 GUI 的设计思维。我们设计一个对话任务的目标是最快速地解决用户的问题。对话式交互产品重点是交互,因此一定要结合场景来设计,要把自己代入对话场景中,想象如果自己使用这个语音界面,会在什么情况下使用、以怎样的方式跟它对话、希望它怎么回复我们。下面我总结出了一些设计步骤和原则,可以作为参考:

    设计步骤

    1. 选择正确的用户场景,提供优质对话体验

    不要尝试直接把现有的手机或桌面应用的交互方式转变成语音交互,这样可能会让语音交互变得更加复杂。我们应该结合用户使用语音交互时的状态,比如在户外不方便看网页或屏幕,或者双手被占用无法操作别的东西。

    这里有以下几点建议来帮忙选择适合转换成语音交互的场景:

    • 需要用户输入的特别熟悉的信息,比如个人信息、位置、时间等。

    • 能快速提供有用信息的场景,用户说几句话就能节省很多操作,比如订餐、叫车。

    • 天生适合语音交互的场景,比如做饭时听菜谱、开车时做笔记。

    2. 创建符合当前场景的对话风格和形象

    开始设计语音交互之前,先考虑你希望它听起来怎么样,能带给人怎样的感受。比如要设计个趣味游戏,你可能想要一种搞笑风格;而设计个新闻阅读器,就需要严肃认真的语气,给人靠谱的感觉。

    3. 编写对话

    选好场景、确定形象后,你可能想要马上投入开发,但是一定要拒绝冲动。相反,我们要用纸和笔先构思一下对话。写下用户可能参与的独立或多轮对话,下面是一些对话类型和可能需要考虑的问题:

    • 完成对话任务最简单的方式,不要太复杂。

    • 完成对话任务的其他方式,这可能是多样化的,因为有的用户一次只说一部分信息,这就需要多次交互才能完成任务,而有的用户则一次把所有信息说完。

    • 需要修正的对话场景,比如系统不支持,或不理解用户的意图。

    • 用户中途结束对话,或完成对话任务后,怎么确认结束对话场景。

    • 问候语,以及怎么引出对话场景。

    • 语音交互部分搞定后,需要考虑怎么在设备屏幕上展示对话内容。比如对话通过语音方式说出了一部分内容,而还有一些数据需要展示在屏幕上。

    4. 进行测试

    测试没有想象中的麻烦,你需要做的就是找一些开发团队之外的人,在没有提示的情况下,让他们用平时正常说话的方式使用你的产品,从各个角度测试对话。多试几次可能就会发现哪些对话任务完成有困难,或者交互给人的感受怎么样。

    设计对话的目标是满足用户的意图,而不仅仅是完成一个功能。

    设计原则
    • 给语音交互界面赋予一个拟人化的形象,不要让用户觉得太生硬,是在跟机器对话。

    • 保持简洁,节省用户的时间,提供有效的信息。

    • 信任用户,用户知道怎么讲话,所以不要试图教用户怎么说,我们只需要提供最自然的方式,推进对话进展就可以。

    • 可以增加个性化能力,使用户听起来感到愉悦,但不要分散用户注意力。

    • 使新用户感兴趣,也要吸引专家用户,设计要面向海量用户,而不是只满足低端需求。

    • 轮流说话,当轮到用户说话时,不要贸然打断。如果是问用户问题,那就不要在他们回答问题的时候又突然插入其他指令。

    • 不要猜测用户的意图,给用户展现事实,让他们自己决定。

    • 结合上下文语境,追踪对话的来龙去脉,保证准确理解用户的话。

    综上,我们对对话式交互有了比较全面的认识,本系列接下来的三篇文章将以本篇讲述的对话式交互知识为背景,深度讲述亚马逊、谷歌和微软的语音交互平台,和大家一起分享如何在这三大平台上,实现我们自己的对话式交互技能。这里对技能的定义是特定领域的对话能力,包括语义理解、对话逻辑控制和相关的内容服务。

    参考
    • https://developer.amazon.com/designing-for-voice/

    • https://developer.amazon.com/alexa-skills-kit/vui

    • https://developers.google.com/actions/design/principles

    • https://design.google/library/conversation-design-speaking-same-language/

    • https://yq.aliyun.com/articles/8301

    作者介绍

    我们来自阿里巴巴智能语音交互团队,隶属于阿里巴巴机器智能技术部门。我们的主攻方向是对话式交互技术,对外输出 Spoken Language System 产品 (http://nls.console.aliyun.com )。我们是上汽集团智联网汽车、上海地铁语音购票、海尔人工智能电视等产品,语音交互能力背后的男人。



    更多相关内容
  • 文|佘凯文 来源|智能相对论(aixdlun) “在经历了糟糕的客服体验后...日前,国际研究机构IDC就发布了一组名为《中国对话式人工智能市场,2020》的报告,报告主要体现了在企业服务资源需求增加的背景下,企业正大量引

    文|佘凯文

    来源|智能相对论(aixdlun)

    “在经历了糟糕的客服体验后,骂骂咧咧的挂断电话”,相信这个场景每个人都不会太陌生,“无休止的等待、冗长繁琐的认证、莫名其妙的分类、一堆毫无作用的回答,最后还希望你对此次服务做出评价。”

    这是过去十多年客服体验的一个缩影,也庆幸这正在成为过去式,随着新型的智能软件解决方案的出现,“客户服务”不再是一个恼人的话题。

    日前,国际研究机构IDC就发布了一组名为《中国对话式人工智能市场,2020》的报告,报告主要体现了在企业服务资源需求增加的背景下,企业正大量引入对话式人工智能能力用于多渠道的产品服务销售与客户管理等工作。

     

    在此之中,百度智能云被评为行业“领导者”,但这个结果对于百度智能云而言可能也没有太多惊喜。

    一、“对话式人工智能”爆发,百度成为“领导者”不意外

    “对话式人工智能”,通俗的说可以是“人工智能小助手”,能够完成与用户、客户的正常对话,捕捉语境并提供智能响应。这种技术放在市场层面也许更易感知:现阶段AI生态系统正在不断丰富,采用对话式人工智能技术的智能语音+文本客服已经广泛出现在金融、零售、医疗、制造、政府、教育等等领域。对于这一变化,IDC也在报告中指出,“得益于聊天机器人和智能对话终端应用的大规模落地,对话式人工智能市场正驱动着整个人工智能软件市场的发展。而到了2024年,这一技术在中国的市场规模将达到15.6亿美元。

    有市场的地方,就会有江湖,对话式人工智能技术亦是如此,基于这一庞大的市场,国内出现了一批技术厂商,且呈百舸争流之势。因此,IDC通过评估核心技术、产品化能力、定制化能力、落地应用数理及生态构成等方面,提出了一批优质“对话式人工智能”技术提供商,其中百度智能云在能力和战略两个维度均显著领先其它厂商,在评估中处于领导者位置。

    二、“善钓者谋趣,不善钓者求鱼”

    所谓“善钓者谋趣,不善钓者求鱼”,直白理解就是“会钓鱼人的,其在意的是过程,不会钓鱼的人他的追求只是上鱼。”

    对于百度智能云而言,“对话式人工智能”是镶嵌在百度整个人工智能体系里面的一个点,做好“对话式人工智能”或许和“善钓者”钓鱼一样,“上鱼”只是一个必然过程。

    当然,想要成为一名“善钓者”也是有前提的。

    1、“善不善钓”好渔具都需必备

    即便浸淫人工智能多年,但想要成为“领导者”还是需要硬核支撑,百度智能云有哪些硬核实力?IDC也在报告中则给出了较为详实的解释。

    第一,专注语音语义技术,并提供覆盖智能客服应用、联络中心、云通信等完备的一体化解决方案;比如百度语音日均调用量已经超过155亿次。又比如在自然语言理解领域,百度文心(ERNIE)在多项中文NLP任务上效果全面超越BERT。7月9日,文心(ERNIE)摘得2020世界人工智能大会最高奖项SAIL奖。百度打造的知识图谱基于知识中台, 提供多专业亿级别规模图谱的高效构建。

    第二,可以提供标准化的产品,以快速的集成能力降低项目实施成本,并注重产品开放性,将易用的产品能力和开放接口赋能业务和技术。

    第三,积累了大量实施方法经验,以人才、运营、最佳实践的三位一体智能服务方案赋能各行业,注重人才培养。

    从技术、到产品,再到生态,不难看出这些优势为百度智能云在“对话式人工智能”领域成为“善钓者”打下了坚实基础。

    2、“善钓者”必然“善打窝”

    在工具备齐后,“钓鱼”还有一步至关重要就是“打窝”,“窝”打的好不好,将直接决定吸引鱼的数量,带到产业领域其实就类似于一个“生态”。百度智能云的相关负责人曾在公开场合表示,百度智能云所追求的是为用户实现“节流、智能、开源和触点”这四大价值。据公开数据显示,百度智能客服产品已经有70多家客户,覆盖了金融、能源、运营商、航空、地产、政府、教育、物流、航空、汽车等多个行业,还获得了多个行业级创新奖项。

    三、“善钓”的百度智能云到底在“钓”什么?

    可以看见,百度智能云对于“对话式人工智能”也是下了大力气的,当然不止是为了博得一个行业领先的名头,归根结底是百度智能云看到市场背后更大的价值。

    1、“企业服务智能化”形成价值裂变

    企业服务的难题已经困扰市场多年,特别是现在需求是起来了,但是“服务模型”却跟不上了,进一步加剧了“市场对于高质量服务的需求与企业能力有限难以达成”之间的矛盾。

    例如,在客户选择的问题上,“大客户”与“小客户”的服务需求显然不同,且在同类型客户中,又因个体差异会出现其它不同,为此企业需要准备大量的服务标准与内容,无形间使企业压力倍增。

    而通过智能的语音对话、服务机器人等多种形式,就让企业完成千人千面的服务成为可能。

    还有突发性事件,同样在加重企业服务的负担,如今年“黑天鹅”事件袭扰,让大量机构、医院压力陡增,所以“企业服务智能化”的需求已经是“迫在眉睫”。

    像百度智能云在疫情期间大放异彩,就是因为通过其AI技术赋能社会公共服务,免费对外提供了智能外呼服务,为防控争取了更多时间的同时,并释放大量人力去做更具针对性的的防疫工作。对整体疫情防控及后来的复工复产提供了宝贵助力。

    2、客服服务的替代与增值

    在客服服务领域另一趋势是,单纯的客户服务正转向客户营销,之前在进行客户接待时,以解决用户问题为主,客户有什么问题,客服人员就处理什么。而现在,客服人员处理问题的着眼点要从访客咨询向全局服务过渡。

     

    但是传统的人工客服却很难解决这一问题,比如他不了解具体的用户喜好,也不清楚用户习惯,所以也导致传统模式只能被动的“解决问题”。

    智能客服的出现则完美实现了这一需求,企业可通过访客轨迹、访客名片等功能,来获取到用户此前的行为记录及习惯,用户画像将贯穿整个客服路径,在解决用户问题的同事,还能完成营销环节,提高消费者消费行为的转化与复购率。

    这么一来,智能客服的出现就不仅仅是减少了资源消耗,还能由成本中心向盈利中心转型。

    基于此,百度智能客服已经实现了多维度的落地,如联合浦发银行打造的银行业首个数字人员工“小浦”就是智能客服的成功范例。用户打开浦发银行APP,通过语音呼唤“小浦小浦”,即可实现与小浦一对一的个性化互动。只要说出个人投资目标、投资期限、投资金额以及风险偏好后,小浦即可精准推荐匹配该名用户的理财产品、基金和资产配置方案。小浦可通过人脸表情识别技术,实时感知用户情绪变化,还通晓不少金融理财基础知识,实时为用户答疑解惑。数字人在减轻银行人力成本同时,让客户足不出户就能获得真人一样的情感交互体验,以及“千人千面”的个性化金融服务。

     

    对于这一款产品,有专业人士盛赞:小浦的出现,不只是改变了企业的营销效率,甚至可能彻底颠覆了企业与客户的沟通方式。

    3、满足“欲壑难填”的服务化需求

    “对话式人工智能”最大的价值则是在于满足市场“欲壑难填”的服务化需求。

    网上有个段子,是说某游戏大厂“没有客服”,为此已经引得无数“声讨”,其实并非是“没有客服”,也有语音客服,但解决问题的能力趋近于没有,而人工通道则是一年四季的“人满为患,无法拨通”。

    一个有能力的“智能客服”的重要性已经不言而喻,通过智能化的升级,帮助企业重塑和优化组织分工,在任意时间和地点为用户提供一致性和延续性的服务,已经是“十万火急”。

    总之,从企业价值提升出来看,还是从用户服务体验而言,“智能客服”领域的前景都十分广阔,所以“企业服务智能化”、“客服营销化”、“无差别服务”成为了既是需求也是趋势的存在,百度智能云也是早就看到了这些“大鱼”,所以才会早早动身,“备好工具、打好窝”静待“一钓惊人”。

    四、总结

    无论如何,“对话式人工智能”的重要性已经不言而喻,特别是在“智能经济”的浪潮下,B端市场也好,C端市场也好,“对话式人工智能”都已展现出了其独特优势,而行业中以百度智能云为首的行业态势也逐步形成,未来“对话式人工智能”还将展现出更大的价值空间。

    深挖智能这口井,同好添加vx:zhinengxiaoyan

    此内容为【智能相对论】原创,

    仅代表个人观点,未经授权,任何人不得以任何方式使用,包括转载、摘编、复制或建立镜像。

    部分图片来自网络,且未核实版权归属,不作为商业用途,如有侵犯,请作者与我们联系。

    智能相对论(微信ID:aixdlun):

    •AI产业新媒体;

    •今日头条青云计划获奖者TOP10;

    •澎湃新闻科技榜单月度top5;

    •文章长期“霸占”钛媒体热门文章排行榜TOP10;

    •著有《人工智能 十万个为什么》

    •【重点关注领域】智能家电(含白电、黑电、智能手机、无人机等AIoT设备)、智能驾驶、AI+医疗、机器人、物联网、AI+金融、AI+教育、AR/VR、云计算、开发者以及背后的芯片、算法等。

    展开全文
  • dreamweaver

    千次阅读 2021-08-05 02:41:03
    dreamweaverCSS使用教程:定义CSS样式背景属性背 景 属 性【定义 CSS 样式背景属性】使用“CSS 样式定义”对话框的“背景”类别可以定义 CSS 样式的背景设置。可以对网页中的任何元素应用背景属性。例如,...

    dreamweaverCSS使用教程:定义CSS样式背景属性

    背 景 属 性

    【定义 CSS 样式背景属性】使用“CSS 样式定义”对话框的“背景”类别可以定义 CSS 样式的背景设置。可以对网页中的任何元素应用背景属性。例如,创建一个样式,将背景颜色或背景图像添加到任何页面元素中,比如在文本、表格、页面等的后面。还可以设置背景图像的位置。

    提示:本页背景图片固定,是【定义 CSS 样式背景属性】的效果。

    定义背景设置:

    在“CSS 样式定义”对话框中,选择“背景”(如下图),然后设置所需的样式属性。

    716885d63802be291e9ff6fde9f4529a.png

    请注意:下列任意属性如果您认为不重要可以保留为空。

    背景颜色:设置元素的背景颜色。两种浏览器都支持背景颜色属性。

    背景图像:设置元素的背景图像。两种浏览器都支持背景图像属性。

    重复:定义是否重复以及如何重复背景图像。两种浏览器都支持重复属性。

    “不重复”在元素开始处显示一次图像。

    “重复”在元素的后面水平和垂直平铺图像。

    “横向重复”和“纵向重复”分别显示图像水平带区和垂直带区。图像被剪辑以适合元素的边界。

    附件:确定背景图像是固定在它的原始位置还是随内容一起滚动。注意,某些浏览器可能将“固定”选项视为“滚动”。Internet Explorer 支持该选项,但 Netscape Navigator 不支持。

    水平位置:和垂直位置指定背景图像相对于元素的初始位置。这可以用于将背景图像与页面中心垂直和水平对齐。如果附件属性为“固定”,则位置相对于“文档”窗口而不是元素。Internet Explorer支持该属性,但 Netscape Navigator 不支持。

    设置完这些选项后,在面板左侧选择另一个 CSS 类别以设置其它的样式属性,或单击“确定”。

    来源:互联网

    501216a8c9887ccc6e7504f982cc8e97.png

    展开全文
  • 生成式对话系统总结(1)

    千次阅读 2020-04-24 15:02:30
    比如背景信息、用户画像、年龄等) , 构建出一个个性化Sequence-to-Sequence 模型,称为 Speaker Model,为不同的用户,以及同一个用户对不同的对象自然语言生成不同风格的Response,架构如下所示. References

    目录

    Intro

    改进思路

    1 Seq2Seq + Context 模型

    2 Seq2Seq + Attention模型

    3 Seq2Seq + 动态记忆网络DMN(dynamic memory network)模型

    4 改进目标函数:最大化互信息 maximum mutual information

    5 Seq2Seq + Speaker Embedding(用户画像)模型

    References


    Intro

    生成式对话系统通常是使用基于深度学习的Encoder-Decoder架构来完成。基于深度学习的技术通常不依赖于特定的答案库或模板,而是依据从大量语料中习得的语言能力来进行对话,根据问题内容直接生成回答的方法被定义为基于某个条件下的生成模型. 深度学习的Seq2Seq技术可以非常好地实现生成模型的框架, 其最诱人的优势就是可以避免人为特征工程的端到端( End-to-End) 框架, 即利用强大的计算和抽象能力自动从海量的数据源中归纳、抽取对解决问题有价值的知识和特征, 使这一过程对于问题的解决者来说透明化, 从而规避人为特征工程所带来的不确定性和繁重的工作量.

     

    改进思路

    如果只是单纯的使用基于RNN的Seq2Seq模型来完成生成式对话模型的话,得到的回答往往在逻辑性,正确性或上下文连贯性上都比较一般,因此下面介绍几种改进方法来优化这一问题。

    1 Seq2Seq + Context 模型

    一般聊天中并不是简单的一问一答,回答时往往要参考上下文聊天信息 Context 的内容, 所以应该把Context引入到 Encoder中,因为这是除了当前输入Message 外的额外信息, 有助于 Decoder 生成更好的会话应答Response内容.很直接的想法是把Context和 Message拼接起来形成一个长的输入提供给Encoder,这样就把上下文信息融入模型中了,但是直接拼接起来形成的输入非常长, 而对于RNN模型来说,输入的线型序列长度越长,模型效果越差。因此后续有paper对这方面做了很多研究,主要改进方法有:

    A neural network approach to context-sensitive generation of conversational responses提出在 Encoder 部分采用多层向前神经网络代替RNN模型,这样既能将Context和Message 通过多 层 前 向 神 经 网 络 编 码 成 Encoder-Decoder 模型的中间语义表达,又避免了RNN对于过长输入敏感的问题,下图是文中提到的2种融合方法.

    方法 1 对 Context 和 Message 不做明显区分, 直接拼接成一个输入; 而方法 2 则明确区分了 Context和 Message,在前向神经网络的第 1 层分别对其进行编码,拼接结果作为深层网络后续隐层的输入,核心思想是强调 Message 的作用.


    2 Seq2Seq + Attention模型

     

    3 Seq2Seq + 动态记忆网络DMN(dynamic memory network)模型

    Ask me anything: dynamic memory networks for natural language processing

    4 改进目标函数:最大化互信息 maximum mutual information

    采用经典的 Encoder-Decoder 模型构建的生成式对话系统比较容易产生“安全回答”问题, 用户不论说什么内容,系统都回答少数非常安全、符合语法但没有实际意义的回答, 比如“I don't know! ”之类. 原因在于传统的Seq2Seq在 Decoding 过程中都是以极大似然估计
    法( maximum likelihood estimate, MLE) 为目标函数,公式为

    式中: M 为 Message; R 为 Response,即生成最符合语法的话,而不是最有用的话,这些安全的句子大量地出现在训练语料中,模型学习了之后,无可避免地总是生成这样的Response.
    互信息目标函数为:

    可以从公式差异中看出,MMI 的优化目标除了最大化从 Message 生成应答 Response 的概率,同时加入了反向优化目标, 即最大化应答 Response 产生Message 的概率,其中 λ 是控制两者哪个更重要的调节超参数。通过具体公式可以看出, 这个优化目标函数要求应答 Response 和 Message 内容密切相关而不仅考虑哪个 Response 以更高概率出现,所以降低了那些非常常见的回答的生成概率,使得应答Response更多样化且跟 Message 语义更加相关

    5 Seq2Seq + Speaker Embedding(用户画像)模型

    模型中考虑个性化信息( 比如背景信息、用户画像、年龄等) , 构建出一个个性化Sequence-to-Sequence 模型,称为 Speaker Model,为不同的用户,以及同一个用户对不同的对象自然语言生成不同风格的Response,架构如下图所示.

     

     

    References

    展开全文
  • ©PaperWeekly 原创 ·作者|金金单位|阿里巴巴研究实习生研究方向|推荐系统本文由犹他大学发表于 WWW 2021。考虑到当前的对话式系统可能由于提出一些不好的澄清式问题,导致...
  • 作者|惠惠惠惠惠惠然整理|NewBeeNLP大规模预训练言模型在生成式对话领域近年来有非常多的工作,如百度PLATO系列(PLATO[1]/PLATO-2[2]/PLATO-XL...
  • 背景 对话摘要(Dialogue Summarization)任务在近两年得到了工业界和学术界的广泛关注。华为、阿里巴巴、滴滴、微软、三星、A*STAR等公司针对会议摘要、客服对话摘要、医患对话摘要等任务进行研究。斯坦福大学、中...
  • 浅谈智能搜索和对话式OS

    千次阅读 2018-01-26 14:15:44
    amp;utm_content=note&utm_medium=seo_notes&...utm_source=recommendation浅谈智能搜索和对话式OS前面的文章主要从理论的角度介绍了自然语言人机对话系统所可能涉及到的多个领域的经典模型和基础知识。...
  • 【Unity3D进阶4-12】Unity3D 对话系统

    千次阅读 2020-06-19 17:31:42
    Unity对话系统让你: 用分支逻辑编写交互式对话。 在灵活的、完全可自定义的UI系统中显示会话。 定义玩家要完成的任务/任务。 播放镜头序列,如相机剪辑和音频。 保存和加载游戏,并在场景更改中持久化数据。 使用...
  • 爱因互动是做对话服务的,是一家 To B 的公司。我们服务的内容是用对话的形态来交付企业的价值。为了提高对话的效率、质量,我们采用了人工智能技术。在这个过程当中,我们会涉及到更加偏售前的方式,会做更
  • 解构语音交互产品--VUI设计原则

    千次阅读 2019-10-23 21:22:19
    语音交互作为对话式交互的一种,目前相对权威的VUI设计原则来自Google的对话式交互规范指南。阅读了《语音用户界面设计》和Slack公司的Amir Shevat写的《聊天机器人:对话式体验产品设计》两本书,其提及对话设计...
  • 基于背景知识的对话 目前,基于背景知识的对话方法可以为两大类:生成方法和抽取方法。两类方法各有优缺点。 ▲ 3. 生成与抽取方法的回复 如 4 所示,生成方法以每个时间步生成一个词(token by ...
  • 背景:在对话系统领域,检索式对话系统一直是工业界的偏爱。笔者曾经单纯基于ElasticSearch的相似度匹配进行过实现(详见:基于ElasticSearch的检索智能问答方案_chenxy02的博客-CSDN博客 )。后面又引入深度学习...
  • 背景:由于CVAE在summary_yxu的代码和讯飞的自己提取出来的对话数据集上,初见成效,于是这次用在一些官方的数据集上和一些对话摘要的baseline上试一下,万一效果也好呢? NOTE:再次提醒自己这次一定要用心,用心...
  • 对话系统最新综述II

    千次阅读 2021-12-26 14:36:36
    Interactive Training :交互训练, 不需要很完善,边聊边学。 下面我们每个领域解读点paper来抛砖引玉感受一下,大家如果对某个领域的研究感兴趣,可以去调研更多paper~ 由于笔者对Knowledge-Grounded System...
  • 智能对话系统之多轮对话

    千次阅读 2019-09-10 15:58:48
    序言 以一周前的一条微博作为开始。...对于一个对话系统而言,我微博中所指的『后续服务』,就是上中的 DST(对话状态维护)以及 Policy(动作候选排序),或者统一的称其为 DM(Dialogue Mannagem...
  • 来源 | AI科技大本营在线公开课 分享嘉宾 | 葛付江(思必驰 NLP ...启发式对话通过建立知识点之间的话题关联,使对话系统能够主动发现相关知识,充分发挥知识的协同作用,引导对话过程,把知识在合适的时间主动送...
  • 复制要替换的字库为将被替换的字库名,如:打开一幅,提示未找到字体jd,你想用hztxt.shx替换它,那么你可以去找AutoCAD字体文件夹(font)把里面的hztxt.shx 复制一份,重新命名为jd.shx,然后在把XX.shx放到font...
  • 先不聊机器和技术,就聊人的对话,本身其实是有一个背景或者一个先验知识的,这会导致不同的人在不同场景下理解会不同。同样一个说法,“上号!”,在游戏圈背景下,那就是要上对应游戏了,在技术群里说一句,说不定...
  • 对话生成:seq2seq模型原理及优化

    千次阅读 2019-06-12 15:56:39
    平安寿险AI团队姚晓远:对话生成模型研究背景模型介绍模型改进效果评估资料获取 更多内容干货请敬请关注「平安寿险PAI」 人机对话作为人机交互系统的核心功能之一,发挥着十分重要的作用。目前,生成的人机...
  • 1. 对话管理模型背景 从人工智能研究的初期开始,人们就致力于开发高度智能化的人机对话系统。艾伦·图灵(Alan Turing)在 1950 年提出图灵测试 [1],认为如果人类无法区分和他对话交谈的是机器还是人类,那么就...
  • 填槽与多轮对话

    千次阅读 2019-01-21 20:27:18
    对于一个对话系统而言,上中的 DST(对话状态维护)以及 Policy(动作候选排序),或者统一的称其为 DM(Dialogue Mannagement,对话管理)。也即,当接收到 NLU 模块的输出、其他场景及用户特征信息之后,判断...
  • 通用对话弹窗Dialog

    千次阅读 2017-11-29 20:35:22
    通用对话弹窗CommonDialog Version 1.0 Created by chenchangjun on 18/1/12. 抽离普通基类见BaseNormalDialog 优化扩展方式 见3.1 基本扩展 添加必要注释 ———————— 项目中,迭代了快8年了,对话框...
  • 智能对话系统研究

    千次阅读 2021-05-03 09:05:43
    对话系统并不是一个新兴的概念,自Weizenbaum于20世纪60年代在麻省理工学院开发Eliza[1]开始,它被认为是第一个对话系统,可以和人进行简单对话,但得到的回复大部分是“What are you saying about…”.微软在20世纪...
  • 本文是cs224n关于nlg系列课程中,关于【问答式对话】的介绍。主要介绍了《A Conversational Question Answering Challenge》这篇论文的想法,无具体算法剖析。
  • 对话系统 | (4) 任务型对话系统基础

    千次阅读 多人点赞 2020-08-14 21:48:33
    本篇博客内容主要来自第十四届中国中文信息学会暑期学校暨中国中文信息学会《前沿技术讲习班》— 张伟男、车万翔《任务型对话系统》 PPT下载链接 1. 任务型对话系统概述 人机对话系统四大功能/分类 2. 任务型对话...
  • 最新任务型对话数据集大全

    千次阅读 2019-05-16 15:57:29
    合适的数据集或者语料是优秀的自然语言研究工作的基础,然而找寻合适的数据集通常是一件耗时耗力的工作。这时候一份优质的数据集汇总...1. 数据集汇总项目这份数据集大全涵盖了到目前在任务型对话领域的所有常用数...
  • 作者|惠惠惠惠惠惠然整理|NewBeeNLP大规模预训练言模型在生成式对话领域近年来有非常多的工作,如百度PLATO系列(PLATO[1]/PLATO-2[2]/PLATO-XL...
  • 2. 机器学习背景知识 本章简要回顾了深度学习和强化学习,这些学习与后续章节中的会话AI最相关。 2.1 机器学习基础 Mitchell(1997)将机器学习广义地定义为包括任何计算机程序,该计算机程序通过经验E来改善其在...
  • 如何创造一个能和你对话的语音AI?

    千次阅读 2022-06-23 14:01:35
    Amazon Echo 解锁了远场语音交互……达摩院语音实验室判断,下一个语音技术解锁的场景将会是对“人-人”语音交流进行分析,并产生智能,完成对当前“人-机”任务完成的语音交互的升级。 今天,我们与大家一起来...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 15,370
精华内容 6,148
热门标签
关键字:

对话式背景图