精华内容
下载资源
问答
  • 作为20世纪重要的思想家之一的戴维?伯姆,在其著作《论对话》中详尽阐述了一系列极具价值的关于对话的思想。他从隐藏在对话背后深处的思维入手,着重分析了对话中...伯姆的对话思想给当前的对话教学带来了诸多启示。
  • 艺术教育中的对话教学一方面被认为是培养艺术人才创新素质的重要途径,另一方面受到“倾听迷失、目标缺失和意义丧失”的质疑。艺术理论课程实践证明,对话教学应该既人乎文本又出乎文本,既确立目标又反对静止...
  • 大学英语听力教学的目标之一是培养学生的听力理解能力.如今的听力材料多是选自...而语用学以语言意义为研究对象,研究如何通过语境来理解和使用语言,因此在听力教学过程中有意识地培养学生语用能力就显得很有必要性.
  • 课堂是社会干预的教学干预空间。 本文旨在分析教师在课堂内和课堂外如何进行跨学科对话,以便在教学知识中运用理论和实践。... 但是,他们一致强调需要制定联合的教学策略,为学生寻求更有意义的知识。
  • 人工智能--智能多轮对话机器人案例剖析(附源码) 数据产品讲师,人工智能探索...

    扫码下载「CSDN程序员学院APP」,1000+技术好课免费看

    APP订阅课程,领取优惠,最少立减5元 ↓↓↓

    订阅后:请点击此处观看视频课程

     

    视频教程-人工智能--智能多轮对话机器人案例剖析(附源码)-NLP

    学习有效期:永久观看

    学习时长:121分钟

    学习计划:3天

    难度:

     

    口碑讲师带队学习,让你的问题不过夜」

    讲师姓名:张子良

    研究员/技术专家/教授

    讲师介绍:数据产品讲师,人工智能探索者,15年一线IT研发经验,国内顶级互联网行业工作背景,社区达人,著有长篇连载《胖子哥的大数据之路》,《数据实践之美》和《运营前线》共同作者。

    ☛点击立即跟老师学习☚

     

    「你将学到什么?」

    对话机器人是目前人工智能发展的一个主流方向, 智能多轮对话机器人案例剖析(附源码)包含三个完整案例,体验式教学; 一套开源框架,所学即所用;

     

    「课程学习目录」

    第1章:基础理论
    1.智能对话机器人概述
    2.多轮对话机器人完整案例演示
    3.多轮对话机器人开发环境安装部署
    第2章:实战案例
    1.实战案例一:智能声控机器人
    2.实战案例二:智能闹钟
    3.实战案例三:航空订票机器人
    第3章:源码剖析
    1.多轮对话机器人框架源码解析一
    2.多轮对话机器人框架源码解析二
    第4章:能力拓展
    1.航空订票机器人功能拓展

     

    7项超值权益,保障学习质量」

    • 大咖讲解

    技术专家系统讲解传授编程思路与实战。

    • 答疑服务

    专属社群随时沟通与讲师答疑,扫清学习障碍,自学编程不再难。

    • 课程资料+课件

    超实用资料,覆盖核心知识,关键编程技能,方便练习巩固。(部分讲师考虑到版权问题,暂未上传附件,敬请谅解)

    • 常用开发实战

    企业常见开发实战案例,带你掌握Python在工作中的不同运用场景。

    • 大牛技术大会视频

    2019Python开发者大会视频免费观看,送你一个近距离感受互联网大佬的机会。

    • APP+PC随时随地学习

    满足不同场景,开发编程语言系统学习需求,不受空间、地域限制。

     

    「什么样的技术人适合学习?」

    • 想进入互联网技术行业,但是面对多门编程语言不知如何选择,0基础的你
    • 掌握开发、编程技术单一、冷门,迫切希望能够转型的你
    • 想进入大厂,但是编程经验不够丰富,没有竞争力,程序员找工作难。

     

    「悉心打造精品好课,3天学到大牛3年项目经验」

    【完善的技术体系】

    技术成长循序渐进,帮助用户轻松掌握

    掌握NLP知识,扎实编码能力

    【清晰的课程脉络】

    浓缩大牛多年经验,全方位构建出系统化的技术知识脉络,同时注重实战操作。

    【仿佛在大厂实习般的课程设计】

    课程内容全面提升技术能力,系统学习大厂技术方法论,可复用在日后工作中。

     

    「你可以收获什么?」

    掌握任务式,多轮对话机器人的原理

    学完就能够从事简单场景的多轮对话机器人的开发。

     

    展开全文
  • 基于知识图谱的人机对话系统 | 公开课笔记

    千次阅读 热门讨论 2018-10-21 18:30:47
    交互形式有聊天、问答、操控、主动对话,是通过知识把它们关联在一起,你会感觉整个对话是个很流畅的对话。   总结下来,知性会话的意思是:它以知识图谱为中心,通过实体发现与链接技术把各种各样可以用来作为对话...

    640?wx_fmt=jpeg

    参加 2018 AI开发者大会,请点击 ↑↑↑


    分享嘉宾 | 刘升平(云知声 AI Labs 资深技术专家)

    来源 | AI 科技大本营在线公开课

     

    人机对话系统,或者会话交互,有望成为物联网时代的主要交互方式。而语言的理解与表达和知识是密切联系的,知识图谱作为一种大规模知识的表示形式,在人机对话系统中各模块都有重要的应用。而知性对话,则是基于知识图谱的人机会话交互服务。

     

    AI 科技大本营邀请到了云知声 AI Labs 资深专家刘升平针对「基于知识图谱的人机对话系统方法与实践」做系统的讲解和梳理。

     

     

    本次公开课介绍了知性会话的架构和关键技术,并结合工业级的人机对话系统实践经验,阐述了知识图谱在人机对话系统的核心模块上面的应用等等。

     

    640?wx_fmt=png

     

    刘升平:云知声 AI Labs 资深技术专家/高级研发总监。前 IBM 研究院资深研究员,中文信息学会语言与知识计算专委会委员。2005 年获得北京大学数学学院博士,国内语义网研究的开创者之一,是 2010 年和 2011 年国际语义网大会的程序委员会委员。曾在语义网,机器学习、信息检索,医学信息学等领域发表过 20 多篇论文。在 IBM 工作期间,两次获得 IBM 研究成就奖。2012 年底,刘博士加入云知声 AI Labs,领导 NLP 团队,全面负责自然语言理解和生成、人机对话系统、聊天机器人、知识图谱、智慧医疗等方面的研发及管理工作。

     

    在本次公开课上,他全面而具体地讲述了知识图谱在人机对话系统中的发展与应用,主要分为以下四部分:

     

    • 语言知识、对话系统综述

    • 知性会话的基本概念及案例分析

    • 知性会话的关键技术:知识图谱的构建,实体发现与链接

    • 知性会话的关键技术:话语理解及自然应答生成


    一、语言、知识与人机对话系统综述


    1. 语言和知识


    语言和知识是密切相关的。这张冰山图很形象地解释了语言和知识的关系,我们看到的语言只是冰山上的一小角,就是我们说的话。但是你如果想理解这句话,跟这句话相关的背景知识就像冰山下面这一大块。

     

    所以,这也是自然语言跟语音、图像很不一样的地方,我们听语音或看一个图片,它的所有信息都在语音信号或者图像像素里,但是语言的话就完全不是这样,这也是自然语言理解远远比语音识别或者图像识别更难的一个地方。

     

    这次的报告内容综合了我最近三年在CCKS会议上做的三个报告。

     

    640?wx_fmt=png


    2. 人机对话系统

     

    640?wx_fmt=png


    人机对话系统最早在工业界引起比较大的轰动是 Apple Siri,它当时还是 iPhone 上的一个 APP,2010 年被苹果收购了。Siri 的创新在于,我们传统的手机 GUI 界面上加了一个语音 Voice-UI。

     

    真正引发人机对话系统革命性创新的是于 2014 年推出的 Amazon Echo,它是一个完全基于语音交互的硬件,其语音技术比 Siri 前进了一大截,因为它支持远讲。

     

    2017 年亚马逊又推出了一个带屏幕的音箱 Amazon Echo Show,大家觉得这是不是又回到 Siri,还是基于 GUI 呢?这里要注意区别, Amazon Echo 是 VUI+GUI,也就是说它是以 VUI 优先的,因为语音的优势是输入很便捷,你说几个字就能代表一段指令,可以代替操作很多界面。但缺点是输出很低效,如果在屏幕上显示很多内容,但是你要用语音说出来,可能得花好几分钟。所以 VUI+GUI 的结合是把两者优势做了整合,VUI 用来做输入,GUI 用来做输出。

     

    更高级的形态是现在很多电影都能看到的像Eva、《钢铁侠》或者《西部世界》里面这种人形的机器人,完全可以跟人自由对话,它的交互是 VUI++,真正模拟人的多模态的交互形态,这个时间点也许在 2045 年会出现。

     

    为什么人机对话系统目前在工业界这么热门?它最重要的一个意义是有望取代目前在手机上的 APP,成为 IoT 时代的一个最重要的人机交互形式,这是它的最主要意义所在。


    3. 人机对话系统的交互形式和应用场景


    就像人和人说话有多种目的和形式一样,人机对话系统也包含很多种交互形式:

     

    1、聊天。典型代表是小冰,它包括问候和寒暄,其特点是没有明确目的,而且不一定回答用户的问题。聊天在现有的人机对话系统中主要是起到情感陪伴的作用。

     

    2、问答。它要对用户的问答给出精准的答案。这些问题可以是事实性的问题,如“姚明有多高”,也可能是其他定义类,描述类或者比较类的问题。问答系统可以根据问答的数据来源分为基于常见问题-答案列表的FAQ问答,基于问答社区数据的CQA问答,基于知识库的KBQA问答。

     

    3、操控,只是解析出它的语义,来供第三方执行,最典型的操控是打开空调、打开台灯,或者播放某一首歌。

     

    4、任务式对话。它是一个目的性很强的对话,目标是收集信息,以完成某个填表单式的任务,最常见的像订外卖、订酒店、订机票,这种方式通过对话来做。

     

    5、主动对话。让机器主动发起话题,不同的是,前面的交互都是让人来主动发起这个交互。

     

    640?wx_fmt=png


    目前人机对话系统的应用场景有很多,像音箱、电视、空调等等,其显著特点是它不是人可以直接触摸到的,可以将语音交互看成遥控器的一种替代品,有遥控器的地方就可以用语音来交互。

     

    另外一个应用场景是在车载方面,因为在开车时,你的眼睛和手脚都被占用着,所以这时通过语音来接听电话、导航甚至收发微信,是非常方便的,也比较安全。车载是刚需场景,所以目前出货量最多是在这块。像我们是从 2014 年开始做车载语音交互方案,到现在有 1500 多万的出货量。

     

    另外一个应用领域是儿童教育机器人,右下角这些各种形状的儿童机器人,实际上可以看成儿童版的音箱,它的内容是面向儿童的,但是交互形式也是人机对话的方式。

     

    4. 人机对话技术架构

     

    640?wx_fmt=png


    人机对话系统从学术界来讲,它的研究历史非常悠久,可能 AI 提出以后,在七八十年代就开始研究。它的技术分为五大部分:


    1、语音识别:主要解决复杂真实场景噪声、用户口音多样的情况下,把人说的话转成文字,即做到“听得清”。

     

    2、语义理解:主要是把用户说的话转成机器能理解执行的指令或查询,即做到“听得懂”。

     

    3、对话管理:维护对话状态和目标,决定系统应该怎么说、怎么问下一句话,也就是生成一个应答的意图。

     

    4、自然语言生成:就是根据系统应答的意图,用自然语言把这个应答意图表达出来。

     

    5、语音合成: 用机器合成的语音把这句话播报出来。


    这样形成一个完整人机对话的闭环。


    5. 语音识别场景演进

     

    640?wx_fmt=png

    因为人机对话系统是以语音作为入口,所以需要讲讲语音技术这块的进展。强调一点的是,如果想真正做好人机对话系统,除了对自然语言处理技术了解之外,对语音技术也必须有所了解。

     

    最早像 Siri 这样的场景是近讲模式,它最主要解决的问题是口音问题,目前这方面的识别准确率非常高,已经能做到 97% 左右,大家平时用的手机语音输入法就是这种模式,一般建议离麦克风的距离是30cm左右。

     

    Amazon Echo 则是远讲模式,你可以离麦克风 3 米甚至 5 米这么远。它要解决的问题很多,因为你离它远了以后更容易受周边噪音的影响,还有一个更致命的影响是声音反射引起的混响问题,特别是在玻璃房里,声音不断在反射,麦克风收到的声音就是很多声音混杂在一起。还有一个很不一样的地方,就是我们用微信语音的时候可以按下说,或者按着一直说,但当你面对一个音箱时,因为你离它有 3-5 米远,不可能按着说话的,这时就有新的技术,叫“语音唤醒”,就像我们跟人说话时叫人的名字一样,像“Hi,Google”,先唤醒机器,再同它对话。

     

    目前语音识别最难的场景是人人对话,在人和人对话的时候,先对它做录音,而且要把它转成文字,这个最常见的场景像开会,自动把不同的人说话转录下来,甚至自动形成会议纪要。还有像司法的庭审,只要是和人说话的场景下都可以用到。这里面最难的问题是鸡尾酒会问题,很多人在一起,环境很嘈杂,大家都在说话,人可以听到只关注的人的说话,即使很嘈杂,但两个人一样可以聊天对话,但这对机器来说很难。


    6. 人机对话系统中的机器角色演进

     

    640?wx_fmt=png

    在人机对话里面机器的角色有个演进的过程:最早人机对话很简单,可以看成是个遥控器的替代品,用户通过固定句式或者单句指令来控制这个系统。

     

    Siri、Amazon Echo 是一种助手的形态,也就是说,你可以通过自然语言交互,且对话是多轮的,甚至可以让机器有些情感。

     

    但是下一个阶段是它会变成专家的角色,特别是面向行业或者特定领域时,当我们跟音箱对话时,希望这个音箱同时也是一个音乐专家,它可以跟你聊音乐的问题,可以跟你聊古典音乐,甚至教你一些音乐知识。我们跟儿童教育机器人对话时,希望这个机器人是一个儿童教育专家,我们跟空调对话时希望后面是个空调专家。这时它的特点是需要有这个领域的知识,而且能够帮你做推荐、做决策。


    二、知性会话基本概念及示例分析

     

    我们做对话必须理解这几个概念——语义、语境、语用。特别是语境,它就是在对话时才有含义,语境就是指人和人发生对话时的一个具体环境,这个环境又包括言语语境,就是我们所说的上下文,还有很多非言语语境,如说话的时间、地点、天气都是非言语语境,还有说话人的信息等等,我们今天强调的知识也是一种重要的非言语语境。

     

    假如用户说「太冷了」这三个字,语义是温度有点低,但如果考虑语用,这句话在特定语境下面传递的会话意义、真实含义: 如果在车里面开着空调,理解这句话的意思是把空调温度调高一点;如果是冬天没有开空调,这句话的意思可能是把车的暖气打开,或者把车的窗户关上;现在马上到秋天了,如果一个女孩子对你说「太冷了」,她的含义可能是想让你给她一个拥抱之类的。所以语境和语用是非常重要的概念,如果做人机对话系统,都会接触到这两个概念。

     

    1. 人机(设备)对话系统下的语境

     

    640?wx_fmt=png


    刚才是说人和人对话时,语境很关键,现在我们做人机对话系统,人和设备对话的时候有哪些语境呢?

     

    1、物理语境。也就是你说话当时现场的信息,包括(1)时间、地点、场所,这个场所是指在车里或在家里等等。(2)天气。(3)情绪和情感。(4)设备上面显示的内容。(5)设备能感知到的信息,比如我们和空调对话,空调能够感知到室内外的温度、湿度。这个语境的生命周期是请求级的。

     

    2、言语语境。(1)上下文,设备上和设备上面反馈的信息也是一种上下文,这个生命周期可以看成是会话级的。

     

    3、知识语境。包括:


    (1)人类的常识和领域知识。举个简单的例子,以前我们一句话叫「中国乒乓球队谁也赢不了」,还有「中国足球队也是谁也赢不了」,这两句话看起来字面是一样的,但人能够理解这两句话的差别,因为我们有常识是:中国足球队很弱,中国乒乓球队很强。所以知识对这句话的理解至关重要。


    (2)用户画像,包括用户的一些基本信息,用户的性别、年龄、文化水平、爱好等等。(3)Agent 画像,就是这个机器人定义的信息,像小冰把它的 Agent 画像定义为一个 18 岁的邻家小妹。(4)设备信息库,如果把音箱作为中控的话,中控连接的设备信息、设备状态等都是语境。如果在家里对中控说「我回家了」这句话到底是什么含义?中控可能会根据你的设备状态、根据当前的环境情况,给你决定是开灯还是关灯,是给你开窗户还是拉窗帘等等。

     

    2. 不要神话知识图谱

     

    知识图谱的历史和概念大家已经比较理解了,我这里主要强调几个基本概念:最重要的知识图谱概念就是「Things,Not Strings」,知识图谱里面的东西都是一个个实体而不是字符串。

     

    另外,我们也不要神化知识图谱,它其实只是一种知识的组织形式而已。因为不管做什么应用,在各种场景下都有知识,以前可能用其他方式来表示这个知识。在概念层,我们以前也接触过类似的东西,就像我们做关于数据库建模时用 ER 模型,它也是一种概念模型。我们写程序,做面向对象设计时会画些类图,这些都是概念模型,这些模型都可以很方便的转成知识图谱来表示。我认为知识图谱首先是知识的一种组织形式。在数据层,知识图谱是一种图模型,它是用节点、边来表达实体、值、关系和属性等。


    3. 什么是知性会话?


    什么叫知性会话?我这里举个例子,用户可能跟音箱聊天:「你喜欢谢霆锋?」「喜欢,他很酷」「你知道他女朋友是谁吗?」「王菲」「来一首她的《传奇》」这是一种操控,机器就会给你播放王菲的传奇,播放之后系统还可以接着问说「你还想听李键的原唱吗?」这是一种主动对话,用户说「好的」,系统可以播放李键的《传奇》,用户还可以问「他的音乐风格是什么样的?」系统说「李健的风格,有民谣的简洁,但比民谣华丽得多。」

     

    你看这个例子的话,它涉及很多跟音乐相关的知识,还包括一些歌星的人物相关的知识。交互形式有聊天、问答、操控、主动对话,是通过知识把它们关联在一起,你会感觉整个对话是个很流畅的对话。

     

    总结下来,知性会话的意思是:它以知识图谱为中心,通过实体发现与链接技术把各种各样可以用来作为对话的数据源融合在一起,实现跨领域、跨交互形式的多轮对话。

     

    640?wx_fmt=png

     

    知性会话的主要特点有:一是跨领域,跨交互形式共享上下文,你可以看它的聊天和问答可以衔接在以前;二是它体现了领域专家的机器人定位,它对这些领域的知识非常了解,可以在聊天或者问答中体现出它掌握的领域知识。它有这方面的知识后,也可以主动发起一些对话。

     

    知性会话的核心技术有:


    • 离线处理,首先要有知识图谱,所以有一个知识图谱构建的问题。另外,我们要把各种跟对话相关的数据通过实体发现与链接技术跟知识图谱关联起来。

    • 在线处理。基于知识做话语理解,怎么在聊天里把知识融合进去,还有基于知识图谱的问答,基于知识图谱的主动对话等。


    三、知性会话关键技术


    (一)知识图谱构建


    1. 知识图谱的构建方法

     

    640?wx_fmt=png

     

    这里我引用复旦肖老师总结的知识图谱构建方法,第一步是做模式设计,我们要定义有哪些类或概念、哪些属性或关系。

     

    第二步确定我们的知识从哪来,所谓的数据来源,这里可以通过对一些结构化的数据、非结构化的数据做转换、对非结构化的数据,即文本,从里面去信息抽取。

     

    第三步,知识图谱里最重要的是词汇的挖掘,各种同义词、缩略词、短语等等。

     

    第四步,有词汇不够,我们要把同义词聚集为一个概念,也就是所谓的实体发现,包括实体实现、实体归类、实体链接等等。

     

    第五步,除了实体之外,知识图谱里还有边,也就是关系,我们要做关系的抽取。

     

    第六步,因为我们的知识图谱可能来源于不同的数据源,所以我们要做知识的融合,主要是实体对齐、属性融合、值的规范化。

     

    最后,对知识图谱的质量做检查控制,包括知识的补全,有错的话要纠错,还有知识更新,最后形成一个领域的知识图谱。

     

    2. 知识图谱的评估方法

     

    如果你不知道怎么评价知识图谱的话,就根本不知道你的知识图谱建得好还是坏、有用还是没用。评估的方法基本可以分为四大类别:最重要的类别是第二类基于应用,把知识图谱在应用里看效果怎样,通过应用效果来间接评估知识本体。我们不要先找几十个人花一两年建知识图谱然后再去找应用,而是知识图谱必须是应用驱动的,根据应用效果来评价知识图谱,这是推荐的一个方法。

     

    还有基于黄金标准评估,也就是说如果我们有些好的知识图谱,或者我们可以建一个小的知识图谱,根据这个标准知识图谱去评估我们建的知识图谱的情况。我们可以看看计算概念和关系的覆盖率,即有多少出现在标准知识图谱中的概念和关系被包含了,这可以评价我们的建的知识图谱是否完整。

     

    另外,简单的评估方式基于指标。可以定一些统计指标,比如这个知识图谱里有多少概念、多少关系、关系属性,然后我们还可以对它进行抽查,看它的准确率、一致性等指标。

     

    3. 敏捷构建

     

    640?wx_fmt=png


    我们现在做应用很多情况都是做敏捷开发,也就是说可能半个月或者一个月就会发一次版本,这时候我们知识图谱也要跟着应用快速迭代,这时候是需要对知识图谱敏捷构建的过程。这里强调我们要对知识图谱做自动化的测试,测试完之后要判断它是否能够发版,发版之后要继续分析它目前的问题。可以把知识图谱看成一个软件,它是不是有哪些 bug 或者需要哪些新功能,根据这些制定下一个版本的发版计划。核心想法就是把知识图谱也看成是一个软件,也要有版本管理,也要有敏捷的开发。


    (二)实体发现与链接

     

    需要解决的问题:如果我们这时候已经有知识图谱了,现在还依赖于实体发现与链接技术。这个技术解决刚才那个问题,「Thinks,not Strings」,它最重要的问题是把字符串和知识图谱的实体关联起来。它要解决两个问题,一个是我们同一个意义可能有表达不同的形式,像「科比」、「黑曼巴」、「科神」很多是指的科比这个人。还有一个是自然语言或者字符串本身有歧义性,就像「苹果」可能是指苹果电脑、苹果手机,也可能是一个水果。

     

    解决方法:所以它的做法是分两步,实体发现和实体链接,实体发现是发现文本中的 mention,就是字符串,像「这个苹果很贵」的「苹果」是 mention。实体链接是把这个 Mention 和知识图谱里的实体关联起来,知识图谱里的实体关于「苹果」可能有多个实体,有苹果公司,还有苹果这个品牌,还可能是苹果手机、苹果电脑,还有水果叫苹果等等,这里的「苹果」到底指哪个呢?可能要靠上下文的判断。

     

    1. 基于实体的多源数据融合

     

    640?wx_fmt=png


    我这里举个很简单的知识图谱,谢霆锋的女友是王菲,王菲唱了《传奇》这首歌,《传奇》这首歌的原唱是李健。

     

    我们在对话这块的数据来源有几个:一个是聊天库,像「你喜欢歌手谢霆锋吗」「喜欢,他很酷。」,还有 FAQ 库,我们可能从百度知道或者很多地方可以找到社区问答的数据,就像这里说「谁能说说李健的音乐风格?」「李健的风格,有民谣的简洁,但比民谣华丽得多。」

     

    我们也会从网上找到很多文档,包括百科的文档或者网页性的文档,我们对这些文档、聊天库、FAQ 库、文档库,我们都要去做实体链接,把这里面出现的歌手和我们知识图谱的歌手关联起来。

     

    2. 如何进行实体发现与链接?

     

    640?wx_fmt=png


    第一步预处理,首先建立一个 mention 到 entity(实体)的关系,这也是目前这个算法的局限性,我们事先要知道一个 mention 可能对应到哪些实体。然后抽取实体相关特征:

     

    一是实体的先验概率。就像苹果可能是水果的先验概率为 40%,是苹果手机的先验概率为 60%,如果我们说葡萄呢?可能葡萄是水果的先验概率有 90%,10% 是其他东西。二是实体上下文的词分布,我们看这些实体周边到底是什么词,或者它篇章的主题词,就像苹果手机出现在文章里都是科技类的主题词。三是实体之间的语义关联度,因为知识图谱是一个图的结构,所以每个实体环绕它周边都有些其他的实体,这些实体都是相关的特征。

     

    第二步,这时实体链接就变成一个排序问题,找到 mention 之后,我们可以根据前面 mention 关系表找到它的候选实体,现在保持只需要对候选实体排序,返回一个最可能的实体。

     

    第三步,对候选实体进行排序,可以用最基本的方法。这个有两大类:一个是实体本身的信息,还有一个是可以利用实体和实体之间的协同关系做排序。如果是苹果旁边的实体都是偏电脑类的,那这个苹果可能就指苹果电脑。


    (三)融合知识的话语理解


    做完实体链接处理以后可以做真正的对话系统这一块,对话系统里最基本的是对用户话语的理解,我们怎么去理解用户说的一句话。


    640?wx_fmt=png


    第一步要做实体的发现与链接,像刚才那个例子,「你喜欢谢霆锋吗」,我们要把谢霆锋跟知识图谱的实体关联起来。

     

    第二步做指代发现,比如「你知道他女朋友是谁」,那这个「他」到底是指谁,我们首先要发现他是一个指代词,然后再根据上下文去判断「他」在这个例子里面是谢霆锋这个实体。

     

    另外,我们做语义理解还有一种情况是结合知识做消歧义。比如用户说「周巧文的生日」,因为《生日》是一首歌的名字,周巧文是这个歌的歌手,这时候我们理解它是个音乐,因为本来就在音箱下面,这时我们可以直接播放周巧文的《生日》这首歌。但是如果系统又问一下「刘德华的生日」,这时候虽然我们的命名实体识别很有可能把「生日」也可能打成歌名的标签,刘德华打成歌手的标签,歌手的歌名,很容易以为是播放音乐,但是我们通过知识的验证知道刘德华并没有唱过这首歌,这时候要转成问答,这不是一个操控性的指令。直接返回他的生日,说「刘德华的生日是 1961 年 9 月 27 日」。

     

    这几个例子是我们通过知识帮助去理解用户的指令。我下面再讲一下怎么把知识和聊天结合起来。


    (四)融合知识的聊天


    1. 上下文


    现在学术界都用深度学习模型,所以我会简单讲一下深度学习的方法,把它的基本思想讲一下。我们现在一般在学界把聊天变成一个 Sequence-to-Sequence 的模型,就是有一个 encoder对输入进行编码为向量, 通过 decoder 把应答生成出来。这时核心问题变成怎么把上下文加进去,最基本的方法是把上下文的文本跟当前文本的向量合在一起作为 encoder 的输入;另外我们可以把上下文作为向量,在 decoder 阶段输入;或者用主题模型对这个 session 去建模,把这个 session 主题模型也作为 decoder 的输入,这样就可以实现一并上下文的效果。

     

    2. 一致性


    聊天还有一个很重要的问题是一致性。我们刚才说语境里面有一个agent画像,跟我聊天的对象虽然是机器人,但是它有统一的人格,它的性别、年龄、籍贯、爱好应该是一致的,这是目前聊天机器人里面最难的一点。你对机器人问它「多大了?」它可能说「18 岁」,如果你再去问一下「你今年高寿」,它很有可能回答「我今年 88 岁」,或者问你「芳龄几许」,它很有可能回答「小女子今年芳龄二八等等」。

     

    640?wx_fmt=png

     

    为什么会出现这种情况?因为目前聊天的机器人都是靠从各个来源去收集各种语料堆在一起的,对这种语料并没有做归一化处理,因为有的语料说「我今年 88 岁」,有的语料里面可能说「我今年 18 岁」等等,这时候换个方式问它可能会出现问答不一致的地方。更复杂的例子,你问它「你出生地在哪里?」它说「我在北京」,然后问它「你是中国人吗?」它可能就回答不了,虽然人类常识知道北京属于中国等等。

     

    在深度学习里如果想把这些所谓的机器人的信息,进行建模或向量化处理导入到 decoder 模型里去,这时候它会优先从身份信息的词向量去生成应答,这样也能达到一定一致性的效果。

     

    3. 融合知识

     

    640?wx_fmt=png


    另外,做问答的时候,像我们这个例子问「姚明有多高」,我们生成比较自然的问答,说「他是两米二六,他是唯一一个可以从太空看到的人类。」当然,这是开玩笑的。这种聊天就融合了知识,它知道姚明的身高。这时候通过深度学习模型做 decode 时,除了生成常规的应答之外,有部分的应答还要从知识库里去检索,然后再把这个应答跟文本的应答拼在一起。

     

    640?wx_fmt=png


    更多的类似工作可以看看获得今年IJCAI杰出论文奖的黄民烈老师的工作。


    (四)基于知识的问答


    知识问答主要有两种方法:一种是基于 Semantic Parsing 的传统方法,它是把一个问题解析成一个形式化的查询语言,再把查询语言知识库里面做查询。这个方法的最大难点是把自然语言的问题转成这样一个形式化的查询语言。同样也有很多方法,最简单的基于规则、基于模板,复杂点的基于翻译模型、基于深度学习模型等。

     

     

    640?wx_fmt=png

     

    目前学术界比较多的是基于机器学习的知识库的问答方法,这里面它的基本思想是把问题建模成一个 embedding,然后对知识图谱也做 embedding,变成一个个向量,这个问答就转换成了一个相似度匹配的问题,把知识库里的子图的向量跟问题对应子图进行相似度匹配。

     

    640?wx_fmt=png

     

    还有很多其他方法,目前比较多的是基于网络的方法,基于带注意力机制的循环神经网络的方法。这块我给一个参考,大家可以看一下《揭开知识库问答 KB-QA 的面纱》这篇文章,讲得非常详尽、非常好。我个人的观点是现在基于深度学习的知识库问答目前在工业界这块不是很成熟,它的效果不太可控,我们在系统里还是用基于传统的 Semantic Parsing 问答。

     

    在 CQA 上也有很多把知识结合进去的方法。CQA 最核心的问题是我们要算用户的问题和在我们问答库里问题的语义相似度,这里的核心问题是怎么能把知识放到对句子的向量表示里。最近的 SIGIR2018 中提到,把知识和注意力的神经网络结合在一起的方法。现在这种论文基本都是一个网络图。另外一篇文章也是类似的,总体是在文本做排序时把知识向量化。


    (五)基于知识的主动会话


    这个实际上是非常关键的。在我们人机对话系统,特别是在 VUI 交互下, VUI 音箱是没有界面的,这就意味着你无法知道这个音箱到底支持哪些功能。当你面对音箱的时候,你怎么知道它的功能,到底哪些话能说,哪些话不能说,或者它有什么东西?这时候很需要机器人主动的对话,能引导用户用它,知道它的功能。

     

    640?wx_fmt=png

    再举个例子,如果一个用户说「来首《传奇》」,机器可以主动问他说「播放以后还想听听李健原唱吗?」其实它的思想很简单,就是根据我们的知识图谱里面,看看相同实体下面有没有其他关系或者属性,或者推荐一个相同关系下面其他的实体。


    640?wx_fmt=png


    这里一篇百度的文章思想也是类似的,如果觉得聊天聊不下去了,会先在上下文里去做实体分析和实体链接,找到作为聊天主题的实体之后再根据知识图谱找相关的实体,根据相关的实体产生话题。


    四、总结


    前面把聊天、问答、对话、语义解析怎么跟知识结合起来做了简单的介绍。接下来做个总结:

     

    第一,为什么人机对话系统很重要?

     

    640?wx_fmt=png


    1、它有可能成为物联网时代的最主要交互形式,类似于 OS。

     

    2、知性会话的核心是知识图谱。它最重要的是做两件事情:一是线下要做基于知识图谱做多源数据的融合,二是在服务时要做基于知识图谱聊天、问答、对话、操控一体化。

     

    3、从技术上来讲,深度学习和知识图谱技术的结合是目前最重要的一个趋势。我个人比较看好 Sequence-to-Sequence 模型,因为它的表达能力非常丰富,而且应用场景非常多,基本上自然语言处理里面大部分的问题都可以建模成一个 Sequence-to-Sequence。包括我们的翻译是一个语言到另外一个语言,还有聊天问答甚至拼音输入法,就是把拼音序列转成文字序列等等,还有做分词、词性识别、命名实体识别等等都是 Sequence-to-Sequence,这种模型分为 encoder 和 decoder 两个阶段,它在不同的阶段都可以把一些知识融合进去。

     

    第二,在人机对话系统里的技术演进是怎样的?

     

    640?wx_fmt=png

     

    1、在对话里不能只看语义,还要看语用,语用就是「语义+语境」。

     

    2、我们不能只做闲聊式的机器人,而且是希望我们机器人是掌握领域知识,它是有文化的,而且文化水平还很高,是个领域专家,是知性会话。

     

    3、流式对话。我们目前跟音箱的交互都是先唤醒,说「小爱同学,给我点首歌」,又说「小爱同学,播放下一首」。非常麻烦,但人和人对话是不会总频繁叫人的名字的,这时候就需要流式对话,这块的技术难点是怎么判断一个人说话是不是说完了,你是否可以打断,这是目前技术上最难的一点。还有一个是怎么去拒绝噪音,因为现在对话是没有唤醒词的,这时候旁边人的说话甚至电视里面说的话很有可能被误识别,机器也会对它做响应。


    五、答听众问

     

    Q:我们公司在构建电商的知识图谱,但是电商的数据是每天都会更新的,有什么好的办法对知识图谱进行更新吗?而且基于 neo4j 的图谱如何做知识推理?

     

    A:这是个好问题。我们刚才强调知识图谱要敏捷构建,敏捷构建就意味着你可以频繁的发版本,这时候就有版本合并的问题,其实也是更新的问题。更新这块主要的技术是知识本体的融合或者知识实体的匹配、实体的对齐。如果更新的数据量不是很大的话,我建议的方法是先通过实体对齐的技术,把更新的数据自动添加到知识图谱里去,如果量不大的话还需要做人工的 review,看更新的数据是否 OK。这个我认为也没有什么特别好的办法,因为更新本来就是知识图谱里最难的问题。

     

    neo4j 的图谱如何做知识推理?首先,我个人认为它不太适合存储海量的知识图谱,电商的数量应该很大的,这时候用 neo4j 合适不合适还有待商榷。如何做知识推理?我们一般认为知识图谱最主要的是知识,尽量少去做推理,因为推理是挺难的一个东西,而且也没有特别工业化成熟度很高的工具。第二,如果非要做推理的话,我们一般做线下的推理,就是预先把推理做好,把它能展开的数据全展开,也叫「知识补全」,就像简单的传递性的关系或者预先把它都展开,相当于存储空间换时间,这是一个比较常用的方法。我们现在不太建议线上服务时做实时推理,因为那个性能一般很难达到要求。

     

    Q:本体构建的大致方法能简单介绍一下吗?

     

    A:本体构建的方法从大的面来讲有两种,一种是传统基于专家的方法,就是请一般专家全手工构建,他们对每个词、每个实体、词之间的关系都开会讨论,最后决定应该这样、应该那样,这是专家驱动的方法。但这种方法已经不太可行,而且这种方法也会成为我们做知识图谱的瓶颈,因为我们期望知识图谱是一个敏捷构建的。

     

    目前大部分是数据驱动的方法,就是我们通过数据挖掘去自动构建知识图谱,适当地基于人工的 review。我倾向于极端的方法,我推荐的方式是知识图谱的构建整个是全自动,但是也需要专家的参与,但是专家参与不是做 review、不是做构建,而是做评测。整个知识图谱的效果根据应用的效果说话,这个应用不能假设整个知识图谱是完全正确的、完整的的。我们可以通过快速迭代,不断的对知识图谱去做更新,然后根据自动化的测试或者根据人工的抽样检查和应用的效果去看知识图谱的质量。只要我们知识图谱的质量能够满足应用的需求就 OK。

     

    Q:实体抽取有一个大致的最佳实践吗?

     

    A:最佳实践是这样的,如果从工业界角度看的话,实体抽取肯定是多个方法的融合,基于词典、基于规则、基于统计学习方法、基于深度学习方法,没有一个方法就能搞定所有的问题。虽然词典挖掘这个东西没有技术含量,但是实践中基于词典的方法是非常有效的方法,特别是在垂直领域里面,像医疗这种领域,当然,在有些领域可能这个方法不靠谱,比如在音乐领域,音乐里面有歌名,任何一个词都可能是歌名。

     

    但基于词典方法还有一个重要考虑,一定要考虑这个词典的这个词有没有歧义,或者一个词的先验概率。比如「我爱你」也是一首歌名,但是它是歌名的概率可能不是特别大,但「忘情水」是歌名的概率就很大,所以词典不是简单的词条列表,而是要带先验概率的信息。

     

    Q:知识图谱还需要语义网的知识吗?构建 OWL 可还需要很强的领域知识?

     

    A:我们刚才说到知识图谱的前身是语义网,所以如果想更加深刻理解知识图谱,还是要了解一下语义网的知识,特别像 RDF OWL 的规范是要了解一下的。

     

    OWL 的这个本体语言还是有点偏复杂,目前基本上不太推荐知识图谱搞得那么复杂,基本对应到 RDF 那种形态就差不多了。我们希望知识图谱可以构建尽量大,但是它从逻辑上来讲尽量简单,不要用 OWL 里面复杂的东西。一点点语义可以走得很远,没必要把模型搞得太复杂,因为把模型搞得太复杂的一个最重要难点是当你把实体放进去时你很难判断这个实体属于哪个概念。

     

    Q:心理学出身的研究者在 NLP 学术领域是否有竞争力?对于心理学研究者转向 NLP 学术圈有哪些建议?

     

    A:这个问题挺有意思的。我们组里有一个主力骨干就是学心理学出身的,但他当时学的心理学是偏统计方面的心理学,也就是计量心理学这方面的,所以他相对有一定的统计基础。这时候由统计基础转向到 NLP,因为有数学基础,是比较容易一点的。另外一点,心理学比较有意义的是认知这一块,因为神经网络这些原理跟认知心理学有一定的关系,所以心理学知识对转到 NLP 挺有帮助的。

     

    关于具体的建议,不管哪个专业转到 NLP,最重要的是学好数学和机器学习最基础的东西,这个基础打好了,转向 NLP 就比较简单了。

     

    Q:基于知识的方法和统计类的方法需要共融互补,老师有没有典型的合作思路,充分利用基于知识规则方法的稳定可控的同时,又能利用统计从有监督的大数据自动抽取模式?是否可以讲讲两者一起 NLP 的经验?

     

    A:现在人工智能主要是三大学派——知识图谱派、统计学习派、深度学习派,从工业界角度来看,在解决具体问题时各有所长,所以需要把这三者融合在一起,真实的线上系统不会只有一个方法。所以知识方法是一个很重要的方法,而且它跟深度学习是有比较好的互补性,特别是可以提供深度学习方法里面没有的可解释性这一块。

     

    具体怎么融合,最简单的融合方法就是做模型Ensemble,把几个分类器组装在一起,这个可以看周志华老师那本「西瓜书」,因为周老师做模型的 Ensemble是最拿手的。

     

    此外,把知识或规则都可以作为特征,从这个角度融合在一起。另外,深度学习里的解码器也可以把知识融合进来,所以这块的方法是很多的。



    【完】


    2018 AI开发者大会

    只讲技术,拒绝空谈


    2018 AI开发者大会是一场由中美人工智能技术高手联袂打造的AI技术与产业的年度盛会!是一场以技术落地为导向的干货会议!大会设置了10场技术专题论坛,力邀15+硅谷实力讲师团和80+AI领军企业技术核心人物,多位一线经验大咖带你将AI从云端落地。


    大会日程以及嘉宾议题请查看下方海报

    (点击查看大图)

    640?wx_fmt=jpeg

    640?wx_fmt=jpeg


    点击「阅读原文」,查看大会更多详情。2018 AI开发者大会——摆脱焦虑,拥抱技术前沿。

    展开全文
  • 心理辅导平台设计

    千次阅读 2017-12-04 10:22:57
    软件开发的意义 :开发该软件是为了增加中国人对心理咨询和心理治疗的了解,改善心理学在中国发展缓慢、不成熟的现状,让中国的心理咨询市场透明化,让心理咨询从业人员拥有更多的发展空间,消除不良从业人员对心理...

    声明:作者对本文档保留所有权利。

    原题目:
    软件工程课程设计
       ——心理学指导软件
    学生学院   机电工程学院       
    专业班级   ******      
    团队名称   “何弃疗”         
    队员姓名   *** *** *** ***
    2014年12月16日    
    

    文章目录

    一、团队介绍	
    二、软件介绍	
    三、可行性分析	
        1.引言	
        2.可行性研究的前提
        3.所建议技术可行性分析	
        4.所建议系统经济可行性分析	
        5.社会因素可行性分析	
        6.项目风险管理:	
        7.结论意见	
    四、需求分析	
        1.功能需求	
        2.性能需求	
        3.界面要求	
        4.出错处理需求	
        5.接口需求	
        6.其他需求	
    五、 总体设计	
        1.设想供选择的方案	
        2.选取合理地方案	
        3.最佳方案	
        4.程序流程图	
        5.层次图	
        6.数据流图	
    六、详细设计	
        1.各个模块功能描述	
    七、测试验收方案	
        1.测试目的
        2.测试的步骤
        3.用户测试
        4.第三方程序员测试
    八、参考文献
    

    ##一、团队介绍
    队名:何弃疗
    成员*** *** *** ***
    作品名:心窝APP
    作品icon

    心窝APP

    姓名分工
    ***总体构思、文档汇总、详细设计
    ***PPT设计、可行性分析、UI界面设计、图标设计
    ***需求分析、测试验收方案、总体设计
    ***程序介绍、总体设计

    ##二、软件介绍
    软件结构简介:改程序分为5个版块,以智能聊天版块为主,其他版块都是辅助和延伸。

    软件开发的意义:开发该软件是为了增加中国人对心理咨询和心理治疗的了解,改善心理学在中国发展缓慢、不成熟的现状,让中国的心理咨询市场透明化,让心理咨询从业人员拥有更多的发展空间,消除不良从业人员对心理咨询市场的影响,改善心理咨询市场两极分化、发展好的从业人员工资很高、发展不好的收入很低的缺点,也让心理疾病患者能及时治疗,不要因为不了解心理咨询和心理治疗和讳疾忌医的心态而影响正常生活。

    功能定位:基于Android端的以心理指导智能聊天系统为主心理学的交流平台。

    用户定位:需要心理指导的普通用户、心理学专业用户、企业、学校心理指导中心等。

    ##三、可行性分析
    ####1 引言
    1.1 编写目的:
    心理咨询是以维护人的心理健康状态为目标和内容的一项工作,这项工作要求借助于一种特殊的人际关系,运用心理学的理论知识和方法,通过言语、文字及其他信息传递方式,就咨询对象的心理方面存在的问题,提供帮助、启发和指导的过程。我国目前正处在社会转型期,当一些人面临前所未有的就业、婚姻、子女、养老等生存压力时,他们的无助和挫折,往往都可能成为一触即发的“引子”。由于应激事件增多,相关的抑郁和焦虑等情绪反应可能形成长期的适应不良或诱发精神障碍:受流行文化影响的不当节食减肥,导致神经性厌食和贪食后也会诱发多种心理疾病。

    与美国相比,我国心理咨询业起步晚得多。早在20世纪30年代,我国曾出现心理诊所,但由于历史原因,心理学及心理咨询在相当长的时间内在我国未得到发展。80年代中期以后,心理咨询在我国一些大城市的高等院校率先进行,受到了广大青年学生和部分教职工的欢迎。面向社会各阶层的正视心理咨询和心理治疗机构也开始设立。随着社会发展、生活节奏加快、矛盾冲突增加,人们对增进心理健康产生了越来越强烈的需求,心理咨询在我国形成需求市场,心理咨询业有了相当程度的发展。

    中商情报网发布的《2010-2015年中国心理咨询业调研及发展前景预测报告》主要依据国家统计局、卫生部、大中城市心理咨询行业协会以及心理咨询相关组织发布的权威数据、资料,分析了国内外心理咨询业发展现状,重点分析了中国心理咨询发展历程及心理咨询市场需求和心理咨询群体特征,然后报告针对目前国内心理咨询业存在的问题提出了发展对策,并重点分析了国内知名度较高的心理咨询机构及网站,最后针对未来几年我国心理咨询业发展潜力及趋势进行了预测。它是业内企业、相关投资公司及政府部门准确把握行业发展趋势,洞悉心理咨询行业竞争格局,规避经营和投资风险的重要依据,对制定正确竞争和投资战略决策具有重要的参考价值。

    因此,本app主要让用户通过这个平台来指导用户通过自我调适解决心理困惑,并建议有心理疾病的用户进行专业的心理咨询。同时通过推送心理有关方面的知识内容让用户了解心理学,在这个平台能实现普通用户与心理学专业用户或企业之间互相的的交流。

    1.2 项目背景:
    (1) 项目的任务提出者和开发者:*** *** *** ***
    (2) 用户:普通用户、心理学专业用户和企业用户。
    (3) 实现单位:校园或者私人心理中心、各企业。

    ####2 可行性研究的前提
    2.1 要求
    (1)软件要求功能:

    用户功能
    普通用户心理疏导、释放压力、心理测试、心理咨询中介
    心理学专业用户和企业用户收集心理学数据、调研、学校心理中心针对学生心理状态监控、辅助咨询、企业了解员工的心理状态、人力资源管理

    (2)性能:
    方便快捷地解决用户的心理问题,便于心理学专业用户和企业用户与用户之间的相互交流。
    (3)系统的输入
    用户者的注册账号(手机,qq邮箱等)和密码
    (4)系统的输出
    用户者得到身份验证,进入app
    (5)安全和保密要求
    系统对于用户的验证方式为他的账号和密码,用户可使用手机号或者qq邮箱等方式注册自己的私人账号。
    (6)开发目标
    系统的开发目标应考虑如下因素:
    a)人力与设备费用的相对减少;
    b)处理速度的提高;
    c)控制精度的提高;
    d)资源利用率的改进
    (7)具备条件
    项目开发中所具备的条件、假定和所受到的限制,如:
    a所建议系统运行寿命的最小值,系统运行寿命的最小值应达三年;
    b进行系统方案选择比较的时间,系统方案选择比较的时间为一个月;
    c可利用的资源和信息:可参考已有的社交软件系统。

    (8)开发基本计划:

    工作集内容时间
    准备工作社会调查,进行学生,社会人士,心理机构中心和企业有关这款app的建议调查,收集数据并总结。1个月
    开发系统源代码及源码测试找计算机人才或者自我培训,并进行内测阶段1个月
    第一阶段完成基本功能:针对焦虑情绪的智能聊天系统、心理状态量表3个月
    第二阶段针对普通用户的功能扩充:界面优化、数据库联网、注册账号、发动态、官方账号发布心理学活动或讲座信息、心理学文章和视频3个月
    第三阶段心理学专业人群和企业用户功能扩充:心理量表、心理测试、调研数据收集、辅助咨询过程(推广)3个月
    第四阶段拓展数据库、增加情绪种类,根据用户反馈改进。3个月

    **2.2、可行性研究方法:** 可行性研究采用的方法如下: (1)客户调查: (2)专家咨询:与学校心理机构中心协商,并申请赞助。 (3)市场相关产品、同类产品调查:

    2.3、评价尺度:
    系统进行评价时所使用的主要尺度为各项功能的优先次序、开发时间的长短及使用的难易程度和用户的交互性。

    2.4、对现有系统的分析
    当我们心情不好或者有心理问题时候,我们一般自己苦闷在心中或者去找身边的朋友聊天,但是这样做并不能有针对性并且有效地解决我们的心理问题,有一些隐私因为在其他人面前无法说出来,然而这款app却能实现这样的隐私保护功能,另外还可以解决自己心理上的疾病或问题,以及对自己进行调查检测,通过专业心理用户与普通用户的线上交流,简易方便地解决了自己的问题。

    ####3、所用技术可行性分析
    参考现有的心理学智能聊天网页——ASP
    实时数据库搜索功能
    参考大型电商网站的智能客服
    查找中文的分词技术论文
    查找心理学情绪关键词和中文词汇的对应的论文
    采用专业的心理学量表
    采用现有的数据库结构设计

    ####4、所建议系统经济可行性分析
    4.1成本支出:
    数据库(阿里云)的使用费用
    人力资本
    硬件成本
    场地费用
    宣传、推广成本
    后期维护成本

    各开发阶段需要使用的人力费用表

    任务人力(%)费用(元)
    可行性研究5200
    需求分析设计10400
    设计251000
    编码和单元测试20800
    综合测试401600
    总计1004000

    **4.2效益** (1)一次性收益:学校及企业软件的使用费用、学校创新培训项目申请资金、加入创业孵化基地。 (2)经常性收益:心理中介收费、调研数据收费、辅助咨询过程收费、定制企业数据库。 (3)不可定量收益:广告,赞助,活动等。

    4.3投资回收周期
    该设备是一次性投资,当产品卖出的时候,已经实现盈利,而且在往后的硬件维护过程中能持续收益。

    ####5、社会因素可行性分析
    法律可行性:该新系统自主研制开发,拥有自主知识产权。该系统的开发将不会侵犯任何个人、集体、国家的利益,也不会违反国家的政策与法律。

    社会推广可行性:心理咨询服务的普及与高速发展,使得相关配套服务系统的完善变得十分必要。而本系统将大大解决用户的心理咨询问题,使得用户的身心健康,符合发展的需求,在中大型城市中将得到推广。

    使用可行性:该系统仅仅需要一个手机就可以间接地了解到心理方面内容,极大的方便用户与心理平台交流,而移动通信端的普及将极大的增加该系统的使用可行性。

    ####6、项目风险管理:
    本次开发过程中存在的风险及规避方法如下表:

    风险类型存在风险规避方法
    进度风险由于时间紧张导致项目最后无法按期完成。充分考虑各种潜在因素,适当留有余地;任务分解要详细,便于考核;在执行过程中,应该强调项目按照进度执行的重要项,再考虑任何问题时,都要经保持进度作为先决条件;同时,合理利用赶工期及快速跟进等方法,充分利用资源。如果出现必须延期的情况,组长需及时同银行相关负责人沟通,并申请延期时间。
    ||系统没有足够的测试时间|	持续地监控,项目进度控制随着项目的进行而不断进行的,保证每个环节都有足够的时间。|
    

    |技术风险 |开发软件结构体系存在问题,使完成的软件产品未能实现项目预定目标 |选用正版软件开发|
    ||对开发软件的掌握不够深入,造成开发出的产品性能以及质量低劣。 |提前制定好两周的学习计划,各组员要对开发工具C++,css,photoshop及flash进行快速的学习。尽快掌握其中的要点。同时在软件的设计上尽可能降低难度使项目最后能成功完成。|
    |质量风险 |质量不符合用户要求| 经常和用户交流工作成果、品牌管理采用符合要求的开发流程、认真组织对产出物的检查和评审、计划和组织严格的独立测试等。|
    |工具风险 |软件项目开发和实施过程,所必须用到的管理工具、开发工具、测试工具未能及时到位 |在项目的启动阶段就落实好各项工具的来源或可能的替代工具,在这些工具需要使用之前跟踪并落实工具的到位事宜。在进行项目开发之前先设计和搭建出系统的基础架构并进行性能测试,确保架构符合性能指标后再进行后续工作。|
    |人力资源风险| 组员成员因意外无法参加设计| 事先同用户商量解决办法|


    ####7、结论意见
    本款App需要运营部,开发部,和行政部门,需要大量的数据调查和调研,尤其需要技术人员和推广人员,以及外联部进行与商家,心理咨询中心和企业的宣传。

    ##四、需求分析
    ####1.功能需求
    该软件首先面向大多数普通用户,普通用户可以通过该软件的量表大概了解自己当时的情绪。当用户有情绪问题时,可以通过软件中的智能心理指导窗口模块与可爱的玩偶“小熊”进行聊天,同时“小熊”会根据对话做出一系列相应的动作来愉悦用户,在一定程度达到用户减少压力、疏导心情的目的。用户还可以通过软件中的心理鸡汤模块搜索到有关心理学的书籍、电影、视频以及最新的心理知识更新,满足对心理学感兴趣的用户学习心理学的目的。用户通过注册账号后,拥有匿名或者不匿名发布动态到动态圈、交友、建群群聊、关注公众号,查看到自己所想要搜查的问题的建议并可将其收藏。如若用户感觉到自己真的有心理上的“疾病”,可以在软件的专家预约模块中预约心理学专家医生,查看其预约时间和个人简介。

    该软件同时面向学校,企业等机构,这些机构可以运用该软件为学生或员工做心理测试,达到辅助咨询的作用,知晓其近期的心理状况,同时在实际生活中做出相应的对策。同时,学校、企业、单位可将在该软件中注册公众号,发布自己的活动动态。企业可以将该软件运用于到人力资源部门。

    功能需求概述图:

    普通用户功能需求

    专业用户功能需求

    ####2.性能需求
    (1)数据精确度
    输入数据:用户填写的账号、密码,个人信息、量表、用户在心理指导窗口的陈述、用户做出的心理测试以及用户的动态
    输出数据:查询结果
    (2)时间特性
    软件运行在Andriod平台上,相应时间取决于数据库操作的相应时间,因不同机器,不同数据库而异。页面的转换和结果的查询应尽量要求在0.5秒-1秒内响应。
    (3)主存容量
    由于该软件功能齐全,集合度较高,主存容量大概为30M.
    (4)磁盘容量
    智能心理指导系统需要储存大量的数据,且用户在对话中的答案会随时被记录进数据库,要求储存数据库的磁盘容量要较大,在此暂定为500G。
    (5)安全性
    无论是普通用户还是学校企业等用户,每个账号是独一无二的,且自己设有密码,安保问题和绑定邮箱和绑定手机,进一步增加用户的安全性。

    ####3.界面要求
    (1)用户界面要求实用
    A.完成同一功能的或任务的的元素放在集中位置,减少移动距离
    B.常用功能支持快捷键
    C.按功能将界面划分区域块,并要有功能说明或标题
    D.界面上首先应输入的和重要信息应当靠前,位置也应放在界面上较醒目的位置
    E.同一界面上的控件数最好不要超过10个,多于10个时可以考虑使用分页界面显示。
    F.用户查看顺序总体从上到下,同时行间从左到右的方式。
    G.选项数相同时多用选项框而不用下拉列表框。
    H.界面空间较小时使用下拉框而不用选项框。
    I.选项数较少时使用选项框,相反使用下拉列表框。
    J.使用通用性词眼。
    K.长时间的操作应提供进度指示和取消功能。
    L.对于一些常用的输入,软件应具有记忆功能,以避免用户重复输入相同的内容。
    M.所有的提示要清晰易懂,避免让用户去记大量无用的东西

    (2)用户界面要求规范
    A.常用功能要有命令快捷方式
    B.界面中的图标能直观的代表要完成的操作。
    C.状态条要能显示用户切实需要的信息,常用的有:目前的操作、系统 状态、用户位置、用户信息、提示信息、错误信息等,如果某一操作需要的时间较长,还应该显示进度条和进程提示。
    D.滚动条的长度要根据显示信息的长度或宽度能及时变换,以利于用户了解显示信息的位置和百分比。
    E.使用操作系统提供的控件,不要改变其功能,避免将用户弄糊涂。

    (3)用户界面要求合理
    A.父窗体或主窗体的中心位置应该在对角线焦点附近。
    B.子窗体位置应该在主窗体的左上角或正中。
    C.多个子窗体弹出时应该依次向右下方偏移,以显示窗体出标题为宜。
    D.重要的命令按钮与使用较频繁的按钮要放在界面上注目的位置。
    E. 错误使用容易引起界面退出或关闭的按钮不应该放在易点位置。横排开头或最后与竖排最.后为易点位置。
    G.与正在进行的操作无关的按钮应该加以屏蔽(Windows中用灰色显示,没法使用该按钮)。
    H.对可能造成数据无法恢复的操作必须提供确认信息,给用户放弃选择的机会。
    I.非法的输入或操作应有足够的提示说明。
    J.提示、警告、或错误说明应该清楚、明了、恰当。
    K…窗体及控件大小合适,避免剩余控件过大或信息显示不全。

    (4)用户界面要求美观
    A.长宽接近黄金点比例,切忌长宽比例失调、或宽度超过长度。
    B.布局要合理,不宜过于密集,也不能过于空旷,合理的利用空间。
    C.按钮大小基本相近,忌用太长的名称,免得占用过多的界面位置。
    D.按钮的大小要与界面的大小和空间要协调。
    E.避免空旷的界面上放置很大的按钮。
    F.放置完控件后界面不应有很大的空缺位置。
    G.字体的大小要与界面的大小比例协调,
    H.前景与背景色搭配合理协调,反差不宜太大,最好少用深色,如大红、大绿等。常用色考虑使用界面色调。
    I.如果使用其他颜色,主色要柔和,具有亲和力与磁力,坚决杜绝刺目的颜色。
    J.界面风格要保持一致,字的大小、颜色、字体要相同,除非是需要艺术处理或有特殊要求的地方。
    K.如果窗体支持最小化和最大化或放大时,窗体上的控件也要随着窗体而缩放;切忌只放大窗体而忽略控件的缩放。
    L.对于含有按钮的界面一般不应该支持缩放
    M.通常父窗体支持缩放时,子窗体没有必要缩放。
    N.如果能给用户提供自定义界面风格则更好,由用户自己选择颜色、字体等。

    (5)用户界面展示

    用户界面展示

    ####4.出错处理需求
    1)对运行过程中出现问题而引起错误的地方有提示,让用户明白错误出处,避免形成无限期的等待,例如用户查询不到自己想查的内容,软件即显示“您所查的内容尚且无法得到,请问是否继续”。
    2)之后,我们后台将会将用户所查的内容收集,放进数据库,以便用户下次查找的时候可以找到所需内容。
    3)每隔一段时间测试软件,减少软件的出错。

    ####5.接口需求
    1)用户接口
    使用Java编程语言类库的抽象窗口工具箱AWT(Abstract Windowing Toolkit)。
    2)硬件接口
    在输入方面,对于键盘、鼠标的输入,可用Java语言输入/输出,对输入进行处理,也可以运用USB接口进行数据的输入。
    在输出方面,运用USB接口进行输出数据。
    3)软件接口
    A.服务器程序可使用Java 提供的对SQL Server的接口,进行对数据库的所有访问。
    B.服务器程序上可使用SQL Server的对数据库的备分命令,以做到对数据的保存。
    C.在网络软件接口方面,使用一种无差错的传输协议,采用滑动窗口方式对数据进行网络 传输及接收。
    D.制作手机界面的软件Photoshop
    E.编程源代码的软件Java
    ####6.其他需求
    为了保证系统的安全性需要在网络的传输过程中对数据进行加密。

    ##五、总体设计
    ####1.设想供选择的方案
    1.1 心理疏导版块
    心理聊天窗口:
    当用户有问题时,用户通过心理聊天窗口语音或者手写输入自己的心理状态,系统通过玩偶小熊的形象及时将信息、建议反馈给用户,同时小熊会根据对话做出一系列的表情与动作。好似用户与心理学专家面对面聊天谈心。若此时,用户输入的信息没有存在于数据库中,数据库会收集用户的信息,同时给用户做出提示。
    心理引导窗口:
    当用户有问题时 ,用户通过心理引导窗口选择相对于自己当时的情绪名词,系统通过玩偶小熊的形象根据用户做出的选择用一些情景场景引导用户或者推荐用户去浏览一些相关的书籍,同时小熊会根据对话做出一系列的表情与动作。当用户确实存在很大的心理“疾病”时,系统会提醒用户去看心理医生。若此时,用户输入的信息没有存在于数据库中,数据库会收集用户的信息,同时给用户做出提示。

    1.2 心灵鸡汤版块
    收集与心理学相关的心理学书籍、电影、视频、文章以及与生活有关的小tips,将他们分类放在界面。同时,在界面的最顶部设有搜索框,用户可以自己搜索想要的知识,满足用户的需要。该版块会隔一段时间更新,确保用户得到最新的心理学知识。可以吸引一些著名的专家为用户推荐好的作品。

    1.3 个人主页版块
    用户通过注册账号,输进账号和密码之后可以进入个人主页界面。在个人主页版块中,用户可以看到自己的呢称、性别、头像以及更换头像、相册、 设置、近期自己发布或者收藏的动态,已添加的好友和关注的公众号,自己所建立的群和加入的群。同时,在这一版块中增加心理测试和心理知识问答游戏。当用户心理测试或者进行心理知识问答后,结果会被数据库采集并增加进数据库。

    1.4 心理专家医生版块
    在线咨询模块:
    当用户确实觉得自己有很大的心理问题时,需要心理医生的咨询。用户可以进入心理专家医生在线咨询模块与其进行语音聊天、文字聊天或者视频聊天,同时心理医生在线收取一定的费用。
    在线预约模块:
    当用户确实觉得自己有很大的心理问题时,需要心理医生的咨询。用户可以进入心理专家医生在线预约模块与医生进行预约,查看医生的简介和预约时间。用户也可以在搜索框中搜索想找到的心理学专家,预约后与医生进行线下的交流,不在线收费。

    ####2.选取合理地方案
    2.1 选取心理引导窗口
    由于心理聊天窗口需要智能化,好似人与人在面对面地聊天,场景设想较多,造成数据库较为庞大,前期由于经费不足,无法收集到十分丰富的信息和购买巨大的数据库,因此不理想。
    心理引导窗口由于具有固定的模式, 数据库较小,较为理想。

    2.2 心灵鸡汤版块
    由于前期关注度不高,专家入驻该软件的人数较少,故减去专家推荐这一功能,改为系统今日推荐这一功能,其他功能保留。

    2.3 个人主页版块
    个人主页版块收集了较多的信息,造成界面较为复杂,故将与个人信息较少联系的功能独立出来,将心理测试与心理知识问答游戏功能分别独立出来作为心理测试版块和心理知识问答版块。

    2.4 心理医生专家版块
    在线咨询可能由于网速,流量、延时等问题造成交流不能有效进行,且在线付费存在风险,用户问题得不到解决,因此不理想。改由在线预约可以使用户与心理医生面对面交流,问题可以得到有效的解决,故选择该方案。

    ####3.最佳方案
    3.1 心理引导窗口
    用户通过心理引导窗口选择相对于自己当时的情绪名词,系统通过玩偶小熊的形象根据用户做出的选择用一些情景场景引导用户或者推荐用户去浏览一些相关的书籍,同时小熊会根据对话做出一系列的表情与动作。当用户确实存在很大的心理“疾病”时,系统会提醒用户去看心理医生。若此时,用户输入的信息没有存在于数据库中,数据库会收集用户的信息,同时给用户做出提示。

    3.2 心灵鸡汤
    收集与心理学相关的心理学书籍、电影、视频、文章以及与生活有关的小tips,将他们分类放在界面。同时,在界面的最顶部设有搜索框,用户可以自己搜索想要的知识,满足用户的需要。该版块会隔一段时间更新,确保用户得到最新的心理学知识。

    3.3 个人主页
    用户通过注册账号,输进账号和密码之后可以进入个人主页界面。在个人主页版块中,用户可以看到自己的呢称、性别、头像以及更换头像、相册、 设置、近期自己发布或者收藏的动态,已添加的好友和关注的公众号,自己所建立的群和加入的群。

    3.4 心理测试
    通过心理测试,用户可以大概了解自己当前的情绪,系统将用户的数据录入数据库。

    3.5 心理知识问答
    通过心理知识问答,用户可以了解自己对心理学知识的了解程度,一定程度上了解当前的情绪,系统同时将用户的数据录入数据库。

    3.6 心理专家信息查询
    当用户确实觉得自己有很大的心理问题时,需要心理医生的咨询。用户可以进入心理专家医生在线预约模块与医生进行预约,查看医生的简介和预约时间。用户也可以在搜索框中搜索想找到的心理学专家,预约后与医生进行线下的交流,不在线收费。

    ####4.程序流程图

    程序流程图

    ####5.层次图

    层次图

    ####6.数据流图

    数据流图

    ##六、详细设计

    ####1.各个模块功能描述:
    1.1 社交版块
    这一版块主要由用户及其关注用户的信息组成。用户个人信息主要有:个人动态、以往的心理测试结果、每一次与智能聊天系统聊天的主题和情绪状态,关注用户的信息主要有动态和关注用户的个人介绍。
    关注的用户由普通用户、包括软件官方账号、心理学专业账号和企业账号在内的公众用户、用户群等组成。大致用户组成关系如表所示:

    用户类别用户组成信息
    个人用户自身个人动态、以往心理测试结果、每一次与智能聊天系统聊天的主题和情绪状态
    关注用户其他普通用户、公众用户(官方账号、心理学专业账号、企业账号)、用户群普通用户动态、公众号消息、群聊动态(以发帖和评论形式,用户点击后可以直接参与)

    1.2 心理测试及版块
    这一版块的功能是为用户提供心理测试和心理量表,用户注册后第一次登陆时需要做一系列关于性格和情绪的量表,以供智能聊天系统在衡量用户的情绪状态时参考,在这之后用户可以通过进入心理测试版块选择不同的量表来测试自己相关的心理参数,每一次做完量表之后,系统都会给出一个参考结果,并自动进入智能聊天系统进行相关的讲解。

    1.3 心理知识问答版块
    这一版块的功能是心理知识问答,该功能可以通过给出经典的心理实验与生活经验相违背的问题,让用户在回答问题的过程中了解到有趣又有用的心理学知识。

    1.4 “心灵鸡汤”版块
    该版块主要是通过为用户推送心理学的相关知识、文章和视频来达到让用户了解心理学和学习心理学的目的,推送的资料主要以外部链接为主,按照不同的主题来分类,让用户能够有针对性地找到自己想了解的资料,指导自我的心理调适以及解决生活中的难题、走出思维误区,拥抱美好的生活。

    1.5 专家查询功能版块
    该版块通过与各大心理咨询机构和医院联系以及心理学专业人员的申请和官方认证,获取心理学咨询领域从业人员的资料。让用户在遇到心理问题,并且通过该软件的指导不能良好的自我调适时,能够获取相关的信息,了解到每个专家的长处,并搜索到最近的心理咨询地点,获得最及时的心理咨询。在咨询后,用户还可以评价该版块内有记录到的心理咨询从业人员,为其他有需要的用户提供参考。

    该版块可以推广心理学在中国的了解,改善心理学在中国发展缓慢、不成熟的现状,让心理咨询市场在中国透明化,让心理咨询从业人员拥有更多的发展空间,消除不良从业人员对心理咨询市场的影响,消除心理咨询市场两极分化、好的工资很高、发展不好的收入很低的缺点,也让心理疾病患者能及时治疗,不要因为不了解心理咨询和心理治疗而影响正常生活。

    1.6 心理指导智能聊天版块
    该版块能够为用户提供以心理指导主题的智能聊天。用户可以用自然语言描述自己的状况和问题,智能聊天系统会接收和处理整个用户输入语句、根据中文分词原理准确地理解用户的意思;然后在数据库中搜索相关的心理学关键词,对关键词进行语句包装,后返回与用户输入的内容直接相关的一句话,引导用户进行心理指导。
    该版块主要有以下几个模块组成:
    1.6.1 解释模块
    功能:
    可以分解用户输入的语句,输出关键词,触发搜索功能
    搜索模块搜索数据库最后一层后输出相应的关键词或引导语,可以把从数据库得到的关键词或者引导语包装成一句话,输出到用户界面,并且能够根据量表结果和语句识别到的用户情绪进行有加权的表情变换。

    性能:
    注重对用户一度的理解准确性,输出更符合用户问题的结果指导语句,牺牲一定的搜索效率,但由于该聊天版块只针对心理学问题的引导,数据库较小,所以基本上对效率的影响很小。

    为了有效识别用户的聊天意图,用户进入聊天界面之后,系统会要求用户做心理量表或者选取要咨询的主题关键词或者根据引导问题做一段自我陈述,然后系统对用户状态做出评估,给出参考结果。

    为了结果的准确性,在用户注册账号的时候需要做性格等量表,在每次开始聊天的时候,系统会对用户的情绪倾向自动做出预测。

    1.6.2 运行流程:
    功能一:分词
    1.识别句子中的标点符号,引号(“ ” ‘ ’)、括号〔( ) [ ] { } 〕、书名号(《 》〈 〉) 内的内容作为特别内容处理,逗号(,)、句号(。)、顿号(、)、分号(;)和冒号(:)以及连续的逗号(,,,)、句号(。。。)和其他的标点符号都当做句子的分词标志;感叹号(!)作为加强情绪的标志,问号(?)作为问句的标志,连续的感叹号(!!……)和问号(??……)作为加强语气的表达和疑问标志等等。

    2.把常用的词语成分中数量比较少的成分,如:介词、连词和助词等单独列出来作为切分句子的标志,并且按照逻辑规则把切分后的句子排序成简单句顺序。

    3.把剩下的字段中的字按顺序逐字和数据库中的词语匹配,并切分成关键词。匹配规则:按顺序优先匹配歇后语、诗词、成语、三字词、两字词语,遇到未能匹配的情况自动跳过一个单字,继续匹配字段中剩下的字,并把跳过的单字反馈到数据库待完善匹配规则,最后输出所有匹配好的关键词到搜索模块。

    分词

    功能二:生成输出语
    根据数据库输出语层返回的关键词,依据中文的语法规则输出符合人性化的语句,并且根据用户账户中记录的用户性格和临时聊天记录识别用户情绪进行加权,生成卡通人物形象的表情变换方案,辅助心理指导的情景构建。

    一般来说,在咨询的前半段的表情变换主要以共情为主,与随着用户的情绪变化,卡通人物会生成相应的忧伤、焦虑的表情;后半段以鼓励为主,根据用户的状态生成正向的情绪的表情,相应的表情参考积极心理学现有的研究成果。识别心理指导是否进入后半段的标志是用户的问题与迷惑减少,负面情绪指数开始稳定或者减少。

    生成输出语

    1.6.3 搜索模块
    功能:
    1.在数据库的用户语库层搜索关键词的词性以及相应的近义词和情绪类别以及情绪强度

    2.根据词性把关键词及其近义词分类为用户问题关键词和情景关键词,存入不同的内存区

    3.在数据库的心理学主题层次中分别搜索每个近义词的对应主题,选出相关度最高的心理学主题

    4.情景关键词的每个近义词在数据库的心理学关键词层搜索对应的心理学关键词,结合心理学主题和用户的性格进行加权运算,最后得出相关度最高的5个关键词

    5.在输出语层搜索相关度最高的关键词的对应输出语,输出到解释模块进行语句包装,并输出其它4个关键词到用户界面候选

    运行流程:

    搜索模块

    1.6.4 数据库:
    心理指导智能聊天系统的数据库分为四层,每一层存储不同的词汇,有用户语层、心理学主题层、心理学关键词层和输出语层。
    存储四个层次的数据内容,并且在搜索模块每次搜索过后都能返回相应的关键词。
    用户语层采用网状结构,每一个关键词都与其近义词关联,当搜索触发一个关键词时即触发下一级的所有关联的近义词,每一个词汇有词性、情绪类别、情绪强度、场景类别等属性。
    心理学主题层和心理学关键词层采用关系结构,每一个词汇对应几个用户语层的关键词,有情绪种类和应用场景等属性。
    输出语层采用关系结构,每一个词汇对应几个心理学关键词层的关键词,每一个词汇有对应的心理学主题。

    智能聊天系统数据库结构
    用户语层
    心理学主题层
    心理学关键词层
    输出语层

    用户语层数据表

    字段名词性情绪类别情绪强度场景类别描述
    关键词1名词抑郁5人际关次关键词
    近义词1名词焦虑3工作学业相关的近义词1及其相关属性
    近义词2名词忧伤2人生规划相关的近义词2及其相关属性

    心理学主题层数据表

    心理学主题情绪种类应用场景描述
    主题情绪种类1应用场景1心理学主题及其相关属性
    相近主题1情绪种类2应用场景2相近主题1及其相关属性

    心理学关键词层数据表

    心理学关键词情绪种类应用场景描述
    关键词情绪种类1应用场景1心理学关键词及其相关属性
    相近关键词1情绪种类2应用场景2相近关键词1及其相关属性

    输出语层数据表

    输出语对应心理学主题应用场景描述
    关键词主题1应用场景1输出语及其相关属性
    相近关键词1主题2应用场景2相近输出语1及其相关属性

    1.7 总数据库
    该软件总数据库分别根据6个版块分为6个子数据库,每个子数据库互相独立,不同版块可以互相调用其他版块的数据,例如:社交版块在查询自己的心理测试和量表结果时,会调用心理测试版块和心理量表版块的数据库数据;智能聊天系统版块在心理指导过程中会应用户要求调用社交版块的相关动态信息等其他版块的数据库数据。

    社交版块数据库:
    用户信息表

    字段名说明描述
    Yhxx不空 主键用户账号
    Lljl不空用户昵称
    Gmjl不空用户公开的动态

    个人关注列表

    字段名说明描述
    Yhxx不空 主键用户1
    Lljl不空用户2
    Gmjl不空用户3

    动态列表

    字段名说明描述
    Yhxx不空 主键用户
    Lljl不空动态主题
    Gmjl不空动态内容

    心理测试版块:
    心理测试、量表

    字段名说明描述
    Yhxx不空 主键题目1
    Lljl不空题目2
    Gmjl不空结果

    心理知识问答版块:
    心理题目

    字段名说明描述
    Yhxx不空 主键题目1
    Lljl不空答案
    Gmjl不空相关心理知识

    “心灵鸡汤”版块:
    心理学知识、文章、视频

    字段名说明描述
    Yhxx不空 主键主题
    Lljl不空题目
    Gmjl不空链接

    专家信息查询版块:
    专家信息

    字段名说明描述
    Yhxx不空 主键姓名
    Lljl不空介绍
    Gmjl不空联系方式

    ##七、测试验收方案

    ####1.测试目的
    软件测试的目的是使我们通过对软件错误的原因和分布进行归纳,来发现并排除当前软件产品的缺陷,对在需求和设计过程中存在的问题查缺补漏,从而确保软件产品的质量。
    1)确定现有项目的信息和应测试的软件构件。
    2)列出推荐的测试需求(高级需求)。
    3)推荐可采用的测试策略,并对这些策略加以说明。
    4)确定所需的资源,并对测试的工作量进行估计。
    5)列出测试项目的可交付元素。
    ####2.测试的步骤
    1)明确需要测试的模块和功能
    2)根据不同的被测试模块选择相应的测试方法
    3)设计相应的测试用例
    4)开始测试
    5)对测试进行总结,做出相应修改
    ####3.用户测试
    3.1 登录模块测试
    功能模块:登录或者注册的人员(包括普通用户、学校企业等单位)
    功能特性:具有身份权限的登录
    测试目的:验证是否能正确判断登录

    步骤操作描述数据期望结果实际结果
    1在登录中输入用户名和密码,输入错误的用户名或密码在用户名中输入11,密码输入123出现“账号或密码不存在,请重新输入”同期望结果
    2在登录中输入用户名和密码,输入错误的用户名或密码在用户名中输入Ruanjian,密码输入123成功进入个人界面同期望结果

    3.2 用户个人主页模块测试
    功能模块:登录或者注册的人员(包括普通用户、学校企业等单位)
    功能特性:进行个人信息完善,密码修改,查看通讯录,动态发布,建群群聊,进行心理测试、玩心理小游戏
    测试目的:验证是否能完成以上的功能

    步骤操作描述数据期望结果实际结果
    1在个人信息界面点击“编辑”输入个人头像,名称,性别,个性签名出现“您输入的的内容已存在或非法,请重新输入”同期望结果
    2在个人信息界面点击“编辑”输入个人头像,名称,性别,个性签名界面刷新后,可以看到用户的个人信息完全照着用户的填写同期望结果
    3在密码修改区的“旧密码”填写之前的密码,在“新密码”和“确认密码”填写改动的密码输入字母、数字出现“您的密码为纯数字或者纯字母,安全性过低,请重新填写字母和数字结合的密码”同期望结果
    4在密码修改区的“旧密码”填写之前的密码,在“新密码”和“确认密码”填写改动的密码输入字母、数字界面刷新后出现“您的密码已修改成功,请重新登录”,并出现登录界面同期望结果
    5在通讯录查看好友,关注的公众号并添加好友,关注公众号输入好友或者公众号的名称或者号码界面出现“您所输入的内容有误,请重新输入”同期望结果
    6在通讯录查看好友,关注的公众号并添加好友,关注公众号输入好友或者公众号的名称或者号码在通讯录中可以看到新加的好友或者公众号同期望结果
    7在动态圈发布动态输入自己的动态在动态圈中可以看到自己和朋友的动态同期望结果
    8搜索群号加入进去或者自己创建群输入群号或者点击“建群”按钮界面出现“您所查找的群不在,请重新查找”或者“您没有权利建群”同期望结果
    9搜索群号加入进去或者自己创建群输入群号或者点击“建群”按钮在通讯录中可以找到所加的群以及自己创建的群同期望结果
    10点击“心理测试”按钮在心理测试中选择每一个选项当完成时出现“你已完成测试,谢谢您的配合”并出现“您当前的情绪指数为XXXX”同期望结果
    11点击“心理游戏”按钮照着游戏的顺序开始游戏游戏运行顺畅同期望结果

    **3.3 心理指导窗口模块测试** 功能模块:登录或者注册的的普通用户 功能特性:与用户聊天,指导用户梳理心理情绪 测试目的:验证用户的输入是否能得到及时的反馈
    步骤操作描述数据期望结果实际结果
    1用户输入自己的一些情况,比如近期的生活、学习、心理状况用户的陈述数据库数据不足以满足用户的情况,界面出现“您当前的问题系统无法为您提出建议”同期望结果
    2用户输入自己的一些情况,比如近期的生活、学习、心理状况用户的陈述界面上的玩偶“小熊”会随着对话做出相应的表情和动作,对话一直持续,直到用户结束对话同期望结果

    **3.4 心灵鸡汤模块测试** 功能模块:登录或者注册的的普通用户 功能特性:为用户提供心理学书籍、电影、视频以及最新心理学知识的更新 测试目的:测试用户是否能够搜到所要查到的心理学知识
    步骤操作描述数据期望结果实际结果
    1用户点击已有的心理学知识分类或者在搜索栏中搜索自己想找的心理学知识搜索栏中数据已有的心理学知识可以打开并观看,搜索时界面出现“您所搜索的不存在,请重新搜索”同期望结果
    2用户点击已有的心理学知识分类或者在搜索栏中搜索自己想找的心理学知识搜索栏中数据已有的心理学知识可以打开并观看,搜索时界面出现转换到搜索到的内容界面同期望结果

    **3.5 心理预约模块测试** 功能模块:登录或者注册的的普通用户 功能特性:查询到心理医生的简介或者预约时间,并可预约 测试目的:验证上述的功能
    步骤操作描述数据期望结果实际结果
    1用户点击“我要预约”或者在搜索栏搜索医生的姓名搜索栏中的数据可以查询界面已有医生的简介和预约时间,搜索时界面出现“您所搜索的内容不在,请重新搜索”同期望结果
    2用户点击“我要预约”或者在搜索栏搜索医生的姓名搜索栏中的数据可以查询界面已有医生的简介和预约时间,搜索时界面出现“您所搜索的内容不在,请重新搜索”同期望结果

    ####4.第三方程序员测试 该过程使编辑该软件的程序员不参与测试阶段,由第三方的程序员按照程序内部的逻辑测试过程,检测程序中的主要执行通路是否都能按预定要求正确工作。第三方程序员通过逻辑覆盖(语句覆盖、判定覆盖、条件覆盖、判定/条件覆盖、条件组合覆盖、点覆盖、边覆盖、路径覆盖)或者控制结构测试(基本路径测试、条件测试、循环测试)对软件内部进行测试。

    测试应长期进行,以便发现其中的错误并及时改正、调试。

    ##八、参考文献
    1.戴开宇;张申生;王淼 分布式虚拟环境中的聊天机器人的研究[期刊论文]-计算机工程与应用 2002(07)
    2.易顺明;胡振宇 中文聊天机器人原型系统的设计 2007
    3.李鹏 中文分词在聊天机器人中的应用研究 2009
    4.宁长英 智能聊天机器人的关键技术研究 2011
    5.樊丽华 心理咨询专家系统的研究与实现 2008
    6.冯德虎 基于ALICE的研究生招生咨询智能聊天机器人研究与实现 2013
    7.穆肃 网络智能聊天系统的原理及其教学应用 2003
    8.施询之;孙宁远;李骋罡 基于微博信息库和文本分词的人机对话模型设计 2013
    9.邓志鸿;唐世渭;张铭;杨冬青;陈捷 Ontology 研究综述 2002
    10.郭文琪;温馨;王鹏;张利军;陈群;李战 Ropeway:基于语义相关的XML关键字搜索引擎 2010
    11.王竖堡 垂直搜索引擎若干关键技术的研究 2007
    12.张艳贺 基于本体的主义搜索研究与实现 2012
    13.侯越先;张鹏;于瑞国 基于内容相关性挖掘的反馈式搜索引擎框架 2008

    展开全文
  • 在回国后的十余年中,由他领导的清华交叉信息研究院,填补了国内在相关技术领域的空白,具有开疆拓宇的意义。  他坚持亲自为本科生上课,其主讲的 “理论计算机科学”成为国内首次开设的计算机理论课程,桃李之中...

    谈起姚期智在学术界的地位,横跨计算机和物理专业,业界人莫不敬仰。凭借加密共享数据方法的世界级突破,姚期智于2000年获得计算机领域的圣杯——图灵奖,在该奖项52年的历史中,他仍是唯一获得殊荣的华人。

      学者之外,让姚期智与人工智能具有强关联的另一个身份是“老师”。在回国后的十余年中,由他领导的清华交叉信息研究院,填补了国内在相关技术领域的空白,具有开疆拓宇的意义。

      他坚持亲自为本科生上课,其主讲的 “理论计算机科学”成为国内首次开设的计算机理论课程,桃李之中成就了中国计算机领域里的一流人才,楼天城、Face++创始三剑客(印奇、唐文斌、杨沐)、张胜誉、邹昊等人均出自他名下,“姚班”被传为佳话。

      夏末秋初,北京的天秋高气爽,燥热和潮湿消失在风中,在一个阳光斑驳的下午,我们来到清华园FIT楼,对姚期智进行了专访。在近三个小时的对话里,我们看到了一种直面人工智能领域核心问题的冷静态度。而这不仅仅关于当下风行的评测夺冠,还有针对人才流失、大国竞争、工业驱动等等方面的思考。

      忆往昔

      姚期智生于上海,幼年随父母迁往台湾省,在台大获得物理学士学位;后前往美国深造,在哈佛大学取得物理博士学位,尔后转向方兴未艾的计算机领域,获得美国伊利诺依大学计算机科学博士学位。57岁时,姚期智辞去普林斯顿大学的终身教职,受邀回国担任清华的全职教授;今年,他与杨振宁先生一同放弃美国国籍,转为中科院院士。

      回望这段豪迈而传奇的人生历程,不难理解姚期智身上自带的中西方融合意味,以及充满警觉式的文化自省。基于物理学和计算机的双重学科背景,姚期智的视野格局更为宽广,交叉与融合的学术思想特点十分明显。

      谈起姚期智一生中的最为重要的两个决定,都绕不开关键先生杨振宁。年幼埋下物理学的坚定信仰源于杨先生的影响,中年毅然回国也因杨的推动。

      1957年,杨振宁与李政道因共同提出宇称不守恒理论获得诺贝尔物理奖,这是华人首次站上诺贝尔奖的舞台。一阵学习物理的热潮在台湾掀起,姚家也不例外。可以说,年仅11岁的姚期智在精神世界上已与杨先生结缘,在心中立下了进入台大物理系的志向,并在中学阶段接触到了相对论。

      在采访中,姚期智建议年轻人“要做科技,本科阶段学习物理是非常好的选择,物理学对于构建科学理念很有帮助。即使变换不同的领域和职业工作,选择问题、构建问题的能力依然重要”。

      1972年,姚期智获得美国哈佛大学物理博士学位,尔后受到妻子的鼓励转向计算机科学。2002年的下半年,姚期智数次来到中国,先后参加了南京、上海、北京三地的学术交流会议,国内关于计算机科学的讨论给他留下了深刻印象,也为日后回国定居打消了环境上的顾虑。同时,清华大学计算机系的主任周立柱、张钹院士联系到姚,希望由他来牵头,建立一个讲学教授的机制。

      姚期智欣然答应,他从国外邀请了十余位计算机专家给清华研究生上课。正是这段给研究生讲学的经历为后来“姚班”精英式教学模式埋下了种子。

      2003年,杨振宁回国定居,在其参与推动成立的清华大学高等研究中心担任教授,并积极地为清华和姚期智牵线搭桥。一方面,他向当时的校长顾秉林极力推荐姚;另一面,他还邀请姚期智回国见面。在内外因素的感召下,2004年,57岁的姚期智辞去了普林斯顿大学的终身教职,回国担任清华的全职教授。

      21世纪初,中国互联网业态苏醒,但学术发展还处于第三世界的发展道路上,尤其是科研工作仍处于“学术边缘”地带。“中国的计算机科学,还和最先进的地方存在相当大距离”。同事吴辰晔曾评价,从育人的角度而言,在普林斯顿或许比在清华更容易培养出更多顶尖的学者。

      但在姚期智看来,回到清华是顺理成章的事情。“能为缩短中美之间的差距做出贡献。我想了不久,就答应了清华的邀请。”姚期智提到,回国前曾与亲人、朋友讨论,“我的爱人十分认同。我们都很专注在科研事业,对于居住的环境、文化改变并没有太多顾虑,并且我们对于自己是中国人的认知从来没变过”。

      随后的一年里,由姚期智主导并与微软亚洲研究院合作的“软件科学实验班”在清华成立。这便是后来赫赫有名的清华大学“计算机科学实验班”,也被称为“姚班”。

      建“姚班”

      谈及“姚班”的创立,姚期智认为两个核心要素奠定了后续的发展。一方面,来自清华领导层面的支持,在现有庞大体系外搭建一套适应前沿技术的创新模式并非易事。从某种程度来说,“办姚班这件事在美国做会更难”。越是成熟和知名的大学,运行模式就越是牢固,从理念到实践的推进,阻力尤其多。

      据姚期智回忆,落地过程似乎很顺利。但在不久前,他才听说当时的清华书记陈希在背后做了许多努力,包括协调多方配合。“这个确实会影响到其他院系和学生,陈希当时只让我放手去做”。另一方面,“姚班”具体授课计划为顺应时代需求而做出了调整。最初,校方希望构建一个培养博士生的良好机制,打造一支具备实力的研究团队,但最后改为面向本科生的教学计划。

      姚期智回忆,这和此前在清华做讲学教授的经验有关,“我发现中国研究生有很多知识点都没学过”。彼时,姚期智已经意识到国内本科基础教育的短板,“要想有好的研究生生源,必须建立配套的本科生的计划”。

      在姚期智留美的二十余年,先后在哈佛大学、伊利诺伊大学、麻省理工学院、斯坦福大学、伯克利加州大学、普林斯顿大学等等顶级学府执教,积累了相当丰富的教学经验。

      立项之初,姚班就将目标设定为“让中国最好的高中毕业生进来,出去以后,一定是世界最好的本科毕业生”。

      除去清华本身的入学高门槛外,姚期智强调全能的选拔标准,要求所有学科都达到优秀。在牢固的基础之上,课程的设置标准和延展空间更容易把握。

      “姚班”采用全英文授课,全英文交流,课程虽不多,但每门课的难度都不低。为了让学生从高中式的学习思维过渡到研究思维,姚期智对教学内容进行优化重组,既注重全面覆盖计算机科学前沿领域,同时突出计算机科学与物理学、数学、经济学、生物学等多学科领域的交叉。

      “不要怕人家说搞精英”。在彼时看来,中美高等教育水平存在明显差距,姚期智认为建立精英研究团队、实行精英教育制度,是中国赶超西方最有效的方式。“我们这代人等不得,国际环境不允许你有一个从容的态度,让中国科研顺其自然发展。我们必须很短时间做到它。”

      谈到中西方的差异,姚期智认为,师资设定和圈子效应值得借鉴。大学里教师的平均素质是比规模和院系数量更重要的指标,“在MIT或者Stanford,对于教授有着非常严格的标准,优秀而富有创造力。在教师与学生的朝夕相处过程中,学生不止于收获课本上的呆板知识,更重要的是老师的思维方式。这个部门是年轻科学家成长过程中,最好的、最宝贵的养分。”

      此外,西方大学中的圈子文化也构成了其差异化优势。“比如在MIT的餐桌上,话题通常围绕你最近听到哪些有意思的工作,或者说我最近做了一个什么新项目,能够跟不同的跨领域人交流,可以增加很多合作机会。”

      在姚期智的主导下,计算机科学实验班的培养方案、教学计划逐步确立并完善,姚期智亲自主讲的“理论计算机科学”成为国内首次开设的计算机理论课程,主要内容正是他精通的计算机算法设计和复杂性领域。

      谈教育

      据今,“姚班”已送走九届毕业生,约320人。其中,90%选择继续深造,59人在姚先生创建的清华大学交叉信息研究院读研,大部分选择出国留学,包括MIT、Princeton、Stanford、CMU、Yale、UC Berkeley、宾夕法尼亚大学、哥伦比亚大学等;另外10%在工业界活跃,创业或者加入谷歌、Facebook等知名科技公司。截至2016年12月,姚班学生为论文通讯作者或主要完成人的已发表论文为121篇,42位优秀姚班学生被选派参加国际会议并作论文宣讲。

      交叉信息研究院聚焦在理论计算机科学、 量子信息、 信息安全、 网络科学、金融科技、人工智能等领域,同时也在不断扩宽覆盖领域和合作,如与蚂蚁金服联合成立金融科技实验室。其中,在人工智能领域,加入工业界的代表如印奇创立的Face++、楼天城在谷歌;在学界的代表,如马腾宇,毕业后先是进入到普林斯顿,然后被斯坦福聘用。“他们确实是人工智能领域的先驱,会在该领域留下非常深刻的痕迹”,

      姚期智评价道。

      高度集中的优质资源塑造了“姚班”的传奇,类似地,在中科大少年班等模式上也得到验证。但从整体水平来看,中国的学术水平和成果仍落后于欧美。姚期智分析,中国学生的创造力并不比国外学生差,缺乏创造力是他们周围的环境,缺少足够的模范,那些有创造力的、思想活泼的教授。“我觉得不管是文化,还是起步晚,都不是我们拿来解释中国科研发展不足的借口。”

      对于优秀人才的可持续性培养策略,姚期智谈到,最理想的方式是引入杰出的大科学家,让他们来吸引教授,能够训练人才。“作为一名资深的科学家,具备整个领域的全局视野,懂得培养年轻人的方法”。但实际上,尤其在计算机科学领域,人才争夺战异常激烈,无论是学界与工业界之间,还是国家层面都在进行着。

      姚期智认为,从国家的角度层面来看,人才仍是大计,尤其是要实现国务院《新一代人工智能发展规划》的“三步走”战略目标。“即使不能大量吸纳知名科学家,也必须实现自产优秀人才。”这涉及到人才的培养机制,要给予足够的空间让年轻人出头,对于成果的评价要有清晰的区隔标准、奖励机制。

      回顾过去五年,姚期智认为,中国高等教育事业已经初见成效。“在计算机科学领域,我们逐步能够引进,亦或者是产出一批杰出的年轻人。他们的工作成果已经是一流水平。”强化人才培养的机制一旦建立,虽然不能立即看到成果,但五到十年后,会有收获。“这需要清华大学领导或者教育部领导共同出力。”

      聊起个人最近的状态和研究方向,姚期智表示,“最近四年我进入了一个新领域——计算经济学,其核心是拍卖理论,让我感到很兴奋。”据清华新闻报道,姚期智曾在经典的“拍卖利润”最优化问题上提出更为简单巧妙的解决方法,解开近年来困扰学术界的一块顽石。

      对于言传身教这件事,姚期智深以为然。他谈到,即使是在办学,身负一些行政的责任,但也绝对不能让自己从研究的第一线退下阵来。“只有自己身处在第一线,做出一些出色的工作,才能够给其他年轻的教授和学生,树立一个参考的标准。离开研究岗位以后,对于事情的判断可能发生偏差。”

      从物理学到计算机科学,再到信息科学与物理学、计算机科学、经济学、生物学等多门学科的交叉与融合,姚期智也在不断积累跨领域研究的能力和方法论,“在每个领域,我会做出两三篇重要文章,然后换到一个新的领域。每个人不一样,这是我的方式”。

      讲竞争

      人工智能产业方兴未艾,下自创业领域、传统产业,上至跨国公司、大国储备,抢夺船票的火药味愈发明显。在最近十年的进程中,中国已经从第三世界跃迁至第二大经济体,人工智能在十年中将会承担什么样的角色?全球范围来看,中国的人工智能水平究竟处于什么样的地位?

      高盛在最新发布的人工智能报告中表示,中国有足够的资源和决心在未来几年打造出一个基于人工智能(AI)和深度学习的智能经济体。特别是以BAT为首的中国互联网企业,正在成为中国人工智能发展的重要推手。

      谈到中美之间的差距,在中、美两地均拥有十余年教研经验的姚期智回答很诚恳。他认为全球的技术水准差异不大,但中国还需要在两个方面进行补足。

      一是系统层面,能够迁移到不同领域的广泛系统。“中国的计算机系统是弱项,我们硬件做得不错,有超级计算机;但是系统工程一直不太注重,这是很大的挑战。”

      他以IBM举例,1997年,Deep Blue打败人类象棋冠军;2007年,IBM研发出一台能迅速回答涉及双关语和文字游戏等复杂问题的机器,在2011年参加了一档美国智力问答节目《危险边缘(Jeopardy)》,尝试在问答游戏中战胜人类。虽然人机大战已成潮流,但在当时看来是件很新鲜的事。打败两个人类冠军后,Waston出名了,但IBM并没有止步于此。“技术具有连续性,他们一直在探索下一步做什么。最后IBM看中了Waston在医病诊断领域的潜力,并不断完善。”

      另一个方向是理论和算法,“下一步算法突破一定要从理论上着手”。姚期智认为,在人工智能领域,国外已经有非常深厚的技术,过去几年在学术界也十分火热。在公众媒介上之所以没有看到,因为这些进展和讨论还不能用通俗的话将清楚。姚期智透露,他现在聚焦的方向就是人工智能理论,“两三年以后,你们可以期待看看。”

      最近一年,能够凸显中国人工智能技术已经站上世界舞台的重要标志,就是在各大权威评测和论文评选中的突围。那么,这背后的意义该如何解读?

      姚期智给出了三个层面的看法:

      1)首先,这些技术已经在全球范围内得到应用。在细节层面,需要一些经验、参数进行调整,但是基本思路都已经得到充分验证。无论是大公司,还是新兴的创业公司,在技术和应用层面的差异非常少。

      2)成果突出,说明中国在人工智能技术的应用能力已经达到世界领先水平,和欧美等国持平。但同时也要看到背后的成因。每家公司之所以在技术应用层面达到一定水准,是因为他们拥有足够的资源和资本,是因为人才本身的流动,公司能够雇到非常好的人才。多花点钱,就能够把更好的技术雇过来,这是一个不断平衡的阶段。

      3)尚存技术瓶颈,比如降噪识别、介质识别等,这才是世界一流的研究机构需要真正攻克的难题。我们不能寄托在人工智能去发现和解决它,因为人工智能还没发展到这个地步,优先还是人的问题。

      在技术层面具有可行性,从大脑的解构和思维模式中切入,能够有所突破。这也就是为什么说,现在是做理论的最佳时间点。“计算机正真走到了前沿和临界点,将来最亮眼的将会是理论层面的创新,但中国现在这方面仍十分落后。”

      作为一名学者,姚期智对于人工智能的兴趣在于:它究竟能解决哪些问题,为什么能解决这些问题,能够解决到什么程度。“这些都还是我们所不能掌控的。”

      结合这次参加人工智能主题节目《机智过人》的初衷,姚期智谈到,希望把节目组设置的12个主题应用整合成一门课,尝试着将每个课题转换成老师的研究思路。“如果好好教授,能够给学生创造足够大的空间去探索”,最好的方法是什么,能够到什么程度,有没有方法准确地预测哪一边会赢。“这是非常硬性的指标,具有挑战性”。

      在竞争格局层面,姚期智认为,美国的大学和公司分工比较清楚。但在中国,学术的竞争,已经不仅是研究机构层面,还包括和大公司的竞争。这在某种程度上也反应出人才流动正在朝着工业界倾斜,而学术人才流失的问题也越发值得重视。

      说人才

      姚期智曾谈到,在姚班的学生中选择深造与进入工业界的比例是9:1,在后者的10%中不乏楼天城、印奇、唐文斌、杨沐等学术奇才的身影。姚期智还强调,这10%中有不少人是已经深造过才进入工业领域的。

      但放眼整个人工智能领域,这个比例并不乐观。

      据LinkedIn发布的《全球AI领域人才报告》显示,截止2016年,中国有10%左右的人工智能领域从业者曾在高校或者研究所工作过,其中超过一半人在之后流入企业。相比中国,美国人工智能领域从业者曾在高校或研究所工作的人数占比更高,超过25%。

      谈到此,姚期智表示,工业与学术的平衡问题,不只在中国存在,在美国同样也会遇到。即便身处中国现在的新兴产业,这些毕业生也受到了很高的薪水吸引,尤其是在机器学习领域的人。“我觉得这是一个没法回避的问题。但终究需要支持和鼓励学术研究,否则中国的发展无以为继”。姚期智仍坚持认为,学校和公司仍是不一样的地方,也是大学的吸引力所在。

      即使在大公司里的研究院从事研究工作,仍会遇到一些限制;这样的处境和在高校自由地从事研究工作存在本质的区别。此外,目标导向性是两种环境的另一大差异。科技公司因为存在进度和效益问题,需要追着时间跑,一个关键性问题解决到80-90%就足够上线了,“他没有时间等到百分之百的程度”。但在大学里做研究,有人会愿意付出精力去做到百分之百,“从80%到100%之间的跨越,很有可能发现新的突破和技术。”

      仿照美国大学和工业建立紧密合作的模式,姚期智表示,中国这个趋势已经很明显,但合作不能只停留在项目上。“不能只说让大学承担项目,或是合作一个应用。而应该从更长远的方向考虑,提高中国在原创领域的水准。”

      谈到吸引人才的机制,姚期智从教育工作者的角度出发,认为有两点需要强化。其一,引进权威人士,同时做出耀眼的工作成绩,吸引新鲜血液。“有名教授能够创造出一种效应,大家都想跟着他学习。因为他提出新新理念,有机会在这之上发展。”

      其二,大学面对不同领域的人才,需要在待遇和安置上给予足够的务实的条件,主动说服他们来到中国工作。这虽然是一项由上级部门主导的工作,但高校也可以灵活运用机制。

      结合到清华的信息交叉学院,姚期智的期待是,高质量的人才团队不在乎数量和规模,而是成果的突破。“中国只要有一两个这样的团队,就可以改变世界”。这同时也是人才培育机制中最好的自力更生的途径。

      聊工业

      谈到如火如荼的工业界,人工智能无疑是其最旺的一把火,有没有可能在这批创业者之中反响做出一套理论突破?

      姚期智对此持乐观态度。“最好的研究都来自于实际应用,像无人驾驶等人工智能最高端的领域”。在实践和落地的过程中,一定会产生很多新问题,可能有意想不到的突破。但姚期智强调,要把握住这样的时代机遇,还需要高校和工业界的紧密合作。

      在自动驾驶之外,金融科技是另一大公认的风口,同时争议不断。在大数据商业化潮流的冲击下,传统金融领域不断受到挑战,智能投顾、量化交易等正在上演。姚期智对此认为,虽然时常听到反对的声音,但金融领域的变革是不可阻挡的,一定会被深耕;同时监管很有必要。

      当下,很多交易都是在网络上完成,如果没有大数据和计算能力,很难获得这些痕迹和数据,这是一种势不可挡的趋势。“因为这个事情中国人不做,国外也会推进。中国要想在金融领域国际化、全球化,必须掌握过硬的金融科技”。

      在变革的过程中,可能会触碰到一些既得利益者而遭遇阻力。但整体而言,在大数据推动下,金融业的适当转型和改革能够降低生意的成本,能够创造更大利益。在初期,我们有足够的时间去讨论法律的建立和保障制度。

      谈话间,姚期智多次强调人工智能系统和理论重要性,那么现在看来,可能最早实现落地的系统将会出现在哪个领域?

      “医疗系统,类似IBM的Waston。严谨地说,它算不上原始的技术突破,更多是整合,同时吸取了非常多的数据。”医疗领域,一年会产出数千本的学术杂志,作为一个普通医生不可能有机会阅读所有文章,但Waston一天就能做到,将读取到信息融入到它需要诊断的疾病案例里。这其中需要整合大数据、自然语言分析、图像识别等人工智能技术,本质上是将已有的知识点按照需求进行整合。

      “这是一个系统工程,团队需要各种专长不一样的人”,面对这样一个庞大的工程,只有大机构才能推动。类似IBM这样的大公司,因为有着非常深厚的信息处理基础,同时与美国的大学建立了密切的合作,所以他们能把这个项目落地。“这样一套机制会使得系统越来越完善,这是其他国家或者公司很难通过竞争实现的。”

      “在中国,也应该有人来推动这件事”,姚期智谈到。一是,在国务院规划中已明确在2030年前,人工智能核心产业规模超过1万亿元的目标;二是,在人工智能系统领域,中国已经落后于美国,如果不迎头赶上,差距会进一步拉大。

      后记

      在这场自下而上推进的工业AI浪潮中,姚期智虽未参与其中,却在冥冥之中成为了诸多中坚力量的领路人,也正因为站在旁观视角,他对于当下“人工智能”的诸多评判才颇具价值。

      采访结束后,一个问题仍在我脑海中徘徊着,在人工智能背后的商机召唤下,人才流失的趋势是否无法挽回?像姚先生等老一辈,还能怀着赤子之心的科学家是否会越来越少?

      金秋九月,正逢高校招新。采访前一天,我在中科院计算所的电梯口,恰听到两位教授关于招收博士生的对话。“那个小伙子不是挺好,可以推荐去呀”,“他女朋友希望能早点工作。现在房价太高压力大,怕念完博士回来还不如直接工作”,“那真是可惜了……

    展开全文
  • 导语:没意义 (雷锋网(公众号:雷锋网)出品) 统计学和机器学习之间是否泾渭分明一直学界争论的焦点。 有的学者认为机器学习只是统计学披了一层光鲜的外衣。而另一些讨论则认为涉及使用逻辑回归或者广义线性...
  • 本课时是在学习了动物以及数字的基础上的对话教学本课着重学习复数形式的陈述和疑问句表达先学习单词的复数形式在此基础上再进行问答的练习最后能组句成段相互交流表演这也是本课的最终所要达到的效果 针对学生语言...
  • 小学数学教学研究论述题参考答案1、 举例说明作为教育的数学和作为科学的数学之间的差异性。答:从知识体系看,前者是经过人为加工和提炼、依据某一特殊人群特殊需要和经验、知识与能力结构而设计的知识和思想体系;...
  • 目的:本研究旨在揭示教师如何在其教学大纲中讨论... 原创性/价值:在教育数据挖掘和分析时代,这是考虑教师是否以及如何在其课程中解决学生数据隐私问题的首批研究之一,该研究启动了反思隐私价值和实践的重要对话.
  • 为探索如何进行语音教学,笔者就音标教学,字母组合教学,音节教学,句群教学四个语音方向搜集了教学案例,进行了策略研究,并制定了语音教学的措施。实施分为三个阶段进行。完成后对学生的语音状况进...
  • 国内外计算机辅助教学发展概况

    万次阅读 2015-01-15 11:54:46
    国内外计算机辅助教学发展概况   复旦大学 吴祖增   (一) 计算机辅助教学的内容 ===============================  利用计算机来帮助完成课程教学教学资源管理中的任何一个环节,都叫计算机辅助教学。这一术语...
  • 8、AI科技评论:大学生参与开源,对他们个人的成长、学习生活、职业有什么样的意义呢? 沈平:拿我自己来说吧。我中学时参与了很多活动,多到你都难以相信。我是全国第一届电脑协会的主席,这个协会就是我创办的。...
  • 卡门(Carmen)和乔恩(Jon)与罗​​布·派克(Rob Pike)和罗伯特·格里塞梅尔(Robert Griesemer)(Go的创造者)讨论了它的起源,增长,影响力和未来。这是一部史诗般的剧集,深入探讨了Go语言的历史和细节,...
  • 一、课题研究意义和价值 随着时代的发展,教育在经济竞争和社会发展中所起的作用愈显重要。为全面推进素质教育,培养具有创新精神和实践能力的人才,在教学过程中就要引导学生自主学习。而在教学中真正体现学生的...
  • 基于问题的学习(PBL)是一种通过自主学习和小组合作开发的主动教学方法,旨在解决问题。... 从这个意义上讲,这项工作提出了一种支持PBL的计算工具,该工具旨在考虑实施该方法所固有的上述困难,并有助于教学过程。
  • 点击⬇️方“逆锋起笔”,公众号回复编程资源 领取大佬们推荐的学习资料 来源:新智元 编辑:Q【新智元导读】你22岁时在做什么?大部分人应该是往返在宿舍食堂教学楼的三点一线吧。可有的人,2...
  • “参与者”技能观认为教学技能是一种引导并和学生一起参与知识和学习意义建构的实践能力,具有交互性、情境性、经验性、创造性和发展性.数学课程改革需坚持“参与者”技能观;引导启发技能、对话互动技能、发现创新...
  • 使用了教学应变的具体方法是( ) A巧妙暗示法 B幽默带过法 C趁热加工法 D顺水推舟法 2、教例二:某姓缪的老师精神抖擞地走进课堂,给新班级上第一堂课。他先作自我介绍:“同学们,我姓缪……”他正要板书“缪”
  • 目前,这项技术已经被广泛应用于研究环境中,在剑桥当地的 Addenbrooke 医院(欧洲最大的教学和研究医院之一)里,这项技术在临床实践中正在进行有效地探索。 Peter Lee:因为这个医学成像应用不可能仅仅采用现有的...
  • 程序员的成长之路互联网/程序员/技术/资料共享关注阅读本文大概需要 2.3 分钟。来自:新智元【导读】你 22 岁时在做什么?大部分人应该是往返在宿舍食堂教学楼的三点一线吧。可有的人,2...
  • 再声明下,生成对话框类主要包括新建对话框类、添加控件变量和控件的消息处理函数等。        因为给大家的例程Addition是基于对话框的程序,所以程序自动创建了对话框模板IDD_...
  • 来源:读芯术本文约5400字,建议阅读10分钟。两人之间的对话标志着人工智能新类型工作的开始。最近,在斯坦福大学,两大人工智能专家尤瓦尔·赫拉利和李飞飞展开了一场时长90...
  • 对话物联网新人1

    2015-11-27 16:11:03
    传感器技术:传感器的意义就在于让物体有了触觉、味觉和嗅觉等感官。这块小编感觉不用列为大家的学习目标,平时的应用玩转就OK。传感器(英文名称:transducer/sensor)是一种检测装置,能感受到被测量的信息,并能...
  • 课堂教学中如何实现有效师生互动 冯娟娟 课堂是一个复杂的“生态系统”,互动是这个生态系统的一个重要元素。当前课堂中的师 生互动存在形式单一、内容单调、深度缺乏等问题,失去了师生互动的应有之义,这样的...
  • 教学之痛!被理念绑架的数学作者:李祎(福建师范大学数学与信息学)>>>>数学新课改已推进十几个年头,然而在当下的数学教学实践中,仍经常发现不少因理念而出现的问题....
  • 如何使学习的科学、教育技术和人才培养方案三者有机结合,特别是向教育技术赋予科学的指导思想和教学实践,将成为高校教学信息化改革的“难点”。 严峻的疫情防控形势对高校教学提出了挑战,我们不能只停留在在线...
  • 大部分人应该是往返在宿舍食堂教学楼的三点一线吧。可有的人,22岁时已经采访了苹果CEO了。 在2月18日之前,我们还不知道一名22岁的博主何同学和60岁的苹果CEO库克之间有什么关系,而当晚10点钟上传的一个访谈视频,...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 4,644
精华内容 1,857
关键字:

对话教学的意义