订阅云计算RSS CSDN首页> 云计算

IBM苏中:认知计算需要左脑和右脑的结合

发表于2015-07-26 17:22| 次阅读| 来源CSDN| 0 条评论| 作者周建丁

摘要:从脑机理的角度,苏中认为,认知计算需要左脑和右脑的结合:左脑偏逻辑,计算的比较多,右脑偏认知。未来要关注三个方面:1.计算架构和编程模型的改变;2.结合大数据包括非结构化数据的理解;3.新一代人机交互技术。

为了更好地引导和推动我国人工智能领域的发展,由中国人工智能学会发起主办,CSDN承办的2015中国人工智能大会(CCAI 2015)于7月26-27日在北京友谊宾馆召开。本次会议的主旨是创办国内人工智能领域规模最大、规格最高的高水平学术和技术盛会,汇聚国内外顶级的专家学者及产业界人士,围绕当前最新热点和发展趋势的话题进行交流与探讨,并针对“机器学习与模式识别”“大数据的机遇与挑战”“人工智能与认知科学”“智能机器人的未来”四个主题进行专题研讨,努力打造国内人工智能前沿技术和学术交流的平台。


IBM中国研究院大数据及认知计算研究总监

苏中谈到,认知计算在以前收到的限制主要包括:数据的可用性,以及算法复杂度需要强大的计算能力和编程能力。IBM研究部门在人机对弈方面就开始认知计算的工作,包括机器自主学习的能力、分布式计算的能力等。当前新的趋势是:大数据应用的普及,以及多层神经网络模型的研究,在多层神经网络下,每个隐层都是特征抽取,收敛很慢,可以通过分层学习来加速,这些为认知计算的发展带来了新的机遇。

从脑机理的角度,苏中认为,认知计算需要左脑和右脑的结合:左脑偏逻辑符号计算,右脑偏感知。在模拟右脑的能力上需要新的计算体系架构,IBM做了类脑计算架构的研究来支持计算。IBM认为,随着摩尔定律即将失效,传统计算架构的计算速度临近天花板。而类脑架构没有单独总线和内存,在计算机架构里面取消了总线和CPU之间通讯的问题,因而在多层神经网络的计算速度和功耗方面有很强的优势。但有一个问题是如何在芯片架构上编程,因为当前的编程模式不合适。

综合来说,IBM认知计算未来要关注三个方面:1.计算架构和编程模型的改变;2.结合大数据包括非结构化数据的理解;3.新一代人机交互技术。苏中还表示,从2011年到现在,IBM WATSON的认知计算工作是让机器理解自然语言,不光能回答问题,还要能够和人类辩论。

以下为苏中演讲速记整理:


苏中: 今天参加这个会议真的觉得学到很多,谭院士和徐院士的两个主题演讲让我茅塞顿开。我们做认知计算,去年有很大的举措,成立了WATSON事业部,让人工智能帮助计算,或者是人工,或者是医疗。谭博士讲几个点我记忆很深刻,讲到天使与魔鬼的问题。徐院士讲到心灵和肉体。其实人工智能这个地方我们从发展历史上当时也讲,在图灵讲出这个,其实大家应该看美国最近有很多很好看的电影,也是给了很多例子,有一个电影非常好,叫《模仿游戏》,那里面提到了很多场景。60年代美国的人工智能蓬勃发展,我们做的是人工智能交互,机器人还可以跟人交流。当时美国WATSON也是做这个工作,现在仍然在做,就是机器能够画画。它里面很大一部分就是说用到了一些很多绘画领域的知识,比如说认得五官大概比例是多少,胳膊多长,什么在上面什么在下面,给机器人做一些规则。

IBM认知计算的研究历史

当时斯坦福人工智能团队想帮助学界科的医生来做专家系统,他把学科医生做感染的领域大概做几百个规则,收集成一组来,用系统呈现以后,得到一个惊人的结果,他们做内部评测,发现它的准确度已经达到在某些场合超过专业医生的学者。所以在那个时代,50年前,给大家一个很好的畅想,那会儿觉得2020年可能人工智能真的可以实现。那时候有很多这方面的发展。林林种种有很多体现。当时的数据可用性,实际上当时的人工智能局限于一些少量的专业人士的知识,以及知识在他们那儿的沉淀和收集。专家他们只是采用少量的数据,所以他们收集对于一些复杂处理可能有很大的限度。第二点,当时在上世纪60年代计算机时代高级语言还没有怎么使用和发明出来,计算机相关的功能很弱,所以真正做一些复杂的事情也是受限。由于一方面的限制,我们发现这方面仍然有工作,但是人们觉得可能人工智能20、30年有很大的突破的想法就觉得更难了。因为我来自IBM研究院,本来我是和我们院长今天有一个讨论,他们今天去美国有一个会议。我们想我们还是出来各做各专业的事情比较好。IBM在人工智能这个方向做了很多过去可以说开创方向的工作吧。如果大家说很热的工作就是叫机器学习,我们以前说这个人写简历的时候说我会C语言,会编程。现在我们写简历就说会大数据。当时有一个老人,我记得当时我读书的时候像马老师讲课,当时讲大数据下象棋和挑起,实际上AB数据最开始的应用就是这个老同志做的,他当时在机器上做编程,那个时候还没有高级联线来接,那就是说他可以通过对于全局的搜索优化加速整个过程。另外一个它可以加速很多数据屏幕,很多数据分析,它可以让数据不断的更聪明,大概这个老先生做了4年的发明,这个机器在当时50年代参加了一个评估,做了一项跳棋的比赛,它打败了当时一个美国的周冠军。这件事情很伟大,因为当时计算机出来是来做人工普查的,人们并没有觉得计算机可以像人这样的事情,所以他做了这个计算机之后股票涨了15%,这是非常非常了不起。当时这位老先生还在IBM。

我们讲这个机器自主,很大一部分机器能够自主学习。我们讲大数据给他一千个大数据他可以写出一千个模型,不断的往前发展。但是人的学习不是这样子,我们想一个孩子他学习,给他一个苹果,不可能把互联所有的苹果照片,国产的各种苹果都认,可能就是拿一个识字卡片上告诉他是苹果,然后再拿给他看,这个是什么?香蕉吗?他会说是苹果。也许还有一天发现树上的菠萝长成什么样子,很像是苹果的样子,他可能还有拓展。当时这位老先生做了什么事情?因为当时下棋有评价,往往人类指令,人类指令是把价值优化指标做出来,这样你能把不断的新的数据来检测,这位先生把这个事情做了一个闭环,这个闭环是我的评价数也可以通过整个数据上的数据来调整。这是很了不起的。从机器学习角度往前走一步,就是说它可以自我学习。它当时选了当时一个国内我还查了维基百科,就是互相之间下棋,当时它的这个系统可以下过世界冠军。

最后是深蓝,深蓝实际上算法方面没有突破,也是基于传统的东西,它当时深蓝后面,参加深蓝的系统后面也是很多下棋高手,他们做评估,还有做很多数据,当然下国际象棋会更多一点。但是就像早年间上世纪70年代,计算机的能力是很弱的。计算机的能力弱的以后,你就需要跟它运算不能太深,运算复杂度算法就不能太复杂,深蓝并不是算法上的突破,而是分布式计算的突破。他想到一个集群的方法能够很好的解决。所以当时参加深蓝的项目组参加很多高性能计算等等。所以我们看到如果从下棋这个角度来说IBM做了很多突破性和开创性的工作,但是另外一种人如果下棋是智能的话,可以说不是单一学科。我特别同意刚刚徐扬生院士讲的,其实智能有很多方面,不是单一学科,是有很多学科在一起,甚至不只是IT,也有很多其他行业发展。

新的技术趋势

最近发生了很多变化,我们看好莱坞电影,人工智能特别受关注,连图灵这个做成一个大片也是这个原因。数据现在已经变得无所不在,传统的数据是机器数据,而现在大数据时代是人的数据越来越多。今天我相信很多朋友发微信,今天上午谭院士的信息没有公开给大家,但是放一个很牛的数据给大家看,这个就很快的传播,这个对我特别有帮助。就是大数据时代,因为很多人的数据放到网上可以共享可以传播,而且人可以传播下来。这样我们人其实绕过了一个状态,比如说让机器来认识一个猫,这件事情就变得可做了。因为数据很多,而且有很多热心的人去标注。所以大数据本身让我们人工智能看到一个新的台阶。

另外一个举个例子,因为数据因为计算能力提高,我们看到另外一个趋势,很多机器学习的算法都重新拿过来再跑一遍,当然深度学习我也是看了一下维基百科,2006年一个学者特讲了两个定,一点是多层人工智能网是可以抽取网络特征的。其实我那时候在上人工智能学鲁晓燕老师也讲,人工智能可以抽取网络特征,它实际上是每个影像的抽取。第二个点你的算法收敛的很慢的情况下,你还是可以分程序学习来加速。这是深度学习又火热起来一个大的起点和用途。可是我们最近发现深度学习非常非常火爆,火爆到你是传统的机器学习你就不叫人工智能。其实很大一点就是没什么,就是因为数据很多,而以前计算能力很强,所以我简单拿数据就能做以前意想不到的结果。举个例子,一个图像分类,我们知道图像分类很难,有背景,也图片,图片各种纹理问题,摄像机参数问题,还有很多遮挡问题等等。传统方法是找出特征,找出数据,像人一样找出数据。一个分割到现在仍然做不好,我们人是有很多知识在里面,可是由于大数据存在,也那么多标注存在,有很多新的大数据计算平台,有很多数据在那里可以用。在图片分类上现在做的比人还要好,我原来不太了解Google对猫的学习有很多种,后来我发现有很多种,人做这个事情你如果需要专业研究动物猫的专家,可能很简单,但是像我们普通人可能很难。人可以进入这方面的技术。

讲到这个不得不再提一下WATSON。WATSON系统是2011年参加过比赛,事实上这个系统是在6年以前IBM成立了专门的系统,全球有几十位IBM专家参加了,这是那天的会议视频。WATSON留学生当时去美国的时候看了这个游戏不太懂,可能是知识背景不够,学的都是文化和知识背景。它这个比赛是三天,WATSON第一天打成平手了。因为这个电视比赛已经有好几十年了,所以参加这些比赛的都是脑记忆力非常好的人,所以WATSON比赛这两位选手一位是记忆力最高的选手,另一位是奖金最高的选手。这是比赛选手。看到很多这些同事他们在视频上跟听到的不太一样,觉得帅了不少。其实我们如果看WATSON这个系统,你想我们是2011年比赛,差不多这个项目是2006年就开始了,那时候还没有DKLD的大数据系统,WATSON是非常传统的系统。WATSON很大的是我的数据能不能实现,其实WATSON一开始自己做了内测,一开始没有说参加比赛,但是这种比赛的时候,有没有这样的数据真的可以让我去学习,让我去提高,甚至让我去标注。当时就发现很好,WATSON比赛里面,99%点几以上的答案都是可以找到的。这个系统我们找了一个内容,就是说我们真的把里面所有的内容拿下来学习理解就可以。第二个就是说下一届确定,当时WATSON这个合作不是IBM一家,找了很多高校一起参加。把当时应该讲世界上最好的一些各种各样的引擎算法都拿过来,攒到一起。它的回答问题的百分比和准确率有关系。你回答多数,正确率大概在20%。然后我们把当时JMS的冠军,每一届都有比赛冠军,把冠军的数据放上来一看,基本上99%。就问你五年之前一直一点点走上大赛,如果是NLP可能就结束了,因为差距太大了,最好的引擎,最好的博士,也做不出来。WATSON的一大特色就是用了机器学习的方法,拿海量的数据来学,把所有的可以用到的引擎都拿来用,不光引擎做数据驱动力,我还可以有很多引擎一起跑的话,就当一个问题给到五个臭皮匠的时候,五个臭皮匠都给到他的答案时,我知道哪个臭皮匠的答案更准确。所以最终的一个结果是一百个臭皮匠把它重在一起达到的效果。第二点,真的一百个臭皮匠在一起,效率又变成有问题。所以在WATSON系统里面仍然是计算方面花的时间非常大,因为WATSON要求三秒以内得到答案,否则你还没有机会。这个是这个方面的变化。

经常在国内跟高校同事交流的时候,大家对WATSON有一些问题,可能觉得第一点WATSON在比赛里面没有语音识别,是通过问题用电子方式交给语音识别,我们不太自信,担心语音识别带来的错误率更高,我相信大数据带来的挑战这个应该不是问题。第二个WATSON这个系统是独立的,也就是说它在比赛的时候没有联网,大家有时候感觉到它是联网了,搜索了。实际上它是把数据集成到一起,把数据进行分析。所以它就像人一样,你首先什么都没有在跟他比赛。有了这个比赛的成功,其实对IBM有了很大的触动。我们在这个之后IBM对未来制定了一个发展方向,WATSON我们做一个过程,我们说WATSON里帮助我们业务,后来又有说WATSON三年,确实想到可能这样的技术的一些积累,会让整个IT行业发生着巨大的变革。但是如果用一页图这个就是变革,50年代或者再早期的时候,机械时代,一八几几年就做计算机,不是电子的,就是打卡机,它能做什么?首先不能变成,所有逻辑和数据是定义的,打进去,它是做计算的,所以在那个年代人们认为可以用机器普查做得更好。当时老人说世界上只需要五台计算机就够了。到了编程时代发现计算机可以做更多的事情,我可以把很多业务逻辑,很多流程,以软件方式放进去。有了编程时代,像我们会场系统,包括桌面时代,计算机是把一件事情简单的流程化的事情做的非常快,在运算、在推理、在计算时代做的非常好。像Google做的识别率高的这种技术。计算机还能做什么?我记得最早我妈妈负责数钱,她做过会计,负责记帐。计算机比她好的多,一个计算机能比我妈妈做的准确,可是像这样的工作计算机现在已经做得差不多。我们看到IT行业已经不再增长,有了新的IT技术我们能拿来它干什么?有一点我们可以做,比如说我们的老师,比如是医生,比如说WATSON比赛里面有很多知识在里面,计算机如果能够理解,找到数据洞察,能够跟人交互,这方面是它的作用。所以我们觉得这是认知时代。

刚刚谭老师说模拟人脑是很有一段的过程,我们觉得还是从理解人脑的机理角度开始,然后由于现在大数据普遍存在,利用大数据的帮助来解决我们以前计算机系统不能解决的更复杂的问题,它某种方向是为了解决加速人类扩展某些方面的能力。计算机不是取代,它会和人一起合作,它会比机器或者是人单独合作会更好。人可能分左右脑,左脑偏逻辑、计算的比较多,这部分做的非常非常好,像WATSON很多人回答的问题已经回答不过它了。我们再看人的另外的问题,右脑问题,比如讲认知。比如说很多年前我就认识马老师,我再过一段时间还认识马老师,可能在几毫秒能够回答出来。在那么快的时间为什么能够收集它呢?这是认知计算。认知计算包含左脑右脑结合的关系,左右脑结合起来是更好。

IBM WATSON的发展方向

所以我们觉得WATSON上面有几个方向可以发展,第一个就是我们叫做类脑的计算机体系架构,计算机很热,摩尔定律基本上快走到头了,当然前几天,我们刚刚在实验室里面做出7纳米,摩尔定律再往前跑几年,但是分子是两纳米,我们不可能做两纳米以下的半导体器件,这很难,除非你有再大的突破。因为摩尔定律停下来以后,因为计算速度各方面可能也就这样。我们现在看到很多说做类脑计算各方面,这是一幅图,就是曼哈顿的一个街景,这个图上面大家能能看到大楼,外面的街景,有一个大的轿车。但是这个图最难理解的就是左下角,人脑很快可以看出来是一个一闪而过的汽车。计算机让人毫秒级的反应一下子理解。但我们用现有的计算做起来很难。

IBM几年前跟美国的一个超算中心,当时说人脑是100 billion,这个机器感觉上可以做这样的一些工作,可是你知道它的功率有多大?12个billion watts,120亿瓦。人做这样的事情一千倍以上。你会说计算机太慢了,北京一度电一块钱,它做这样的事情算电费都受不了。如果真的是用脑方面,让计算机真的可以往下发展,一定是一个新的发展引擎。你如果研究脑你会发现脑的功耗很低,脑的90%以上是AD,脑的主题也没那么高。脑里面没有单体的主线和内线。我们在类脑和美国高校合作,神经元计算芯片Synapse一开始目标就是跟人脑相当功率,它能达到信息上跟人脑做的差不多。所以在去年有第一款芯片叫Synapse,那里面容纳了4000多个神经元在里面。它里面每个部分都是独立的。这里面我想提几点,第一个脑子是分区的,也就是说现在计算机CPU是统一的,只是指令驱动。现在芯片里面每一个度都是不一样,它的芯片与芯片之间是有局部的一点。所以这是很大的不同,所以在计算机架构里面取消了总线和CPU之间通讯的问题,而且还可以做对应的地方。对应的难度在哪儿?就是契合度。实际上IBM有了这样的计划,我们当与做一个Synapse的能力。我们现在编程模式可能不适合人脑编程,本身这个过程可能不适合理解的过程。

如果有人像Synapse的芯片能做的更好,大概几年前有人拿Synapse做实验,有几个视频,其中一个视频好像是在大学里面一个街景,十字花园里面,人骑自行车过去,这么一个视频,做图像的人,基本上都是用图象识别做比赛。Synapse在这个芯片的准确里80%,但是它的整个功耗是几十毫瓦,而且它能做到实时。这个如果拿PC做,CPU功耗是几百瓦,所以功耗可能降到了千分之一甚至万分之一,而且它的性能更强。如果有这样的愿景,刚刚徐院士已经说了,人工智能,不光是大脑。拿徐院士举的例子,手拿一个开水,手拿出来,可能手就烫伤了。在“端”上这个很重要的地方。比如采样大气的情况,或者是我发到外面空间的东西,或者是我自己戴个眼睛,它上面可以做很多东西。我见到的人现在到一定年龄,我现在大脑已经变成队列了,一个时间好几件事情,肯定有一件事情就忘掉了。如果拿出来辨识,可能帮助我们提升。如果芯片上有类脑的计算技术的发展,真的可以有很大的改观。

 第二个也许是新的计算机架构,新的芯片,新的模型,新的应用发生。另外传统的很重要的一点,就是结合大数据的理解。这点我不多讲,刚刚徐院士已经讲了很多。这个有一个美国院士研究脑癌的分析,是拿DNA来做,在你的癌细胞做测序,然后再正常的做测序,做比对。然后数据量非常大,有几百个Billion数据可以去对。但是他们在基因,在化合物和蛋白质上面做了各种各样的研究,而且他们把科研研究以论文以材料放在某个地方,那个上面有很多突破。也就是说如果你发现问题,你把海量这些学术期刊里关于这些基因上面有没有特别疗效的药物,有人做了很好的实验,来做这样一个比对,也就是说给他个性化的比对。这个关键就是说能不能拿到海量的信息帮助它理解。所以这是人工智能发展很不一样的,结合大数据结合非数据化的呈现改变很多事情。

 最后一个是新一代人机交互技术。这是我们美国的一个实验室,里面叫做Cognitive Environments,把里面采集的声音、图像的各方面东西塞进去,塞进去以后这里面有很多技术联动。这方面有一个视频来让大家看到以后人机交互方面会带来什么改观。

这个假想场景,是在一个应急储备中心,发现天气很不好,来了一个风暴,比如北京来了大暴雨,主人公就是来帮助做预案,传统要做预案,很多人把数据拿过来做整理分析。如果有这样的人机交互理解我们可以做什么东西。atlantic  energy是人机交互,可以指令,能帮助他提供很多建设性的方案。这个机器可以自动识别风暴来了以后地方可能被淹,电力可能被中断。针对上一次的时候如何被政府给批评,哪些原因被当时媒体或者老百姓抱怨?把相关的文本和其他相关信息抓下来,然后分析大的医院,再把这个数据收集,然后给到他们建议。

如果有这样一个环境,它就像是一个非常非常强大的秘书,既可以了解你个性化的需求,帮你收集材料,整理材料,还有后台可以感很多事儿。如果有这样的技术,可能在很多方面会有变化。比如我们觉得在未来在医院会诊可能变得不一样。如果有这样一个很智能的系统可以帮你做很多分析,IBM有一个新的项目,它的目标是计算机理解能力可以达到一个放射科大夫的水准,他看到一个CT照片,把结果很能够找出来,而且给他的分析者。所以这样的人机交互在一起,确实可以改变很多的工作。

WATSON从2011年发展到现在,这些年我们做了很多有意思的工作,2011年WATSON做的事儿就是让计算机更理解语义。当时我们在美国张凯瑞博士他当时说的,我今天才把这样一个场合给大家看到。基本上是这样的问题,让机器不光能回答问题,还能辩论。我们想辩论,WATSON实际上是展示一个能力,是一个事实型的问题,它能帮助人找到答案。但是事实上让你理解这些点,而且最后辩论完了陈词一讲清楚之后逐一再找方法,这是很有兴趣的,我们全球有很多人参与在其中,中国研究院也参与在里面。我就放一段简单的视频吧。

这是去年的辩题,视频节目要不要禁止暴力视频。辩论题有个论点,这个系统反射了什么,它理解的论点是什么,它从这个论点里面找到论据,正方的观点是什么,反方的观点是什么。这是去年的水准,当然它的水准不是事实性,它的很多来源于杂志相关的数据,那真的需要理解。我们不光是能够把观点拿出来,而且对方抛出观点的时候我还可以反方面做。所以我想这是IBM部门在整个认知方面做的一些工作,就像各位院士讲的,人工智能是非常有兴趣的,过了大概20年的寒冷期,冰河期,又到春天,而且热的很快,一下子到了99度了,真的希望各位同行,老师、学校、政府各行各业的人一起在这个领域一起做很多工作。谢谢大家!

更详细的会议日程和相关信息请随时关注大会官网(持续更新中):http://ccai2015.csdn.net/

0
0