订阅云计算RSS CSDN首页> 云计算

徐扬生院士:机器人,从动作到智能

发表于2015-07-30 13:23| 次阅读| 来源CSDN| 0 条评论| 作者魏伟

摘要:中国工程院院士、香港中文大学(深圳)校长徐扬生以视频形式现场演示了爬树机器人、书法机器人、救援机器人、服务机器人等。他深度分享了目前他一直思考的问题,包括如何向自然学习,智能从哪里来,智能可扩展吗。

为了更好地引导和推动我国人工智能领域的发展,由中国人工智能学会发起主办,CSDN承办的2015中国人工智能大会(CCAI 2015)于7月26-27日在北京友谊宾馆召开。本次会议的主旨是创办国内人工智能领域规模最大、规格最高的高水平学术和技术盛会,汇聚国内外顶级的专家学者及产业界人士,围绕当前最新热点和发展趋势的话题进行交流与探讨,并针对“机器学习与模式识别”“大数据的机遇与挑战”“人工智能与认知科学”“智能机器人的未来”四个主题进行专题研讨,努力打造国内人工智能前沿技术和学术交流的平台。


中国工程院院士、香港中文大学(深圳)校长徐扬生

中国工程院院士、香港中文大学(深圳)校长徐扬生发表了题为《机器人:从动作到智能》的演讲,他认为机器人应该具备三个方面的能力:动作、感知、认知,而机器人的动作包括爬、抓、行、跳、飞……等等,阐述了关于从动作到智能的几个问题,详细介绍了爬树机器人、书法机器人、救援机器人、服务机器人、全方位转向车等研究项目、并以视频形式做了现场演示。

此后,他表示科学家五十年来集中在机器人的动作,现在是时候考虑智能问题了,他还谈了自己现在正在思考的问题,即智能可能比动作更为重要,有关智能问题,他讲了几个研究方向,包括:

  1. 如何向自然学习,比如人类需要的不仅是在结构上,而且还要在运动上,提供灵活性,减少能耗,在这方面应该如何向自然界的进化学习。
  2. 智能从哪里来。现阶段各种各样的智能学习算法基本都是向模型学习。我们其实可以通过learning by demonstration向人学习。再者,人还可以向动物学习。从collective behavior方面,还应该向人群的集体行为学习。其中,大数据与智能,他认为是一个火车的两个轮子,两者缺一不可,是联结在一起的。
  3. 智能可扩展吗?也就是说当机器人学了开车的技术之后,它能否把这种技能扩展到去驾驶飞机。

以下是演讲速记整理:

各位朋友,各位同事,早上好。非常高兴人工智能学会邀请我做这个报告,我搞机器人大概30年吧,很愿意跟大家分享一下机器人里面跟智能有关的一些感悟。我以前在卡内基梅隆大学工作的时候,大家经常讨论人工智能和机器人的关系,很多大牌的人工智能专家,中午吃饭的时候讨论人工智能是机器人的一部分,还是机器人是人工智能的一部分。当时很多人说人工智能是机器人的一部分,因为验证人工智能技术时需要机器人作为平台。同时有些人讲,机器人研究其实包含人工智能部分。

提到智能,我在天津的一次会议上讲了我自己的观点,即心脑可能比肉体更为基本、更为重要。为什么呢?因为现在的的医学告诉我们人体所有器官当中,很多细胞都在更新,十来年后每个人的肉体基本上都换新的了。但是有两种细胞是基本上不更新的,一种是心肌,一生中大概更新1.5次,有的人两次,有的人没有更新;另一种是脑神经细胞,基本不更新,有的只更新一次。所以我说定义你今天是不是你自己,不是基于你的肉体,而是你的心脑部分。

机器人的动作

机器人包含三个内容,一个是动作,一个是感知,就是传感部分,另一个是认知,就是我们人工智能的部分。比如说起风了。你知道起风了吗?这是感知问题。起风了以后要不要加衣服,这是判断,认知问题。下面决定要加衣服,这就是一个动作问题。机器人这门科学在之前50年中都是在围绕着穿衣服这件事情,没有在想着风来了吗?我需不需要要加衣服这个问题上,而人工智能主要是围绕应不应该加衣服这件事情。

我们先从动作问题讲起,其实里面也有需要解决的智能问题。动作是什么,爬、抓、走路、跳、飞,这些都是动作的问题。因为我左边膝盖有点扭伤,昨天有个医生,在骨科这方面做了很多年。后来我俩讨论了学术问题,他问我人的动作大概分哪几个。我觉得人的动作和行为大致可以分为两种,一部分是原始动作,一部分是文明动作。走路,吃饭,睡觉,爬,都是原始动作。文明的动作是什么?开会、上网、手机操作就是文明动作。我们现在这个时代,文明的动作比原始的动作相比多了太多。100年前原始动作跟文明动作相比可能还是原始动作多,比如说80:20,而现在反过来了。

各位有兴趣看看基因的书,100年到现在基因基本上不变,变化的可能只有万分之一。但是行为和动作,变化了这么多,现在很多人的动作100年前的人肯定没有。这就是现代人出问题,生各种各样病的原因。

实践动作对智能是非常重要的。人的智能如果没有很好的动作锻炼是很难提高的,就像一个学生一定要会做家务。劳动和实践是产生智能的源泉。为什么重要?我后面慢慢展开,没有动作你是做不到的。

爬树机器人

第一个是爬树机器人。我小时候喜欢爬树,我在美国住时,有时也就地爬过树。爬树机器人面临很多挑战,主要在几个方面:第一,下面的树枝是粗的,上面的树枝是细的。你要粗细都爬。第二,机器人不能太重。第三,爬树是斜着爬还是竖着爬,爬小树与爬大树可能要用完全不同的方式。当时也有其它人做,但都有限制。而我们的机器人需要什么树都能爬。我们可以先观察毛毛虫是怎么爬的。它是通过什么感知?它没有什么视觉。明天微软的沈向洋博士,他讲vision,谭院士也是搞vision的。我的想法是vision能不能避过去。我们就是从灵活度的方面来研究。机器人要爬上去,背的东西比它本身重量大很多倍。这是一个机构设计和实践的问题。机械设计中需要包含一点柔性,这与树形是有关的。这个稍稍多说几句话,可能有些人忽略了。这设计中需要一些被动的特性,不是主动的。

下面介绍一下是爬树机器人的概念和机构,再演示机器人的运动视频。我们看看它是怎么爬的?这个是在我们学校的校园里面。机器人是两节的,也可以设计成三节或更多,可以背负比自身重3倍的负载,根本没有用到视觉。树干没有粗细之分,一样都可一爬。

书法机器人

下面讲讲书法机器人,会场有些人是练书法的,我自己本身比较喜欢练书法,所以研究书法机器人。书法是什么字体?什么风格?怎么建模描述?打个比方,很简单,我们说人的脸可以表征成若干参数,比如说你跟你儿子像不像,你儿子也可以是高维空间一个参数点,你和你儿子的同学也有一个点。你和你儿子比较像,你们两个点在的参数坐标上的距离大概就比较近。书法也是这样子,不同的书法有不同的参数点,你可以找到其中一点。我们做了一个机器人来实现这个功能。这个机器人当然也有很多要求,这个其实与动作很有关系。我看到在座的有好几位做笔记。做笔记的朋友们请停下来,手不要动。你看你的手臂形状基本上都是呈90度。这个是有道理的。为什么呈90度?我在做学生时就有几篇论文在将这些,动作是有智能在的,人写字的时候一般是呈90度的。你写字不可能用180度方式去写。

其次,怎么把书体分类,如篆书、隶书、楷书等?书写动作也包含智能学习。每一笔都有特征元素。比如苏东坡,他的横一般是怎么写?他的竖一般是怎么写?比如苏东坡要写李院士的李字。机器人可以从仓库里面把参数化的苏东坡的字拿出来。宋代人黄庭坚的字写得好,他可能写过“人工智能大会”里面五个字,但是这个“能”字没写过,怎么办?我们就猜,黄庭坚如果活着的话,“能”字怎么写?机器人学习人写字就是这样,它是模仿的,教的人写得差它也写得差,你写得好它也写得好。

这个视频演示了书法机器人的运作。展示了动作的智能,这种智能包含了许多工艺部分,比如说添墨、下笔、打钩等等。工艺最难,工艺确确实实代表了你的智能在里面,你看它用笔都用的很好,这个不是苏东坡教它的,它自己解决。我们曾经写过一篇文章,关于骑自行车到哪里,是你告诉他的,但是不掉下来,不翻倒是它能解决的问题。书法也是这样,把动作分解了,智能分解了,这个是动作智能的问题。

救援机器人

接下来我讲一下救援机器人。这是一个当时为地震灾后救援研发的机器人。我的想法是做哪里都能去的,室内室外各种废墟里都能运动。我们当时选三角星形的驱动机构。你看下面那个图,它是怎么做到的?红色那个轮是怎么攀爬的?蓝色的被挡住的,红色的轮子就自动翻过去了。你再看左边那个图,机器人是怎么爬上去得?它是一边推一边挤上去得,不是通过任何复杂控制上去的。这是一个具有passive元件的机器人,所以我说passive元件很重要。这个机器人很有力量,什么废墟都能去。这个是实地拍摄的视频。

服务机器人

我们再看看服务机器人。比如说家庭里面的,服务机器人当时我们开发了大概十几种,我们选讲几种。服务机器人中,有一些是帮老人家取东西的,必然会需要动作。年纪大了有的时候不知道东西放在那里,可以通过机器人找到。这个是家庭监控机器人。你们家里有陌生人来,它就会给你发短信。这种机器人还可以照顾宠物。你用手机可以通过它与家里的宠物对话。宠物听到了主人的声音,但是不知道主人在哪里,开始很奇怪,后来熟悉了。比如说我们上海一个院士,家里面有一只狗,老是不能出远门。两三天有一个会议你说带好还是不带好。第三个服务机器人,这是一只假狗,它跟老人玩,老人在家里很闷,我们家里都有老人,老人你给他吃,你给他穿,给他钱,他都不要,他到底要什么?他要找人给他陪伴,所以我们找个机器人就是跟陪他玩。跟它玩牌,对它稍稍好一点也能让你赢几把。我的机器人就是三岁到四岁的智力。它还可以跳不同的舞。你要睡觉了,它就不玩了。

全方位转向车

下面跟大家谈谈全方位转向车。开车是一件非常好的手眼协调的工作。我说年纪大起来其实开车是很好的锻炼。我到李院士那里,前几年李院士太太开车。我觉得开车防止老年人脑退化非常好。开车中最难的一件事情是什么?是停车,停车为什么难?因为现在的转向机构,延续了一百多年前的机构。我们现在做混合动力汽车或者纯电动汽车,能够改变它吗?我们做四轮独立驱动和四轮独立转向机构,可以横着开。这样停车不是变得很简单吗?一下子就停进去了。北京的停车费也很贵,而且停车场里面停车的面积只占到40%左右,其它面积都是用于车辆在里面运行,不是停车。通过全方位转向,不就把倒车问题解决了吗。这个我觉得是非常有意义的一件事情。

机器人的智能

现在我讲完了第一部分,就是动作部分,给大家展示了我们做的几个机器人的视频。50年的科学家主要集中在动作这个领域,没有回答在智能领域的问题。现在是时候考虑智能的。为什么呢?有很多原因在里面,其中有一个在20年之前已经开始讨论的问题是什么叫分布智能,这件事情以前不可能,或者说很难。现在是有可能。智能是不是全部在脑袋里面?离开脑袋能不能有智能?我们说可以。我现在口渴了,机器人给我倒一杯水,一拿很烫,我怕烫着,把被子扔了,我的手里面本身就有智能。每个人手里面都有智能,这种智能是分布式的。智能可不可以利用人体?比如说讲虚一点,人体外的有没有智能?当年我们念博士的实验室,当时做一个打乒乓球的机器人,它打得比人好。打乒乓球的时候一个小时,基本上都是它赢。这个机器人好在哪里?它有36个眼睛,它的眼睛不是装在脑袋里面,它的眼睛是装在乒乓球桌的四周,36只,它是分布的,这就是分布式智能。智能的东西如果把它做分布式的,就很厉害。这件事情很少有人做研究,现在有人做研究是因为网络发展了。

再看看感知的问题。感知,我刚刚讲,起风了,应该穿衣服了吧。所有人都围绕着应该穿衣服这件事,为什么不想想起风了这件事情也很重要。这件事情蛮难做的。我们说眼、耳、鼻有很多的协调功能在里面,这些东西本身带着智能的。要做个“鼻子”,闻东西,这种传感器很难做,但这不仅是传感器的问题,我希望做人工智能的朋友们多在感知的层面上作些研究。20多年前,我们曾经做个主动视觉的研究,比如说台子的这边写着“人工智能大会”,但是机器人在另一边看不到,机器人应该怎么办?应该移动到这边来看。机器视觉的研究者只停留在看不到的层面,但是机器人的研究者就需要驱动机器人到另一个角度去看,这就是主动视觉。我说应该继续做下去。就是做智能与动作结合的,感应器件里面含有分布式智能的内容。

几个智能有关的问题

下面我想谈谈几个问题,这几个问题是跟动作有关的智能。有些是做了点,有些还没有做,有些做了还没做好。今天就拿出来讨论讨论,供大家参考。

第一是如何向自然学习。我们人和动物都是跟自然界协调而进化的。人为什么行走,原来是爬的,这个世界需要我们人走。以后可能所有人的背都是驼的,因为大家都是拿手机嘛。因此,动物就是这么进化过来的。人的动作,是非常智能的。是可能向自然学习,人的很多动作本来就是向自然学习过来的。当我们机器人沙滩走路走得不行的时候,我们有没有去想过龙虾是怎么走?螃蟹是怎么走?我们再看鸟。两千多年来,人类一直想着飞行的梦,想做大的翅膀,绑在手臂上,希望像鸟一样飞起来。然后,一直没有成功,飞机是另一回事,这是很大的像鸟一样的机器,人坐到它的肚子里面,原理很不同,跟当初人的梦想是不一样。为什么现在做不出来?还是向自然界学习不够,自然界有很多智能的东西还没有学习到。

我们再看看,一个是结构上一个是运动上,结构上是学习问题,运动上是智能问题。你是怎么走路的?现在很多病人,只要在家里面做一段时间爬的动作,你的腰都会好起来。这绝对是科学的智能的。之前我说的把人的行动分成两类。人类离文明太近了,这个需要代价。人类的文明动作太多了。而爬是原始动作。如果我们能多向自然学习,实际机构也好,运动也好,都能够体现灵活性。

再说说机器人和机器动物。为什么要做机器人?大家都知道机器人中有一类叫人形机器人humanoid,这是现在做得很火的。一开始的时候美国机器人学界非常看不起这个东西。日本人在搞什么名堂?为什么要做人形机器人?做机器人的目的是什么?做机器人就是做人很难做的事情。比如说现在要上到这个柱子上去,我上不去,能否做个机器人让它能上去,做一个人一样的东西干什么?没有这个必要,对不对?很多人把Robot翻译成机器人,这个翻译本身有错误。Robot和“人”一点关系都没有。所以机器动物大家其实可以好好想想,包括动物在行动上的学习智能。

第二个问题就智能从哪里来。我们在座的朋友很熟悉算法,算法是向模型学习,你要有模型,有统计的,有最优的,有叠代的,有神经网的。比较直接的方法是“向人学习”。模型实际上是把知识堆集起来,蛮难的。你为什么不向人学习呢?比如研究移动机器人路径规划,从门进来,一直到这个讲台,基于模型的方法是用几何的方法算出来,另一种方法是,看人怎么走过来,观察两三个人就知道应该怎么走过来。这就是向人学习。我们叫Learning  by  demonstration,虽然可能不是最优的,但是可行的。最简单的办法就是把三个人平均下来,大概就是讲中庸,中国人讲中庸,中庸之道就是平均。

可不可以向动物学习?动物有很多智能,为什么不能向动物学习呢?现在研究动物的人太少了,尤其是动物的智能。我觉得绝对是有意思的。我在美国时有一个人民日报海外报,里面有一个很小的新闻,说是四川一个老人家在深山三十几年,他能够听懂鸟的50多种声音,所以老头想把这个教给儿子。他儿子上山,但是觉得山上非常枯燥,不耐烦。大概两三个月以后儿子回来了。过了两三年以后老人过世了。我当时看了这个新闻以后觉得非常遗憾,没有人继承这种本领。我觉得狗与狗之间一定能沟通,能有学习,但绝大多数人是不懂的,有可能有人会懂。再一种是人群的智能。这不是人的智能,是人群的智能。所有人是跟风的,最简单的就是上个月大家都知道中国的股票市场,股票市场的动力就是人群的集体行为心理学。很简单,现在我们在这里开会,过会儿某个角落里面有两三个人往外面跑,旁边两三个人也跟着往外面跑,后面有人不知道什么事儿也往外面跑。人就是这样子,有很多可以研究的智能问题在里面,大家也不知道在做什么,但是他们是集体的行为。

再一个是大数据与智能,下午还有人讲大数据。大数据跟智能,就是一个火车的两个轮子,我个人感觉到缺了一个都不行。有了大数据以后,如果没有智能,也没效果,反映过来智能也要靠大数据,所以这两件事情是联结在一起的。

第三个事情我想跟大家讲一下智能的扩展性。智能的可扩展性。我在做机器人动作控制老想这件事情,是不是可以扩展?人的智能可不可以扩展?这个扩展,你可以把它形式化,也可以不讲形式化,我知道李院士明天讲形式化的问题。比如我们开车,开一辆大卡车。大卡车学会了,开辆小车行不行?大卡车学会了不一定也会开小车,但是比刚刚学会开车容易一点。再说开飞机,是不是开车的朋友开飞机也容易?我跟你说,我不知道。我们做了半天研究以后没觉得这件事情有用。这件事情也是很值得搞智能的研究工作者去好好想想。这个可扩展的条件到底是什么?是硬件还是软件?还是数据?原来很多人说数据不够,我估计是歪理,但是也不一定。大家可以去想一想,特殊的智能和通用的智能到底在哪里。特殊智能很重要。你要做一件事情,国内很多竞赛,特殊智能的机器人是很容易做的。机器人智能的可扩展性也许与有效性有矛盾,如何解决。谢谢大家。

更详细的会议日程和相关信息请随时关注大会官网(持续更新中):http://special.csdncms.csdn.net/ccai2015/

0
0