人工智能 订阅
人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大,可以设想,未来人工智能带来的科技产品,将会是人类智慧的“容器”。人工智能可以对人的意识、思维的信息过程的模拟。人工智能不是人的智能,但能像人那样思考、也可能超过人的智能。人工智能是一门极富挑战性的科学,从事这项工作的人必须懂得计算机知识,心理学和哲学。人工智能是包括十分广泛的科学,它由不同的领域组成,如机器学习,计算机视觉等等,总的说来,人工智能研究的一个主要目标是使机器能够胜任一些通常需要人类智能才能完成的复杂工作。但不同的时代、不同的人对这种“复杂工作”的理解是不同的。 [1]  2017年12月,人工智能入选“2017年度中国媒体十大流行语”。 [2] 展开全文
人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大,可以设想,未来人工智能带来的科技产品,将会是人类智慧的“容器”。人工智能可以对人的意识、思维的信息过程的模拟。人工智能不是人的智能,但能像人那样思考、也可能超过人的智能。人工智能是一门极富挑战性的科学,从事这项工作的人必须懂得计算机知识,心理学和哲学。人工智能是包括十分广泛的科学,它由不同的领域组成,如机器学习,计算机视觉等等,总的说来,人工智能研究的一个主要目标是使机器能够胜任一些通常需要人类智能才能完成的复杂工作。但不同的时代、不同的人对这种“复杂工作”的理解是不同的。 [1]  2017年12月,人工智能入选“2017年度中国媒体十大流行语”。 [2]
信息
提出时间
1956年
简    称
AI
提出地点
DARTMOUTH学会
中文名
人工智能
名称来源
雨果·德·加里斯 的著作
外文名
ARTIFICIAL INTELLIGENCE
人工智能定义详解
人工智能的定义可以分为两部分,即“人工”和“智能”。“人工”比较好理解,争议性也不大。有时我们会要考虑什么是人力所能及制造的,或者人自身的智能程度有没有高到可以创造人工智能的地步,等等。但总的来说,“人工系统”就是通常意义下的人工系统。关于什么是“智能”,就问题多多了。这涉及到其它诸如意识(CONSCIOUSNESS)、自我(SELF)、思维(MIND)(包括无意识的思维(UNCONSCIOUS_MIND))等等问题。人唯一了解的智能是人本身的智能,这是普遍认同的观点。但是我们对我们自身智能的理解都非常有限,对构成人的智能的必要元素也了解有限,所以就很难定义什么是“人工”制造的“智能”了。因此人工智能的研究往往涉及对人的智能本身的研究。其它关于动物或其它人造系统的智能也普遍被认为是人工智能相关的研究课题。人工智能在计算机领域内,得到了愈加广泛的重视。并在机器人,经济政治决策,控制系统,仿真系统中得到应用。尼尔逊教授对人工智能下了这样一个定义:“人工智能是关于知识的学科――怎样表示知识以及怎样获得知识并使用知识的科学。”而另一个美国麻省理工学院的温斯顿教授认为:“人工智能就是研究如何使计算机去做过去只有人才能做的智能工作。”这些说法反映了人工智能学科的基本思想和基本内容。即人工智能是研究人类智能活动的规律,构造具有一定智能的人工系统,研究如何让计算机去完成以往需要人的智力才能胜任的工作,也就是研究如何应用计算机的软硬件来模拟人类某些智能行为的基本理论、方法和技术。人工智能是计算机学科的一个分支,二十世纪七十年代以来被称为世界三大尖端技术之一(空间技术、能源技术、人工智能)。也被认为是二十一世纪三大尖端技术(基因工程、纳米科学、人工智能)之一。这是因为近三十年来它获得了迅速的发展,在很多学科领域都获得了广泛应用,并取得了丰硕的成果,人工智能已逐步成为一个独立的分支,无论在理论和实践上都已自成一个系统。人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,主要包括计算机实现智能的原理、制造类似于人脑智能的计算机,使计算机能实现更高层次的应用。人工智能将涉及到计算机科学、心理学、哲学和语言学等学科。可以说几乎是自然科学和社会科学的所有学科,其范围已远远超出了计算机科学的范畴,人工智能与思维科学的关系是实践和理论的关系,人工智能是处于思维科学的技术应用层次,是它的一个应用分支。从思维观点看,人工智能不仅限于逻辑思维,要考虑形象思维、灵感思维才能促进人工智能的突破性的发展,数学常被认为是多种学科的基础科学,数学也进入语言、思维领域,人工智能学科也必须借用数学工具,数学不仅在标准逻辑、模糊数学等范围发挥作用,数学进入人工智能学科,它们将互相促进而更快地发展。 [3] 
收起全文
精华内容
参与话题
问答
  • 人工智能教程 - 前言

    万次阅读 多人点赞 2019-07-02 09:52:27
    总目录 各位乡亲父老们!人工智能,马上就要爆发了。一旦爆发,将会如黄河泛滥一发不可收拾。在当今,人工智能已经渗透到了网络搜索,广告...而且一旦控制不好,会真如马斯克所说的一样——人工智能会毁灭人类~

    朋友们! 如需转载请标明出处:http://blog.csdn.net/jiangjunshow

    人工智能被认为是一种拯救世界、终结世界的技术。毋庸置疑,人工智能时代就要来临了,科幻电影中的场景将成为现实,未来已来!

    我很庆幸。十四年前就认定了人工智能专业,一路学习着,从国内学到了国外,然后又回到了祖国参加工作,继续着对人工智能的研究!

    我很担忧。正是因为对人工智能的钻研,让我深深地知道它的无比强大。我担忧的不仅仅是它将取代人类的工作,而是将取代整个人类——毁灭人类。
    在这里插入图片描述

    在将来不懂人工智能就像现在不懂操作电脑的人一样,会被社会淘汰;而掌握了人工智能技术的人,则可能引领世界。

    很多人都想学人工智能,它比黑客技术更加神秘更加吸引人。但是很多人都不敢学,因为传统教材的门槛都很高——需要编程,高数,统计学等等知识。所以我才编写了这一系列教程,使它通俗易懂,接地气,无需高数,只要你上过高中,就可以学!而且,传统教材都很枯燥,即使作者花时间写得很易懂但依然很少人能坚持学下去,因为太枯燥了。所以我主张快乐学习,尽量加入搞笑的成分在教程里面,其实我生活中就很乐观幽默,歌手李健就是我性格的一个写照吧,只不过我能说荤段子他不能。金杯银杯不如口碑,读者的留言让我的努力得到了认可!
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    我希望通过这一系列的教程使越来越多的中国人掌握人工智能技术,人工智能是中国的一次机遇,国家已经认识到了这一点并将人工智能提升到了国家战略级别。我希望为我的民族为我的同胞出一份力。我也希望有缘看到这篇文章的你也为我们的民族为我们的同胞出一份力。
    在这里插入图片描述
    那么,让我们开始吧!

    教程涉及到了人工智能的方方面面,从基础原理到现在很火的人脸识别,自动驾驶.,股票预测,金融分析…以及一些小众的特殊应用,例如利用AI去除视频里的马赛克,甚至可以用AI将女主角换成Angelababy…
    在这里插入图片描述
    教程里将我十多年积累的知识都教给大家了,而且每小节后面还提供了实战编程代码。学完这套教程后,找份人工智能方面的工作不是问题,有天赋的更可以开发出各种颇具经济价值的人工智能程序。大家可以通过点击每篇文章前面的“总目录”链接来进行导航浏览。

    在开始学习前,你可能会担心自己没有基础,担心自己数学不好,担心自己编程功底差等等。不用担心!我会用最通俗易懂的描述让你理解那些所需的数学知识以及教会你相关的编程技巧!

    朋友们,让我们向着人工智能领域出发吧!

    下一篇:《什么是神经网络》

    展开全文
  • Python人工智能8大课程
  • 张钹:人工智能技术已进入第三代

    万次阅读 多人点赞 2019-09-21 02:45:14
    原文编注:近日,中科院院士、清华大学人工智能研究院院长张钹教授接受记者采访时认为,目前基于深度学习的人工智能在技术上已经触及天花板。从长远来看,必须得走人类智能这条路,最...
        

    原文编注:近日,中科院院士、清华大学人工智能研究院院长张钹教授接受记者采访时认为,目前基于深度学习的人工智能在技术上已经触及天花板。从长远来看,必须得走人类智能这条路,最终要发展人机协同,人类和机器和谐共处的世界。未来需要建立可解释、鲁棒性的人工智能理论和方法,发展安全、可靠和可信的人工智能技术。

    640?wx_fmt=jpeg

    张钹院士:AI奇迹短期难再现 深度学习技术潜力已近天花板

    在Alphago与韩国围棋选手李世石对战获胜三年过后,一些迹象逐渐显现,张钹院士认为到了一个合适的时点,并接受了此次的专访。

    深度学习目前人工智能最受关注的领域,但并不是人工智能研究的全部。张钹认为尽管产业层面还有空间,但目前基于深度学习的人工智能在技术上已经触及天花板,此前由这一技术路线带来的“奇迹”在Alphago获胜后未再出现,而且估计未来也很难继续大量出现。技术改良很难彻底解决目前阶段人工智能的根本性缺陷,而这些缺陷决定了其应用的空间被局限在特定的领域——大部分都集中在图像识别、语音识别两方面。

    同时,在张钹看来,目前全世界的企业界和部分学界对于深度学习技术的判断过于乐观,人工智能迫切需要推动到新的阶段,而这注定将会是一个漫长的过程,有赖于与数学、脑科学等结合实现底层理论的突破。

    作为中国少有的经历了两个人工智能技术阶段的研究者,张钹在过去数年鲜少接受采访,其中一个原因在于他对目前人工智能技术发展现状的估计持有部分不同看法,在时机未到之时,张钹谨慎的认为这些看法并不方便通过大众媒体进行传播,即使传播也很难获得认同。


    一、“奇迹并没有发生,按照我的估计,也不会继续大量发生”

    经济观察报:您是如何估计和评价目前人工智能发展的现状?

    张钹:这一轮人工智能热潮是本世纪初兴起的。首先是出现在学术界。学术界过去对人工智能是冷遇的,但是多层神经网络的出现带来了一些改变,神经网络的理论在上世纪50年代就有了,但是一直处于浅层的应用状态,人们没有想到多层会带来什么新的变化。

    真正引起大家注意的就是2012年斯坦福的实验(注:2012年谷歌和斯坦福利用多层神经网络和大量数据进行图像识别的实验),过去实验的图像样本数最多是“万”这个级别,斯坦福用了1000万,用多层神经网络来做,结果发现在人脸、人体、猫脸三个图像类别中,这个模型的识别率大概有7%-10%的提高。

    这给大家非常大的震动,因为通常识别率要提高1%要做好多努力,现在只是把层数增加了,竟然发生两大变化,一个是识别率提高这么多;第二个是能处理这么大数据。这两个变化给大家非常大的鼓舞,何况在2012年之前,人工智能没有解决过实际问题。

    经济观察报:这种突破的原因是什么?

    张钹:现在分析下来是三个原因,大家也都非常清楚了,一个大数据、一个是计算能力、一个是算法。认识到之后,一夜之间业内业外对深度学习都非常震动,然后就发生了三件历史性的事件。

    第一件事是2015年12月,微软通过152层的深度网络,将图像识别错误率降至3.57%,低于人类的误识率5.1%;第二件事,2016年微软做的语音识别,其词错率5.9%,和专业速记员水平一样;第三件事:Alphago打败韩国围棋选手李世石。

    通过人工智能,利用深度学习、大数据这两个工具,在一定条件下、一定领域内竟然能够超过人类,这三件事情给大家极大的鼓舞。

    特别是对于业外的人,都认为我只要掌握了大数据,利用深度学习说不定还能搞出奇迹来,于是大家做了很多很多预测,比如在多短时间内计算机会在什么事情上能超过人。

    但实际上,在这个之后,奇迹并没有发生,按照我的估计,今后也不会大量发生。准确一点说,今后或许会在个别领域取得进展,但是不会像之前预计的那样全面开花。特别是中国市场乐观的认为“中国市场大、数据多,运用又不受限制,所以将来奇迹一定会发生在中国”。

    结果很多企业在做的时候发现,不是那么回事。从目前的情况来看效果最好的事情还是这两件:图像识别、语音识别。我看了一下,中国人工智能领域20个独角兽30个准独角兽企业,近80%都跟图像识别或者语音识别有关系。

    经济观察报:为什么会出现这样的情况?或者说在这么长时间后,我们对人工智能目前能做什么有一个清晰的认识了吗?

    张钹:人工智能在围棋上战胜人类后产生了这种恐慌,“大师才能做的事,人工智能居然能做,我的工作这么平凡,肯定会被机器所替代”。这里需要考虑一下它的局限性,我一直在各种各样的会上谈到不要过于乐观。

    人工智能能做的那三件事(语音识别、图像识别、围棋)是因为它满足了五个条件,就是说只要满足了这五个条件,计算机就能做好,只要有任何一个或者多个条件不满足,计算机做起来就困难了。

    第一个是必须具备充足的数据,充足不仅仅是说数量大,还要多样性,不能残缺等。

    第二个是确定性。

    第三个是最重要的,需要完全的信息,围棋就是完全信息博弈,牌类是不完全信息博弈,围棋虽然复杂,但本质上只需要计算速度快,不要靠什么智能,可是在日常生活中,我们所有的决策都是在不完全信息下做的。

    第四个是静态,包括按确定性的规律演化,就是可预测性问题,在复杂路况下的自动驾驶就不满足这一条;实际上它既不满足确定性,也不满足完全信息。

    第五个就是特定领域,如果领域太宽他做不了。单任务,即下棋的人工智能软件就是下棋,做不了别的。

    经济观察报:就是说在满足这五个条件的前提下,目前的人工智能是胜任部分工作的?

    张钹:如果你的工作符合这五个条件,绝对会被计算机替代,符合这五个条件的工作特点很明显,就是四个字“照章办事”,不需要灵活性,比如出纳员、收银员。如果你的工作富有灵活性和创造性,计算机绝对不可能完全代替,当然部分代替是可能的,因为其中肯定也有一些简单和重复性的内容。如果认识到这一条就会认识到人工智能仍处于发展阶段的初期。不是像有些人估计的那样“人工智能技术已经完全成熟,而进入发展应用的阶段”。

    二、“深度学习技术,从应用角度已经接近天花板了”

    经济观察报:我们应该怎么去定义目前的深度学习技术路线,它是基于概率学的一个事物吗?

    张钹:现在的深度学习本质是基于概率统计,什么叫做概率统计?没有那么玄,深度学习是寻找那些重复出现的模式,因此重复多了就被认为是规律(真理),因此谎言重复一千遍就被认为真理,所以为什么大数据有时会做出非常荒唐的结果,因为不管对不对,只要重复多了它就会按照这个规律走,就是谁说多了就是谁。

    我常常讲我们现在还没有进入人工智能的核心问题,其实人工智能的核心是知识表示、不确定性推理这些,因为人类智慧的源泉在哪?在知识、经验、推理能力,这是人类理性的根本。现在形成的人工智能系统都非常脆弱容易受攻击或者欺骗,需要大量的数据,而且不可解释,存在非常严重的缺陷,这个缺陷是本质的,由其方法本身引起的。

    经济观察报:就是说通过改良的方式无法彻底解决?比如我们再增加神经网络层数和复杂性或者再提升数据的量级,会解决它的缺陷吗?

    张钹:改良是不行的,深度学习的本质就是利用没有加工处理过的数据用概率学习的“黑箱”处理方法来寻找它的规律,这个方法本身通常无法找到“有意义”的规律,它只能找到重复出现的模式,也就是说,你光靠数据,是无法达到真正的智能。

    此外,深度学习只是目前人工智能技术的一部分,人工智能还有更大更宽的领域需要去研究,知识表示、不确定性处理、人机交互,等等一大片地方,不能说深度学习就是人工智能,深度学习只是人工智能的一部分。一直到去年人工智能大会交流的论文还是三分之一是机器学习方面,三分之二是其他方面。

    经济观察报:学界在这上面还是有一个比较清晰的认识?

    张钹:我可以这么说,全世界的学界大多数有清晰的认识;全世界的企业界大多持过于乐观的估计。

    为什么出现这样的情况呢?因为从事过早期人工智能研究的人,大多已经故去或者年老,已经没有话语权。现在活跃在人工智能研究第一线的都是深度学习、大数据兴起以后加入的,他们对人工智能的了解不够全面。

    经济观察报:如果说每一个技术路线都有一个“技术潜力”,那么在深度学习方面,我们已经把这个潜力用了多少?

    张钹:科学研究是很难精确估计的,但是深度学习如果从应用角度,不去改变它,我觉得已经接近天花板了,就是说你要想再出现奇迹的可能性比较小了。

    经济观察报:那基于此,目前商业公司在底层技术和产业应用上还是有很大的空间吗?

    张钹:只要选好合适的应用场景,利用成熟的人工智能技术去做应用,还有较大的空间。目前在学术界围绕克服深度学习存在的问题,正展开深入的研究工作,希望企业界,特别是中小企业要密切注视研究工作的进展,及时地将新技术应用到自己的产品中。当然像谷歌、BAT这样规模的企业,他们都会去从事相关的研究工作,他们会把研究、开发与应用结合起来。

    经济观察报:有一种观点认为我们强调的“白盒”(可理解性)它实际上是从人的思维来强调的,但是通过大数据、概率统计工具离散到连续的投射,它实际上是机器的思维,你不一定需要它给你一个解释,只要正确的答案就可以了?

    张钹:目前有两种意见,一种观点认为智能化的道路是多条的,不是只有一条路能通向智能,我们通过自然进化产生了自然智能,那么我们为什么不能通过机器产生机器智能?这个智能和自然智能不会是完全一样的,条条大路通罗马,我们通过自然进化获得的智能也不见得是最佳的。这个观点我赞成,机器智能与人类不相同,其实是有好处的,恰恰可以互补,发挥各自的长处。

    是从长远来看,必须得走人类智能这条路,为什么?因为我们最终是要发展人机协同,人类和机器和谐共处的世界。我们不是说将来什么事情都让机器去管去做,人类在一边享受。我们要走人机共生这条路,这样机器的智能就必须和人类一样,不然没法共处,机器做出来的事情,我们不能理解,我们的意图机器也不知道,二者怎么能合作?

    经济观察报:就是必须具有可解释性?

    张钹:是,就是可解释性,你要它做决策,你不理解它,飞机就让它开,谁敢坐这架飞机?所以目前的阶段,车和飞机还是不能完全让机器开的。为什么司机坐在上面我们放心?因为我们和他同命运,要撞死一块撞死,机器和你可不是同一命运,它撞不死,你撞死了。

    有的人非常脱离实际的去想这个问题,这是不对头的,人类怎么会去那样发展机器呢(注:指把人类的命运全部交给机器)?人类不会去那么发展的,有些人在那边担忧什么机器人统治人类,我说这最多只能算远虑。

    经济观察报:所以图灵的论文中也说这种观点“不值一驳”。

    张钹:是,那是远虑,我们目前还有很多近忧,发展人工智能必须要考虑安全问题,这已是现实问题。

    你看语音合成,利用现有的技术可以做到以假乱真,和真人基本没有差别。现在看来这种技术不能推广应用,因为一旦推广就全乱套了,只要搞一段用语音合成技术做成的假录音,就可以让任何一位名人身败名裂。这些都是非常危险的技术。人工智能的治理已经提到日程上了。

    三、“我们培养不出爱因斯坦、培养不出图灵”

    经济观察报:一种观点认为中国有更多的数据和更多的工程师,这种规模能倒推带来基础研究层面的突破或者决定技术的路线?

    张钹:这里混淆了好多概念,科学、技术、工程。科技水平需要三个标准来衡量,一个是科研水平、一个是技术水平、一个是工程实践能力,或者产业化能力。

    我们中国什么情况?从工程角度来看,在一些领域我们“接近世界水平”;技术水平我用的词是“较大差距”,因为不少东西还是外国会做我们不会做;科研究领域我用的词是“很大差距”,科学研究就是原创,实际上,所有人工智能领域的原创成果都是美国人做出来的,人工智能领域图灵奖得主共十一人,十个美国人,一个加拿大人。

    经济观察报:数据显示中国在人工智能领域的论文发表量和被引用次数都已经进入前列位置,这是否说明中国人工智能科学研究领域的突破?

    张钹:如果单从论文来看研究水平,基本反映在三个指标上:数量、平均引用率、单篇最高引用率。拿人工智能来讲,中国研究者论文的数量和平均引用率都还不错,但是单篇最高引用率和世界差距就很大,而这个指标恰恰是反映你的原创能力。

    也就是说深度学习这个领域,我们的平均水平达到世界水平了,但是最高水平和世界差距还是很大的。不过还是要肯定的,我们应用上发展比较快。

    经济观察报:清华在这方面有什么优势吗?

    张钹:在人工智能重要的会议杂志上,这十年期间论文数量、平均质量CMU(美国卡耐基梅隆大学)排第一,清华大学排第二。我们培养的人,在计算机这个领域,清华的本科、博士生都是世界一流的。

    目前我们的跟踪能力是比较强的,一旦有人起个头,我们能迅速跟上去。但是很可惜,我们缺乏顶尖人物,也培养不出顶尖的人才,如爱因斯坦、图灵等。

    我个人认为原因之一,可能与中国的文化有点关系,我们的从众心理很严重,比如在人工智能领域,深度学习很热,发表的论文作者中几乎70%是华人,但是其他非热门领域,包括不确定性推理、知识表示等几乎没有华人作者。这就是从众扎堆,不愿意去探索“无人区”。

    当然也不要着急,科学研究本来就是富人干的事情,是富国干的事情,我们还是发展中国家,科学研究起点比较低,暂时落后是难免的,我们会迎头赶上。


    四、“低潮会发生,但不会像过去那样”

    经济观察报:如果说深度学习已进天花板,那么人工智能未来的前进方向将会在哪?

    张钹:最近我们准备提出一个新的概念,就是第三代人工智能的概念,人工智能实际上经历过两代,第一代就是符号推理,第二代就是目前的概率学习(或深度学习),我们认为现在正在进入人工智能的第三代。原因很明显,第一代、第二代都有很大的局限性。

    经济观察报:你所说的第三代人工智能技术是有明确的实现方向或者特点吗?

    张钹:我们现在提出的是要建立可解释、鲁棒性(注:可以理解为稳健性)的人工智能理论和方法,发展安全、可靠和可信的人工智能技术。

    经济观察报:这样的技术可能要等很久?

    张钹:是啊,很难预计,我们也很着急。

    经济观察报:是不是还得回归到数学等理论层面里再去找新的方法?

    张钹:这个目前我们有两条路,一个是和数学结合,一个是和脑科学结合。你想想如果没有新的数学工具,没有来自于脑科学启发下的新思路,哪来的新理论?另一方面是要把数据驱动和知识驱动结合起来,因为通过数学、脑科学上寻求突破是比较艰难的,前面这件事现在则完全能够做。

    经济观察报:这个结合是指之前几十年人工智能的经验统合到一块?

    张钹:是的,至少有一个方向就是要把第一代和第二代结合,利用各自的优势。但是这两个结合很困难,因为他们在不同空间中操作,一个是向量空间,一个是符号空间,也需要有新的数学工具的加入。

    经济观察报:看人工智能历史,每一代技术之间有很长的间隔期,第三代人工智能技术也会这样吗?

    张钹:我认为会更长,因为需要攻坚,因为遇到的问题更困难。

    经济观察报:会不会再过10年、20年,人工智能在学界或者公众心中,又变成一个“隐学”,就像70、80年代那样,大众又不会再经常提起来这个词?

    张钹:低潮会发生,但不会像过去那样,原因在哪?因为有大数据、互联网和强大的计算资源,这些都会支撑人工智能继续走下去,尽管有的时候还只是表面上的繁荣。

    640?wx_fmt=jpeg附:在2018 全球人工智能与机器人峰会上,清华大学人工智能研究院院长张钹院士做题为“走向真正的人工智能”(Towards A Real Artifitial Intelligence)的大会报告。以下为报告全文,供大家学习交流。

    张钹院士:走向真正的人工智能

    我今天要讲的中心思想就是:我们现在离真正的人工智能还有一段很长的路。为了讲清这个思想,我必须回答下面三个问题:

    第一,什么叫做真正的人工智能?我们的目标是什么?
    第二,为什么我们需要真正的人工智能?
    第三,我们如何走向真正的人工智能?

    我现在回答这三个问题。

    首先我们如何评价目前人工智能取得的成果,我们的评价很简单,针对这 5 件事:

    第一是深蓝打败人类国际象棋冠军;第二是 IBM 在电视知识竞赛中打败了美国的前两个冠军,这两件事是一种类型,后面的三件事是另外一种类型;即 2015 年微软在 ImageNet 上做图象识别,它的误识率略低于人类。还有百度、讯飞也都宣布在单句的中文语音识别上,它的误识率也略低于人类。还有一个是大家非常熟悉的 AlphaGo 打败了李世石。这 5 件事情都是机器在一定的范围内超过了人类,我们如何来评价这 5 件事?

    大家一致认为这 5 件事之所以成功,是由于前面三个因素,一是大数据,二是计算能力提高,第三是有非常好的人工智能算法。这三个因素大家都讨论得非常多了,没必要我再来说,我现在要说的最后一个因素是被大家所忽略的,这个因素是说,这所有的成果必须建立在一个合适的应用场景下。这 5 件事虽然领域很不一样,但是它们都满足完全一样的条件,或满足下面的 5 个限制,首先你必须有丰富的数据或者丰富的知识,如果这两件东西没有,或者很少,你不用来谈人工智能,因为你无法实现无米之炊。人工智能唯一的两个资源,一个是数据,一个是知识。还有确定性信息、完全信息、静态的、单任务和有限领域。这 5 个条件里面任何一个条件不满足,现在的人工智能做起来就非常困难了。

    大家想想这 5 个限制条件下的应用场景是什么样的应用场景?就是照章办事,不需要任何灵活性,这显然不是智能的核心。

    我们现在分析一下上述 5 个场景。下象棋是完全信息博弈,信息完全和确定,没有问题。其次,它遵循着完全确定的游戏规则演化,我们把这种情况也叫做静态。Watson 机器人也是这样,Watson 是什么样的对话问题呢?它为什么选择知识竞赛呢?我们知道知识竞赛提的问题都没有二义性,都是明确的,它的答案总是唯一性的。所以这样的问答对机器人来讲是非常容易的。它涉及的领域虽然比较宽,但也是有限的,包括大家觉得很玄乎的围棋,也完全符合上面 5 个条件,所以对计算机来说也是很容易的。目前计算机打麻将就不行,因为牌类是不完全信息博弈,所以比棋类要难。总之,我们对目前人工智能取得的成果要有一个正确的评价。

    目前的人工智能技术在以下领域都可以找到它的应用,它们是交通、服务、教育、娱乐等等,但我要强调是这些领域里面只有满足上述 5 个条件的事情,计算机做起来才会容易,如果不满足这些条件,计算机就做起来就困难了。大家常常关心什么样的工作会被机器所替代,我可以明确告诉大家,满足这 5 个条件的工作,总有一天会被计算机取代,就是那些照章办事,不需要任何灵活性的工作,比如说出纳员、收银员等等。在座的所有工作都不可能被计算机完全代替,但不排斥你的工作中有一部分会被计算机取代,老师、企业家等的工作不可能被计算机完全代替。

    为什么有这 5 个限制?原因在于我们现在的人工智能是没有理解的人工智能。

    我们先看符号模型,理性行为的模型,举 Watson 的例子,它是个对话系统,我们现在所有做的对话系统都跟这个差不多,但是 Watson 做得更好些,它里面有知识库,有推理机制。沃森除了专家知识之外,还有大量互联网上大众的知识,还运用了多推理机制。请看,这就是 Watson 系统的体系结构。它里面有哪些知识呢?有很多,包括百科全书、有线新闻、文学作品等等。所有的知识用纸质来表示有 2 亿页,用存储量表示达到了 4TB。它能回答什么问题呢?用它的例子来说明。第一个问题,1974 年 9 月 8 日谁被总统赦免?这对美国人来讲很好回答,同样对计算机来讲也很好回答,你用这几个关键字「1974 年 9 月 8 日」、「被总统赦免」,就能在文献里头查出来是谁,他就是尼克松。也就是说根据问题中的关键字,可以在已有的文献里头直接找到答案,这就是一般的网络检索方法。

    第二个问题,荧光粉受到电子撞击以后,它的电磁能以什么方式释放出来?我们用「荧光粉」、「电子撞击」、「释放电磁能」等关键词,也可以找到答案:「光或者光子」。这种方法就是平时网络搜索的原理,应该说没有什么智能。

    回答下面的问题就需要「智能」了,跟智利陆地边界最长的是哪个国家?跟智利有陆地边界的国家可以检索到,它们是阿根廷和玻利维亚,但是谁的边境长?通常查不到。Watson 具备一定的推理能力,它从边界间发生的事件、边界的地理位置等等,经过分析推理以后就可以找出答案,它就是阿根廷。下一个问题也属于这种性质,跟美国没有外交关系的国家中哪个最靠北,跟美国没有外交关系的国家有 4 个,只要检索就行了,但是哪个国家最靠北,没有直接答案,但可以从其它信息中推导出来,比如各个国家所处的纬度、气候寒冷的程度等等分析出来,答案是北朝鲜。

    智能体现在推理能力上。但是很不幸,现在的对话系统推理能力都很差。Watson 系统好一些,但也很有限。换句话说,我们现在的对话系统离真正的智能还很远。

    我们通过索菲亚机器人就可以看出来,索菲亚的对话是面向开放领域,你可以随便提问,问题就暴露出来了。大家在电视上看到索菲亚侃侃而谈,问什么问题都能答得很好,这里面有玄机,如果你的问题是预先提出来的,因为里头有答案,因此回答得非常好,在电视上给大家演示的都是这种情况。

    如果我们临时提问题,问题就出来了。这是一个中国记者给索菲亚提的 4 个问题,它只答对了一个。「你几岁了」,这个问题很简单,它答不上来,它的回答是「你好,你看起来不错」,答非所问,因为它不理解你所问的问题。只有第二个问题它是有准备的,里面有答案,所以答得很好。「你的老板是谁」,这个肯定它有准备。第三个问题,「你能回答多少问题呢」?它说「请继续」,没听懂!。再问第四个问题,「你希望我问你什么问题呢」?它说「你经常在北京做户外活动吗」?这就告诉我们说,现代的问答系统基本上没有理解,只有少数有少量的理解,像 Watson 这样算是比较好的。

    为什么会这样?也就是说我们现在的人工智能基本方法有缺陷,我们必须走向具有理解的 AI,这才是真正的人工智能。我这里提出的概念跟强人工智能有什么区别?首先我们说它在这点上是相同的,我们都试图去准确地描述人类的智能行为,希望人工智能跟人类的智能相近,这也是强人工智能的一个目标,但是强人工智能只是从概念上提出来,并没有从方法上提出怎么解决。大家知道强人工智能提出了一个最主要的概念,就是通用人工智能。怎么个通用法?它没有回答。我们现在提出来的有理解的人工智能是可操作的,不只是概念,这是我们跟强人工智能的区别。

    人机对话的时候,机器为什么不能理解人们提的问题。我们看一个例子就知道了,我们在知识库里把「特朗普是美国总统」这个事实,用「特朗普-总统-美国」这三元组存在计算机里面,如果你提的问题是「谁是美国总统」?机器马上回答出来:「特朗普」。但是你如果问其它有关的问题,如「特朗普是一个人吗」?「特朗普是一个美国人吗」?「美国有没有总统」?它都回答不了。它太傻了,任何一个小学生,你只要告诉他特朗普是美国总统,后面这几个问题他们绝对回答得出来。机器为什么回答不了后面的三个问题呢?就是这个系统太笨了,没有常识,也没有常识推理。既然特朗普是美国的总统,美国当然有总统,但是它连这一点常识的推理能力都没有。所以要解决这个问题,必须在系统中加上常识库、常识推理,没有做到这一步,人机对话系统中机器不可能具有理解能力。但是大家知道,建立常识库是一项「AI 的曼哈顿工程」。大家想想常识库多么不好建,怎么告诉计算机,什么叫吃饭,怎么告诉计算机,什么叫睡觉,什么叫做睡不着觉,什么叫做梦,这些对人工智能来说都非常难,美国在 1984 年就搞了这样一个常识库的工程,做到现在还没完全做出来。可见,要走向真正的人工智能,有理解的人工智能,是一条很漫长的路。

    这里介绍一点我们现在做的工作,加入常识以后,对话的性能会不会有所改善。我们的基本做法是建立一个常识图谱,用这个图谱帮助理解提出的「问题」,同时利用常识图谱帮助产生合适的答案。

    下面就涉及到具体怎么做了,我不详细说了,我就说结果,结果是有了常识以后,性能有了显著的改善,对话的质量提高了。这篇文章已经发表,有兴趣可以去阅读。

    另外是准符号模型,深度学习、神经网络主要用来模拟感性行为,感性行为是一般很难采用符号模型,因为感性(感觉)没法精确描述。比如「马」,怎么告诉计算机什么叫做马?你说马有四条腿,什么叫做腿?你说细长的叫做腿,什么叫细?什么叫做长?没法告诉机器,因此不能用符号模型。目前用的办法就是我们现在说的神经网络或者准符号模型,也就是用人类同样的办法,学习、训练。我不告诉机器什么叫做马,只是给不同的马的图片给它看,进行训练。训练完以后,然后再用没见过的马的图片给它看,说对了,就是识别正确了,说不对就是识别不正确,如果 90% 是对的,就说明它的识别率是 90%。后来从浅层的神经网络又发展到多层的神经网络,从浅层发展到多层有两个本质性的变化,一个本质性的变化就是输入,深层网络一般不用人工选择的特征,用原始数据就行。所以深度学习的应用门槛降低了,你不要有专业知识,把原始数据输进去就行了。第二个是它的性能提高很多,所以现在深度学习用得很多,原因就在这个地方。

    通过数据驱动建立的系统能不能算是有智能呢?必须打一个很大的问号,就是说你做出来的人脸识别系统甚至识别率会比人还高,但是我们还不能说它有智能,为什么呢?这种通过数据驱动做出来的系统,它的性能跟人类差别非常大,鲁棒性很差,很容易受干扰,会发生重大的错误,需要大量的训练样本。我们刚才已经说过,给定一个图像库我们可以做到机器的识别率比人还要高,也就是说它可以识别各种各样的物体,但是这样的系统,我如果用这个噪声输给它,我可以让它识别成为知更鸟,我用另外的噪声输给它,可以让它识别成为猎豹。换句话讲,这样的系统只是一个机械的分类器,根本不是感知系统。也就是说它尽管把各种各样动物分得很清楚,但是它不认识这个动物,它尽管可以把猎豹跟知更鸟分开,但是它本质上不认识知更鸟和猎豹,它只到达了感觉的水平,并没有达到感知的水平,它只是「感」,没有上升到「知」。我们的结论是,只依靠深度学习很难到达真正的智能。这是很严峻的结论,因为如果有这样的问题,在决策系统里头是不能用这样的系统,因为它会犯大错。我在很多场合讲过,人类的最大的优点是「小错不断、大错不犯」,机器最大的缺点是「小错不犯,一犯就犯大错」。这在决策系统里头是不允许的,这就显示人跟机器的截然不同,人非常聪明,所以他做什么事都很灵活,这就使得他很容易犯各种各样的小错。但是他很理性,很难发生大错。计算机很笨,但是很认真,小错误绝对不会犯,但是它一犯就是天大的错误。刚才把那个把噪声看成知更鸟,这不是大错吗?你把敌人的大炮看成一匹马,不是大错吗?但是人类不会发生这种错误,人类只会把骡看成驴,但是计算机的识别系统会把驴看成一块石头。原因在哪儿?原因还是 AI 的理解能力问题。

    我们看这个自动驾驶,过去讲得很多,而且讲得很乐观,我们看看问题在什么地方。我们现在是这样做,我们通过数据驱动的学习方法,学习不同场景下的图象分割,并判别是车辆还是行人、道路等,然后建立三维模型,在三维模型上规划行驶路径。现在用硬件已经可以做到实时,请问大家,这样能不能解决问题?如果路况比较简单,行人、车辆很少,勉强可以用。复杂的路况就用不了。什么原因?非常简单,好多人总结出这个经验,行人或者司机都会有意无意破坏交通规则,包括外国人也一样,中国人更严重一点。这就使得数据驱动方法失效,比如说我们可以用数据驱动方法来了解各种各样行人的行为,我们可以通过大量进行训练,都训练完以后,如果出现新的情况呢?计算机能理解这是人从底下钻过来,很危险吗?所以你不可能把所有情况都训练到。自动驾驶不可能对付突发事件,如果这个突发事件它没见过,它就解决不了。怎么来解决这个问题呢?实际上就是要解决从「Without」到「With」理解的问题。人工智能现在有两种基本方法,一种是用符号模型来模拟理性行为,符号模型可以表达信息的内容,所以它是在一个语义的符号空间里头,但是非常不幸,这个离散的符号表示,数学工具很难用,很多数学工具用不上去,所以它发展很慢。在模拟感性行为的时候,我们用的是特征空间的向量,向量就是数,可以把所有的数学工具都用上,优化的工具、概率统计的工具全部用上。所以数据驱动方法这几年发展非常快,再难的问题,下围棋非常难吧,计算机也可以「算」出来。但是它有一个非常大的缺陷,它是在特征空间里,缺乏语义。我们用数据去训练一个模型,所谓「黑箱学习法」,加上你的数据质量不高,很难学出有用的东西。什么叫概率统计?重复多了就是真理。如果数据质量差,充满了「谎言」。谎言重复多了,就变成真理了。

    我们现在想出的解决办法是这样的,就是把这两个空间投射到一个空间去,这个空间叫做语义的向量空间。也就是说我们把符号变成向量,同时把特征空间的向量变成语义空间的向量。怎么做?一是通过 Embedding(嵌入)把符号变成向量,尽量保持语义不变,可惜现在的方法都会引起语义的丢失,我们只能在投射的过程中让语义丢失得少。第二方面做的工作比较少,就是 Raising(提升),把特征空间提升到语义空间去,这主要靠学科交叉,靠跟神经科学的结合。只有这些问题解决以后,我们才能够建立一个统一的理论,因为过去的感知和认知是不同的处理方法,大家说不到一块,如果我们能够投射到同一空间去,我们就可以建立一个统一的理论框架,这是我们的目标。在语义空间处理就可以解决理解问题,但是这项工作是非常艰巨的。

    介绍一项我们现在做的工作。人工神经网络为什么不能得到语义信息呢?人脑的神经网络为什么可以呢?差别就在这里,我们现在用的人工神经网络太简单了,我们正想办法把脑神经网络的许多结构与功能加进去,我们这里只用了「稀疏发电」这一性质,就可以看出一些效果,人脸、大象或者鸟的轮廓,神经网络可以把它提取出来。

    还有一个办法就是把数据驱动跟知识驱动结合起来。刚才讲了,人的智能没法通过单纯的大数据学习把它学出来,那怎么办?很简单,加上知识,让它有推理的能力,做决策的能力,这样就能解决突发事件。我们现在做的工作就是把这些结合起来,这是我们的基本思路,知识也好,数据也好,都投射到同一空间,然后都用同样的数学方法进行处理,这方面我们已经做了不少工作。

    最后做一个总结,我们从这个坐标看人工智能,横轴代表领域的宽窄,从单领域到多领域、到开放领域。纵轴代表信息的确定性与完全性,从完全到不完全、从确定到不确定。在左下角代表最容易的,就是刚才讲的符合 5 个条件的,现在人工智能在这部分解决得非常好,我们用白色来表示它,AlphaGo 在这里,深蓝在这里,工业机器人在这里。现在我们正在向灰色地区去走,打牌,信息不完全,现在打德州扑克,一人对一人,计算机能战胜人类,多人对弈,计算机还不行,这是灰色地带,我们还可以做,为什么可以做?尽管打牌是不确定的,但是它在概率意义下是确定的,你拿的这副牌的概率,可以算出来,同花的概率是多少,排成顺的概率是多少,既然概率能算出来,最终人类肯定会被计算机打败。Watson 在右边,它的领域比较宽,但是它是确定性的,所以是在灰色的区域。往右上方去就比较难了,自动驾驶、服务机器人、大数据分析,它是一个大框,有的简单,有的困难,就自动驾驶来讲,专用道、行车很少,路况简单等,在白色或者灰色区,如果路况复杂就到了黄色区域,黄色区现在计算机还解决不好。最远的在哪儿呢?右上角,图灵测试。大家对图灵测试有很多误解,其实图灵测试是开领域问答,很难!索菲亚做得怎么样?很糟糕。自然语言理解也在这里,复杂环境下的决策在偏左一点的地方,这也是很难的。所以我们人工智能现在是从左下角往右上角走,我们现在处在出发点附近。有的人想把它用一些名词来区分人工智能的不同发展阶段,有专家问我,你的看法怎么样?我建议不要用新词,用新词往往说不清,很麻烦,有的人说现在是弱人工智能,以后是强人工智能,也有人说现在叫增强智能(Augmented Intelligence)也是 AI……概念太多说不清,还是简单一点,「我们正在通往真正 AI 的路上」,现在走得并不远,在出发点附近,人工智能永远在路上,大家要有思想准备,这就是人工智能的魅力。大家为什么这么重视人工智能?因为我们永远在路上,这就吸引我们去解决这些问题,这些问题一旦解决了,人类的社会进步、人类的生活就会发生本质上的改变。

    最后我用中文写最后一段作为总结,可惜我翻译不了。
    周穆王西巡狩,路遇匠人名偃师。翌日偃师谒见王,偕来一个假人。「趋步俯仰,信人也」。「领其颅,则歌合律;捧其手,则舞应节。千变万化,惟意所适。王以为实人也,与盛姫内御并观之,技将终,倡者瞬其目而招王之左右侍妾。王大怒,要杀这个偃师。偃师大慑,立剖其倡者以示王,皆傅会革、木、胶、漆、白 、黑、丹、青之所为。穆王始悦,诏贰车载之以归。

    这是 3000 年前我们古人对机器人的想象,看看现在的人工智能做得怎么样呢?索菲亚是我们现在达到的水平,可是她不会唱歌、不会跳舞,只会说英文,周王也听不懂,肯定没有印象。现在我们假设索菲亚「瞬其目而招王之左右侍妾」,向周王的姨太太们送去秋波,王会如何呢?我认为没反应,因为索菲亚是女的,他用不着吃醋。但是我们假设索菲亚「瞬其目而招王」,向大王送去秋波,王会大悦,立即神魂颠倒,坠入爱河?我认为不会,因为索菲亚根本不像人,它最近才刚刚安上手脚,走路都不利索,怎么行呢?所以我的结论是,「索菲亚通不过穆王的测试,当然它更通不过图灵测试」。

    我们的结论是什么?人工智能刚刚起步,离真正的 AI 还很遥远,大家共同努力吧,我们任重道远。

    来源:经济观察报

    展开全文
  • 人工智能

    千次阅读 多人点赞 2019-08-09 19:03:15
    人们在日常生活中接触人工智能的频率越来越高,有可以帮用户买菜的京东智能冰箱;可以做自动翻译的机器;还有Siri、Alexa和Cortana这样的机器人助理;以及无人车、AlphaGo等已经把人工智能技术带到了“看得到摸得着...

    人们在日常生活中接触人工智能的频率越来越高,有可以帮用户买菜的京东智能冰箱;可以做自动翻译的机器;还有Siri、Alexa和Cortana这样的机器人助理;以及无人车、AlphaGo等已经把人工智能技术带到了“看得到摸得着”的境地。人工智能正以前所未有的态势汹涌而来,相关领域的融资总额一直在逐年稳步增长,到2016年达到数十亿美元的火爆程度。那么人工智能到底是什么?这个领域涉及哪些方面?人工智能要完成的目标和任务有哪些?接下来的内容将做一一介绍。

    1.什么是人工智能
    Alan Turing定义的AI是:能使计算机完成那些需要人类智力才能完成的工作的科学。斯坦福大学的学者认为AI是智能机器的科学和工程,特别是智能计算机程序。维基百科定义AI是指由人工制造出来的系统所表现出来的智能,该词同时也指研究这样的智能系统是否能够实现,以及如何实现的科学领域。不管怎样定义,都离不开智能,然而到目前为止人类还没能统一地给出智能的定义,通常所说的智能也只是参考人类智慧的表现形式。原中国人工智能学会理事长钟义信教授,认为人类智慧包含发现问题、定义问题、解决问题三方面,而人工智能目前只做到了解决问题的程度。笔者认为智能是一种有序,是信息的体现,也是使世界朝着有序的方向发展的能力。可悲的是,根据熵增原理,无论智能体做怎样的努力,整个宇宙总是朝着熵增加的方向发展,即越来越无序和混乱。不知道这是上帝故意的安排,还是人类观察到的宇宙之外另有天地。

    2.人工智能的历史
    1950 年代初期,人工智能聚焦在所谓的强人工智能,希望机器可以像人一样完成任何智力任务。强人工智能的发展止步不前,导致了弱人工智能的出现,即把人工智能技术应用于更窄领域的问题。1980 年代之前,人工智能的研究一直被这两种范式分割着,两营相对。但是,1980 年左右,机器学习开始成为主流,它的目的是让计算机具备学习和构建模型的能力,从而它们可在特定领域做出预测等行为。、
    在这里插入图片描述

    历史上人工智能有三大学派:符号主义(symbolicism),又称为逻辑主义(logicism)、心理学派(psychologism)或计算机学派(computerism),其原理主要为物理符号系统(即符号操作系统)假设和有限合理性原理。连接主义(connectionism),又称为仿生学派(bionicsism)或生理学派(physiologism),其主要原理为神经网络及神经网络间的连接机制与学习算法。行为主义(actionism),又称为进化主义(evolutionism)或控制论学派(cyberneticsism),其原理为控制论及感知-动作型控制系统。

    符号主义认为人工智能源于数理逻辑。其早在1956年首先采用“人工智能”这个术语。后来又发展了启发式算法->专家系统->知识工程理论与技术,并在20世纪80年代取得很大发展。

    连接主义认为人工智能源于仿生学,特别是对人脑模型的研究。20世纪60~70年代,连接主义对以感知机(perceptron)为代表的脑模型的研究出现过热潮,由于受到当时的理论模型、生物原型和技术条件的限制,脑模型研究在20世纪70年代后期至80年代初期落入低潮。直到Hopfield教授在1982年和1984年发表两篇重要论文,提出用硬件模拟神经网络以后,连接主义才又重新抬头。1986年,鲁梅尔哈特(Rumelhart)等人提出多层网络中的反向传播算法(BP)算法。此后又有卷积神经网络(CNN)的研究,连接主义势头大振,从模型到算法,从理论分析到工程实现,为神经网络计算机走向市场打下基础。2006年,Hinton在《Science》和相关期刊上发表了论文,首次提出了深度信念网络(DBN)的概念,将深度学习推向学术界并成为当前人工智能领域非常热门的研究方向。
    在这里插入图片描述
    行为主义认为人工智能源于控制论。控制论思想早在20世纪4050年代就成为时代思潮的重要部分,影响了早期的人工智能工作者。维纳(Wiener)和麦克洛克(McCulloch)等人提出的控制论和自组织系统以及钱学森等人提出的工程控制论和生物控制论,影响了许多领域。控制论把神经系统的工作原理与信息理论、控制理论、逻辑以及计算机联系起来。早期的研究工作重点是模拟人在控制过程中的智能行为和作用,如对自寻优、自适应、自镇定、自组织和自学习等控制论系统的研究,并进行“控制论动物”的研制。到20世纪6070年代,上述这些控制论系统的研究取得一定进展,播下智能控制和智能机器人的种子,并在20世纪80年代诞生了智能控制和智能机器人系统。行为主义是20世纪末才以人工智能新学派的面孔出现的,引起许多人的兴趣。这一学派的代表作者首推布鲁克斯(Brooks)的六足行走机器人,它被看作是新一代的“控制论动物”,是一个基于感知-动作模式模拟昆虫行为的控制系统。

    3.人工智能的目标
    人工智能的目标包括:推理、知识表示、自动规划、机器学习、自然语言理解、计算机视觉、机器人学和强人工智能八个方面。知识表示和推理包括:命题演算和归结,谓词演算和归结,可以进行一些公式或定理的推导。自动规划包括机器人的计划、动作和学习,状态空间搜索,敌对搜索,规划等内容。机器学习这一研究领域是由AI的一个子目标发展而来,用来帮助机器和软件进行自我学习来解决遇到的问题。自然语言处理是另一个由AI的一个子目标发展而来的研究领域,用来帮助机器与真人进行沟通交流。计算机视觉是由AI的目标而兴起的一个领域,用来辨认和识别机器所能看到的物体。机器人学也是脱胎于AI的目标,用来给一个机器赋予实际的形态以完成实际的动作。

    在这里插入图片描述
    人工智能、机器学习、数据挖掘这些非常相关的术语或知识我们经常看到,也见到很多关于三者关系的文章和讨论。一般来说,人工智能是一个很大的研究领域;机器学习是人工智能的一个目标,提供很多算法;而数据挖掘是偏向算法应用的部分。三者相辅相成,另外也需要其他领域的知识支持。具体关系请参考下图。
    在这里插入图片描述
    4.人工智能的方法
    为了达到人工智能的目标,下面依次梳理一下学术和工业界研究的各种方法和成果。

    4.1 知识的表示和推理
    知识表示包括:基于知识的系统,表示常识知识等。传统的知识表示已经很成熟了,包括了描述逻辑,也包括了语义网(资源描述框架RDF)。知识推理建立在逻辑上,首先需要庞大的数据集,比如freebase;其次需要关系抽取自动化工具;最后需要合理的知识存储结构,比如资源描述框架RDF。谷歌提的知识图谱概念就是一种知识工程,它有庞大的知识库和基于知识库的各种服务。早年业界研究的知识本体也是一种知识工程,研究成果有 FrameNet、WordNet、中文知网HowNet等。具体的知识本体的例子请参考下图。
    在这里插入图片描述
    IBM在2011年研发了Watson问答系统。谷歌在2012年提出知识图谱,作为谷歌的两大重要技术储备,一个是深度学习,形成了谷歌大脑;另一个就是知识图谱,用来支撑下一代搜索和在线广告业务。脸谱公司利用知识图谱技术构建兴趣图谱,用来连接人、分享的信息等,并基于此构建了graph search。其他的工业应用还有:SIRI、EVI、Google Now、Dbpedia、 freebase等。一般一个知识工程的底层技术架构,请参考以下图示。
    在这里插入图片描述
    4.2 自动规划
    首先要说一下有限状态机(FSM),一般应用于游戏机器人,网络协议,正则表达式,词法语法分析,自动客服等。如下图是一个简单的游戏机器人状态转移和行动图。
    在这里插入图片描述
    其次是状态空间搜索,最简单粗暴的是盲目搜索,就像特斯拉评价爱迪生:“如果说有一根针掉进草垛了,让他去找,他会毫不犹豫的,一根一根草挑出来找”。优化改进的版本是启发式搜索,如A*算法。这方面的应用有国际象棋Deepblue,围棋AlphaGo。AlphaGo 在蒙特卡洛树搜索 (Monte Carlo Tree Search, MCTS) 基础上使用了深度学习,监督学习和增强学习等方法。“蒙特卡洛树搜索”是一类启发式的搜索策略,能够基于对搜索空间的随机抽样来扩大搜索树,始终保证选取当前抽样中的最优策略从而不断接近全局最优,确定每一步棋应该怎么走才能够创造更好机会。另外还包括:计划、动作和学习,敌对搜索,基于逻辑的规划方法,状态演算等内容。在这里插入图片描述
    4.3 机器学习
    谷歌CEO桑德尔·皮蔡在一封致股东信中,把机器学习誉为人工智能和计算的真正未来,可想而知机器学习在人工智能研究领域的重要地位。机器学习的方式包括:有监督学习、无监督学习、半监督学习和强化学习。其中的算法有:回归算法(最小二乘法、LR等),基于实例的算法(KNN、LVQ等),正则化方法(LASSO等),决策树算法(CART、C4.5、RF等),贝叶斯方法(朴素贝叶斯、BBN等),基于核的算法(SVM、LDA等),聚类算法(K-Means、DBSCAN、EM等),关联规则(Apriori、FP-Grouth),遗传算法,人工神经网络(PNN、BP等),深度学习(RBN、DBN、CNN、DNN、LSTM、GAN等),降维方法(PCA、PLS等),集成方法(Boosting、Bagging、AdaBoost、RF、GBDT等)。想要深入学习的同学请参考《机器学习知识表格》和《机器学习方法汇总》。

    深度学习是机器学习中人工神经网络算法的延伸和发展,近期深度学习的研究非常火热,就在这里介绍一下神经网络和深度学习。先说两层网络,如下图,其中a是“单元”的值,w表示“连线”权重,g是激活函数,一般为方便求导采用sigmoid函数。采用矩阵运算来简化图中公式:a(2) = g( a(1) * w(1) ), z = g( a(2) * w(2) )。设训练样本的真实值为y,预测值为z,定义损失函数 loss = (z – y)2,所有参数w优化的目标就是使对所有训练数据的损失和尽可能的小,此时这个问题就被转化为一个优化问题,常用梯度下降算法求解。一般使用反向传播算法,从后往前逐层计算梯度,并最终求解各参数矩阵。
    在这里插入图片描述
    深度学习采用多层神经网络,在求解参数矩阵时计算量随层数呈指数上升。假设处理一张300300像素的图片,采用8层网络,每层6个节点,那么在全联接的情况下将有300300*6^8个参数需要计算求解。卷积神经网络(CNN)提出卷积算子和权值共享来大幅减少参数个数。另外一个问题是梯度弥散,由于sigmoid函数求导后的函数小于0.25,标准化正态分布产生的初始随机参数w也都在0-1之间。而各层的梯度是从后往前逐层求解,且前面层的梯度是来自后面层的值乘积。因此会有一个剃度指数,一旦初始值小于1,经过多层乘积后将会迅速变小。一个有效的解决方案是使用ReLU做激活函数。介于篇幅这里只做简介,想要深入了解深度学习的同学请参考《一文读懂深度学习》。
    在这里插入图片描述
    4.4 自然语言处理NLP

    NLP是人工智能的另一个目标,用于分析、理解和生成自然语言,以方便人和计算机设备进行交流,以及人与人之间的交流。它的应用领域包括:机器翻译,文本、语音、图片转换,聊天机器人,自动摘要,情感分析,文本分类,信息提取等。以下给出了自然语言处理简要的知识架构图。
    在这里插入图片描述
    4.5 机器人视觉
    视觉对人很重要,人类获得讯息90% 以上是依靠眼睛的,那么对于机器人要想获得人获取信息的能力,重点是解决机器人视觉系统。目前机器视觉已经可以做到很多事情,比如识别人脸、标志和文字;探测物体并了解其环境的应用,如自动驾驶无人车等;检测的事件,对视频监控和人数统计;组织信息,如对于图像和图像序列的索引数据库;造型对象或环境,医学图像分析系统或地形模型;自动检测,如在制造业的应用程序。

    4.6 机器人学和强人工智能
    机器人学是一个交叉学科,主要研究包括环境适应机器仿生,机器人自主行为,人机协作,微纳操作机器人,制造装备机器人、科学工程机器人、服务型机器人等。目前国内的机器人行业还没有形成规模,商业化做得好的比如大疆、沈阳新松机器人公司。

    强人工智能是人工智能研究的最主要目标之一,强人工智能也指通用人工智能(artificial general intelligence,AGI),或具备执行一般智慧行为的能力。强人工智能通常把人工智能和意识、感性、知识和自觉等人类的特征互相连结。实现强人工智能至少需要拥有以下能力:

    自动推理,使用一些策略来解决问题,在不确定性的环境中作出决策;
    知识表示,包括常识知识库;
    自动规划;
    学习;
    使用自然语言进行沟通;
    整合以上这些手段来达到同一个的目标。
    目前的强人工智能主要出现在电影或小说里,比如斯皮尔伯格导演的《人工智能》里面的机器男孩大卫。

    最后,再回到人类智慧和人工智能的讨论上,人类智慧是人类的“隐性智慧”与“显性智慧”相互作用相互促进相辅相成的能力体系。其中,“隐性智慧”主要是指人类发现问题和定义问题从而设定工作框架的能力,由目的、知识、直觉能力、抽象能力、想象能力、灵感能力、顿悟能力和艺术创造能力所支持,具有很强的内隐性,因而不容易被确切理解,更难以在机器上进行模拟;“显性智慧”主要是指人类在隐性智慧所设定工作框架内解决问题的能力,依赖于收集信息、生成知识和创生解决问题的策略并转换为行动等能力的支持,具有较为明确的外显性,因而有可能被逐步理解并在机器上模拟出来。目前几乎所有的人工智能都只能模仿人类的解决问题的能力,而没有发现问题、定义问题的能力。因此,“人工智能将全面超越人类智慧”的说法没有科学根据,目前的人工智能只是帮助人类提高生产力的工具而已。

    展开全文
  • 人工智能:进阶超级大牛「一课通」
  • 人工智能教程 - 目录

    万次阅读 多人点赞 2019-09-03 23:01:09
    目录 请先点击下面查看序言 序言 1 神经网络与深度学习 1.1 介绍神经网络 1.1.1 什么是神经网络 1.1.2 监督学习型神经网络 1.1.3 什么使深度学习火起来了 1.2 神经网络基础 ...1

    目录

    请先看前言

    前言

    1 人工智能

    1.1 科普

    1.1.1 什么是神经网络

    1.2 基础知识

    1.2.1 如何将数据输入到神经网络中

    1.2.2 神经网络是如何进行预测的

    1.2.3 神经网络如何判断自己预测得是否准确

    1.2.4 神经网络是如何进行学习的

    1.2.5 计算图

    1.2.6 如何计算逻辑回归的偏导数

    1.2.7 向量化

    1.2.8 如何开始使用python

    1.2.9 如何向量化人工智能算法

    1.2.10 [实战编程]教你编写第一个人工智能程序

    1.3 初级神经网络

    1.3.1 浅层神经网络

    1.3.2 如何计算浅层神经网络的前向传播

    1.3.3 如何计算浅层神经网络的反向传播

    1.3.4 为什么需要激活函数

    1.3.5 常见的激活函数

    1.3.6 激活函数的偏导数

    1.3.7 随机初始化参数

    1.3.8 [实战编程]教你编写浅层神经网络

    1.4 深度神经网络

    1.4.1 为什么需要深度神经网络

    1.4.2 如何计算深度神经网络

    1.4.3 核对矩阵的维度

    1.4.4 参数和超参数

    1.4.5 [实战编程] 构建深度神经网络

    2 实战优化

    2.1 实战基础

    2.1.1 如何配置数据集

    2.1.2 欠拟合和过拟合

    2.1.3 如何解决欠拟合与过拟合

    2.1.4 L2正则化

    2.1.5 dropout

    2.1.6 数据增强

    2.1.7 将输入特征进行归一化处理

    2.1.8 梯度消失和梯度爆炸

    2.1.9 梯度检验

    2.1.10 [实战编程] 构建实战神经网络

    2.2 优化算法

    2.2.1 Mini-batch 梯度下降

    2.2.2 如何为mini-batch选择合理的大小

    2.2.3 指数加权平均

    2.2.4 理解指数加权平均

    2.2.5 指数加权平均的偏差修正

    2.2.6 momentum梯度下降

    2.2.7 RMSprop

    2.2.8 Adam优化算法

    2.2.9 学习率衰减

    2.2.10 局部最优问题

    2.2.11 [实战编程] 优化神经网络

    2.3 调试神经网络

    2.3.1 调试处理

    2.3.2 为调参选择采样标尺

    2.3.3 调参技巧的通用性和超参数的过时性

    2.3.4 调参模式

    2.3.5 归一化隐藏层

    2.3.6 归一化隐藏层的好处

    2.3.7 使用模型时的隐藏层归一化

    2.3.8 Softmax 回归

    2.3.9 深入理解softmax

    2.3.10 如何选择深度学习框架

    2.3.11 手把手教你使用tensorflow

    2.3.12 [实战编程] 使用框架构建神经网络

    3 深度学习项目实战

    3.1 项目实战一

    3.1.1 决策很重要

    3.1.2 正交化

    3.1.3 如何判断哪个网络更好?——单一数值指标

    3.1.4 如何判断哪个网络更好?——优化指标和满足指标

    3.1.5 验证集与测试集的数据来源要一致

    3.1.6 如何决定数据集的大小?

    3.1.7 判定标准是可以变的

    3.1.8 AI能力与人类能力的关系

    3.1.9 利用贝叶斯误差来判断拟合度

    3.1.10 人类误差是多少呢?

    3.1.11 AI超越人类

    3.1.12 提升AI系统的一般流程

    3.1.13 [实战编程] 大项目神经网络

    3.2 实战项目二

    3.2.1 手工分析错误

    3.2.2 同时手工分析多个错误类别

    3.2.3 错误标签

    3.2.4 如何修正错误标签

    3.2.5 快速地构建一个简单的系统

    3.2.6 训练集与验证集的来源不一致

    3.2.7 异源时的拟合度分析

    3.2.8 不常用的误差分析

    3.2.9 如何解决异源问题

    3.2.10 迁移学习

    3.2.11 如何实现迁移学习

    3.2.12 什么时候才应该使用迁移学习?

    3.2.13 多任务学习

    3.2.14 [实战编程] 优化大项目

    4 人脸识别

    4.1 智能视觉

    4.1.1 智能视觉

    4.1.2 卷积运算

    4.1.3 边缘检测

    4.1.4 深入理解边缘检测

    4.1.5 padding

    4.1.6 卷积步长

    4.1.7 3D卷积

    4.1.8 多过滤器

    4.1.9 卷积层

    4.1.10 卷积神经网络

    4.1.11 池化层

    4.1.12 池化层(二)

    4.1.13 一个较完整的卷积网络

    4.1.14 卷积的好处

    4.1.15[实战编程] 构建简单的人脸识别程序

    4.2 深度卷积网络

    4.2.1 学习一些牛逼的例子

    4.2.2 LeNet-5

    4.2.3 AlexNet

    4.2.4 VGG

    4.2.5 残差网络

    4.2.6 为什么残差网络能防止梯度问题

    4.2.7 1×1卷积

    4.2.8 Inception网络

    4.2.9 inception网络与1×1卷积

    4.2.10 完整的inception网络

    4.2.11 学会利用开源项目

    4.2.12 [实战编程] 优化人脸识别程序

    4.3 目标检测

    4.3.1 目标定位

    4.3.2 特征点检测

    4.3.3 目标检测

    4.3.4 卷积的滑动窗口实现

    4.3.5 Bounding Box预测

    4.3.6 交并比

    4.3.7 非极大值抑制

    4.3.8 Anchor Boxes

    4.3.9 YOLO 算法

    4.3.10 候选区域

    4.3.11 [实战编程] 构建商用人脸识别程序

    4.4 油画风格转换

    4.4.1 什么是转换?

    4.4.2 One-Shot学习

    4.4.3 Siamese 网络

    4.4.4 Triplet 损失

    4.4.5 风格验证与二分类

    4.4.6 什么是神经风格转换?

    4.4.7 什么是深度卷积网络?

    4.4.8 代价函数

    4.4.9 内容代价函数

    4.4.10 风格代价函数

    4.4.11 一维到三维推广

    4.4.12 [实战编程] 构建风格转换程序

    5 语音识别

    5.1 循环序列模型

    5.1.1 为什么选择序列模型?

    5.1.2 数学符号

    5.1.3 循环神经网络模型

    5.1.4 通过时间的反向传播

    5.1.5 不同类型的循环神经网络

    5.1.6 语言模型和序列生成

    5.1.7 对新序列采样

    5.1.8 循环神经网络的梯度消失

    5.1.9 GRU单元

    5.1.10 长短期记忆

    5.1.11 双向循环神经网络

    5.1.12 深层循环神经网络

    5.1.13 [实战编程]构建简单的语音识别程序

    5.2 自然语言处理与词嵌入

    5.2.1 词汇表征

    5.2.2 使用词嵌入

    5.2.3 词嵌入的特性

    5.2.4 嵌入矩阵

    5.2.5 学习词嵌入

    5.2.6 Word2Vec2.7 负采样

    5.2.8 GloVe 词向量

    5.2.9 情绪分类

    5.2.10 词嵌入除偏

    5.2.11 [实战编程] 优化语音识别程序

    5.3 序列模型和注意力机制

    5.3.1 基础模型

    5.3.2 选择最可能的句子

    5.3.3 集束搜索

    5.3.4 改进集束搜索

    5.3.5 集束搜索的误差分析

    5.3.6 Bleu 得分

    5.3.7 注意力模型直观理解

    5.3.8注意力模型

    5.3.9语音识别

    5.3.10触发字检测

    5.3.11 [实战编程] 构建商用语音识别

    6 生成对抗网络GANs

    7 自动驾驶

    8 强化学习

    9 无监督学习

    10 人工大脑

    展开全文
  • 人工智能人工智能资料汇总(百度云盘)

    万次阅读 多人点赞 2017-04-28 11:02:59
    人工智能人工智能资料汇总(百度云盘) https://mp.weixin.qq.com/s/9NotiYPjXk4ImE8G1egJZg ———————————————————————————————————— 仅做个人学习交流,如有版权问题,...
  • 人工智能杂记》人工智能时间简史

    万次阅读 多人点赞 2018-03-13 08:54:55
    1人工智能基本概念 人工智能(Artificial Intelligence,AI)是指计算机像人一样拥有智能能力,是一个融合计算机科学、统计学、脑神经学和社会科学的前沿综合学科,可以代替人类实现识别、认知,分析和决策等多种...
  • 人工智能杂记 人工智能简史

    万次阅读 2019-07-05 15:39:33
    人工智能杂记 人工智能简史
  •   人工智能( Arti ticial Intelligence ) ,也称为机器智能,是指白人工制造出来的系统所表现的智能,所谓的智能,即指可以观察周围环境井据此做出行动以达到目的.   在人工智能的早期,那些对人类智力来说非常...
  • 人工智能,进来热点不断,似乎都在蹭热点,但其实早在前几年,欧美部分地区是比较注重这一块的,那么有个地方应该是比较低调的,那就是浪漫之都——法国 France。 Γ(n)=(n−1)!∀n∈N\Gamma(n) = (n-
  • AI:2020年7月10日世界人工智能大会WAIC青少年人工智能创新发展论坛《人工智能从娃娃抓起》 导读:教育是生态系统,包括北大清华的本硕博正在逐设人工智能课程,五年以后,中国将会迈向人工智能大国,进而走向...
  • 其实AI技术被区分为弱人工智能、通用人工智能、超级人工智能三种模式,弱人工智能也被称为狭义人工智能,是专攻某一领域的人工智能,比如一种AI能在国际象棋比赛中打败世界冠军,例如在围棋上大放异彩的AlphaGo都...
  • AGI:走向通用人工智能的【哲学】之现实世界的虚拟与真实——带你回看1998年的经典影片《The ...当下的人工智能还是属于弱人工智能,要想走向强人工智能,必须要解决通用人工智能的问题,要想解决通用人工智能,还是要
  • 初识人工智能——人工智能的冷落与兴起

    万次阅读 多人点赞 2018-11-14 21:42:41
    今天开始慢慢进入人工智能的介绍与算法网络等的实现的“传送期”,希望大家能够喜欢! 好,揭幕!! 一、人工智能介绍 什么是人工智能?可能是大家一开始最想了解的。 大家看图中关于人工智能的定义。通俗点来说呢...
  • 人工智能架构

    千次阅读 多人点赞 2017-06-07 21:12:55
    人工智能
  • 嵌入式与人工智能关系_嵌入式人工智能的发展趋势

    万次阅读 多人点赞 2019-04-09 17:00:43
    嵌入式与人工智能关系_嵌入式人工智能的发展趋势  所谓嵌入式人工智能,就是设备无须联网通过云端数据中心进行大规模计算去实现人工智能,而是在本地计算,在不联网的情况下就可以做实时的环境感知、人机交互、...
  • 毕竟现在是数字化,信息化的时代,人工智能越来越流行,越来越先进也是无可厚非的,但是现阶段,人工智能的发展还是存在局限性呢,不过未来发展成什么样子呢,说实话,谁也说不上来,科技充满了无限的...
  • 一文读懂人工智能产业链:基础技术、人工智能技术及人工智能应用     概要:针对人工智能产业链,主要有三个核心:基础技术、人工智能技术及人工智能应用,本文将从主要从这三个方面进行梳理 人工智能...
  • 漫画人工智能人工智能简史

    千次阅读 2019-04-09 16:35:00
    欢迎关注天善智能,我们是专注于商业智能BI,人工智能AI,大数据分析与挖掘领域的垂直社区,学习,问答、求职一站式搞定! 对商业智能BI、大数据分析挖掘、机器学习,python,R等数据领域感兴趣的同学加微信:...
  • c++与人工智能

    千人学习 2019-02-27 19:30:50
    2、C++技术与人工智能在主流行业中的已有应用 3、从算法到人工智能::如何真正实现随机生成?来自扫雷游戏的启示 4、智能语音应答的技术解决方案:QQ自动聊天是如何实现的 5、Python人工智能...
  • 人工智能时代,所需要了解人工智能的基本常识

    万次阅读 多人点赞 2018-12-10 22:49:44
    国内对于人工智能的讨论大多是不成体系的碎片式,很难从中深入了解人工智能的发展脉络和技术体系,也很难有实际借鉴意义。人工智能的历史、核心技术和应用情况进行了详细说明,尤其是其中重要的认知技术。这份报告将...
  • 前言 下面是自己总结一套人工智能机器学习整个知识体系,一起学习,有总结不到位的希望大家给出纠正!...一 人工智能基础语法篇人工智能基础语法篇二 人工智能中级篇人工智能中级篇三 人工智能高级算法篇

空空如也

1 2 3 4 5 ... 20
收藏数 139,008
精华内容 55,603
关键字:

人工智能