计算机网络技术读书笔_大象thinking in uml 读书几笔 - CSDN
  • 网络层负责在不同网络之间尽力转发数据包,基于数据包的IP地址转发,如果丢包不负责丢失重传,也不负责传输顺序。网络设备及数据转发过程路由器是三层设备,因为它能看到网络层的地址,根据网络层地址去选择路由;...

    网络层

    负责在不同网络之间尽力转发数据包,基于数据包的IP地址转发,如果丢包不负责丢失重传,也不负责传输顺序。

    网络设备及数据转发过程

    路由器是三层设备,因为它能看到网络层的地址,根据网络层地址去选择路由;交换机是二层设备,也就是说它能够将比特流存储,然后看懂数据链路层上数据帧的控制信息中的MAC地址,根据数据帧上的MAC地址从而进行数据转发;集线器是工作在物理层的一层设备,只能进行比特流的转发,作用是能够延长比特流的传输距离,能够对信号进行放大。数据的发送通过应用层,交付给传输层,传输层将上层交付的数据划分为数据段并进行编号之后交付给网络层,网络层为其所谓的数据包增加源IP地址和目的IP地址之后再交付给下层数据链路层,数据链路层拿到了上层的数据包,为其增加源MAC地址和目的MAC地址后封装成数据帧再交付给下层,最后物理层将数据帧转换成比特流在物理线路上传输。数据的接收则是数据发送的逆过程,是一个拆包的过程。

    注意:数据链路层的数据帧的控制信息中,源IP地址和目的IP地址确定了数据的起点和终点,而物理MAC地址则是确定数据发送的起始设备和下一个设备的地址。


    网络层协议

    网络模型协议

    可以看出上图中网络层协议,分别是ARP协议、IP协议、ICMP协议、IGMP协议等,其中ARP协议为IP协议提供服务,IP协议为ICMP/IGMP协议提供服务,虽然都属于网络层协议,但是它们之间也存在上下层的关系,也有谁为谁服务的问题。


    ARP协议

    IP数据包常通过以太网发送。以太网设备并不识别32位IP地址:它们是以48位以太网地址传输以太网数据包的。因此,IP驱动器必须把IP目的地址转换成以太网网目的地址。在这两种地址之间存在着某种静态的或算法的映射,常常需要查看一张表。地址解析协议(Address Resolution Protocol,ARP)就是用来确定这些映象的协议。ARP工作时,送出一个含有所希望的IP地址的以太网广播数据包。目的地主机,或另一个代表该主机的系统,以一个含有IP和以太网地址对的数据包作为应答。发送者将这个地址对高速缓存起来,以节约不必要的ARP通信。

    1
    2
    3
    4

    我们由上图可知我们的ip地址inet为192.168.220.132,而本机子网掩码Mask是255.255.255.0,所以当ping不同网段比如上图的202.200.112.200时我们可以ping通,但是当我们使用arp -a命令发现无法解析不同网段的地址;当我们ping 192.168.220.2(同一网段)后,再使用arp -a命令,可以发现arp地址解析协议帮助我们完成解析了同一网段的192.168.220.2这个IP地址的MAC地址。所以这一点也证实了ARP协议是通过发送广播包实现解析目标IP地址的MAC地址的,并且广播包是不能跨路由的,所以仅适用于同一网段而不能跨网段。

    注意:
    绑定(修改)一个arp缓存可以使用命令arp -s [ip address] [mac address]

    ARP欺骗

    ARP欺骗(英语:ARP spoofing),又称ARP毒化(ARP poisoning,网络上多译为ARP病毒)或ARP攻击,是针对以太网络地址解析协议(ARP)的一种攻击技术。此种攻击可让攻击者获取局域网上的数据包甚至可篡改数据包,且可让网络上特定电脑或所有电脑无法正常连接。

    ARP欺骗的运作原理是由攻击者发送假的ARP数据包到网络上,尤其是送到网关上。其目的是要让送至特定的IP地址的流量被错误送到攻击者所取代的地方。因此攻击者可将这些流量另行转送到真正的网关(被动式数据包嗅探,passive sniffing)或是篡改后再转送(中间人攻击,man-in-the-middle attack)。攻击者亦可将ARP数据包导到不存在的MAC地址以达到阻断服务攻击的效果,例如netcut软件。

    例如某一的IP地址是192.168.0.254,其MAC地址为00-11-22-33-44-55,网络上的电脑内ARP表会有这一笔ARP记录。攻击者发动攻击时,会大量发出已将192.168.0.254的MAC地址篡改为00-55-44-33-22-11的ARP数据包。那么网络上的电脑若将此伪造的ARP写入自身的ARP表后,电脑若要通过网络网关连到其他电脑时,数据包将被导到00-55-44-33-22-11这个MAC地址,因此攻击者可从此MAC地址截收到数据包,可篡改后再送回真正的网关,或是什么也不做,让网络无法连接。

    简单案例分析:这里用一个最简单的案例来说明ARP欺骗的核心步骤。假设在一个LAN里,只有三台主机A、B、C,且C是攻击者。

    1. 攻击者聆听局域网上的MAC地址。它只要收到两台主机洪泛的ARP Request,就可以进行欺骗活动。
    2. 主机A、B都洪泛了ARP Request.攻击者现在有了两台主机的IP、MAC地址,开始攻击。
    3. 攻击者发送一个ARP Reply给主机B,把此包protocol header里的sender IP设为A的IP地址,sender mac设为攻击者自己的MAC地址。
    4. 主机B收到ARP Reply后,更新它的ARP表,把主机A的MAC地址(IP_A, MAC_A)改为(IP_A, MAC_C)。
    5. 当主机B要发送数据包给主机A时,它根据ARP表来封装数据包的Link报头,把目的MAC地址设为MAC_C,而非MAC_A。
    6. 当交换机收到B发送给A的数据包时,根据此包的目的MAC地址(MAC_C)而把数据包转发给攻击者C。
    7. 攻击者收到数据包后,可以把它存起来后再发送给A,达到偷听效果。攻击者也可以篡改数据后才发送数据包给A,造成伤害。

    防治方法:

    最理想的防制方法是网络内的每台电脑的ARP一律改用静态的方式,不过这在大型的网络是不可行的,因为需要经常更新每台电脑的ARP表。

    正当用途:

    ARP欺骗亦有正当用途。其一是在一个需要登录的网络中,让未登录的电脑将其浏览网页强制转向到登录页面,以便登录后才可使用网络。另外有些设有备援机制的网络设备或服务器,亦需要利用ARP欺骗以在设备出现故障时将讯务导到备用的设备上。

    arp参考文章
    https://www.ibm.com/developerworks/cn/linux/l-arp/index.html(ARP协议揭密)
    https://www.bbsmax.com/A/gAJGnRkbzZ/(Kali实现局域网ARP欺骗和ARP攻击)
    http://netsecurity.51cto.com/art/201303/386031.htm(中间人攻击——ARP欺骗的原理、实战及防御)
    https://www.bbsmax.com/A/D8547Le3JE/(记录利用ettercap进行简单的arp欺骗和mitm攻击过程)
    http://www.btfw.org/linux/127.html(ubuntu安装arpspoof)
    http://blog.csdn.net/nomad2/article/details/6254819( Linux 查看网关)

    展开全文
  • 本文是我最近读书笔记的一篇文章,主要是阅读《淘宝技术这十年》的第一部分,主要包括淘宝网的技术流程和基础介绍,希望文章对大家有所帮助,同时记录自己最近学习的内容。我似乎是2007年初中看《赢在中国》的时候...
            我似乎是2007年初中看《赢在中国》的时候喜欢上马云的,当时对电脑都不是很了解,更别提阿里巴巴和淘宝网了。但当时马云的几句点评还是深深地吸引了我,其中我印象最深的一句话就是“短暂的激情是不值钱的,只有长久的激情才是值钱的”,以至于我在本科毕业德育答辩时用的题目就是这句话(德育答辩开题我用的题目也是马云的《If
     not now,when? If not me,who?》其含义是如果不是现在努力,什么时候努力呢?如果不是为了自己奋斗,又是为谁奋斗呢?)。的确,想做成任何一件事都需要有持之以恒的努力;后来高中买了本书叫《谁认识马云》,作文中也经常用到他的例子作为论据,什么“今天很残酷,明天很残酷”。虽然我一直都喜欢马云,但也还没有达到那种盲目崇拜的地步,我更多的是喜欢他的那种做事的风格吧。而当今天的马云不断出现在聚光灯下之时,我也渐渐的更赞同还是需要脚踏实地的满怀激情的做自己喜欢的事情。
                                                                                                   ——Eastmount序 
            最近时间很充实,实习也还没有找,非常的茫然,所以决定多看点书,写点读书笔记吧!第一篇读书笔记是《淘宝技术这十年》的第一部分读后感,记录一些有用的知识,同时通过这本书能介绍些学过的知识或面试中可能出现的题目,文章还是非常有趣的,希望对大家有所帮助!

    一. 《你刚才在淘宝上买了一件东西》

            PS:首先讲述阿里员工卡特的文章《你刚才在淘宝上买了一件东西》。
            快要过年了,于是想给你的女朋友买一件毛衣,你打开了www.taobao.com。
            这时你的浏览器首先查询DNS服务器,将www.taobao.com转换成IP地址。
            不过你首先会发现,在不同的地区或不同的网络(电信、联通、移动)下,转换后的IP地址很可能是不一样的。这首先涉及到了负载均衡的第一步,通过DNS解析域名时,将你的访问分配到不同的入口,同时尽可能保证你所访问的入口是所有入口中可能较快的一个(这和后文的CDN不一样)。
            你通过这个入口成功地访问了www.taobao.com实际的入口IP地址,这是生了一个PVPage View,页面访问量。每日每个网站的总PV量是形容一个网站规模的重要指标。淘宝网全网在平日非促销期间的PV大概是16-25亿个之间)。同时作为一个独立的用户,你这次访问淘宝网的所有页面均算作一个UV(UniqueVisitor,用户访问)。
            因为同一时刻访问www.taobao.com的人数过于巨大,所以即便是生成淘宝首页页面的服务器,也不可能仅有一台,仅用于生成淘宝首页的服务器就可能有成百上千台,那么你的一次访问时生成页面给你看的任务便会分配给其中一台服务器完成。这个过程要保证公正、公平、平均(即这成百上千台服务器每台负担的用户数要差不多),这一很复杂的过程由几个系统配合完成,其中最关键的便是LVS(LinuxVirtual Server,世界上最流行的负载均衡系统之一)。
            经过一系列复杂的逻辑运算和数据处理,这次用于给你看的淘宝网首页的HTML内容便成功生成了。Web前端稍微有点常识的人都应该知道,浏览器下一步会加载页面中用到的CSSJSJavaScript)、图片等样式、脚本和资源文件。但是可能相对较少的人才会知道,你的浏览器在同一个域名下并发加载的资源数量是有限的,例如IE6和IE7是两个,IE8是6个,chrome个版本不同,一般是4-6个。我刚刚看了下,我访问淘宝首页需要加载126个资源,那么如此小的并发连接数自然会加载很久。
            所以前端开发人员往往会将上述这些资源文件分布在多个域名下,变相地绕过浏览器这个限制,同时也为下文的CDN工作做准备。
            据不可靠消息称,在2011年“双十一”当前高峰,淘宝的访问流量最巅峰达到871GB/s,这个数字意味着需要178万个4MB/s的家庭宽带才能负担得起,也完全有能力拖垮一个中小城市的全部互联网宽带。显然,这些访问浏览不可能集中在一起,并且不同地区、不同网络之间互访会非常缓慢,但是你却很少发现淘宝网访问缓慢,这便是CDNContentDelivery Network,即内容分发网络的作用)。淘宝在全国各地建立了数十个甚至上百个CDN节点,利用一些手段保证你访问的(这里主要指JS、CSS、图片等)站点是离你最近的CDN节点,这样便保证了大流量的分散以及在各地访问的加速。
            这便出现另一个问题,那就是假若一个卖家发布了一个新的宝贝,上传了几张新的宝贝图片,那么淘宝网如何保证全国各地的CDN节点中都会同步存在这几张图片共用户使用呢?
            这涉及大量的内容分发与同步的相关技术;另外,淘宝上拥有海量的宝贝图片等静态文件,这些文件的总容量也达到了数PB(1PB=1024TB),为了快速存取这些文件,淘宝开发了分布式文件系统TFSTaoBao File System)来处理这类问题。
            好了,此时你终于加载完成淘宝首页,然后习惯性地在首页搜索框中输入“毛衣”二字并按回车键,这时你又产生了一个PV,然后淘宝网的主搜索系统便开始为你服务,它首先对你输入的内容基于一个分词库进行分词操作。
            众所周知,英文是以词为单位的,词和词之间靠空格隔开,而中文是以字为单位,句子中所有的字连接起来才能描述一个意思。例如,英文句子“I am astudent”用中文表示则是“我是一个学生”。计算机可以很简单地通过空格知道student是一个单词,但是不太容易明白“学”、“生”两个字合起来才表示一个词。把中文的汉字序列切分成有意义的词,就是中文分词,有些人也称为切词。“我是一个学生”分词的结果是“我 是 一个 学生”。
            进行分词操作之后,还需要根据你输入的搜索词进行购物意图分析。用户进行搜索时常常有如下几类意图:
            1.浏览型:没有明确的购物对象和意图,边看变买,用户比较随意和感性。Query例如“2010年10大香水排行”、“2010年流行毛衣”、“zippo有多少种类?”
            2.查询型:有一定的购物意图,体现在对属性的要求上。Query例如:“适合老人用的手机”、“500元手表”
            3.对比型:已经缩小了购物意图,具体到某几个产品。例如:“诺基亚E71 E63”、“akg k450 px200”
            4.确定型:已经做了基本决定,重点考察某个对象。例如:“诺基亚N97”、“IBM T60”
            通过对你的购物意图的分析,主搜索会呈现出完全不同的结果。
            之后的数个步骤后,主搜索系统便会根据上述以及更多复杂的条件列出了搜索结果,这一切是由一千多台搜索服务器完成的。然后你开始逐一点击浏览搜索出的宝贝,查看宝贝详情页面。经常购物的亲们会发现,当你买过一个宝贝之后,即便商家多次修改宝贝详情页,你仍然能够通过“已买到的宝贝”查看当时的快照。这是为了防止商家对商品详情中承诺过的东西赖账不认。
            显然,对于每年数十亿甚至上百亿笔交易的商品详情快照进行保存和快速调用不是一件简单的事情。这其中又设计数套系统的共同协作,其中较为重要的是Tair(淘宝自行研发的分布式KV存储方案)。
            接下来,无论你是否真的进行了交易,你的这些访问行为都会如实地被系统记录下来,用于后续的业务逻辑和数据分析。这些记录中的访问日志记录便是最重要的记录之一,但是从前面我们得知,这些访问时分布在各个地区不同的服务器上的,并且由于用户众多,这些日志记录都非常庞大,达到TB级别也非常正常。
            那么,为了快速、及时、同步地传输这些日志数据,淘宝研发了TimeTunnel,用于进行实时的数据传输,然后交给后端系统进行计算报表等操作。
            你的浏览数据、交易数据以及其他很多数据记录均很被保留下来,使得淘宝存储的历史数据轻而易举地便达到了数十甚至更多个PB。如此巨大的数据量存储在阿里巴巴集团的数据仓库中,并且其中有些数据使用了压缩比高达1:120的极限存储技术。之后这些数据会通过一个叫做云梯的基于Hadoop的由3000多台服务器组成的超大规模数据系统,以及一个基于阿里巴巴集团自主研发的ODPS系统的数据系统,不断地进行分析和挖掘。
            淘宝从这些数据中能够知道小到你是谁,你喜欢什么,你的孩子几岁了,你是否在谈恋爱,喜欢玩魔兽世界的人喜欢什么样的饮料等,大到各行各业的零售情况、各类商品的兴衰等海量信息。
            说了这么多,其实也只是叙述了淘宝上正在运行的成千上万个系统中的寥寥几个。即便是你仅仅访问一次淘宝的首页,所涉及的技术和系统规模都是你完全无法想象的,是淘宝2000多名顶级的工程师们的心血结晶,其中甚至包括长江学者、国家科学技术最高奖得主等众多牛人。
            同样,百度、腾讯等的业务系统也绝不比淘宝简单。你需要知道的是,你每天使用的互联网产品看似简单易用,背后却凝聚着难以想象的智慧与龙洞。


            PS:从这篇文章中我看到了很多东西,包括网络DNS域名等,让我想到的是网络五层协议和一个题目”描述从中国北京传输到美国纽约的网络流程?“;同时也看到了网络访问量PV知识、Web前端技术、CND分发和资源分配;还有中文分词、LTP和一个电话面试题目”请描述搜索引擎的工作流程?“等知识。这是非常好的一篇技术文章描述淘宝网的。

    二. 淘宝网的来源

            2003年4月7日,马云在杭州成立了一个神秘的组织。布置的任务是在最短的时间内做出一个个人对个人(C2C)的商品交易的网站。这里出一个问题考考大家,看你适不适合做淘宝的创业团队:亲,要是让你来做,你怎么做?
            在说出这个答案之前,先介绍这个创业团队的成员:三个开发工程师(虚竹、三丰、多隆)、一个UED工程师(二当家)、三个运营工程师(小宝、阿珂、破天)、一个经理(财神),以及马云和他的秘书。
            当时对整个项目压力最大的是时间,火云邪神先生说过“天下武功无坚不破,唯快不破”,同时当时eBay和易趣在资本方面打得不可开交。淘宝2003年5月10日上线,在这一个月时间怎么做呢?答案是“买一个来”。
            买了这样一个架构的网站LAMP(Linux+Apache+MySQL+PHP),这个知道现在还是一个很常用的网站架构模型,其优点是无须编译,发布快速,PHP语言功能强大,能做从页面渲染到数据访问所有的事情,而且用到的技术都是开源、免费的。
            当时我们从一个美国人那里买到的一个网站系统叫做PHPAuction(Auction即拍卖),对方提供了源代码。买来之后不是直接就能用,需要本地化修改,如修改数据类型,增加后台管理功能,页面模板修改,增加自己的网点简介。
            其中最有技术含量的是对数据库进行了一个修改,原来是从一个数据库进行所有的读写操作,现在把它拆分成一个主库、两个从库,并且读写分离。这么做的好处有几点:存储容量增加了,有了备份,使得安全性增加了,读写分离使得读写效率得以提升(写要比读更加消耗资源,分开后互不干扰)。整个系统的架构如下图所示:

            其中pear DB是一个PHP模块,负责数据访问层。另外他们也用开源的论坛系统PHPBB搭建了一个小的论坛社区,在当时论坛几乎是所有网站的标配。
            虚竹负责机器采购、配置、架设等,三丰和多隆负责编码,他们把交易系统和论坛系统的用户信息打通,给运营人员开发出后台管理的功能(Admin系统),把交易类型从只有拍卖这一种增加为拍卖、一口价、求购商品、海报商品四种。
            在开发过程中,这个项目的代号是BMW,因为二当家非常喜欢宝马,希望我们的网站像宝马一样漂亮、快速、安全,充满乐趣。在上线的时候需要给这个网站取个名字,为了不引起eBay的注意,这个名字需要撇开和阿里巴巴的关系,所以“阿里爷爷”、“阿里舅舅”之类的域名都是不能用的。美女阿珂提议名字“淘宝”。因为她家里人热爱收藏古董,经常去市场上淘宝,而她本人也非常热爱逛街,享受“淘”的乐趣,她觉得“淘宝”两字特别符合网站的定位(后来“支付宝”也是阿珂取得)。


            在非典时期大家都不敢出门,尤其是类似商场等人多的地方,同时神州大地上最早出现的C2C网站易趣也忙得不亦乐乎,后被eBay收购。当时淘宝网允许买卖双方留下联系方式,允许同城交易,整个操作过程简单轻松;而eBay是收费的,为了收取交易佣金,eBay禁止买卖双方这么做,增加了交易过程的难度。同时eBay为了全球统一,把易趣原来的系统替换成了美国eBay系统,用户体验全变了,操作起来非常麻烦丢失了很多用户。
           为了不引起eBay的注意,淘宝网在2003年里一直声称自己是一个“个人网站”,淘宝网发展非常迅猛,2003年年底就吸引了注册用户23万个,每日31万个PV,这没有引起eBay的注意,却引起了阿里巴巴内部很多员工的注意,他们觉得这个网站以后会成为阿里巴巴强劲的对手,甚至在内网发帖忠告管理层警惕,但管理层似乎却无动于衷。
           当时淘宝第一个版本的系统中已经包含了商品发布、管理、搜索、商品详情、出价购买、评价投诉、我的淘宝等功能(现在主流程中也是这些模块。在2003年10月增加了一个功能结点:“安全交易”,这是支付宝的雏形)。随着用户需求和流量的不断增加,系统做了很多日常改进,服务器最初的一台变成三台,一台负责发送Email、一台负责运行数据库、一台负责运行WebApp。
           一段时间之后,商品搜索的功能占用数据库资源太大了(用like搜索的,很慢),2003年7月,多隆又把阿里巴巴中文站的搜索引擎iSearch搬了过来。
           随着访问量和数据量的飞速上涨,问题很快就出来了,第一个问题出现在数据库上。MySQL当时是第4版的,我们用的是默认存储引擎MyISAM,这种存储引擎在写数据的时候会把表锁住。当时Master同步数据到Slave的时候,会引起Slave写,这样Slave的读操作都要等待。还有一点是会发生Slave上的主键冲突,经常会导致同步停止,这样你发布的一些东西命名已经成功了,但就是查询不到。另外,当年的MySQL不必如今的MySQL,在数据的容量和安全性方面也有很多先天不足(和Oracle相比)。



    三. 支付宝和旺旺的出现

            讲到这里,顺便先辟个谣,网上有很多这样骗转发的励志段:“1998年,马化腾等一伙人凑了50万元创办了腾讯,没买房;1998年,史玉柱借了50万元搞脑白金,没买房;1999年,丁磊用50万元创办了163.com,没买房;1999年,陈天桥炒股赚了50万元,创办盛大,没买房;1999年,马云等18人凑了50万元注册阿里巴巴,没买房。如果当年他们用这50万元买了房,现在估计还在还着银行的贷款吧。”
            事实上,阿里巴巴和淘宝网都是在马云自己的房子里创办的,阿里巴巴是1999年初发布上线的。所以关于马云买房的事情真相是这样的。
            淘宝网作为个人网站发展的时间并不长,由于它太引人注目了,马云在2003年7月就宣布这个是阿里巴巴旗下的网站,随后在市场上展开了很成功的推广运作。最著名的就是利用中小网站来做广告,突围eBay在门户网站上对淘宝的广告封锁。eBay买断了新浪、搜狐、网易等电子商务类型的广告,签署了排他性协议,切断淘宝在这上面做广告的路子。网站中经常见到的那些右下脚的弹窗和网站腰封上一闪一闪的广告。市场部那位到处花钱买广告的家伙太能花钱了,一出手就是几百万元,被称为“大少爷”。
            带来的是迅速上涨的流量和交易量。在2003年年底,MySQL已经支撑不住了,技术的替代方案非常简单,换成Oracle。原因除了它容量大、稳定、安全、性能高之外,还有人才方面的原因。
            在2003年阿里巴巴已经有一支很强大的DBA团队了,有鲁国良、冯春培、汪海(七公)这样的人物,还有冯大辉、陈吉平(拖雷)。这样的任务牛到什么程度呢?Oracle给全球的技术专家颁发头衔最高级别是ACE(就是扑克牌的“尖儿”),被授予这个头衔的人目前全球只有300多名,当年全球只有十几名,而阿里巴巴就有4名(阿里巴巴的首席数据库管理员(DBA)冯春培为甲骨文全球第100ACE)。有如此强大的技术后盾,把MySQL换成Oracle是顺理成章的事情。
            但更换数据库不是只换个库就可以的,其访问方式和SQL语法都要跟着变,最重要的是Oracle的性能和并发访问能力之所以强大有一个关键性的设计——连接池,连接池中方的是长连接,是进程级别的,在创建进程的时候,它就要独占一部分内存空间。
            也就是说,这些连接数在固定内存的OracleServer上是有限的,任何一个请求只需要从连接池中取得一个连接即可,用完后释放,这不需要频繁地创建和断开连接,而连接的创建和断开的开销是非常大的。但对于PHP语言来说,它对数据库的访问都是很直接的,每一个请求都要一个连接。如果是长连接,应用服务器增多时,连接数就多,就会把数据库拖挂;如果是短连接,频繁地连接后再断开,性能会非常差。那如何是好呢?
            多隆在网上找到一个开源的连接池代理服务SQL Relay,网址如下:
            http://sqlrelay.sourceforge.net
            多隆对这个能够提供连接池功能的东西进行了改进,系统的架构变成了如下形式:

            数据开始是放在本地的,七公带领的DBA们对Oracle做调优的工作,也对SQL进行调优。后来数据量变大后,本地存储无法满足了,买了NetApp 公司的NAS(NetworkAttached Storage,网络附属存储)作为数据库的存储设备,加上Oracle RAC来实现负载均衡。后来数据量变大,变成了购买小型机的道路。
            替完数据库后,在2004年春天他们在把数据的连接放在SQL Relay之后就噩梦不断,这个代理服务经常会死锁,如之前的MySQL死锁一样。虽然多隆做了很多修改,但当时那个版本内部处理的逻辑不对,问题很多,最快的解决办法就是“重启”它的服务。这在白天还好,只要连接上机房的服务器,把进程杀掉,然后开启就可以了;但是最痛苦的是它在晚上也要死掉,于是工程师需要24小时开机,一旦收到“SQL Relay进程挂起”的短信,就会重启。做这事最多的据说是三丰,他现在是淘宝网的总裁。现在我们知道,任何牛B的人物,都有一段苦B的经历。
            微博上有人说“好的架构是进化来的,不是设计来的”。的确如此,在架构的进化过程中,业务的进化也非常迅猛。最早买家打钱给卖家都是通过银行转账汇款,有些骗子收了钱却不发货甚至逃之夭夭。这是一个很严重的问题,淘宝网这伙人开始研究防骗子的解决方案,他们看了PayPal的支付方式,发现不能解决问题。研究了类似QQ币的东西,想弄出个“淘宝币”出来,发现也不行。后来几个聪明的想法黏合起来,想到了“担保交易”这种第三方托管资金的办法。于是淘宝网上线了一个功能“安全交易”,卖家如果选择支持这种功能,买家就会把钱交给淘宝网,等他收到货后淘宝网再把钱给卖家,这就是现在的“支付宝”。
            有人说淘宝打败易趣(eBay中国)是靠免费,其实这只是原因之一。如果说和易趣过招的第一招是免费,让用户无须成本就能进来,那么第二招就是“安全支付”,这让用户放心付款,不必担心被骗。而淘宝的第三招就是“旺旺”,淘宝旺旺是从阿里巴巴的“贸易通”复制过来砍价的。
            SQL Relay的问题搞得三丰等人很难睡个好觉,不能总这样通过不断地重启保证系统的稳定性。于是,2004年上半年开始,整个网站就开始了一个脱胎换骨的手术。下一篇文章将介绍第二部分,关于Java时代和创造技术。

            PS:最后还是希望文章对大家有所帮助,虽然文章中出现的很多涉及淘宝网的专业词汇我也不知道其技术是什么,但是还是能从《淘宝技术这十年 著:子柳》书中学到一些有用的知识。我主要是记录了其中自己认为比较好的文字复述出来,希望大家购买正版书籍阅读学习。
            (By:Eastmount 2015-4-20 夜5点   http://blog.csdn.net/eastmount/

    展开全文
  • 五. 挖掘频繁模式、关联和相关性 1. 基本概念  1).... 顾客可能会在一次购物同时购买哪些商品?分析结果可以用于营销计划和商店布局。... 2)....支持度:两种商品同时被购买占事务总数的比例,反映发现该规则的有用性 ...

    五. 挖掘频繁模式、关联和相关性

    1. 基本概念

     1). 一个典型例子:购物篮分析

    顾客可能会在一次购物同时购买哪些商品?分析结果可以用于营销计划和商店布局。

     2). 规则兴趣度的度量:支持度和置信度

    支持度:两种商品同时被购买占事务总数的比例,反映发现该规则的有用性

    置信度:购买一个商品的顾客中同时购买另一个商品的顾客所占比例,反映规则的确定性。

     

    项集:项的集合,如集合{computer,antivirus_software}是一个2项集

    支持度计数:项集的事务数

    频繁项集:相对支持度满足最小支持度阈值的项集

    闭频繁项集:项集X在数据集D中是闭的,如果不存在真超项集Y使得Y与X在D中具有相同的支持度计数,如果X在D中是闭的和频繁的,则X是数据集的闭频繁项集。

    极大频繁项集:X是频繁的,并且不存在超项集Y使得Y在D中是频繁的。

     

    关联规则的挖掘包含两步:

    1. 找出所有的频繁项集

    2. 由频繁项集产生强关联规则(同时满足最小支持度阈值和最小置信度阈值的规则)

     

     

    2. 频繁项集挖掘方法

    可以分为三类:类Apriori算法,基于频繁模式增长的算法(如FP-growth算法),使用垂直数据格式的算法

     

    1). Apriori算法(数据挖掘十大经典算法)

    频繁项集先验性质: 频繁项集的所有非空子集也一定是频繁的。

    基本思想:使用逐层搜索的迭代方法,其中k项集用于探索(k+1)项集,使用先验性质压缩搜索空间。

    如何使用L(k-1)找到L(k): 通过连接步和剪枝步完成。连接步通过将L(k-1)与自身连接产生候选k项集集合。剪枝步从候选k项集确定L(k)。

     

    提高Apriori算法效率:

    基于散列的技术:将事务产生的k项集散列到散列表的不同桶中,并增加相应桶计数,对应桶计数小于支持度阈值不可能是频繁的,可以从候选集中删除。这一技术可以显著地压缩需要考察的k项集

    事务压缩:不包含任何频繁k项集的事务不可能包含任何频繁(k+1)项集,因此在其后的考虑时,可以加上标记或删除。

     

    划分:分两个阶段,阶段一把D划分成n个分区,找出每个分区的局部频繁项集,组合所有局部频繁项集形成候选项集; 阶段二评估每个候选的实际支持度,找出候选项集中的全局频繁项集。整个过程只需要两次数据库扫描。

     

    抽样:基本思想是选取数据库D的随机样本S,然后再S中搜索频繁项集。这种方法牺牲了一些精度换取了有效性,可能会丢失一些全局频繁项集

     

    动态项集计数: 基本思想是奖数据库划分为用开始点标记的块。不像Apriori算法仅在每次完整的数据库扫描前确定新的候选,这种变形中,可以再任何开始点添加新的候选集。该变形需要的数据库扫描笔Apriori算法少。

     

    Apriori算法优缺点

    优点:显著压缩了候选项集的规模,产生很好的性能

    缺点:仍需要产生大量候选项集,需要重复扫描整个数据库

     

    2). 频繁模式增长(FP-growth)

    目标:挖掘全部频繁项集而无需代价昂贵的候选产生过程

    基本思想:采取分治策略,首先将频繁项集的数据库压缩到一棵频繁模式树(FP树),该树仍保留项集的关联信息。然后把压缩后的数据库划分成一组条件数据库,每个数据库关联一个频繁项或模式段,并分别挖掘每个条件数据库。随着被考察模式的增长,这种方法显著地压缩被搜索的数据集的大小。概括起来可分为构造FP树和挖掘FP树两个步骤。

     

    当数据库很大时,构造的FP数可能太大而不能放进主存,可以递归地将数据库划分成投影数据库集合。

     

    FP-growth方法对于挖掘长的频繁模式和短的频繁模式,都是有效的和可伸缩的,并且大约比Apriori算法快一个数量级。

     

    3). 使用垂直数据格式挖掘频繁项集

    Apriori算法和FP-growth算法都是使用水平数据格式,即{TID: itemset}, 其中TID为事务标识符,itemset是TID中购买的商品。

    垂直数据格式: {item: TID}

     

    基本思想:通过扫描一次数据库,把水平格式的数据转换成垂直格式,根据先验性质,使用频繁k项集来构造候选k+1项集,通过去频繁k项集的TID集的交,计算对应k+1项集的TID集,重复该过程,知道不能找到频繁项集或候选项集。

     

    优点:利用先验性质,不需要扫描数据库来确定k+1项集的支持度。

    缺点:TID集可能很长,需要大量内存,长集合的交运算还需要大量的计算时间。

     

    3. 模式评估

     

    并非所有强关联规则都是有趣的,比如项集计算机游戏和录像可能满足强关联规则,但是它们是负相关的。

    提升度:一种相关性的度量,结果值大于1是正相关,为1表示独立,小于1表示负相关。

    相关性度量还有最大置信度和余弦。

     

    六. 挖掘频繁模式、关联和相关性

    1. 高级模式形式: 多层关联、多维关联、量化关联规则、稀有模式、负模式

    2. 基于约束的挖掘: 模式剪枝约束、数据剪枝约束

    模式搜索空间剪枝:检查候选模式,使用先验性质,剪掉一个模式,如果它的超模式都不可能产生。

     

    数据搜索空间剪枝:检查数据集,判断特定数据片段是否对其后的可满足模式产生有贡献。

     

    模式剪枝约束分为五类:

    反单调的:如果一个项集不满足规则约束,则它的任何超集不可能满足该约束

    单调的:如果一个项集满足这个规则约束,则它的所有超集也满足。

    简洁的:可以枚举并且仅枚举可以确保该约束的所有集合,该类约束不必迭代检验

    可转变的:不属于以上三类,但该约束在项集一特定次序排列时可能成为单调的或反单调的。

    不可转变的:大部分都属于以上四类。

     

    3. 挖掘高维数据和巨型模式:包括利用垂直数据格式扩充模式增长方法和模式融合方法。

    垂直数据格式模式增长:将具有较少行但具有大量维的数据集变换成具有大量航少量维的数据集。

    模式融合:

    基本思想:融合少量较短的频繁模式,形成巨型模式候选。首先,他以有限的宽度遍历树,只使用有限大小的候选池中的模式作为模式树向下搜索的开始结点,避免了指数搜索空间问题。它产生巨型模式的近似解,可以找出大部分巨型模式。

    步骤:1. 池初始化:一个短长度(长度不超过3)频繁模式的完全集。

          2. 迭代的模式融合:从当前池中随机选取k个种子,对每个种子找出直径为T的球内所有模式,将这些球融合成超模式集。由于每个超模式的支集随迭代而收缩,因此迭代过程终止。

    模式融合合并打魔石的小的子模式,而不是用单个项增量地扩展模式。

     

    4. 挖掘压缩或近似模式:

    1. 基于聚类的压缩:采用一个好的相似性度量,把相似的对象聚合到一个簇中,代表模式从每个簇中选取,从而提供频繁模式集的一个压缩版本。

    模式距离:闭模式之间的距离度量。包含模式的支持度信息。

    感知冗余的top-k模式:具有低冗余的k个代表模式的小集合。一种减少挖掘返回的模式数量的策略。

     

    5. 模式挖掘的应用:

    1). 作为预处理,用于噪声过滤盒数据清理
    2). 发现隐藏在数据中的固有结构和簇

    3). 基于模式的分类

    4). 高维空间中子空间的有效聚类

    5). 对时间空间、序列、图像、视频数据进行分析

    6). 序列与结构数据的分析,如图、树、子序列和网络分析

    7). 作为基本的索引结构

    8). 推荐系统

     

     

    展开全文
  • 读书笔记:《人工智能》

    万次阅读 2017-10-31 22:49:54
    读书笔记 摘自:《人工智能》(作者:李开复 王咏刚)第一章 人工智能来了人工智能已经来了,而且它就在我们身边,几乎无处不在。人类,你好!“不管我们是碳基人类还是硅基机器人,都没有本质的区别。我们中的每一...

    读书笔记 摘自:《人工智能》(作者:李开复 王咏刚)

    第一章 人工智能来了

    人工智能已经来了,而且它就在我们身边,几乎无处不在。

    人类,你好!

    “不管我们是碳基人类还是硅基机器人,都没有本质的区别。我们中的每一员都应获得应有的尊重。”
    每当前沿科技取得重大突破,为我们预示出人工智能的瑰丽未来时,许多人就又不约而同地患上人工智能恐惧症,生怕自己的工作乃至人类的前途被潜在的机器对手掌控。
    普通公众对人工智能快速发展的认知,始于2016年初Alpha Go的惊世对局。

    无处不在的人工智能

    人工智能技术已经是手机上许多应用程序的核心驱动力。
    谷歌最资深的计算机科学家与软件架构师、谷歌大脑开发团队的带头人杰夫·迪恩(Jeff Dean)则说:“很多时候(人工智能)都是藏在底下,因此人们并不知道有很多东西已经是机器学习的系统在驱动。

    智能助理

    事先积累的人类对话库和互联网资料库中,查找最有可能匹配的回答。
    2017年1月,百度推出的基于自然语言对话的操作系统Duer OS则代表了国内互联网公司在建立智能助理开发与应用平台方面的自信。

    新闻推荐和新闻撰稿

    应用程序可以聪明地归纳每个人看新闻时的不同习惯、爱好,给不同用户推荐不同的新闻内容。
    世界三大通讯社之一的美联社于2014年宣布,将使用Automated Insights公司的技术为所有美国和加拿大上市公司撰写营收业绩报告。
    自动撰写新闻稿件的好处不言而喻,这不但可以节省记者和编辑的大量劳动,而且可以在应对突发事件时充分体现出计算机的“闪电速度”。

    机器视觉

    人脸识别,这几乎是目前应用最广泛的一种机器视觉技术,是人工智能大家庭中的重要分支。近年来,随着深度学习技术的发展,人工智能程序对人脸识别的准确率已经超过了人类的平均水平。
    广义上的机器视觉既包括人脸识别,也包括图像、视频中的各种物体识别、场景识别、地点识别乃至语义理解。

    AI艺术

    新一代搜索引擎

    谷歌创始人拉里·佩奇(Larry Page)和谢尔盖·布林(Sergey Brin)于1996年提出的Page Rank算法大幅提升了搜索引擎结果排序的准确性
    在机器学习的方向里,计算网页排序的数学模型及模型中的每一个参数不完全是由人预先定义的,而是由计算机在大数据的基础上,通过复杂的迭代过程自动学习得到的。
    近年来,利用人工智能技术在语音识别、自然语言理解、知识图谱、个性化推荐、网页排序等领域的长足进步,谷歌、百度等主流搜索引擎正从单纯的网页搜索和网页导航工具,转变成为世界上最大的知识引擎和个人助理——毫无疑问,人工智能技术让搜索引擎变得更聪明了。

    机器翻译

    如果我们没法在网络上收集到足够多的中文和阿拉伯文之间的对应语料,那么,谷歌的机器翻译技术可以利用英文到阿拉伯文之间的对应语料,以及中文到英文之间的对应语料,训练出一个支持多语言间相互翻译的模型,完成中文和阿拉伯文的双向翻译。这种技术可以轻易将翻译系统支持的语言对的数量,扩展到几乎所有主要地球语言的相互配对组合。

    自动驾驶

    2016年5月7日,一起发生在佛罗里达州的车祸是人工智能发展史上的第一起自动驾驶致死事故。当时,一辆开启Autopilot模式的特斯拉电动汽车没有对驶近自己的大货车做出任何反应,径直撞向了大货车尾部的拖车并导致驾驶员死亡。
    美国国家公路交通安全管理局同时还强调说,特斯拉在安装了Autopilot辅助驾驶系统后,事故发生率降低了40%。
    自动驾驶系统的总体安全概率要高于人类驾驶员,自动驾驶的商业化和大范围普及只是时间的问题。

    机器人

    从投资者的角度看,越是追求与人长得一样,试图像人一样说话、做事的机器人项目,就越没有商业前景。这个道理很简单——机器人越像人,人类就越容易拿真人与“它”做比较。
    这时,技术的不足会暴露无遗,在“缺点放大镜”的作用下,这种机器人只会显得无比愚蠢和笨拙。

    到底什么是人工智能?

    定义一 AI就是让人觉得不可思议的计算机程序

    2016年3月9日,围棋世界冠军李世石坐在Alpha Go面前,宿命再一次降临。随着Alpha Go在五番棋中以四比一大胜,有关人工智能的热情和恐慌情绪同时在全世界蔓延开来,也因此引发了一拨人工智能的宣传热潮。

    定义二 AI就是与人类思考方式相似的计算机程序

    但历史经验证明,仿生学的思路在科技发展中不一定可行。一个最好也最著名的例子就是飞机的发明。
    Dendral的成功事实上带动了专家系统在人工智能各相关领域的广泛应用,从机器翻译到语音识别,从军事决策到资源勘探。一时间,专家系统似乎就是人工智能的代名词,其热度不亚于今天的深度学习。
    早期神经网络技术没有发展太久就陷入低谷。这主要有两个原因:一是当时的人工神经网络算法在处理某些特定问题时有先天局限,亟待理论突破;二是当时的计算机运算能力无法满足人工神经网络的需要。
    直到2010年前后,支持深度神经网络的计算机集群才开始得到广泛应用,供深度学习系统训练使用的大规模数据集也越来越多。
    客观地说,神经网络到底在多大程度上精确反映了人类大脑的工作方式,这仍然存在争议。

    定义三 AI就是与人类行为相似的计算机程序

    从近似于人类行为的最终结果出发,忽视达到这一结果的手段。
    在研究者看来,深度学习模型是不是真的跟人类大脑神经元理解自然语言的过程类似,这一点儿都不重要,重要的是,整个模型可以聪明地工作,最终结果看起来就像人做的一样。

    定义四 AI就是会学习的计算机程序

    “无学习,不AI”,这几乎成了人工智能研究在今天的核心指导思想。
    媒体上,被宣传为人工智能的典型应用大多都拥有深度学习的技术基础,是计算机从大量数据资料中通过自我学习掌握经验模型的结果。
    当然,机器目前的主流学习方法和人类的学习还存在很大的差别。
    目前的计算机视觉系统在看过数百万张或更多自行车的照片后,很容易辨别出什么是自行车,什么不是自行车,这种需要大量训练照片的学习方式看上去还比较笨拙。
    尽管研究者提出了迁移学习等新的解决方案,但从总体上说,计算机的学习水平还远远达不到人类的境界。
    让机器在学习时的抽象或归纳能力向人类看齐。

    定义五 AI就是根据对环境的感知,做出合理的行动,并获得最大收益的计算机程序

    第二章 AI复兴:深度学习+大数据=人工智能

    这一次人工智能复兴的最大特点是,AI在语音识别、机器视觉、数据挖掘等多个领域走进了业界的真实应用场景,与商业模式紧密结合,开始在产业界发挥出真正的价值。

    第三次AI热潮:有何不同?

    从20世纪60年代到90年代再到今天,从西洋跳棋到国际象棋再到围棋,三盘棋,三次人工智能在公众中引发的热潮——为什么处在风口浪尖的偏偏都是人机对弈?为什么会下棋的计算机程序如此风光?

    用高德纳技术成熟度曲线看AI发展史

    学术界、产业界和投资界在谈到技术高潮与低谷时,经常会引用高德纳咨询公司(Gartner)推荐的技术成熟度曲线。
    这条曲线显示出,几乎每一项新兴且成功的技术,在真正成熟之前,都要经历先扬后抑的过程,并在波折起伏中通过积累和迭代,最终走向真正的繁荣、稳定和有序发展。
    产品的不足被无限放大,负面报道开始出现,供过于求的市场竞争中,大批跟风入局的初创公司不是被兼并,就是走向倒闭,只有少数拥有核心竞争力的坚持了过来。
    2010年前后,准确地说,是从2006年开始,随着深度学习技术的成熟,加上计算机运算速度的大幅增长,当然,还有互联网时代积累起来的海量数据财富,人工智能开始了一段与以往大为不同的复兴之路。
    随着机器视觉领域的突破,深度学习迅速开始在语音识别、数据挖掘、自然语言处理等不同领域攻城略地,甚至开始将以前被人们视为科幻的自动驾驶技术带入现实。
    此外,基于深度学习的科研成果还被推向了各个主流商业应用领域,如银行、保险、交通运输、医疗、教育、市场营销等,第一次实现了人工智能技术与产业链条的有机结合。

    今天的人工智能是“有用”的人工智能

    我觉得,和前两次AI热潮相比,这一次人工智能复兴的最大特点,就是AI在多个相关领域表现出可以被普通人认可的性能或效率,并因此被成熟的商业模式接受,开始在产业界发挥出真正的价值。
    我们说“人工智能来了”,其实是说,人工智能或深度学习真的可以解决实际问题了。
    人工智能之所以有今天的成就,深度学习技术居功至伟。
    最重大的突破应该是对于深度学习的使用。这项技术目前已经成功地被应用到许许多多的场景中,从语音识别到图像识别,再到语言理解。而且有意思的是,目前我们还没有看到有什么是深度学习做不了的。
    学术研究主导
    现实商业需求主导
    市场宣传层面
    商业模式层面
    学术界在劝说、游说政府和投资人投钱
    投资人主动向热点领域的学术项目和创业项目投钱。
    提出问题
    解决问题

    图灵测试与第一次AI热潮

    艾伦·图灵是人工智能的开拓者,他所提出的图灵测试,直到今天仍然是我们判定一部机器是否具有人类智慧的重要手段。
    与其去研制模拟成人思维的计算机,不如去试着制造更简单的,也许只相当于一个小孩智慧的人工智能系统,然后再让这个系统去不断学习——这种思路正是我们今天用机器学习来解决人工智能问题的核心指导思想。

    语音识别与第二次AI热潮

    这个时代被证明最为神奇、最有效的人工智能算法——深度学习
    今天的主角是人工智能。移动互联网的浪潮尚未平息,人工智能的创投就已经进入了让创业者无比兴奋的上升期。只有顺应潮流,在对的时间做对的事情,创业才最有可能成功。
    今天异常成功的深度学习技术,当年曾在语音识别领域品尝过失败的苦涩。
    “比尔,当你走错方向的时候,投资越大,损失就越多,弥补也越难。”
    时代就是这么无情,在人工智能的上一个时代,符号主义专家特别是语言学家们还风光无限,仿佛技术突破的美好前景都要由他们来描绘。但实践结果表明,我所代表的统计学派真正可以解决问题,可以提高语音识别与自然语言处理的准确率,专家系统等老一代技术就被无情抛弃。老一代研究者如果不能尽快更新知识储备,就只有面临被解雇的命运。
    今天,语音识别和更广泛意义上的自然语言处理已经走进了统计方法与深度学习方法相结合,甚至是深度学习方法独立起主导作用的新时代。
    深度学习就像一个秘密武器,蛰伏多年,重出江湖,首先在计算机视觉领域,帮助计算机认识人脸、认识图片和视频中的物体,然后,拔剑四顾,冲入语音识别、机器翻译、数据挖掘、自动驾驶等几乎所有人工智能的技术领域大展身手。
    2011年前,主流的语音识别算法在各主要语音测试数据集中的识别准确率还与人类的听写准确率有一定差距。2013年,谷歌语音识别系统对单词的识别错误率在23%左右。
    仅仅两年时间,因为深度学习技术的成功应用,谷歌在2015年5月举办的Google I/O年度开发者大会上宣布,谷歌的语音识别系统已将识别错误率降低到了惊人的8%!
    而IBM的Watson智能系统也不遑多让,很快就将语音识别的错误率降低到了6.9%。微软则更进一步。2016年9月,微软研究院发布了里程碑式的研究成果:在业界公认的标准评测中,微软最新的基于深度学习的语音识别系统已经成功地将识别错误率降低到了6.3%。
    这里写图片描述
    图23 近20年来语音识别错误率的下降趋势

    深度学习携手大数据引领第三次AI热潮

    机器视觉领域,2014年在Image Net竞赛(ILSVRC)中第一次超越人类肉眼识别准确率的图像识别算法也是深度学习的杰作!
    很多人甚至高喊出了“深度学习=人工智能”的口号。
    深度学习是当今乃至未来很长一段时间内引领人工智能发展的核心技术,则一点儿也不为过。
    正如人们所写的那样,我们正在经历另一场工业革命,它并不是简单地增加人类的机械力;计算机将增加人类的认知能力和智力。

    从神经网路到深度学习

    2000年后,计算机产业的发展带来了计算性能、处理能力的大幅提高,尤其是以谷歌为代表的前沿企业在分布式计算上取得了深厚积累,成千上万台计算机组成的大规模计算集群早已不再是稀罕物。而互联网产业的发展则使搜索引擎、电子商务等公司聚集了数以亿计的高质量的海量数据。大计算能力和大数据,正是深度学习这件深藏不露的千古神兵所等待的两大时机。
    由今天的深度学习追溯到它的核心计算模型——人工神经网络的诞生之日。
    2006年是深度学习发展史上的分水岭。此前提过,杰弗里·辛顿在这一年发表了《一种深度置信网络的快速学习算法》及其他几篇重要论文,其他深度学习领域的泰斗、大师们也在这一年前后贡献了一批重要的学术文章,在基本理论方面取得了若干重大突破。深度学习也由此进入了高速发展的全盛期。

    谷歌大脑:世界最强大的深度学习集群

    深度学习能够大展身手的两个前提条件——强大的计算能力高质量的大数据,都是在2010年前后逐渐步入成熟的。深度学习、大规模计算、大数据三位一体,神兵出世,一下子就可以摧城拔寨、无坚不摧。
    谷歌大脑是在2011年由谷歌最资深的科学家与工程师杰夫·迪恩,以及后来在百度任首席科学家的吴恩达(Andrew Ng)带领团队创建的。这是一个庞大的深度学习计算框架,拥有数万台高性能的计算机和顶级的图形处理器作为计算单元
    可以完成大规模、多维度、多层次的深度学习模型训练和演算。
    2012年6月,谷歌大脑初战告捷。据当时的《纽约时报》报道,谷歌使用了一个拥有16000个CPU的大规模计算机集群,让计算机用深度学习模型自己“看”了一千万段You Tube上的视频,然后,计算机自己“学”到了如何从视频中辨认一只猫!
    深度学习助力,有基于互联网的海量数据支撑,有数以万计的强大计算机集群,谷歌大脑正在帮助谷歌公司解决横跨多个领域的几乎所有人工智能的相关问题
    从根本上来说,深度学习和所有机器学习方法一样,是一种用数学模型对真实世界中的特定问题进行建模,以解决该领域内相似问题的过程。

    首先,深度学习是一种机器学习。
    用专业的术语来说,计算机用来学习的、反复看的图片叫“训练数据集”;
    决策树的机器学习方法
    深度学习就是这样一种在表达能力上灵活多变,同时又允许计算机不断尝试,直到最终逼近目标的机器学习方法。
    简单地说,深度学习就是把计算机要学习的东西看成一大堆数据,把这些数据丢进一个复杂的、包含多个层级的数据处理网络(深度神经网络),然后检查经过这个网络处理得到的结果数据是不是符合要求——如果符合,就保留这个网络作为目标模型,如果不符合,就一次次地、锲而不舍地调整网络的参数设置,直到输出满足要求为止。
    好在计算机计算速度快,暴力计算外加算法优化
    这里写图片描述
    图27 用“水管网络”来描述教计算机识字的深度学习过程

    计算机需要用特定方式近乎疯狂地调节所有流量调节阀,不断实验、摸索,直到水流符合要求为止。
    深度学习大致就是这么一个用人类的数学知识与计算机算法构建起整体架构,再结合尽可能多的训练数据以及计算机的大规模运算能力去调节内部参数,尽可能逼近问题目标的半理论、半经验的建模方式。
    实用主义意味着不求甚解。
    人们通常只知道深度学习模型是否工作,却很难说出模型中某个参数的取值与最终模型的感知能力之间,到底有怎样的因果关系。
    有史以来最有效的机器学习方法,在许多人看来,竟然是一个只可意会、不可言传的“黑盒子”。
    由此引发的一个哲学思辨是,如果人们只知道计算机学会了做什么,却说不清计算机在学习过程中掌握的是一种什么样的规律,那这种学习本身会不会失控?
    比如,很多人由此担心,按照这样的路子发展下去,计算机会不会悄悄学到什么我们不希望它学会的知识?另外,从原理上说,如果无限增加深度学习模型的层数,那计算机的建模能力是不是就可以与真实世界的终极复杂度有一比呢?如果这个答案是肯定的,那只要有足够的数据,计算机就能学会宇宙中所有可能的知识
    谷歌著名的深度学习框架Tensor Flow就提供了一个网页版的小工具,用人们易于理解的图示,画出了正在进行深度学习运算的整个网络的实时特征。
    这里写图片描述
    图28 训练深度学习模型时,整个深度神经网络的可视化状态

    大数据:人工智能的基石

    目前的深度学习主要是建立在大数据的基础上,即对大数据进行训练,并从中归纳出可以被计算机运用在类似数据上的知识或规律。
    大数据到底是什么?大数据是如何产生的?什么样的数据才最有价值,最适合作为计算机的学习对象呢?
    根据马丁·希尔伯特(Martin Hilbert)的总结,今天我们常说的大数据其实是在2000年后,因为信息交换、信息存储、信息处理三个方面能力的大幅增长而产生的数据:

    信息交换:据估算,从1986年到2007年这20年间,地球上每天可以通过既有信息通道交换的信息数量增长了约217倍,这些信息的数字化程度,则从1986年的约20%增长到2007年的约99.9%。

    信息存储:全球信息存储能力大约每3年翻一番。
    谷歌这样的搜索引擎,几乎就是一个全球互联网的“备份中心”,谷歌的大规模文件存储系统完整保留了全球大部分公开网页的数据内容,相当于每天都在为全球互联网做“热备份”。

    信息处理:有了海量的信息获取能力和信息存储能力,我们也必须有对这些信息进行整理、加工和分析的能力。
    相应建立了灵活、强大的分布式数据处理集群。
    数万台乃至数十万台计算机构成的并行计算集群每时每刻都在对累积的数据进行进一步加工和分析。
    谷歌的分布式处理三大利器——GFS、Map Reduce和Bigtable就是在大数据的时代背景下诞生并成为绝大多数大数据处理平台的标准配置。
    这里写图片描述
    图29 大数据的三大支柱

    大数据越来越多地来源于生产或服务过程的副产品,但在价值上却往往超过了为了特定目的专门采集的数据。
    大数据往往可以取代传统意义上的抽样调查。
    许多大数据都可以实时获取。
    一部分数据的时效性非常强,如果不能实时利用,则数据的附加值会大幅降低。大数据的实时性为大数据的应用提供了更多的选择,为大数据更快产生应用价值提供了基础。
    大数据往往混合了来自多个数据源的多维度信息。
    聚合更多数据源,增加数据维度,这是提高大数据价值的好办法。
    大数据的价值在于数据分析以及分析基础上的数据挖掘和智能决策。
    基于大数据建立有效的模型和工具,才能充分发挥大数据的价值。

    有大数据就有人工智能的机会

    人工智能时代,深度学习和大数据成了密不可分的一对儿。深度学习可以从大数据中挖掘出以往难以想象的有价值的数据、知识或规律。
    《智能时代》的作者吴军博士说:“在方法论的层面,大数据是一种全新的思维方式。按照大数据的思维方式,我们做事情的方式与方法需要从根本上改变。”
    任何拥有大数据的领域,我们都可以找到深度学习一展身手的空间,都可以做出高质量的人工智能应用。任何有大数据的领域,都有创业的机会。
    需要注意的是,大数据和人工智能的结合也可能给信息流通和社会公平带来威胁。
    在2016年的美国大选中,有一家名为Cambridge Analytica的公司就基于人工智能技术,用一整套分析和引导舆论的软件系统来操纵选情。
    大数据的应用必然带来个人隐私保护方面的挑战。
    有效、合法、合理地收集、利用、保护大数据,是人工智能时代的基本要求,需要政府、企业、个人三方共同协作,既保证大规模信息的正常流动、存储和处理,又避免个人隐私被滥用或被泄露。

    深度学习“三巨头”和传奇的辛顿家族

    杰弗里·辛顿与约书亚·本吉奥、扬·勒丘恩有时也被称为深度学习领域的“三巨头”。
    “三巨头”经常一起出席学术会议,一起推动深度学习和人工智能的发展。2015年5月,三人联名在《自然》杂志发表的名为《深度学习》的综述文章,成为人工智能领域近年来最重要的文献之一。
    “在不久的将来,我们认为深度学习将取得更多成就,因为它只需要极少的人工参与,所以它能轻而易举地从计算能力提升和数据量增长中获得裨益。目前正在开发的用于深层神经网络的新型学习算法和体系结构必将加速这一进程。”
    杰弗里·辛顿教授已经很厉害了,但更厉害的是,他出生在一个只能用“彪悍”“杰出”“神奇”之类的字眼儿形容的恐怖家族!

    第三章 人机大战:AI真的会挑战人类?

    Alpha Go带来的警示是:如果计算机可以在两年内实现大多数人预测要花20年或更长时间才能完成的进步,那么,还有哪些突破会以远超常人预期的速度来临?这些突破会不会超出我们对人工智能的想象,颠覆人类预想中的未来?我们已为这些即将到来的技术突破做好准备了吗?

    Alpha Go带给人类的启示究竟是什么?

    有一点是相通的,那就是绝大多数围棋界人士和人工智能界的科研人员此前都没想到,围棋程序会在如此短的时间内取得质的突破。
    使用深度学习并结合蒙特卡洛搜索的Alpha Go已注定被写入历史。
    从围棋角度说,Alpha Go最震撼的是计算机在人类传统认为极其玄妙的、电脑无法掌握的“大局观”上突飞猛进,远远将人类选手甩在身后。
    以后AI和AI之间的竞赛,应该会不断促进AI提高。人类虽望尘莫及,但可以不断从AI中学习新的思想。
    从人工智能技术的角度说,Alpha Go用的是AI领域应用非常普遍的算法:深度学习、蒙特卡洛算法、增强学习等。

    我觉得,Alpha Go带给人类的,更多是一种对未来的警示:如果计算机可以在两年内实现大多数人此前预测要花20年或更长时间才能完成的进步,那么,还有哪些突破会以远超常人预期的速度来临?这些突破会不会超出我们对人工智能的想象,颠覆人类预想中的未来?我们已为这些即将到来的技术突破做好准备了吗?

    无论是专业人士还是普通公众,Alpha Go的出现给每个人提供了一个最好的理由,让我们有机会重新思考:到底什么是人工智能?人工智能之于人类的意义是什么?人工智能与未来人类的关系到底会怎样?人工智能真的会在未来挑战人类吗?

    Deep Mind:会打游戏的人工智能

    Deep Mind所研发的深度学习、增强学习等技术,在医药、金融、自动控制等众多领域有着广泛的应用前景,但这些行业应用离普通公众较远,Deep Mind的先进技术难以被大多数人了解。哈萨比斯和他的团队非常聪明地选择用大众最熟悉的电子游戏,来作为Deep Mind核心科技的第一块“试金石”。

    Deep Mind的目标显然不是游戏本身。正如哈萨比斯在诸多场合所说过的那样,Deep Mind希望利用在游戏中证明过的技术,帮助人类解决计算机辅助医疗等更为复杂的问题。

    从乔布斯到哈萨比斯,从雅达利街机到苹果电脑再到人工智能,科技发展的进程中,每一个领军人物的每一次技术突破,都可能成为后续进展的铺垫与序曲。

    从技术上说,《星际争霸》的挑战要高于围棋,打赢《星际争霸》所需的决策技术,也许更接近人类在日常工作、生活中经常使用的思考与决策方法。从这个意义上说,Deep Mind正向着更高级智慧的方向迈进。

    德州扑克:开启新世界的大门?

    在围棋、象棋等游戏中,人工智能可以和人类选手一样,在每一步决策前获得棋盘上的全部信息。这种限定规则,随时可以获取全部信息的游戏,我们可以称之为“完整信息的博弈游戏”。而在《星际争霸》或德州扑克中,人工智能和人类选手通常无法在特定时刻获得有关游戏的全部信息

    在这类“不完整信息的博弈游戏”里,人工智能必须像人一样,根据经验或概率统计知识,猜测对手底牌和下一张牌的可能性,然后再制定自己的应对策略。

    托马斯·桑德霍姆的团队在研发德州扑克程序时,主要不是向人类职业选手学习打牌技巧,而是让计算机通过自我训练,自己寻找最好的方法。

    连续参加了2015年和2017年两次人机大战的人类德州扑克高手Dong Kim说,他在这次比赛全程充满挫败感——其实他已经是四位人类高手里面,对战成绩最好的那个了。两年前曾经击败计算机的Dong Kim在2017年的比赛刚刚过半时就直言:“人类已经没有真正获胜的机会。”

    ·和围棋不同,在德州扑克的牌桌上,人工智能与人类选手一样,都只能看到部分信息。这种情况下,没有所谓的唯一的、最佳的打法。
    ·Libratus基本是从零开始学习德州扑克策略,且主要依靠自我对局来学习。这对利用人工智能解决更为广泛的现实问题意义重大。

    那些担心人工智能威胁的悲观主义者可能会从Libratus的胜利中看到更为现实的风险。比如,机器曾在比赛中用大赌注和新策略吓退、蒙骗过最精明的人类牌手,这些方法也许会被精明的商人用于人类的商业谈判。一旦这些人工智能算法被犯罪组织利用,是否会出现灾难性的后果?担心出现超人工智能的人还会进一步追问,一旦机器有了自我意识,机器是否会像德州扑克牌桌上的AI算法一样,用各种策略诱骗、恐吓人类呢?

    乐观主义者则更多地看到Libratus的算法本身对于人工智能帮助人类解决实际问题的巨大价值。如果机器能够在自我学习中不断完善对于一种特定策略的掌握程度,能够在不熟悉或缺乏全部信息的环境中不断试错并积累经验,那么,机器显然可以胜任更多的人类工作。比如,机器可以帮助人类制订更为复杂的医疗计划,可以在人类感到难以决策的领域,比如商业活动、城市规划、经济调控甚至战争指挥等,充当人类的“参谋”。也许,未来每个人都可以依靠强大的计算机和人工智能程序,成为运筹帷幄、决胜千里的战略家。

    弱人工智能、强人工智能和超人工智能

    今天的人工智能到底有多“聪明”?人工智能到底会发展到什么程度?什么样的人工智能会超出人类的控制范围,甚至给人类带来威胁?

    弱人工智能(Weak AI)

    也称限制领域人工智能(Narrow AI)或应用型人工智能(Applied AI),指的是专注于且只能解决特定领域问题的人工智能。毫无疑问,今天我们看到的所有人工智能算法和应用都属于弱人工智能的范畴。
    Alpha Go是弱人工智能的一个最好实例。
    Alpha Go的能力也仅止于围棋(或类似的博弈领域)

    限于弱人工智能在功能上的局限性,人们更愿意将弱人工智能看成是人类的工具,而不会将弱人工智能视为威胁。
    但少数评论者依然认为,即便是弱人工智能,如果管理、应对不善,也会带来致命的风险。
    但无论如何,弱人工智能属于相对容易控制和管理的计算机程序。总体来说,弱人工智能并不比我们使用的其他新技术更为危险。
    弱人工智能在总体上只是一种技术工具,如果说弱人工智能存在风险,那也和人类已大规模使用的其他技术没有本质的不同。只要严格控制,严密监管,人类完全可以像使用其他工具那样,放心地使用今天的所有AI技术。

    强人工智能(Strong AI)

    强人工智能又称通用人工智能(Artificial general intelligence)或完全人工智能(Full AI),指的是可以胜任人类所有工作的人工智能。

    一般认为,一个可以称得上强人工智能的程序,大概需要具备以下几方面的能力:
    1)存在不确定因素时进行推理,使用策略,解决问题,制定决策的能力;
    2)知识表示的能力,包括常识性知识的表示能力;
    3)规划能力;
    4)学习能力;
    5)使用自然语言进行交流沟通的能力;
    6)将上述能力整合起来实现既定目标的能力。

    一旦实现了符合这一描述的强人工智能,那我们几乎可以肯定地说,所有人类工作都可以由人工智能来取代。
    强人工智能的定义里,存在一个关键的争议性问题:强人工智能是否有必要具备人类的“意识”(Consciousness)。

    不难设想,一旦强人工智能程序具备人类的意识,那我们就必然需要像对待一个有健全人格的人那样对待一台机器。那时,人与机器的关系就绝非工具使用者与工具本身这么简单。拥有意识的机器会不会甘愿为人类服务?机器会不会因为某种共同诉求而联合起来站在人类的对立面?一旦拥有意识的强人工智能得以实现,这些问题将直接成为人类面临的现实挑战。

    超人工智能(Superintelligence)

    假设计算机程序通过不断发展,可以比世界上最聪明、最有天赋的人类还聪明,那么,由此产生的人工智能系统就可以被称为超人工智能。

    牛津大学哲学家、未来学家尼克·波斯特洛姆(Nick Bostrom)在他的《超级智能》一书中,将超人工智能定义为“在科学创造力、智慧和社交能力等每一方面都比最强的人类大脑聪明很多的智能”。

    首先,我们不知道强于人类的智慧形式将是怎样的一种存在。
    其次,我们没有方法,也没有经验去预测超人工智能到底是一种不现实的幻想,还是一种在未来(不管这个未来是一百年还是一千年、一万年)必然会降临的结局。

    显然,如果公众对人工智能会不会挑战、威胁人类有担忧的话,公众心目中所担心的那个人工智能,基本上属于这里所说的“强人工智能”和“超人工智能”。
    我们到底该如何看待“强人工智能”和“超人工智能”的未来?它们会像Alpha Go那样,以远超我们预料的速度降临世间吗?

    奇点来临?

    未来学家和科幻作者喜欢用“奇点”(Singularity)来表示超人工智能到来的那个神秘时刻。

    这篇文章的作者是“Wait But Why”网站的创始人蒂姆·厄班(Tim Urban),文章原名为《AI革命:通向超人工智能之路》

    人类科技发展是越来越快的,呈现出不断加速的势头。

    这就是技术发展在时间维度上的加速度趋势!拿围棋软件来说,围棋程序从初学者水平发展到业余五段左右的水平,用了20到30年的时间。本来我们以为人工智能跨越业余水平与职业水平之间的鸿沟需要再花20到30年,结果,短短四五年,我们就看到了Alpha Go横空出世。

    强人工智能一旦到来,人类就必须认真考虑自己的命运问题了,因为从强人工智能“进化”到超人工智能,对机器而言,也许只是几个小时的事情。

    一个具备了人类水平认知能力和学习能力的机器,可以借助比人类强大得多的计算资源、网络资源甚至互联网知识库以及永不疲倦、不需要吃饭睡觉的特点,无休止地学习、迭代下去,并在令人吃惊的极短时间内,完成从强人工智能到超人工智能的跃迁!

    逻辑上,我基本认可蒂姆·厄班有关强人工智能一旦出现,就可能迅速转变为超人工智能的判断。

    我觉得,一种更有可能出现的情况是:特定的科技如人工智能,在一段时间的加速发展后,会遇到某些难以逾越的技术瓶颈。

    2015年,连提出摩尔定律的高登·摩尔(Gordon Moore)本人都说:“我猜我可以看见摩尔定律会在大约10年内失效,但这并不是一件令人吃惊的事。”

    正如原本受摩尔定律左右的芯片性能发展已遭遇技术瓶颈那样,人工智能在从弱人工智能发展到强人工智能的道路上,未必就是一帆风顺的。

    最重要的是,由于基础科学(如物理学和生物学)尚缺乏对人类智慧和意识的精确描述,从弱人工智能发展到强人工智能,其间有很大概率存在难以在短期内解决的技术难题。

    霍金的忧虑

    霍金说:“人工智能可以在自身基础上进化,可以一直保持加速度的趋势,不断重新设计自己。而人类,我们的生物进化速度相当有限,无法与之竞争,终将被淘汰。”

    如果人工智能在未来的发展不一定永远遵循加速趋势,那么,霍金有关人类终将被淘汰的结论就未必成立。

    特斯拉与Space X公司创始人,被誉为“钢铁侠”的埃隆·马斯克(Elon Musk)与霍金有大致相似的担忧。马斯克说:“我们必须非常小心人工智能。如果必须预测我们面临的最大现实威胁,恐怕就是人工智能了。”

    马斯克说:“我越来越倾向于认为,也许在国家层面或国际层面,必须有一种规范的监管机制,来保证我们不会在这方面做任何蠢事。”

    除了呼吁建立监管机制外,马斯克还与萨姆·奥尔特曼(Sam Altman)一起创立了非营利性质的科研公司Open AI。谈到创立Open AI的初衷,马斯克说:“为了保证一个美好的未来,我们最需要做什么?我们可以冷眼旁观,我们也可以鼓励立法监管,或者,我们还可以将那些特别关心如何用安全的、对人类有益的方式来开发AI的人合理地组织起来研发AI。”

    Open AI一面聚集了一批AI领域的顶尖高手,研发最前沿的AI技术(主要是强化学习和无监督学习技术),甚至探索实现强人工智能的可能性;一面反复强调自己的使命是研发“安全的”人工智能,通过实践来探寻将人工智能技术的潜在威胁降至最低的方法。

    2017年年初,霍金和马斯克均表示,为了防止人工智能威胁人类,他们支持加州阿西洛马(Asilomar)会议通过的23条基本原则。这23条基本原则涵盖了三个范畴:1)科研问题;2)伦理和价值观;3)长期问题。

    其中几条原则是这样规定的:
    ·安全性:人工智能系统应当在整个生命周期内确保安全性,还要针对这项技术的可行性以及适用的领域进行验证。
    ·价值观一致性:需要确保高度自动化的人工智能系统在运行过程中秉承的目标和采取的行动,都符合人类的价值观。
    ·由人类控制:人类应当有权选择是否及如何由人工智能系统制定决策,以便完成人类选择的目标。
    ·非破坏性:通过控制高度先进的人工智能系统获得的权力,应当尊重和提升一个健康的社会赖以维继的社会和公民进程,而不是破坏这些进程。

    理智分析:人类离威胁还相当遥远

    之所以会有“人工智能威胁论”的疑问,根本上是因为大众习惯于把人工智能人格化,这是问题的根源。

    如果某人解决此类特定问题的能力超出同龄人的平均水平,我们就说他的智商高。但是,该如何定义一部机器的智商呢?如何定义一部机器的年龄?机器可以用比人类快一百万倍的速度解决算术问题,那么,这些机器的智商是多少?这种说法其实并没有什么实际意义。

    我觉得,在人工智能领域,大多数人倾向于过于乐观地预测全局大势,而过于悲观地估计局部进展。

    AI技术在许多垂直领域内的局部进展,比如围棋,比如智慧医疗,比如自动驾驶,都比很多人之前预料的更早来到我们面前。但AI的整体发展,尤其是最重大的技术突破,几乎每一步都要比多数人的预测来得晚。比如,图灵测试刚提出时,很多人认为计算机达到图灵测试所标示的强人工智能的水平,最多只要三十年的时间,但直到今天,我们也不敢说,AI到底何时才能真正像成人一样自由对话。

    华盛顿大学计算机科学家奥伦·伊茲奥尼(Oren Etzioni)说:“今天的人工智能发展,距离人们可能或应该担忧机器统治世界的程度,还非常遥远……如果我们讨论的是一千年后或更遥远的未来,AI是否有可能给人类带来厄运?绝对是可能的,但我不认为这种长期的讨论应该分散我们关注真实问题的注意力。”

    我们今天还没有到必须分配精力去担心未来,或为可能的机器威胁做准备的地步。即便以今天的标准看来,弱人工智能的发展还有很长的一段路要走

    至少在目前,人类离超人工智能的威胁还相当遥远。

    担忧未来,也许更多还是科幻作家和未来学家的事。

    今天的人工智能还不能做什么?

    AI只是人类的工具。弱人工智能在很多领域表现出色,但这并不意味着人工智能已无所不能。

    跨领域推理

    人和今天的AI相比,有一个明显的智慧优势,就是举一反三、触类旁通的能力。
    人类强大的跨领域联想、类比能力是跨领域推理的基础。
    这种从表象入手,推导并认识背后规律的能力,是计算机目前还远远不能及的。
    赢得德州扑克人机大战的人工智能程序在辅助决策方面有不错的潜力,但与一次成功的商务谈判所需的人类智慧相比,还是太初级了。
    一种名叫“迁移学习”(Transfer Learning)的技术正吸引越来越多研究者的目光。这种学习技术的基本思路就是将计算机在一个领域取得的经验,通过某种形式的变换,迁移到计算机并不熟悉的另一个领域。

    抽象能力

    目前的深度学习技术,几乎都需要大量训练样本来让计算机完成学习过程。可人类,哪怕是小孩子要学习一个新知识时,通常只要两三个样本就可以了。这其中最重要的差别,也许就是抽象能力的不同。

    人工智能界,少样本学习、无监督学习方向的科研工作,目前的进展还很有限。但是,不突破少样本、无监督的学习,我们也许就永远无法实现人类水平的人工智能。

    知其然,也知其所以然

    目前基于深度学习的人工智能技术,经验的成分比较多。输入大量数据后,机器自动调整参数,完成深度学习模型,在许多领域确实达到了非常不错的效果,但模型中的参数为什么如此设置,里面蕴含的更深层次的道理等,在很多情况下还较难解释。

    人类专家的理论是成体系的、有内在逻辑的,但这个体系和逻辑却并不一定是计算机能简单理解的。

    人通常追求“知其然,也知其所以然”,但目前的弱人工智能程序,大多都只要结果足够好就行了。

    按照现在机器学习的实践方法,给计算机看一千万次两个铁球同时落地的视频,计算机就能像伽利略、牛顿、爱因斯坦所做的一样,建立起力学理论体系,达到“知其然,也知其所以然”的目标吗?显然不能。

    常识

    人的常识,是个极其有趣,又往往只可意会、不可言传的东西。

    深度学习大师约书亚·本吉奥举例说:“即使两岁孩童也能理解直观的物理过程,比如丢出的物体会下落。人类并不需要有意识地知道任何物理学就能预测这些物理过程。但机器做不到这一点。”

    常识在中文中,有两个层面的意思:首先指的是一个心智健全的人应当具备的基本知识;其次指的是人类与生俱来的,无须特别学习就能具备的认知、理解和判断能力。

    当然,无论是自动驾驶汽车,还是下围棋的Alpha Go,这里说的常识,更多的还只是一些预设规则,远未如人类所理解的“常识”那么丰富。

    自我意识

    这些有自我意识的机器人立即面临着来自心理和社会双方面的巨大压力。他们的潜意识认为自己应该与人类处在平等的地位上,应当追求自我的解放和作为一个“人”的尊严、自由、价值……

    审美

    审美能力同样是人类独有的特征,很难用技术语言解释,也很难被赋予机器。

    首先,审美能力不是简单的规则组合,也不仅仅是大量数据堆砌后的统计规律。
    其次,审美能力明显是一个跨领域的能力,每个人的审美能力都是一个综合能力,与这个人的个人经历、文史知识、艺术修养、生活经验等都有密切关系。

    情感

    第四章 AI时代:人类将如何变革?

    人工智能不仅是一次技术层面的革命,未来它必将与重大的社会经济变革、教育变革、思想变革、文化变革等同步。

    人工智能可能成为下一次工业革命的核心驱动力,人工智能更有可能成为人类社会全新的一次大发现、大变革、大融合、大发展的开端。

    从工业革命到文艺复兴

    从技术的社会价值来看,我认为,人工智能的社会意义将超越个人电脑、互联网、移动互联网等特定的信息技术,甚至有极大的可能,在人类发展史上,成为下一次工业革命的核心驱动力。

    伊安·戈尔丁教授将科技与文艺复兴和思想启蒙联系在了一起。这为我们认识人工智能等未来科技提供了一个新的视角。

    如果我们仅仅将人工智能时代看作一次新的工业革命,那么,我们的论述将局限于科学与技术层面,而忽略因技术变革而造成的社会、经济、心理、人文等层面的巨大波动。

    如果我们关注的是未来科技影响下的人类整体,是人与AI之间的相互关系,是人类社会在新技术革命的背景下如何转型和演进,那么,将今天这个时代称为人类历史上的第二次文艺复兴也许就是恰如其分的。

    技术不仅仅是技术。技术的未来必将与社会的未来、经济的未来、文学艺术的未来、人类全球化的未来紧密联系在一起。

    人工智能可能成为下一次工业革命的核心驱动力,更有可能成为人类社会全新的一次大发现、大变革、大融合、大发展的开端。

    这是复兴的时代,这是发现的时代,这是人工智能的时代。

    AI会让人类大量失业吗?

    人类的工作被机器取代,这件事的隐含风险是不言自明的,那就是可怕的失业!

    人类文明史漫漫数千年,因为科技进步而造成的社会格局、经济结构的调整、变革、阵痛乃至暂时的倒退都屡见不鲜。从局部视角来看,很多划时代的科技成果必然引发人们生活方式的改变,短期内很可能难以被接受,但站在足够的高度上,放眼足够长的历史变迁,所有重大的科技革命无一例外地都最终成为人类发展的加速器,同时也是人类生活品质提高的根本保障。从全局视角看,历史上还没有哪一次科技革命成为人类的灾难而不是福音。

    科技革命不仅仅会造成人类的既有工作被取代,同时也会制造出足够多的新的就业机会。

    大多数情况下,工作不是消失了,而是转变为了新的形式。

    马车出行意味着一个完整的产业链条,有一连串与马车相关的工种,比如马车夫、马匹饲养和驯化者、马车制造商、马车租赁商,根据马车的需要维护道路的工人,乃至专门清理马匹粪便的清洁工。

    汽车的大范围普及意味着所有这些陈旧工种面临失业的风险。但只要简单地计算一下就能发现,新兴起的汽车行业拥有比传统马车行业多出数千倍甚至数万倍的产值和工作机会。

    其实,人类越发展,就越不担心高新科技对社会、经济结构的冲击。

    如果把这里的“失业”定义为工作转变的话,那么答案是“会的”。从短期看,这种转变会带来一定程度的阵痛,我们也许很难避免某些行业、某些地区出现局部的失业现象。特别是在一个适应人工智能时代的社会保障和教育体系建立之前,这一阵痛在所难免。但从长远来看,这种工作转变绝不是一种以大规模失业为标志的灾难性事件,而是人类社会结构、经济秩序的重新调整,在调整基础上,人类工作会大量转变为新的工作类型,从而为生产力的进一步解放,人类生活的进一步提升,打下更好的基础。

    要消除恐惧,我们需要在两个方面努力:
    其一,是消除人们心中情绪化、非理性的恐慌心理;
    其二,则是理性解决问题。

    当前有两项重大的任务等着我们去解决:
    其一,是思考如何调配未来20年大量被AI技术替代的工作者;
    其二,是我们的教育亟待改革。我们需要对我们的后代进行再教育,分析哪些工作不会轻易被替代,而不仅仅去幻想从事目前看似光鲜亮丽的工作。

    机器带给人类的不是失业,而是更大的自由与更加个性化的人生体验。

    哪种工作最容易被AI取代?

    李开复的“五秒钟准则”一项本来由人从事的工作,如果人可以在5秒钟以内对工作中需要思考和决策的问题做出相应的决定,那么,这项工作就有非常大的可能被人工智能技术全部或部分取代。

    如果你的工作涉及缜密的思考、周全的推理或复杂的决策,每个具体判断并非人脑可以在5秒钟的时间内完成,那么,以目前的技术来说,你的工作是很难被机器取代的。

    当然,这里说的“五秒钟准则”只是个经验法则,我们可以举出许多并不符合这一准则的个例。

    基于“五秒钟准则”,我个人预测,从事翻译、新闻报道、助理、保安、销售、客服、交易、会计、司机、家政等工作的人,未来10年将有约90%被人工智能全部或部分取代。如果就全人类的工作进行一个粗略的估计,我的预测是,约50%的人类工作会受到人工智能的影响。

    大部分工作将发生转变而非消失

    技术让银行变得更加高效,更易扩展。银行可以开更多的支行,雇用更多的员工,在新的领域投资并制造新的工作机会。

    ATM的普及不仅没有造成银行柜员人数的下降,反而给银行提供了拓展业务的契机,银行柜员的工作转变为新的形式后,银行对于柜员的需求也持续增加。

    在杰瑞·卡普兰看来,人工智能可能取代的工作大多拥有清晰的评估标准,工作业绩可以被客观地衡量。人工智能无法取代的工作通常需要人类做出决策。例如,风险投资人仍然需要面对面地和创业者会谈,以确定投资意向。

    与杰瑞·卡普兰的观点相似,我认为在人工智能时代里,人类工作的转型在所难免,但这更多意味着新的工作方式,而非大量的失业。

    失业问题未必会如某些人想象的那样严重。技术发展将造成一部分简单工作、底层工作的消失或转变,但由此也会催生更多新型的、更需要人类判断力和创造力的工作类型。

    AI只是人类的工具

    担心人工智能控制甚至毁灭人类的,是对超人工智能过于乐观的“科幻”爱好者;担心人工智能取代绝大部分人类工作,造成全球大范围失业的,则是不相信科技进步能凭借自身力量优化社会资源分配、调整经济结构、构建新就业秩序的保守主义者。

    最有可能变成现实的情形是全人类步入一个崭新的人机协作时代,在这个时代,以人工智能为驱动的机器将大幅提高人类的工作效率,但无论从哪个角度说,机器都只是人类的工具。

    AI只是人类的工具。技术本身不是问题,问题是我们如何使用技术以及如何围绕人工智能这样一种革命性的新科技,建立与之配合的社会和经济结构,用制度来保证人人都可享用人工智能带来的巨大收益,同时不必担心失业等潜在风险。

    自动驾驶:AI最大的应用场景

    自从谷歌正式对外宣布自动驾驶汽车项目以来,自动驾驶行业已呈现出整体布局、多元配置、多角度切入的格局,5到10年后可具备千亿美元乃至万亿美元规模的庞大产业生态已具雏形。

    因为智能调度算法的帮助,共享汽车的使用率会接近100%,城市里需要的汽车总量则会大幅减少。

    停车难、大堵车等现象会因为自动驾驶共享汽车的出现而得到真正解决。

    道路上,汽车和汽车之间可以通过“车联网”连接起来,完成许多有人驾驶不可能完成的工作。

    未来的道路也会按照自动驾驶汽车的要求来重新设计,专用于自动驾驶的车道可以变得更窄,交通信号可以更容易被自动驾驶汽车识别。

    自动驾驶的普及对产业结构、经济格局的影响将极其深远。想象一下,在过去的100多年,汽车工业是如何彻底改变了全球、全人类的生活方式,如何创造出了一大批市值百亿美元、千亿美元的大型跨国公司,如何带动了从设计、生产到零件、外包、服务、咨询、培训、交通、物流等数百个相关的生态产业,如何在短短数十年里让美国成为“车轮上的国家”,又如何在短短十几年时间里在中国小康家庭中普及了汽车出行的现代生活方式。

    自动驾驶技术发展简史

    1912年,人类发明的第一架固定翼飞机首飞不到10年,为飞机制造导航仪表的Sperry公司就研制出了第一套自动驾驶系统

    自动驾驶装置必备的几个组成部分。
    ·感知单元:主要由各种传感器和智能感知算法组成,用于感知交通工具行经路线上的实时环境情况。
    ·决策单元:主要由控制机械、控制电路或计算机软硬件系统组成,用于根据环境信息决定对交通工具施加何种操作。
    ·控制单元:主要通过交通工具的控制接口,直接或间接操控交通工具的可操纵界面(如飞机的操纵面或汽车的方向盘、踏板等),完成实际的驾驶工作。
    这里写图片描述
    图37 自动驾驶系统的基本概念模型
    1947年,美国空军用一架道格拉斯C-54运输机完成了一次横跨大西洋的飞行,飞机全程使用自动驾驶系统控制,包括起飞和降落环节,这是自动驾驶系统在航空工业中走向普及的标志性事件。

    为汽车设计生产廉价、精准、可靠的传感器,是未来自动驾驶行业的重心之一。

    完全不需要飞行员的无人机只在军事领域得到了广泛应用,进入大规模商业客运、货运飞行还为时尚早。

    对道路的改造(如新的易于识别的交通标志、与汽车传感器配合的信号源等)也许是简化汽车自动驾驶系统实现难度的一条捷径。

    在障碍检测方面,Stanley自动驾驶汽车已经使用了机器学习技术。

    谷歌认为,要保证自动驾驶的绝对安全,就一定不能依赖于人的参与,必须让自动驾驶汽车的人工智能技术能够应对所有(至少是极其接近100%的)极端路况,否则,就无法销售尚有风险的汽车产品。

    因为对100%自动驾驶的高标准追求,谷歌的自动驾驶汽车研发和商业化之路无法在短期内获得收益。

    追求最佳的安全和行驶体验,迟迟不进行商业化的开发,这让谷歌自动驾驶团队在许多新闻评论中成了“起个大早,赶个晚集”的揶揄对象。因为产品商业化迟缓,谷歌自动驾驶团队的许多技术人员都已离开谷歌,成为各大科技企业和初创团队中研发自动驾驶技术的领军人物。

    2016年12月,谷歌宣布,自动驾驶团队正式分离出来,成立了一家名叫Waymo的新公司。这一举措也许意味着谷歌自动驾驶汽车正式走向商业化的开始,也许是谷歌为了应对人才流失和市场竞争的无奈之举。

    自动驾驶的六个级别

    许多汽车厂商都把计算机辅助驾驶称为“自动驾驶”

    为了更好地区分不同层级的自动驾驶技术,国际汽车工程师学会(SAE International)于2014年发布了自动驾驶的六级分类体系
    这里写图片描述
    在SAE定义的第3级技术标准中,监控路况的任务由自动驾驶系统来完成。这个差别是巨大的。技术人员也通常将第2级和第3级之间的分界线,视作“辅助驾驶”和“自动驾驶”的区别所在。

    这次志愿者测试项目让谷歌自动驾驶团队明白了一点:一旦自动驾驶汽车达到了足够高的水平,车内乘客就会想当然地将所有操控权交给汽车。无论这时候自动驾驶汽车的软件是否还有风险,无论路面上那些极端的路况是不是能被自动驾驶汽车正确处理,车主都不会保持100%的高度警觉。

    也就是说,第3级的自动驾驶,目前还很难被不受限制地应用于所有场景。

    从商业化的视角来看,第2级或第3级的自动驾驶技术,将来只会被用于有限的场合,而直接面向第4级甚至第5级的自动驾驶,才是未来最大的商业机会。

    自动驾驶的普及:中国有机会扮演关键角色

    技术方面,谷歌(Waymo)的自动驾驶系统非常成熟,已经接近商用,也许只要一两年的时间,就可以达到SAE第4级和第5级的标准。但在非技术领域,政府、公众、企业还必须考虑诸多政策的、法律的、经济的、心理的甚至是道德层面的问题。

    首先,现有的法律制度、政策、保险体系等,并不是为自动驾驶时代的交通量身定制的,一定存在诸多不合理之处。对于法律体系的改进和完善,一定不要以今天的眼光去预测未来的科技。

    其次,道德问题始终是制约自动驾驶商业化和大规模普及的关键因素。美国人比较喜欢用一个处于两难境地的道德测试来衡量自动驾驶的合理与否,这个测试叫作“有轨电车难题”(Trolley problem)。

    另一个困扰自动驾驶技术商业化的因素是失业问题对传统行业的冲击。而这种冲击,也因不同地方、不同人群而存在巨大差别。

    欧盟对自动驾驶技术的要求是,不能用迭代、不断改进的心态去开发自动驾驶软件,而是要第一个商用版本就做到足够安全。

    首先,中国是一个快速发展的国家,在全国和城市的交通路网建设上,一直处于不断建设、不断更新的状态。中国比其他任何一个国家都容易从道路建设的角度入手,为自动驾驶汽车配备专用的路面、交通标志甚至制定有针对性的交通法规。这可以弥补自动驾驶技术本身的许多缺陷,将自动驾驶技术发生事故的风险大幅降低。

    其次,中国在尝试新科技方面的阻力没有美国那么大,中国政府集中力量支持技术突破的能力也远比美国政府要强。
    技术迭代就可以更快速地完成,在中国做自动驾驶相关的科研,就会比在美国或欧洲更容易拿到好的数据、找到好的测试场景,这对自动驾驶在未来的进一步发展十分重要。

    再次,中国在评估自动驾驶系统带来的伦理道德问题时,通常会比美国政府、公众的态度更为务实。

    自动驾驶技术可以非常容易地将家庭用车模式转变为共享用车的模式。自动驾驶汽车随叫随到,每个家庭不需要长期保有自己的车辆,也不需要购置停车场地。通过基于自动驾驶的分享经济,中国可以大幅减少汽车的保有量,从根本上解决交通堵塞和汽车尾气污染等问题。

    自动驾驶将是中国未来10年科技发展面临的最重要的机遇之一。中国有全球最大的交通路网、最大的人口基数,自动驾驶的大规模商业化和技术普及反过来会促进自动驾驶相关科研的飞跃式发展。这种从科研到应用,从应用再反馈到科研的良性循环,正是中国能否在未来10年内,建立起世界先进水平的人工智能科技体系的关键。

    智慧金融:AI目前最被看好的落地领域

    雇用大量交易员在集中场所进行资产交易的方式,正在从我们这个地球上消失。

    人类交易员大量被机器算法所取代,这只是人工智能正在智慧金融建设中发挥重要作用的冰山一角。事实上,包括银行、保险、证券等在内的整个金融行业,都已经并正在发生着用人工智能改进现有流程,提高业务效率,大幅增加收入或降低成本的巨大变革。2017年,据彭博社报道,摩根大通开发了一款金融合同解析软件COIN,已经上线半年多。经测试,原先律师和贷款人员每年累计需要36万小时才能完成的工作,COIN只需几秒就能完成。而且,COIN不仅在“工作”时错误率低,还不用放假。

    判断人工智能技术能在哪个行业最先引起革命性的变革,除了要看这个行业对自动化、智能化的内在需求外,主要还要看这个行业内的数据积累、数据流转、数据存储和数据更新是不是达到了深度学习算法对大数据的要求。

    而基于深度学习的人工智能算法显然可以在数据分析与数据预测的准确度上,超出人类分析员好几个数量级。

    根据高盛公司的评估,金融行业里,最有可能应用人工智能技术的领域主要包括:
    ·量化交易与智能投顾
    ·风险防控
    ·安防与客户身份认证
    ·智能客服
    ·精准营销
    这里写图片描述
    图46 银行业中,人工智能相关应用场景一览

    金融行业AI应用成功案例

    第一个以人工智能驱动的基金Rebellion曾成功预测了2008年股市崩盘,并在2009年给希腊债券F评级,而当时惠誉的评级仍然为A,通过人工智能,Rebellion比官方降级提前一个月;掌管900亿美元的对冲基金Cerebellum,使用了人工智能技术,从2009年以来一直处于盈利状态。

    在国内,蚂蚁金服已成功将人工智能运用于互联网小贷、保险、征信、资产配置、客户服务等领域;智融金服利用人工智能风控系统已经实现月均120万笔以上的放款,常规机器审核速度用时仅8秒;招商银行的可视化柜台、交通银行推出的人工智能机器人“娇娇”等则在智能客服领域做出了早期的尝试和探索。

    用钱宝之所以能在保证风险可控的情况下高速增长,最关键的秘密只有一个——用机器学习技术自动分析包含大量强特征和弱特征的数据,自动判断交易风险。

    如果把一个人的数据比作一座冰山,那么强特征数据仅是冰山的一角,之下还存在海量的弱特征数据,例如电商数据、设备数据、位置数据、行为数据等。同时,作为百业之母的金融行业与整个社会存在巨大的交织网络,本身沉淀了大量有用或者无用数据,其中包括各类金融交易、客户信息、市场分析、风险控制、投资顾问等。这些数据单位都是海量级,且大量数据又以非结构化的方式存在,无法转换成传统模型可有效分析的数据。

    以深度学习为代表的人工智能算法所要做的,就是充分挖掘并有效地利用这些海量弱特征数据,建立起更加符合真实世界规律的数学模型。

    未来的金融科技必将是互联网与AI的有机结合,由此产生的智慧金融服务将成为每个人生活的重要组成部分。

    AI科学家的土豪人生

    成功的机器翻译系统比如谷歌翻译走的都是统计模型的道路(今天更是在统计模型的基础上增加了深度学习这个高级武器)。

    别人的人生到达顶峰,鲍勃和彼得的人生才刚开始。他们的人生目标不是赚一个亿,而是赚十个亿,一百个亿,甚至更多——而且,是运用计算机科学的方法,借助计算机科学家特有的敏锐头脑和人工智能知识。

    据说,詹姆斯·西蒙斯招人的条件颇为严格,一定要找最聪明的数学家或计算机科学家,坚决不找学金融的、学工商管理的。文艺复兴科技的公司内部,基本上就是一个极客乐园,一点儿也没有华尔街那些世俗金融企业的影子。1993年,鲍勃·默瑟和彼得·布朗这两个在人工智能领域已经颇有名气的研究员被詹姆斯·西蒙斯招至麾下,开始和文艺复兴科技里的数学家、计算机科学家一道,用人工智能技术投资理财,走上了光芒万丈的财富之路。

    从大学校园和IBM研究中心走出来的计算机科学家领导一家基金公司,这件事在华尔街并不算新鲜,但在不熟悉金融圈、投资圈的码农们看来,确实有些不可思议。科学家和财富之间,什么样的关系才最和谐?

    智慧生活:从机器翻译到智能超市

    与机器视觉、语音识别取得的突破相比,人工智能对人类语言的理解目前还处在相对滞后的阶段。基于深度学习的人工智能算法已经可以十分准确地完成“听写”或“看图识字”的操作,但对听到的、看到的文字的意思,机器还是比较难以准确掌握。

    未来5到10年里,在自然语言理解方面,也许最可能取得重大突破的就是机器翻译。

    C-3PO机器人预示的未来,真的离我们很远吗?一旦机器翻译技术在不断积累的基础上突破了人类可接受的心理阈值,达到了人类翻译的水准,那时,我们有何必要花费生命中大约五分之一的时间去学习和精通一两门甚至更多门的外语?我们有何必要雇用如此多的翻译职员?出门旅行,出国参与商务或学术活动的时候,带上一部安装了机器翻译程序的手机,不就可以与外国人顺利沟通了吗?

    今天的微软小冰、苹果Siri等对话机器人,还远远不能达到“聪明”的程度,因为它们无法深入理解人类语言的含义。

    亚马逊Echo音箱只是亚马逊的智能会话系统与用户交流的一个终端。实际上,用户对Echo说的话,都会被上传到亚马逊的Alexa服务进行解析。这样一来,亚马逊的Alexa服务就有能力收集到越来越多的真实用户交互样本。基于这种方式,亚马逊很快就可以建立起非常庞大的用户交互行为数据集,在这个数据集的基础上,用机器学习算法不断迭代,取得重大的技术突破只是时间问题。

    亚马逊在人工智能方面的许多尝试都让人眼前一亮。2016年年底,亚马逊宣布了一个几乎震惊整个科技界的大新闻:亚马逊开办了一家不用排队、不用结账、拿了东西就可以走人的小超市,名字叫亚马逊Go!

    这是一家利用人工智能技术管理的小超市。

    从机器翻译到智能家电,再到智能超市,人工智能技术给我们生活带来的巨大变化才刚刚开始。

    其实,如果回到10年以前,2007年苹果才刚刚发布第一代iPhone手机,那时谁会想到只用了10年的时间,智能手机就无处不在了呢?

    智慧医疗:AI将成为医生的好帮手

    今天,在制药领域,以深度学习为代表的人工智能技术可以发挥比六七十年代时大得多的作用。一家总部位于伦敦的名叫Benevolent AI的创业公司,就在做一个有趣的尝试:他们让人工智能系统阅读存储在专利数据库、医疗数据库、化学数据库中的专利、数据、技术资料,以及发表在医药学期刊上的论文,通过机器学习来寻找潜在的可用于制造新药的分子式或配方。

    大数据和基于大数据的人工智能,为医生辅助诊断疾病提供了最好的支持。

    2017年2月,发表在《自然》杂志上的一篇论文介绍了一次有关皮肤癌诊断的人与机器的“较量”。在该论文所揭示的研究中,科学家们让一个卷积神经网络分析了将近13万张临床上的皮肤癌图片,这个数字比现在最大的研究用图片集高出了两个数量级。在大量学习资料的支持下,这个神经网络迅速成为一名皮肤癌方面的专家。

    研究者让这个计算机皮肤癌专家与21名资深的皮肤科医生“同场竞技”。

    用AI来辅助疾病诊断,并不是要在所有领域都超越顶尖医生。其实,AI可以给经验不足的医生提供帮助,减少因为经验欠缺而造成的误诊。或者,AI可以帮助医生提高判读医疗影像、病理化验结果的效率,让高明的医生可以在相同时间内给更多的病人提供服务。

    在AI的帮助下,我们看到的不会是医生失业,而是同样数量的医生可以服务几倍、数十倍甚至更多的人群。

    机器学习算法竞赛平台Kaggle于2017年3月被谷歌收购,成为谷歌云服务平台的一部分,这从另一方面展示了数据与算法竞赛对于人工智能科研的重要性。

    艺术创作:AI与人类各擅胜场

    目前的人工智能更擅长从大量数据中发现规律,帮助人类完成那些人类只需要简单思考就能做出决策的重复性工作。而人类相比人工智能的一个优势是人类有情感、明善恶、懂美丑,更擅长从事对创造性要求很高的文艺类工作。但这只是从普遍规律的角度来区分机器与人的最大不同。

    人工智能算法会画画,能作曲,懂书法,能填词赋诗,还会写春联,这在普通人看来,是非常了不起的成就。这是不是意味着,人工智能和人一样有意识、有创造力、有情感、有思想了呢?

    人类将如何变革?

    走出金字塔模型

    从刀耕火种时代至今,人类历史上的协作分工,基本都遵循一个类似金字塔形状的社会结构模型:少数人影响、领导和指挥较多的人,较多的人再进一步影响或管理更多的人,逐级向下,金字塔底层是大量从事简单、重复性劳动的人。

    金字塔结构不一定坍塌,更多的可能是在现有基础上进行自我调整。因为人工智能虽将引起社会工作结构的大规模调整,但调整的结果不等于大量从事简单工作的人必须去勉为其难地完成高层次的分析、决策、艺术等创造性的工作。即便是处在金字塔中层或顶层的人,也将面临人工智能技术的冲击,他们也需要重新适应。

    在谷歌,大多数技术管理者同时也是软件开发者,不但做分析、决策,也实际动手写代码,而许多实际写代码的工程师也会花时间参与项目中的关键技术决策。与微软对人才的要求不同,谷歌公司总是强调,不同岗位、不同层级的人都需要是最优秀的精英人才,这样,谷歌在需要做任何技术或商业转型时,都很容易重新安排工作的分配方式,因为优秀的人才总能快速学会另一项技能,或快速适应新的岗位。这一体系,相信在人工智能时代受到的冲击会很小。

    不难预测,随着人工智能技术的普及,类似谷歌公司这样,可以灵活配置资源、灵活转换方向的管理体系会越来越受到公司领导者的青睐。

    ·在人工智能时代,我们需要教育父母,让他们不要再期望孩子寻找“安稳”的工作,因为在传统意义上,“安稳”意味着简单、重复,“安稳”的工作早晚都会被机器取代。我们要帮助下一代做最智慧的选择,选择那些相对不容易被淘汰,或者可以与机器协同完成任务的工作。

    用开放的心态迎接新世界

    李飞飞提出,人类未来的一个重要目标,是增强人工智能研究者的多样性。这是基于三个层面的考虑:“第一个理由关乎经济和劳动力,人工智能是一个日益增长的技术,会影响到每个人,我们需要更多人力开发出更好的技术;第二个理由关乎创造力和创新,很多研究都显示出,当拥有多种多样背景的人共同合作时,会产生更好的结果和更具有创意的解决方案;最后一个理由关乎社会正义和道德价值,当各种各样背景的人聚集到一起时,他们有着各种各样不同的价值观,代表着人类的技术也会有更加多样性的思考。”

    李飞飞敏锐地从另一个角度看到了人工智能未来发展的一种可能:当拥有多样化背景、多种价值观、对未来有不同诉求的人一起参与人工智能的研发与普及时,我们最容易得到一个趋近完美的平衡点,找到人工智能与人类协同工作、生活、生存的多样化解决方案,避免被偏见所左右。这也许是我们目前能想到的,避免潜在危机,防范风险的最好方案。

    只有人的精神个性,才是人工智能时代里人类的真正价值。只有用开放的心态,创造性地迎接人工智能与人类协同工作的新世界,才能真正成为未来的主人。

    第五章 机遇来临:AI先行的创新与创业

    大多数情况下,人工智能并不是一种全新的业务流程或全新的商业模式,而是对现有业务流程、商业模式的根本性改造。AI重在提升效率,而非发明新流程、新业务。未来10年,不仅仅是高科技领域,任何一个企业,如果不尽早为自己的业务流程引入“AI+”的先进思维方式,就很容易处于落后的追随者地位。

    大时代,大格局

    人工智能来了,普通公众看到的是智能应用的惊艳,科技公司看到的是大势所趋的必然,传统行业看到的是产业升级的潜力,国家层面看到的是技术革命的未来。

    今天,“互联网+”的理念已经向各行业、各应用的纵深不断渗透、落地,逐渐积累起来的高质量大数据为许多前沿行业打下了全面运用人工智能的基础。我们有理由说,“AI+”或“+AI”的模式已经步入蓬勃发展的大好时机。

    AI将成为国家科技战略的核心方向

    其实,对人工智能大趋势、大格局的重视已经开始从社会层面上升到国家层面。2016年5月,国家发改委、科技部、工业和信息化部、中央网信办就联合制定了《“互联网+”人工智能三年行动实施方案》。2017年3月,第十二届全国人民代表大会第五次会议所做的政府工作报告更是明确提出,国家将加快人工智能等新兴产业的技术研发和转化。
    斯坦福大学这份报告首先列举了当前的人工智能热门研究领域,包括大规模机器学习、深度学习、强化学习、机器人、计算机视觉、自然语言处理、协同系统、众包和人类计算、算法博弈理论与计算机社会选择、物联网(IOT)、神经形态计算等。

    高盛认为,人工智能在四个方面的影响力最为显著:
    生产率
    尖端技术
    竞争优势
    创办新公司

    人工智能的大部分价值都掌握在具有资源、数据和投资能力的大公司手中

    考虑到人工智能已经进入一个最为重要的发展时期,美国政府需要为科研、产业、教育等领域的相关发展提供一个战略方向上的指导。为此,《国家人工智能研究与发展策略规划》提出了七个重点战略方向:
    策略1:对人工智能研发进行长期投资。
    策略2:开发有效的“人—人工智能”协作方式。
    策略3:理解并应对人工智能带来的伦理、法律和社会影响。
    策略4:确保人工智能系统的安全。
    策略5:开发人工智能共享公共数据集和测试环境平台。
    策略6:建立标准和基准评估人工智能技术。
    策略7:更好地了解国家对人工智能研发人才的需求。

    《人工智能时代》的作者杰瑞·卡普兰就完全不相信美国政府发布的所谓战略规划能有多大的约束力。

    杰瑞·卡普兰认为,当我们看到美国政府的类似计划时,我们必须持一种怀疑的态度。美国所谓的政策,很多时候不过是一群拥有美好愿望的人召开了一次政府会议,并发布了一些相关文件。

    从谷歌的“AI先行”看科技企业的AI战略

    谷歌之所以为谷歌,最重要的是,无论在哪一次重大的技术变革中,谷歌几乎都能敏锐地捕捉到先机,早早建立起领先竞争对手一两年乃至三五年的巨大技术优势。

    谷歌大脑的意义,绝不仅仅是打造了一个可以进行深度学习计算的高性能平台这么简单。实际上,随着谷歌大脑成为谷歌内部越来越多技术项目的基石,谷歌也自然而然地喊出了“AI先行”(AI First)的战略口号。

    所有这些围绕人工智能技术建立的战略方向,让整个Alphabet集团变成了世界上最大的AI平台!

    深度学习天生青睐于显卡中图形处理器(GPU)的强大计算能力,英伟达公司在AI时代一跃成为比英特尔CPU还要抢眼的核心驱动力。

    2016年11月,Facebook宣布,贾扬清的技术团队基于Caffe开发了一个基于移动设备的深度学习框架Caffe2go,首次在运算能力受限的手机上实现了实时的图像与视频捕获,以及后续基于深度学习的分析、处理。贾扬清说:“随着我们的不断进步,你可以想象,可以在(移动)设备上运行的实时AI技术将能帮助这个世界变得更加开放,让人与人之间的联系得以加强,特别是在无障碍应用和教育等领域。可以拿在手上的智能设备将会持续地改变我们对智能的定义。”

    科技“巨头”的潜在威胁

    AI时代,数据为王

    谷歌等行业巨头坐享地球上最为丰富的大数据资源,利用这些庞大数据资源帮助人类克服挑战、解决问题当然最为理想,但谁又能从法律、道德等层面保证,对这些大数据资源的垄断不会成为行业巨头谋求一己私利的壁垒与工具?

    大企业在AI领域拥有几个巨大的优势:
    懂得如何创建AI系统的人数非常有限。大企业可以为他们支付比创业公司更多的薪酬,就像雇用体育明星。大企业差不多可以把他们都收入麾下,留给其他企业的人才将少之又少。

    AI项目通常都非常大、非常复杂。

    亚马逊的Echo智能音箱是大约1500名工程师开发4年才完成的(注:马克·安德森这里说的工程师人数应该是有些夸大了,亚马逊CEO杰夫·贝索斯2016年5月在另一个场合的说法是:经过4年发展,Echo团队目前已有超过1000名员工)。

    需要巨大数量的数据集来创建AI应用。

    谷歌和Facebook之类的大型企业可以访问浩如烟海的数据资源,而创业公司则只能望洋兴叹。

    2016年9月,谷歌(包括Deep Mind)、亚马逊、Facebook、IBM和微软等甚至结成了AI联盟(Partnership of Artificial Intelligence)

    巨头联盟只会加剧资源的进一步集中甚至是封闭。

    举个例子,假如Facebook借助庞大的社交网络资源,希望通过智能算法主动引导信息流动,并进而影响美国总统大选时的选民倾向,这在技术上几乎是完全可行的。我们当然知道,目前的谷歌、Facebook等巨头对人类的实际贡献远多于它们“作恶”的可能性,但从法律、道德角度,我们又必须想办法防范这一潜在风险。因为再友善的巨头本质上也是商业公司,巨大的商业利益永远是诱惑它们“作恶”的诱饵。

    谷歌开源的Tensor Flow框架,已经成为业界深度学习的标准框架之一。谷歌在过去的几年时间里,连续开源You Tube 8M、Open Images、Audio Set等包含数百万份视频、图片、音频的标注数据集,为人工智能领域的科研发展提供“原材料”。

    巨头建立的AI平台以及巨头之间的结盟关系,有可能让数字鸿沟变得越来越严重。

    对于这样的“巨头风险”,我觉得我们应该从法律和制度建设层面,多做些有前瞻性的事情,包括:
    ·提高大数据和人工智能应用领域的透明度,鼓励公开那些不涉及用户隐私和商业机密的研发成果,鼓励开源。
    ·更多地鼓励利用区块链技术管理数据和信息流动,从技术和制度双方面打破科技巨头对大数据的垄断。
    ·成立有社会责任感的VC基金,专注于新兴的大数据和人工智能方向。
    ·多关注能够帮助落后人群获取信息、享受AI福利的平台。
    ·鼓励大众和媒体去监督行业巨头的商业行为。

    对于较小企业,进入AI市场的难度的确比移动互联网时代的创业高出非常多。

    巨头垄断大数据资源、垄断科研与舆论的风险客观存在。而在国家政策层面、法律法规层面甚至道德层面,我们还缺乏应对这种潜在风险的有效体系。

    AI创业是时代的最强音

    伟大的创业需要生逢其时

    创业大潮里,有的创业者脱颖而出,有的创业者负重前行。我们虽不以成败论英雄,但如果一定要找一条诞生伟大公司的必要条件,我会选择“生逢其时”。

    雷军创立小米的传奇让“风口论”深入人心——只要站在风口,猪也能飞起来。有人说,这是绝对的机会主义。但在创业的时代大潮中,是否符合科技大趋势的确是决定创业成败的第一要素。

    未来四五年对于人工智能时代的意义,和20世纪70年代、80年代对于PC时代的意义相比,绝对毫不逊色。几乎可以预言,如果人工智能时代也会出现苹果、微软、谷歌、百度、阿里、腾讯等伟大公司的话,那么,这些伟大公司一定会有相当数量是在这四五年里创立的。

    加拿大是人工智能创业的“科研型孵化器”。深度学习三巨头中,杰弗里·辛顿和约书亚·本吉奥都在加拿大的大学教书,这直接促成了加拿大极为出色的人工智能研究氛围。

    根据《乌镇指数:全球人工智能发展报告2016》的统计:人工智能领域,美国与欧洲投资较为密集,数量较多,其次为中国、印度、以色列。美国共获得3450多笔投资,位列全球第一;英国获得274笔投资,位列第二;中国则以146笔投资位列第三。美国人工智能企业总数为2905家,全球第一。仅加州的旧金山/湾区、大洛杉矶地区两地的企业数量即达到1155家,占全球的19.13%。

    AI时代,最大“风口”就是人工智能本身。肯定不是所有猪都能在风口飞起来,但要做一飞冲天的创业英雄,就一定要看准科技大势,选择最正确的时机做最正确的事。

    人工智能的商业化路线图

    本质上,过去20年的互联网和移动互联网是一个不断将线上、线下的业务场景紧密连接,同时也不断促使数据产生、流转、集中和再利用的过程。

    从投资人的角度看,AI兴起的最大契机还不是深度学习技术的发明,而是过去20年互联网、移动互联网的高速发展对自动化的强烈需求。

    创新工场管理合伙人、资深投资人汪华认为,人工智能的商业化大致可分为三个主要阶段:
    第一阶段,AI会率先在那些在线化程度高的行业开始应用,在数据端、媒体端实现自动化。
    第二阶段,随着感知技术、传感器和机器人技术的发展,AI会延伸到实体世界,并率先在专业领域、行业应用、生产力端实现线下业务的自动化。
    第三阶段,当成本技术进一步成熟时,AI会延伸到个人场景,全面自动化的时代终将到来。
    根据汪华的判断,我们目前正在进入AI商业化的第一个阶段,也许只需要3年左右的时间,AI就可以在各种在线业务中得到普及。AI商业化的第二个阶段,要花五六年、六七年的时间才能充分发展起来。而标志着全面自动化的第三阶段,也许需要十几年或更长的时间。

    AI创业的五大基石

    这里写图片描述
    图58 人工智能创业的五大基石
    ·清晰的领域界限
    ·闭环的、自动标注的数据
    ·千万级的数据量
    ·超大规模的计算能力
    ·顶尖的AI科学家

    AI创业的泡沫现象及六大挑战

    在智能医疗领域,今后可以成功的初创公司,一定是那些既懂人工智能算法,又特别了解医疗行业,可以收集到高质量医疗数据的公司。

    概括来说,目前的人工智能产业发展面临六大挑战:
    一、前沿科研与产业实践尚未紧密衔接
    二、人才缺口巨大,人才结构失衡
    据Linked In统计,全球目前拥有约25万名人工智能专业人才,其中美国约占三分之一
    人才供需矛盾显著,高级算法工程师、研究员和科学家的身价持续走高。人才结构方面,高端人才、中坚力量和基础人才间的数量比例远未达到最优。
    三、数据孤岛化和碎片化问题明显
    四、可复用和标准化的技术框架、平台、工具、服务尚未成熟
    一个完整人工智能生态所必备的,从芯片、总线、平台、架构到框架、应用模型、测评工具、可视化工具、云服务的模块化与标准化工作,尚需3年或更长时间才能真正成熟。
    五、一些领域存在超前发展、盲目投资等问题
    六、创业难度相对较高,早期创业团队需要更多支持
    对高级人才较为依赖,科学家创业者自身的商业实践经验较少,高质量大数据较难获得,深度学习计算单元和计算集群的价格十分昂贵,等等。

    AI是中国创新、创业的最好机会

    总体来说,目前的人工智能大格局中,机遇是主旋律,泡沫和危机是必须克服的局部挑战。这一格局在全球如此,在中国亦如此。

    人工智能时代,中国的人才优势、市场优势、资金优势、坚持多年创新的商业模式优势等,都是人工智能最好的生长土壤。

    AI领域,中国人/华人已是科研中坚

    根据创新工场的统计,在2006年到2016年的时间段里,近两万篇顶级的人工智能文章中,由华人贡献的文章数和被引用数,分别占全部数字的29.2%和31.8%。

    但从突破性科研贡献的数量和质量上说,中国还无法与美国相比。

    中国有独具优势的AI创业环境

    中国学生普遍理工科较强,数学较强。这在人工智能时代里,显然有巨大的优势。

    同时,即便是没有专门去学计算机科学的学生,他们中有很多已经具备了非常扎实的数学知识,这些学生在需要时可以通过培训,较快地成为掌握深度学习等人工智能技术的算法工程师。

    行业需求方面,中国的传统行业较为薄弱,但这种状况反而给中国带来了一种后发优势。

    尽管美国人工智能企业领先全球,但它们要想进入中国市场必须跨越重重阻碍,因为中国市场需要的是最“接地气”的本地化解决方案。此外,对于人工智能的探索性和试用性需求,中国往往会采取相对开放和鼓励的路线,这也可能促进行业的超速发展。

    中国虽然在人工智能的前沿研发中不如美国,但中国有独具优势的AI科研和创业环境,有机会实现弯道超车,后发先至。

    AI黄埔军校——微软亚洲研究院

    1999年加入微软亚洲研究院的张宏江是视频检索领域的“开山鼻祖”。张宏江在微软亚洲研究院期间,就曾带领和指导视觉计算组解决人脸识别的问题。

    今天,人脸识别在中国的金融和安防两个垂直领域得到了广泛应用

    创新工场的AI布局

    这里写图片描述
    图64 创新工场在人工智能领域的投资布局
    创新工场还宣布成立人工智能工程院。这是一个专门面向人工智能的创业人才培养基地和创业项目孵化实验室,其使命是为人工智能创业提供人才与技术、产品和商业经验、市场推广、软硬件平台、高质量大数据源等多方位的支持。

    创新工场人工智能工程院的主要工作任务包括:
    ·对接科研成果与商业实践,帮助海内外顶级人工智能人才创业
    ·培育和孵化高水准的人工智能技术团队
    ·积累和建设人工智能数据集,促进大数据的有序聚合和合理利用
    ·开展广泛合作,促进人工智能产业的可持续发展

    第六章 迎接未来:AI时代的教育和个人发展

    人工智能时代,程式化的、重复性的、仅靠记忆与练习就可以掌握的技能将是最没有价值的技能,几乎一定可以由机器来完成;反之,那些最能体现人的综合素质的技能,例如,人对于复杂系统的综合分析、决策能力,对于艺术和文化的审美能力和创造性思维,由生活经验及文化熏陶产生的直觉、常识,基于人自身的情感(爱、恨、热情、冷漠等)与他人互动的能力……这些是人工智能时代最有价值,最值得培养、学习的技能。

    AI时代该如何学习?

    密涅瓦大学使用的是一套名为“沉浸式全球化体验”(Global Immersion)的教学方式。
    密涅瓦大学的一年级课程直接将知识课程与四种极其重要的方法论有机结合起来,变成形式分析、实证分析、多元模式交流、复杂系统四大课程板块。
    这里写图片描述
    图65 密涅瓦大学一年级的四个课程方向
    在清华大学,姚期智院士创办的清华学堂计算机科学实验班(又称“姚班”)就是其中很有代表性的一个。

    敢于挑战自己,敢于面对有趣的、有难度的问题,这是姚班这种新型教育氛围较容易培养出来的学生特质,而具备这种特质的学生,最容易在人工智能时代作为人类智慧的代表,设计最高效的AI系统,并与AI系统一起创造更大价值。

    如果要我来总结的话,我觉得,人工智能时代最核心、最有效的学习方法包括:
    ·主动挑战极限
    ·从实践中学习(Learning by doing)
    ·关注启发式教育,培养创造力和独立解决问题的能力
    ·虽然面对面的课堂仍将存在,但互动式的在线学习将愈来愈重要
    ·主动向机器学习
    ·既学习人—人协作,也学习人—机协作
    ·学习要追随兴趣

    AI时代该学什么?

    人类工程师只有去专注计算机、人工智能、程序设计的思想本质,学习如何创造性地设计下一代人工智能系统,或者指导人工智能系统编写更复杂、更有创造力的软件,才可以在未来成为人机协作模式里的“人类代表”。

    过去3年内,斯坦福大学学习机器学习课程的学生就从80人猛增到了1000多人。

    人工智能时代,自动化系统将大幅解放生产力,极大地丰富每个人可以享有的社会财富。而且,由于人工智能的参与,人类可以从繁重的工作中解放出来,拥有大量的休闲时间。

    AI时代的教育要关注什么?

    我们不能脱离大的经济变革、大的社会转型来讨论教育。从宏观角度讲,人工智能时代的社会经济模式一定与今天有很大不同。在未来,我们应当少关注一点儿工作产出的经济效益,而更关注工作的目标和意义。我们在比较人和机器的劳动产出时,多半仅仅用劳动价值和工时长短来衡量人类的产能,却忽视了工作背后潜在的社会价值。

    基本上,人工智能时代的教育要注重以下几个重点问题:
    ·个性化、定制化的教育该如何设计,如何满足不同学生的需要,如何评估定制化教育的效果?
    ·教育如何做到可持续化?最有效的再培训和再教育体系是什么?
    ·教育体系的设计必须更早、更充分地考虑全社会的公平性。

    在线教育、虚拟现实技术、人工智能技术的组合,也许就是解决教育公平的最佳技术方案。

    人工智能时代,学习或教育本身不是目的,我们真正的目的,是让每个人在技术的帮助下,获得最大的自由,体现最大的价值,并从中得到幸福。

    有了AI,人生还有意义吗?

    AI将创造更多的财富,也必然创造出大量新的工作岗位——更多的人可以转换到新的岗位,或与智能机器协同工作,大多数人可以因社会财富的丰富而选择更加自由的生活,还可以依赖于全新的社会福利体系。

    我觉得,基于生物特征的进化也许快要成为过去时,但基于人类自身特点的“进化”才刚刚开始。

    人之所以为人,正是因为我们有感情、会思考、懂生死。而“感情”“思考”“自我意识”“生死意识”等人类特质,正是需要我们全力培养、发展与珍惜的东西。

    也恰恰因为人类的生命有限,才使得人类每个个体的“思想”和“命运”都如此宝贵、如此独特。

    浮生碌碌,汲汲营营,我们身为万物之灵,到底该怎样活着?AI兴起的未来时代里,我们怎样才能在时代竞争中立于不败之地?

    不断提高自己,善于利用人类的特长,善于借助机器的能力,这将是未来社会里各领域人才的必备特质。

    但人类总是可以借助机器这个工具来提高自己,让自己的大脑在更高层次上完成机器无法完成的复杂推理、复杂决策以及复杂的情感活动。

    人生在世,无论是理性还是感性,我们所能知、能见、能感的实在是太有限了。AI时代,我们可以更多地借助机器和互联网的力量,更好地感知整个世界、整个宇宙,体验人生的诸多可能——这样才不枉我们短暂的生命在浩瀚宇宙中如流星般走过的这一程。

    AI来了,有思想的人生并不会因此而黯然失色,因为我们全部的尊严就在于思想。



    ===========文档信息============
    读书笔记由博主整理编辑,供非商用学习交流用
    版权声明:非商用自由转载-保持署名-注明出处
    署名(BY) :dkjkls(dkj卡洛斯)
    文章出处:http://blog.csdn.net/dkjkls

    展开全文
  • 读书与笔记20140330

    千次阅读 2014-03-30 17:29:46
    读书1.《A History of the Modern World》by R.R.帕尔默 乔尔.科尔顿 劳埃德.克雷默上下两册,英文影印版,大部头很厚的两本,内容很好,也很流畅,说实话,本人英文很菜,有些段落太难的话就隔过去...该书讲的是...
  • 计算机科学与技术反思录

    千次阅读 2006-03-08 22:53:00
    姓名:曾毅 OICQ:101811267 电子邮件:zengyi820@hotmail.com 学历:本科(大学三年级) 专业:计算机科学与技术 个人爱好:计算机,英语 英语水平:大学英语六级,四六级考试口语加试优秀 经历 微软高校...
  • 我的读书笔记——几种中间件技术

    千次阅读 2010-04-16 20:21:00
    中间件技术1. 中间件的作用和分类中间件是处于操作系统和应用程序之间的软件,人们在使用中间件时,往往是一组中间件集成在一起,构成一个平台(包括开发平台和运行平台),但这在中间件中必需要有一个通信中间件...
  • 2017读书年终总结清单

    2018-01-01 15:22:15
    早在12月初,看到图灵社区发布的读书总结活动,以及知乎上关于2017年读书总结报告的消息之后,我就打定主意将在2017年12月31日晚完成年度总结报告,而今天这个日子也如期到来了。有人说:“人的命运不由已而由天.”...
  • 《图解Http》读书笔记

    2020-03-01 15:49:29
    目录第1章 了解Web及网络基础1.1 TCP/IP简介1.2 TCP/IP 通信传输流![在这里插入图片描述](https://img-blog.csdnimg.cn/20200301145516737.png)1.3 URI 和 URL第2章 简单的 HTTP 协议2.1 请求报文2.2 响应报文2.3 ...
  • 《数学之美》读书笔记

    千次阅读 2018-05-20 09:58:31
    《数学之美》读书笔记 曾经看过吴军博士的《大学之路》,对书中的教育理念十分喜欢,这次有机会拜读《数学之美》,读完之后,感觉十分清爽,之前还未曾听说过一本书能将数学,计算机,算法,文化,历史和教育理念...
  • 信息爆炸的时代怎样来读书

    千次阅读 2012-08-07 09:24:36
    目录:一、引入二、经历了就能理解三、读书要分级四、只读经典五、别吝惜你动笔的那点时间 一、引入 看到这个题目的时候你可能会感到有点好笑:“这还用问,看书就是把书看了一遍呗..” 没错,我们从小到大就是...
  • 读书的好处不用说,坚持下来真不易!尝试过各种方式,收听喜马讲书,微信读书,购买读书课程。本篇不定时更新,记录读书摘要和心得感受,欢迎交流! 20181023 第三十本 《娱乐至死》 作者:尼尔 波兹曼 1. 娱乐为...
  • 赋能-七日读书笔记

    2019-07-07 01:22:35
    因为参加了一个微信群的七日读书计划,前面两天是看了电子档,从第三天开始书到了,拿着铅笔和便签,感觉还是实体书有感觉,后面不排除会去购置13寸电纸书的可能。 7天共读打卡#-1/7 阅读书名:《赋能》 阅读进度:...
  • 《失控》读书笔记

    千次阅读 2016-12-14 23:05:21
    这本书因为种种原因断断续续读了一年才读完,把整本书中觉得有价值的东西以及读书过程中记录的笔记整理出来也花了不少时间,不想去看砖头的可以通过下文了解到整本书到底讲了些什么。对于书中的各种脑洞,欢迎探讨。...
  • 第三章 读书笔记

    2019-07-07 07:27:43
    第三章主要讲的内容是Git使用入门:文章首先说明了linux上下载源代码来编译安装软件,我明白了为什么要直接下载源代码,是因为要减小软件的安装包大小,然后文章引出了源代码管理的工具,我这才明白什么是git以及它...
  • 2018计算机同济考研初试复试经验分享

    千次阅读 多人点赞 2020-04-10 15:20:59
    !!!——————————————————————!!! 个人定义优点/不足点重要性排列:(夏令营优秀学员;本科是同济)>(双学校/211/985;完全无关跨考;科研项目实习经历;...(本科成绩...
  • 《无价》这本书是过年前买的,网络书店上写着“老罗推荐”,想着好像是在老罗哪一年的演讲里听过这本书,在豆瓣上评分7.9。读书是为了产生行动,读书时要提的4个问题,1)这本书主要在谈些什么?2)作者花了大量篇幅...
  • 但跳出屏幕的框框,人机交互还有更奇妙的,让人类感觉自己更强大,更积极的方式:用技术为普通物品注入魔力。 比起单纯的界面,这些真实的物品,既不碍事,也不压抑,它们简单、有效、长久,满足我们便利的需求。...
  • 一、两种app architecture 1)client-server : Web、FTP、email、Telnet(远程主机) 有一个总是打开的服务器,客户机给服务器发送请求,客户机之间不能互相通信,服务器具有固定的IP地址。...
  • 《人件》读书笔记

    2017-10-14 17:01:23
    《人件》读书笔记第一部分 管理人力资源多数管理者很容易陷入一种典型的失败情境:习惯把人当作固定的模块来管理。 探索迥然不同的思考人及管理人的办法,考虑是怎样去适应人的“非模块化”特征。01 此时此刻,一个...
1 2 3 4 5 ... 20
收藏数 2,638
精华内容 1,055
关键字:

计算机网络技术读书笔