2014-04-25 14:47:23 u014741335 阅读数 678



在昨天(4月24日)的百度技术开放日上,李彦宏现身并推出了百度大数据引擎。这在百度,表明对相关产品最高的重视了。

这个发布是什么意思呢?简单地讲,大数据引擎将百度在大数据的数据、能力和技术开放给行业,行业可以近身距离甚远的大数据盛宴,百度则寻到了一个新的增长点。


大数据引擎三件套

百度大数据引擎一共分三个部分。

开放云:百度的大规模分布式计算和超大规模存储云。过去的百度云主要面向开发者,大数据引擎的开放云则是面向有大数据存储和处理需求的“大开发者”。

百度的开放云拥有超过1.2万台的单集群,超过阿里飞天计划的5k集群。百度开放云还拥有CPU利用率高、弹性高、成本低等特点。百度是全球首家大规模商用ARM服务器的公司,而ARM架构的特征是能耗小和存储密度大,同时百度还是首家将GPU(图形处理器)应用在机器学习领域的公司,实现了能耗节省的目的。

数据工厂:开放云是基础设施和硬件能力,你可以把数据工厂理解为百度将海量数据组织起来的软件能力。就像数据库软件的位置一样。只不过数据工厂是被用作处理TB级甚至更大的数据。

百度数据工厂支持单词百TB异构数据查询,支持SQL-like以及更复杂的查询语句,支持各种查询业务场景。同时百度数据工厂还将承载对于TB级别大表的并发查询和扫描,大查询、低并发时每秒可达百GB,在业界已经是很领先的能力了。

百度大脑:有了大数据处理和存储的基础之后,还得有一套能够应用这些数据的算法。图灵奖获得者N.Wirth(沃斯)提出过“程序=数据结构+算法”的理论。如果说百度大数据引擎是一个程序,那么它的数据结构就是数据工厂+开放云,而算法则对应到百度大脑。

百度大脑将百度此前在人工智能方面的能力开放出来,主要是大规模机器学习能力和深度学习能力。此前它们被应用在语音、图像、文本识别,以及自然语言和语义理解方面,被应用在不少App,还通过百度Inside等平台开放给了智能硬件。现在这些能力将被用来对大数据进行智能化的分析、学习、处理、利用。百度深度神经网络拥有200亿个参数,是全球规模最大的,它拥有独立的深度学习研究院(IDL)和较早的布局,在人工智能上百度已经快了一步,现在贡献给业界表明了它要开放的决心。


大数据引擎可以干嘛

百度将基础设施能力、软件系统能力以及智能算法技术打包在一起,通过大数据引擎开放出来之后,拥有大数据的行业可以将自己的数据接入到这个引擎进行处理。同时,一些企业在没有大数据的情况下,还可以使用百度的数据以及大数据成果。

从架构来看,企业或组织也可以只选择三件套中的一样使用,例如数据存放在自己的云,但要运用百度大脑的一些智能算法应该也是支持的。

举几个例子可能你更加清楚百度大数据引擎究竟是什么。

许多政府部门拥有海量大数据——大数据经典之作《大数据》也是在讲美国政府的大数据。但政府部门几乎都没有大数据处理和挖掘技术。交通部门有车联网、物联网、路网监控、船联网、码头车站监控等地方的大数据,卫生部门拥有流感法定报告数据、全国流感样病例哨点监测和病原学监测数据,公安部门有大量的视频监控数据。如果这些数据与百度的搜索记录、全网数据、LBS数据结合,在利用百度大数据引擎的大数据能力,则可以实现智能路径规划、运力管理、流感预测、疫苗接种指导、安防追逃等等。

许多企业也拥有海量大数据——通信、金融、物流、制造、农业等行业。不过,它们几乎都没有大数据能力,坐拥海量数据却一筹莫展。这时候如果能够应用百度大数据引擎,则可以对海量数据进行可靠低成本的存储,进行智能化的由浅入深的价值挖掘。在百度技术开放日上,中国平安便介绍了如何利用百度的大数据能力加强消费者理解和预测,细分客户群制定个性化产品和营销方案。

可以看出,大数据引擎的输入实际上是百度拥有的大数据以及行业已有的大数据,而输出则是各种行业应用成果,也就是大数据的“价值”。


与一些类似项目的对比

在百度之前,业界已经有一些类似的思路,即有一些大数据能力的企业视图将自己在基础能力或者软件方面的优势释放出来。

Google:

大数据时代的奠基者。对应到百度开放云,它有举世闻名的数据中心以及基于Colossus的云;对应到百度数据工厂,Google近年来为迎接大数据时代不断改造核心技术,包括比MapReduce批处理索引系统搜索更快的Caffeine,专为BigTable设计的分布式存储Colossus比GFS还要先进,Dremel和PowerDrill管理和分析大数据,以及Instant和Pregel。对应到百度大脑,Google提供的大数据分析智能应用包括客户情绪分析、交易风险(欺诈分析)、产品推荐、消息路由、诊断、客户流失预测、法律文案分类、电子邮件内容过滤、政治倾向预测、物种鉴定等多个方面。技术有Big Query、趋势图等。

可以说Google与百度的思路最为接近,不过Google目前还未将它的大数据能力打包起来以一个新“引擎”的方式共享。毫无疑问,这在不久之后就会发生。


亚马逊:

云计算的奠基者。亚马逊是IaaS(基础设施即服务),与阿里云非常相似。亚马逊在用户交易、个人偏好、经济领域的大数据能力可能比Google还要优秀,也被一些人视作这是亚马逊与Google竞争的唯一机会。亚马逊目前更多还是在云领域做贡献,虽然也有Redshift的方案,但在数据工厂和人工智能的开放上进展慢一些。


阿里巴巴:

亚马逊对应回中国自然是阿里巴巴。阿里云是国内最早的独立运作的云部门。数据则是阿里三大核心战略之一,大数据也被摆到了阿里十分重要的位置,不懂技术的马云经常谈及大数据都有人调侃他应该改名Data Ma。阿里在大数据基础设施领域确实取得了突飞猛进的进展,飞天、Apsara、跨机房5K集群都是知名的大数据项目,应对双十一、余额宝规模取现预测、广告业务高速增长等业务场景也证明了阿里的大数据能力。

阿里大数据的思路便是做大数据的集市,让阿里系之外的大数据能够跑在阿里苦心搭建的大数据机器上运转起来。不久之前阿里与东软合作,后者的业务未来都将部署在阿里云。这意味着东软客户的数据很可能会进入阿里的大数据体系。可以确定阿里将会推出类似大数据引擎的平台,将大数据能力完全开放出来。

相比百度,阿里在“数据工厂”这块应该是各有所长,在数据基础领域以及业务理解方面有着电商领域的专注,但人工智能这块跟百度比肯定会有不小差距。语音、图像和自然语言理解,阿里并没有多少积累,它更擅长处理结构化的数据。

其他电商玩家如京东和苏宁也有类似的云,与阿里和百度完全不在一个级别就不比较了。


Salesforce等软件公司:

Salesforce近两年收购了超过5家与社交大数据相关的营销公司,目的是获取更多的数据。其他的软件厂商和方案厂商也有大数据引擎方面的布局,EMC、Oracle有对应的大数据处理软件,IBM有大数据行业方案,英特尔入股大了数据初创企业Cloudera,Cloudera推出的Impala比GoogleDremel还要快。Intel还推出了基于Hidoop的“大数据引擎”,加州伯克利大学AMPLab开发了名为Shark 的大数据分析系统。

回到国内,华为在去年发布了大数据平台产品FusionInsight,还有百分点科技这样的基于大数据的推荐服务公司。而“天河2号”等独立超级计算机也对外宣称它们的超级计算能力将会逐步开放出来。

不过,软件公司、方案公司以及超级计算机都无法做到像百度一样将大数据作为一种云端能力打包开放出来,也无法同时具备基础设施、数据工厂和智能算法的开放能力。尤其是“百度大脑”这部分,很少有其他具备这样的“数据智能”的能力。

百度将用互联网的方式来做开放的大数据引擎。它不可能采取与软件方案公司一样的“一竿子买卖”方式进行合作。而是将大数据引擎做成一个开放平台,形成标准的接口,让每个行业不同企业可以根据自身需求各取所需。而它的首要目的是获取数据,然后是考虑变现。

变现方式可能是增值服务、收费云、数据分析结果、技术咨询等方式,这将改变百度盈利模式过渡依赖“搜索广告”的现状。有消息称,大数据已经给Google每天带来2300万美元的收入,一年约为82亿美元。这已经远远超过百度2013年51亿美金的年收入了。因此,如果百度大数据引擎能够成功,很可能会为之带来源源不断的数据以及现金流。
2013-10-19 22:50:09 yangliding2011 阅读数 922

        之前看过一本叫《大数据时代》的书,讲述了不断变化的IT时代。目前到了信息爆炸,资源丰富的多元化社会,大数据的处理能力和分析能力也许在这个时代会得到逐渐的重视和看好,从事这项工作的工程师也会成为吃的香的职业。

        今天看到李彦宏在浙大和学子一起交流,其中主持人给大家看了一张照片,讲述的是李彦宏给中央领导人讲述大数据,大数据这个词在逐渐的普及,他就讲到一个例子,比如在节假日开始之前的几个月,我们普通的市民就一般通过百度搜索引擎找寻相关景点的信息,百度可以通过这个访问量或者浏览量,从而是否是一个热点,形成一个和前几年的一个对比,从而分析出这个景点是否会出现景点爆棚等现象,从而能告知相关景点做好安排工作,我想这次四川九寨沟的情况在得知相关信息后就不会出现了。百度也可以用这些数据做更多的工作,涉及各个领域。最近在阅读吴军博士的《浪潮之巅》,感觉我对计算机这个行业还有很多未了解的地方,书中基本是以一个企业的兴衰来讲述的,而且还讲到一些定律与法则,非常适合大学生的课外阅读,这里强烈推荐一下,这也是以前我们数据结构老师给我们推荐的书,嘿嘿。

        推荐《大数据时代》,大家能够发现现在很多的,丰富的资源充斥着互联网——这个我们经常接触的地方。

  

        

       

(转载本站文章请注明作者和出处 Coder的不平凡 ,请勿用于任何商业用途)

2016-06-09 22:50:49 qq_34960569 阅读数 225

6月8日,第十一届百度联盟峰会在“风花雪月城”——云南大理举办。

李彦宏再次发表了对于互联网发展的看法,他认为:推动互联网下一幕发展的核心动力,不是大数据,不是云计算,而是人工智能。

百度联盟开大会,李彦宏演讲,对人工智能信心爆棚

以下是演讲全文及PPT:

欢迎大家来到第十一次的百度联盟峰会,在去年的时候我已经基本上预告了今年要讲什么。按照惯例我们在联盟峰会上会讲产业趋势,而今年我们稍微变了变形式,以前是纯粹“讲”,今天有一个PPT,它题目叫做《下一幕》。

百度联盟开大会,李彦宏演讲,对人工智能信心爆棚

去年在联盟峰会上我讲了互联网的第一幕和第二幕,我们先回顾一下。从1994年开始的PC互联网,一直持续到了大约2012年,应该说是改变了整个世界、改变了人们的生活,这算是互联网的第一幕;我觉得第二幕应该算是从2012年开始,每个人都切实地感受到了移动互联网的大潮对于我们生活的改变。所以我去年就留了一个疑问:移动互联网之后是什么?今天我想和大家分享这样一个主题。

从2012年到现在,其实只有短短四年的时间,移动互联网的成长非常迅速,同时我们每一个人可能也感受到了其中的压力。这个压力是什么?中国互联网的渗透率现在已经到了50%左右,如果把老人、小孩这些都去掉,其实能上网的人大多数都已经上网了。现在,人口的红利快要没有了,该用智能手机的人都已经用上了智能手机,市场的规模也逐步趋于饱和。现在大家都说市场很大、很繁荣,各种各样的机会不断地出来。可是当我们再往前看一下的时候,我们会发现整个互联网面临着巨大的挑战。PC互联网走了18年左右的路,移动互联网走了仅仅四年,很多人就已经感觉到这当中成长的压力。

过去的PC互联网时代,比如说百度成立的时候,中国只有不到1000万网民,现在这个数字是7亿,这里一直有人口红利的迅速增长。移动互联网仅仅发展了四年时间,就基本上已经处于一个普及的状态了。在这种情况下,未来会是什么样子?

百度联盟开大会,李彦宏演讲,对人工智能信心爆棚

其实现在从国家政策的角度来讲,非常提倡所谓的“互联网+”行动计划,这是因为国家的经济进入了新常态,从国家政策的角度来讲,我理解新的增长动力就是希望靠“互联网+”,让互联网和每一个行业结合来提升运营的效率,从而推动经济持续地、高速地增长。但是国家靠互联网推动经济的增长,而移动互联网本身的增长我们现在已经看到瓶颈了。所以我们必须要思考互联网靠什么来保持它持续地、高速地增长。最近几年其实这两个词都是非常热的,一个是大数据,一个是云计算。所以互联网+的下一幕是不是大数据,是不是云计算?我的答案:不是。那是什么?是人工智能。

百度联盟开大会,李彦宏演讲,对人工智能信心爆棚

这是我本来去年就有点想讲的,后来因为要讲其他的内容,所以把它推到了今年。没有想到在过去一年当中人工智能从一个高精尖的科技变成了每一个人都可以街谈巷议的热门话题。事实上,人工智能背后的技术其实还是非常复杂的,需要投入、需要做的事情是非常多的。所以我想先给大家回顾一下人工智能的发展历程。

1950年图灵提出图灵测试,就是当你对面有一个屏幕和你交流的时候,你说一句话它回答一句话,看看回答这个话背后的究竟是一台机器还是一个人,如果你能够区别出来是机器还是人,就说明计算机还不具有智能,如果你区分不出来它是一个机器还是一个人,我们就可以说计算机具备了智能。

到1956年的夏天,MIT(麻省理工学院)一群科学家首次提出了“人工智能”这个词,Artificial intelligence。当时他们聚在一起的时候,六七个人打算用一夏天的时间,用他们这些聪明的头脑就可以解决人工智能的问题。没有想到不仅仅是一夏天解决不了,之后的半个世纪都没有能够解决人工智能的问题。我们看到70年代、80年代,一直到90年代初期,90年代是我在美国读计算机的时期,我们有人工智能的课程,我非常喜欢,但是学完了之后非常失望的发现人工智能其实没有实际的应用,在当时任何一个领域我们都看不到有价值的人工智能的应用,所以当时非常depress(失望)。

90年代以后,数据量越来越大,计算的能力也越来越强,机器学习逐渐兴起;到2006年一个叫做深度学习的模式首次能够证明它比过去所有的算法例如图像识别等都更加有效,而且是远远地超出过去图像识别的能力。深度学习其实也不是2006年提出来的,是很早就提出来了。但是2006年为什么出现了这样一个拐点,为什么大家突然觉得这个东西行了、work(起作用)了,是因为数据量越来越大,计算能力越来越强,而且越来越便宜,所以过去那些不实用的算法,到2006年以后逐步进入到了实用阶段。

这里还有一个2013年,在2013年年初,百度对外宣布成立IDL(深度学习研究院),开始大规模进入深度学习的领域。以上大致就是人工智能发展60年时间的回顾。

现在人工智能已经能够在多个领域显现出来它的威力,第一领域是语音的识别。当前百度的语音识别准确率超过了97%。目前语音识别日请求的量到了1亿以上。97%是什么概念?它比正常人的听力都要好一些了。不信我们来试一试。

展示语音识别技术:播放方言或发音不清晰的语音,请现场嘉宾判断内容。在观众表示很难听清的情况下,机器则能够准确的进行判断

百度联盟开大会,李彦宏演讲,对人工智能信心爆棚

深度学习这样的计算机能力在语音识别上已经相当精准,所以我有时候向朋友推荐用百度语音搜索,很多人第一反应是百度有语音搜索吗?第二反应是它能够识别我的话吗?我的话不是很标准,其实大家看到了刚刚这些不是很标准的语言都可以被很不错地识别出来了。不仅是语音方面的进展,我们可以看到在语音合成上也能做很多事情。刚才是识别,你说了它能够知道你说什么,接下来它能够学你说话,说出来跟你说话几乎是一模一样的。我给大家演示一下,模仿麦兜动画片里面的配音演员对百度联盟峰会说一段话。

展示语音合成技术:通过人工合成用麦兜的声音说出一段话

百度联盟开大会,李彦宏演讲,对人工智能信心爆棚

这个配音演员其实从来没有说过这些话,但是我们根据过去他说的很多很多话就可以人工合成出来一段他“讲”的话,并且听起来还是很像的,合成的准确度也会逐步地提高。

这是语音的合成,其实我们完全可以想象图像也可以合成,图像合成有什么实际用处呢?昨天晚上吃饭的时候大家聊,如果一旦实现了图像的合成,以后演员、大腕们演电影也将会被改变,只要他们同意演这个电影,不用实际去演,我们可以把他所有的动作和语言合成出来。过去一个大腕一年拍两部戏、三部戏,以后可以拍2000部戏、3000部戏,只要他同意我们就可以合成出来各种各样的动作和声音。所以这些技术一旦应用到各个领域,就能够产生出来无穷无尽的可能性。

下面我们看一下图像识别技术,先看2015年时做到的东西,这个我在当时联想的技术创新大会上演示过一遍,大家看一下。

展示2015年图像识别技术:对既有图片进行提问

百度联盟开大会,李彦宏演讲,对人工智能信心爆棚

大家看到这个图片是在表达什么样的东西,计算机是能够明白的。不仅如此,它还能够懂得你问话的意思,它能够理解你的自然语言。这是2015年我们已经实现的,那接下来我们看一下2016年和2015年有什么不一样?

展示2016年图像识别技术:对现场拍照得到的图片进行提问

百度联盟开大会,李彦宏演讲,对人工智能信心爆棚

2016年和2015年有什么不一样?2015年我们用了一张静态高质量的图片,2016年我们就用手机随便拍一张很自然图片,在质量不是很高的情况下机器仍然理解的比较到位,画面里是什么样的东西,我们的提问是什么意思。所以对图像和对自然语言理解的相关技术也在迅速的提升。

其实我们人工智能的技术不仅仅在图像识别、语音识别、自然语言理解方面有非常大的推动作用,另外一个很大的推动作用实际上是百度从去年开始对外宣传的无人车。我一直在说,从本质上来讲无人车是带着轮子的电脑,这台电脑就可以像人一样,识别障碍物、识别交通灯、遵守交通规则、带着乘客到任何他想要去的地方。这里我也想给大家放一个短片,演示一下我们的无人车实际在路上跑的情况。

百度联盟开大会,李彦宏演讲,对人工智能信心爆棚

播放“无人车”上路测试视频

百度联盟开大会,李彦宏演讲,对人工智能信心爆棚

大家可以看到,视频中无人驾驶车路测的整个过程是没有人进行任何干预的。当然,无人车离使用还有一段时间。现在我们能做到的是在路况不是特别复杂、非上下班高峰期的时候,无人车不需要人工干预就可以上上下下、做各种动作,但如果路况特别复杂的话,现在我们技术还达不到。但是我们相信,三五年之内,无人驾驶一定可以成为现实。

我们认为人工智能再往下发展,其最主要的作用是会取代简单的脑力劳动。我刚才举的几个例子,比如无人车,一般人用几个月都可以学会驾车,而自动驾驶就是能够模仿人类的这种简单脑力劳动。还有一些在餐馆里的点餐员,他做的事情也是相对比较简单的,我们的人工智能也能够替代这样的功能,我们来看一下点餐的状况。

播放“度秘”入驻上海肯德基餐厅为顾客点餐视频

百度联盟开大会,李彦宏演讲,对人工智能信心爆棚

这是在上海的一个肯德基概念店,我们用度秘实现了点餐的功能。其实我们可以想象,未来很多这种简单、重复性的劳动都可以通过人工智能的方式来实现,代替人的作用。

百度联盟开大会,李彦宏演讲,对人工智能信心爆棚

当然,人工智能在很多领域都有应用,比如金融领域。依据大数据,依据我们对一个人的理解和分析,这其实也是一种人工智能、机器学习的技术,能够实现很多过去不那么方便实现的东西。比如征信,现在百度的教育贷款,基本上就是以秒为单位就可以决定是否要给一个人贷款,而在过去恐怕是要以天为单位去计时的。

在很多领域,人工智能都能够对传统产业产生改变。我觉得不需要我做更多的解释,大家只要想一想刚才展示的这些技术,无论是语音识别也好,自然语言的理解也好,还是图像识别也好,这些技术一旦应用到各种各样的产业中,都会对每一个产业产生巨大的改变。我们讲了很多年互联网对于制造业的影响,讲了很多年的物联网,我可以下这样的结论,如果没有人工智能的能力,物联网也好,互联网也好,对于制造业——大家知道中国是一个制造业大国——是不会有本质性影响的;但是有了人工智能,它对于制造业几乎每一个领域都可以产生巨大的影响。原来大家觉得一个死的东西,将来就变活了,它就会具有人类的智能。

百度联盟开大会,李彦宏演讲,对人工智能信心爆棚

那么问题来了,这可能是很多人比较喜欢谈论的一个话题:人工智能到底是会解放人类,还是会毁灭人类?业界其实有很多大咖都倾向于后者,他们都很担心人工智能会毁灭人类,我是属于比较乐观的那一类,我认为人工智能会做的是解放人类,至少在我有生之年,它毁灭不了人类。

其实这个道理很简单,大家想想,能够毁灭人类的东西早就出现了,比如说原子弹。现在人类拥有的原子弹可以毁灭人类很多次,但是为什么至今还没有能够毁灭人类呢?这是因为我们还拥有最终的控制权,谁能去push那个launch button(发射按钮),这个方面还是有很好的机制能够管理的。所以人工智能会越来越智能、越来越接近人类的能力,能够解放人类很多繁琐的工作,也能够激发无限的可能性。过去我们觉得不能做的事情,未来可能通过人和机器的结合,就越来越能做了,但是我不觉得人工智能会毁灭人类,因为我们有能力去控制,我们也有能力去制定相应的规则。

讲了很多技术,我想说的是,这些技术不仅仅是属于百度的,我们会无偿把它开放出来,供我们联盟的伙伴使用。不管你想做什么行业,不管你想进入哪一个领域,百度这些技术完全都是开放的,让大家自由地使用,甚至我们很快也会把我们深度学习的源代码开放出来,让大家看到底这些东西是怎么实现的,大家甚至可以在这个基础上进行相应的改进。这样的话确实能够使得人工智能迅速地渗透到各个行业,从而改变我们的社会。

百度联盟开大会,李彦宏演讲,对人工智能信心爆棚

所以,我所说的下一幕就是人工智能。这是继移动互联网之后一个更加激动人心、更加能够给我们带来各种各样想象、各种各样可能性的新时代。我们希望每一个在座的人都能够在下一幕、在新的时代中,绽放自己的能力和风采,谢谢!

2014-05-31 13:21:51 KelJony 阅读数 1361

以下为李彦宏演讲实录

大家好,欢迎大家来到黄山。

每年的联盟峰会都会选择一个山清水秀的地方,这样是因为,一方面心情可以比较放松;另外一方面,思路也容易打开。去年的联盟峰会在香格里拉举 行,当时我讲的话题是“互联网加速颠覆传统产业”。其实这个话题也是在峰会前一天晚上才把思路整理出来的,不是说平时不在想,而是平时想的时候思路比较 乱、不成系统;到前一天晚上,去一个比较安静的地方,在一个美丽的环境当中,就很容易能够把思路理出来。当然,当时讲的时候主要还是觉得,我在讲的是未来 三到五年才会发生的事情,没有想到仅仅过了不到一年,这个理念就被很多人所接受了。当时讲这个话主要还是希望让我们的传统产业能更早地意识到互联网给他们 带来的冲击,同时及早地去拥抱互联网,及早地用互联网思维来做事情。

那次讲话之后,银行来找我,证券公司来找我,保险公司来找我,医院来找我,学校来找我,都希望能和百度合作。其实跟一家公司合作这种解决方案是 没法拓展的,我觉得,每一个企业应该更多从自身的特点想办法,用互联网的思维做事情,或者把原本的事情做得更好,效率才能提得更高。

这里我给大家举个例子,就是企鹅的例子。大家没有必要那么敏感,我是讲的真的企鹅。百度百科里有一个企鹅的词条,大家如果现在去试一下、或者最 近有所注意的话,就会发现这个企鹅词条里面有一个live web cam(实时网络摄像头)。你在看到这个词条的时候,不仅有文字性的介绍和图片,还有一个实时的对准北京动物园企鹅馆的录像。你要想看企鹅是什么样子、它 现在在那儿干什么,就能够看得到。这就是一个比较典型的传统行业拥抱互联网的例子。我了解,当初在做这个合作的时候,北京动物园内部也有两派意见:一个觉 得这是在拥抱互联网,是一个进步;另外一个觉得这样会影响动物园原有的业务,因为大家都能在网上轻易地看到动物园里面所有的动物长得什么样,那谁还会来动 物园现场看动物呢?

他们经过一番debate(讨论)之后,还是拥抱了互联网思维。其实,我们作为互联网从业者,来做这个决定是非常轻而易举的:如果把这些东西都 放到网上的话,就一定能够帮助我们获得更多的客户,帮助让更多的人产生对动物的兴趣、进而真正来动物园看一下。在网上看直播和到现场看的感受,其实还是非 常不一样的。我们每个人都应该会同意这一点。但是,对于一个传统产业来说,想要真正地把这种思维方式转变过来,还是需要一定时间的。但是,至少我自己,很 高兴看到在过去的这一年,这一方面的意识,无论在哪个产业都变得相当强了。

我也在想,每年在联盟峰会就是希望能够跟大家分享一下我对未来产业发展的判断。当然,不是说对未来一年的判断,更多的是对未来五年、或者更长时 间的判断。很多事情需要经过一定阶段、一定时间的酝酿才会越来越明显。而像去年那样讲了以后立竿见影、不到一年就所有人接受,是比较出乎意料的。

其实对我来说,讲未来的趋势也有一定的难度,因为百度本来就在互联网这个领域之中,我们想做的事我肯定天天都在想。但我要想做的不一定愿意告诉 大家,等我做出来以后才会告诉你们;我愿意告诉你们的,又是我不想做的,又能够代表未来趋势的,这个确实还是有难度的。我不想做的,“A”和“T”想不想 做呢?我估计他们也不想做。所以这个话题就变成:未来五年会有非常大的发展,但是BAT又都不会做的,是什么东西?我想了想,确实还有,有两个东西。

第一个是企业级软件。这倒不是一个新东西,但是在未来会变得很新。去年我们讲传统产业正在被加速颠覆,在这个颠覆的过程中,企业要拥抱互联网, 用互联网的思维来做事情。其实企业级软件,在发达国家,像美国等都有非常大的市场,孕育了很多市值非常大的公司,IBM(183.08, -1.70, -0.92%)、Oracle、 Microsoft等。像Microsoft原来有很大程度的收入来自consumer(用户端),但现在有70%的收入是来自enterprise(企 业端)。我估计未来这个比例会更高。一个企业级软件市场可以养这么多的大公司,但是在中国没有特别大的企业级软件公司。

为什么呢?我觉得有两个原因,第一,中国过去劳动力成本很低,而企业级软件在过去解决的问题是什么呢?是提高企业内部的运营效率,运营效率提高 了,可以少雇人。软件比人便宜,那么人们就买软件,这个事情过去在中国不是很明显,所以这个结论就不是特别成立。第二,我们发现其实在中国,当老板的人基 本不用PC,如果他自己不用的话,就很难带着整个公司去用。或者说,他很难去特别推崇用PC提升工作效率。

但是这两个条件,或者说这两个现象,都是正在改变的。一方面,中国的劳动力成本上升非常非常快,这是整个中国经济发展面临的非常大的问题。另一 方面,我们也看到,现在每一个老板都拿着一个智能手机,不仅拿着,而且他真的会用。如果是这样的话,他通过智能手机,随时随地带着,一天二十四小时都用, 这个手机又可以上网,那么自然而然地,他会想到去用这个企业级的软件来提升工作效率。

但是,我讲的这个企业级软件可以说是一种新的企业级软件,和我们过去讲的企业级软件是不一样的。它不一定是基于PC的,它的整个工作理念可能也 是不一样的。去年我们收购了91无线,很多人都很关注,但可能有一点你们没有注意到。我们在和91打交道的过程中有一点让我们觉得很吃惊,就是每个91高 管的名片,上面写的电子邮件的域名地址都是不一样的,不是91.com,而是163、qq、gmail或者其他域名的。我们很纳闷,觉得91 虽然不是大公司,但也是有几千人的公司,为什么高管拿出来的名片email都是乱七八糟的?他们说,我们工作不用邮件,我们用IM(即时通讯软件),他们 自己开发的。这个IM可以做什么呢?除了能够即时通讯,它还什么都干,ERP的审批、报销、员工绩效考核、任务的分发……任何事情都可以通过这个内部开发 的一个IM实现。我觉得这个东西其实挺有意思的,它很可能代表一种方向。整个企业可以用一种新型的软件来运营。一个IM就把我们过去在企业里面需要买的各 种各样的企业级软件都代替了。

其实整个产业界,不管是中国,还是美国,都在朝着这个方向发展。比如微软最近发布的Office365,基本就是把Office搬到了云端。这 是因为他们认为这代表了一个方向,所以才会这样做。但是仅仅接管过去企业内部流程运转方面的工作的话,我觉得还不能完全代表新的企业级软件。

在我心目当中,新的企业级软件是什么呢?它应该能够解决更多的问题。它不仅仅可以解决企业内部流程的问题,而且能够解决企业从内部到外部的连接问题,就是说,企业如何与客户打交道的问题。过去的企业级软件是没有办法解决这些问题的,而未来是可以解决的。

再给大家举个例子,不知道大家最近有没有注意到,青岛航空把整个售票体系全部包给了去哪儿。我卖了多少张票、每一张票多少钱、什么时候卖出、上 座率多少,这些东西都靠去哪儿软件来做决策。其实在Airline Industry(航空产业)中,航空公司对于上座率的问题已经研究很长时间了,因为如果空一个座位的话,它的成本就完全浪费了,就没有价值了。所以对航 空公司来说,把飞机坐满,同时让每一个人付的价钱又最高,这对于航空公司来讲是收益最大的。所以Airline Industry中一直在研究,提前一个月买票是多少钱、提前两周买票是多少钱、提前一天买票是多少钱、而我站在那儿等着马上就上飞机又是多少钱。但是, 他们过去的研究主要是根据historical data,比如说现在是5月29号,那么一年前5月29号的乘客数目是多少?demand(需求)是多少?未来,有很多其他的信息,如果用互联网的思维来 重新看一遍的话,有很多其他的信息是可以加进去,可以把票卖得更好。

去哪儿开发一了套软件,他们不仅知道过去卖票的情况,而且可以更好地预测到未来,根据人的特点、现在环境发生的变化、竞争情况等等,就可以卖出 去平均来说更高的价格。当我认为demand不够的时候,就把价格降得更低一些,或者提早降价;当然如果航空公司认为会有足够多的人在最后一分钟买票的 话,价格就一直不降,这里会有很多的技术。其实大家想想,不光是Airline Industry,在我们平时接触的很多行业中都有这个现象、也都有这个问题。

比较典型的是餐馆。我们都知道,好餐馆是经常需要排队的,有的餐馆价位定的比较高,客人就没有那么多,就会坐的不是很满。好餐馆每天一顿饭翻一 次台和翻两次台、翻三次台挣得钱是不一样的,因为餐馆的固定成本基本差不多。餐馆里坐了10%的人、和90%的人也是很不一样的。所以,怎样动态地定价, 让足够多的人、按照足够高的价钱到餐馆来,这其实和航空业的机票定价是一模一样的,酒店的房间也是同样的:什么时间、面向什么人、卖出什么价格……这套东 西如果作为一种企业级软件开发出来,那么未来不光是对企业内部的效益,而且对整个社会的效益都会有非常大的提升。所以,机票、酒店、餐馆、歌厅、发廊…… 很多这种服务型的企业,也是我们国家未来想大力发展的出口、投资、消费当中的消费的部分,这类型的企业,目前的运营效率是非常低的。用这类软件去提升效 率,我认为是未来五年左右一个具有巨大发展潜力的方向。

第二个方向跟大数据有关,但不完全是大家一般意义上讲的大数据。每每讲到大数据,我的美国同行,就是Google Chairman(谷歌(561.68, -4.27, -0.75%)董事长) Eric Schmidt(施密特)经常说的一句话是:在过去两年,我们生产的数据,是占全部人类文明史上所有数据总和的90%。也就是说,过去一万年产生的数据也 只占整个数据的10%。言外之意是,现在数据已经爆炸了,我们要解决的是信息爆炸、数据太多的问题。其实我觉得,这有点误导的嫌疑,我们现在看到,每天产 生的很多数据基本都是没价值的数据,很多产业,尤其是传统产业,他自己抱着那些数据说:我这些数据特别值钱,大数据时代来了,我这些数据可以开始显现威力 了。像百度这样的公司,在技术上有相当多年的积累,在我们看来,技术已经almost ready(基本就位),技术是可以去做一些事情的;但是我们真正想要的数据现在没有,或是还没有搜集上来,已经被搜集上来的数据基本没有价值。

比如说最近比较火的智能硬件。戴个手环、弄个眼镜,搜集了很多数据,但把这些数据拿回来之后总觉得用不上,觉得没法分析。比如戴眼镜,人平时眼睛能看到的,一天24小时除了闭着眼睡觉之外,把剩下能看到的全部搜集过来,但这些有什么用?我们想来想去,其实是没有用的。

国家有关部门的卫星,照了大量的卫星图片,数据量也非常非常大。百度做地图,其实我们对这些东西也研究了很长时间。琢磨来琢磨去,觉得这个数据拿过来我们用不了。那它们就不是大家真正需要的东西。弄个手环,算一下我每天走了多少步、消耗了多少卡路里、心跳多少,能帮助治病吗?我也问过很多医生, 他们也说这东西不能帮助治病。

我觉得下一个方向其实是新数据。就是要思考,什么数据能够真正的帮助人们解决问题。今年4月1号的时候,我们讲了一个概念性的产品,就是百度筷搜。很多人问你们什么时候出这个产品,我们想买。实际上,这个东西我们还没做出来。但是,这东西确实是代表方向的。当我们说,你有一双筷子,在你吃饭的时 候就能知道这盘菜有没有用地沟油、或者这个蔬菜是不是重金属超标了……那么大家就会觉得这个东西太有用了,我想要这个东西。

目前来说,这个数据还没有,我们还没有能力收集这些数据。但是这个的确是代表了一个方向,因为你本来天天就在吃饭、本来每天都在用筷子,不像你 本来不带手环你却戴上了、你本来不戴眼镜,却戴了这个很重的东西,这是完全不一样的。我本来就干的事,同时帮我收集数据,这些数据可以立刻告诉我一些有价 值的信息;或者这些数据也许不会立刻告诉我有哪些信息,立刻告诉我的也不一定有价值,但是,我如果坚持这样做下去,也许就会有价值。

就像中医的理念是“治未病”,就是还没生病的时候就告诉你身体以后会怎么样。很多的病有一个漫长的积累过程,在这个积累的过程当中,你的身体各 项指标一定是在发生变化的。可是目前的医学实践,都是说等你有病了,或者说你觉得你有病了,到医院进行检查,希望几个小时之内、最长几天之内诊断出来到底 有什么问题。而真正能够治疗人们的这种“未病”的、或者说更先进的治疗方法,是对很多症状的多年积累,在积累的过程中、由于你持续地monitor(监 测)你的身体特征长达三个月、六个月的时间,就可以知道我今天和六个月之前的身体数据有哪些不一样,可能是身体上出了什么问题,需要及早去医院看。

这样的不是“快数据”,而是“慢数据”。“慢数据”会对消费者有很大的价值。而这种“慢数据”的收集方法,又不是来自于那些原本不需要戴的东西,一定是平时就在 干的事,顺便就把这些数据收集上来了。比如说我天天都要刷牙,我在刷牙的过程中,唾液的情况都是可以接触到、可以分析的。也许有一种癌症,就可能会在被现 代医学检查出来前的五年,通过检测唾液,持续检测半年之后就可以知道癌症可能会发生,这样的数据如果收集上来,就会非常有价值。

所以我觉得,新一代的数据收集,不管是收集工具也好,或者说数据本身也好,都会有很大的发展。但是这里面,难点并不在于你制造出来一个新型的硬件,而在于能够找到那个点,找到什么数据对人们是有价值的。

其实在健康方面的大数据也讲了很长时间了。比如说,人类的基因测序,过去很多国家花了纳税人很多的钱,搞了这个人类的基因图谱。现在成本急剧下 降,可能花一千美元,用几天的时间,就能够把整个人的基因测出来了。理论来讲,这个数据也是可以告诉你,你这个人的身体会发生什么变化、有什么特点、未来 会有什么风险。但是在本质上,这些数据还是没有用的。因为它本质上就是ATCG,基因的序列就是利用ATCG排下来的。你看到的就是一串ATCG,可能重 复了很长很长的距离而已。现在所说的大数据有很多都是这样的数据。但是这样的数据是没有用的。我们拿着很好的技术,但是对这种数据下不了手。要想找到有价 值的数据,其实不光要有技术。技术是有价值的,但在这里并不是最关键的。最关键的是什么呢?最关键的是domain knowledge(领域知识)、你的experience(经验)、以及跨领域的思考能力。假如说你真的是一个懂互联网的中医,你就有可能研究能够出来 一个指标,在连续follow(跟踪)半年之后,就可以知道哪些病会不会发生,而这是纯互联网公司干不了的,需要有这个领域的专业知识、甚至是经验。还有 跨领域的思考,并不是一个简单的医生就可以想到这些东西,你一定要有互联网的思维。你可以不知道这个技术是怎么实现的,但是你要知道技术上可以实现这些东 西。那才有可能找到合适的数据。

所以,这种类型的数据,我认为是未来真正有价值的数据,过去不管产生了多少数据,其实都浪费掉了。所以从这个意义来讲,现在传统产业在数据上仍 然没有优势,互联网公司目前在数据上也没有优势。我们讲很多大数据,百度每天有几十亿人次的搜索什么的,这些数据,现在做的事情大多数是宏观上的预测:比 如我们预测一下端午节哪个景点人比较多、高速上哪里要堵车了,这些都相当于是统计型的结果,现在的数据可以做到这些。但是真正 individualized(个性化)的数据,比如说,我们怎么能够知道一个人在走进一个餐馆的时候会点什么菜?现在的数据积累其实还不够;某一个人, 五年以后会得什么病?我们现在也搞不明白。

所以,这样的东西,是需要每一个行业,以及拥有行业知识、行业经验的人,来积极拥抱互联网,来跟互联网进行结合,才能够做出来。

我之所以讲这些东西,还是希望有更多产业的人,不光是互联网产业界的人,其他产业界的人,能够多跟我们这些人碰撞。我也希望在座的联盟合作伙 伴,多和各个行业的人进行碰撞,因为很多东西是在不同的行业进行交叉的时候,才能够撞出火花,才能真正把一些过去被别人忽略掉的东西找出来。而这种领域, 恰恰是机会最多的。你是这个领域,他是另外一个领域,而大家没有把注意力都没有集中到中间的状态中;而且就算你把注意力集中到中间状态,但如果仅仅从自己 的角度来看这个问题,你就会发现其实也没什么价值。

百度这么多年积累了很多很多技术。比如现在我们有以图识图,用手机去拍,就立刻可以知道这个花叫什么。但是,这个东西到底有什么用,我们不知 道。有一天,如果有一个人告诉我说,这个东西你如果拍一下就能知道它是什么,那就有价值了,那就厉害了。我们现在缺这样的东西。我现在有这种 technology(技术),但我不知道计算机能够识别出什么,它就会变得就有价值。所以,希望不同领域的人能够进行交叉、进行相互的激励,最后产生创 新。而这方面,我觉得中国其实是处在一个非常有优势的地位,我们的传统产业时间更短,基础并不是那么牢固,我们的传统产业中的企业家,尤其是民营企业家, 他们更加开放——因为过去几十年中国的市场就一直是一个迅速变化的市场,他们本身做生意的方式就在变化,再变化一次对他们来说也没有那么难。这和美国那些 做了上百年的传统企业的思维方式,或者说转变思维方式的成本相比,还是很不一样的。所以,如果我们能够更好的把互联网公司的思维方式、技术、经验和每一个 领域进行更好结合,我觉得产生出来的未来价值,对整个社会的运营效率的提升,都是非常有帮助的。

所以当我们有了新的企业级软件,当我们有了新的数据,再结合上比如最近几年飞速发展的深度学习、人工智能这些技术,我相信未来若干年都会有一个非常美好的前景。


转至:36大数据

2018-08-29 06:23:56 weixin_34198583 阅读数 8

6月22日,百度公司董事长兼CEO李彦宏以全国工商联副主席的身份应邀为全国工商联的全体机关干部带去一场题为《技术改变世界 AI开启新时代》的人工智能公开课。

智搜(Giiso)信息成立于2013年是国内领先的“人工智能+资讯”领域技术服务商,在大数据挖掘、智能语义、知识图谱等领域都拥有国内顶尖技术。同时旗下研发产品包括资讯机器人、编辑机器人、写作机器人等人工智能产品!凭借雄厚的技术实力,公司成立之初,就获得了天使轮投资,并在2015年8月获得了金沙江创投500万美元pre-A轮投资。

百度公司董事长兼CEO李彦宏

在公开课上,李彦宏对当下人工智能技术的发展现状以及百度已经在该领域取得的研究成果进行了阐述。李彦宏表示,从研究者的角度来看,人工智能可以分成三个阶段:弱人工智能、强人工智能和超人工智能,目前人们还处在弱人工智能阶段。

但李彦宏指出,人类对人工智能的研究经过前期50年左右的漫长准备,现在已经到了爆发期。它对人类社会的影响一定会越来越明显。而人工智能前50年,基本上是学术范围的探讨。这个漫长的摸索过程过去之后,随着计算资源越来越丰富,价格越来越低廉,数据越来越多,人工智能技术进入了实用阶段。“人工智能是不会再回头的,它会一直往前落实,各个行业也会由此发生各种各样的改变。”李彦宏说道。

李彦宏还为全国工商联干部详细阐释了发展人工智能的关键性技术:语音识别、图像识别和自然语言处理。李彦宏表示,有了这些技术,在人工智能时代,人们只要用人话跟机器沟通,它就明白你要干什么,万物都能被唤醒。这个广阔前景会改变任何一个行业,而及早地了解人工智能更有助于推动这个改变。

在公开课上,李彦宏通过视频展示了百度的人工智能技术在人脸识别、无人驾驶、AR重现建筑、AI寻人等领域的应用。他表示,人工智能可能会在未来发展出来各种各样我们觉得不可思议的能力。目前在很多单项能力方面,人工智能已经超过了人类。李彦宏举例道:“在搜索的场景下,人的听力的识别率,即一字不落地听下来一句话的比率是82%,但机器已经做到了87%。”

谈到人工智能时代对人类社会的负面影响时,李彦宏指出,在未来会有一些职业将不复存在,譬如司机、翻译、金融分析师等。但是人仍然可以控制人工智能使得它的正面影响发挥到最大,负面影响降到最校同时,人工智能会带来很多新的机会,尤其是需要人的创意来参与的时候,就会诞生出新的工作机会。另一方面,当未来生产效率越来越提升的时候,人们可能更多的时间是花在娱乐、花在享受上,人工智能可以在这些方面更好地帮助人享受生活。

在讲座结束后,针对在场干部的提问李彦宏也一一做出解答。

当被问及人工智能时代下中国传统产业转型升级的路径问题时,李彦宏提出,制造业未来的方向应是运用AI时代的思维方式,来使产业智能化。同时,他指出“重视人工智能已经成为全球共识”,而中国在这场AI竞争中占据优势,庞大市尝人才和资金已使中国走在世界前列。

当有人指出百度在人工智能产品化方面进展较慢时,李彦宏称,百度在人工智能这个领域布局了大概有五六年的时间,不管是语音的识别、图像的识别、自然语言的理解和用户画像这些基础技术,都有很多应用的场景,但是未来到底是哪一个产品,哪一款产品有最大的商业价值,有最大的社会价值,现在还在一个探索的过程当中。

以下为李彦宏在全国工商联的人工智能讲座实录:

非常高兴能够来到工商联跟大家进行一次交流。这次,这个讲座是以人工智能为主题,一方面是我对这个主题比较熟悉,另外一方面人工智能确实在过去这一两年当中非常火热,不仅仅是在IT领域很热,在一般的普罗大众心目中也越来越意识到人工智能的重要性。今天我讲这些内容,就是希望能让大家更好地理解,为什么人工智能会这么热?以及它会有哪些作用和影响。

我们如果回顾过去这几十年整个世界的变化,经济一直还是在相对比较平稳地保持增长。但是经济增长的动力其实是技术创新。过去这40年主要增长的是发达国家,虽然发展中国家增长更快,但是发达国家体量大,所以他们的增长是真正在带动全球经济增长的。发达国家的增长靠什么?不是靠人口的增长,而是靠它的劳动生产力的提升。劳动生产力靠什么提升呢?靠技术创新。可以说,过去40年IT技术是这其中最明显的,也是影响最大的一个能够提升劳动生产力的推动力。

智搜(Giiso)信息成立于2013年,是国内首家专注于资讯智能处理技术研发及写作机器人核心软件开发和运营的高科技企业。公司成立之初,就获得了天使轮投资,并在2015年8月获得了金沙江创投500万美元pre-A轮投资。 

所以如果我们看一下,今天美国股市上市值最高的公司和40年前市值最高的公司相比,没有一个是一样的。40年前,最有价值的这些公司是来自汽车、能源这些我们今天看来相对比较传统的领域,而今天在美国股市上市值排名前五位的公司,是苹果、谷歌(Alphabet)、微软、Facebook、亚马逊(Amazon),全部都是IT或者互联网公司,为什么?因为过去这些年,世界经济主要推动的力量是通过技术创新,而技术创新主要来自于这些IT互联网企业。


转载于:https://juejin.im/post/5b863bc6f265da436479f047

没有更多推荐了,返回首页