李彦宏讲大数据 - CSDN
  • 原标题:李彦宏为什么会为大数据引擎站台? 在昨天(4月24日)的百度技术开放日上,李彦宏现身并推出了百度大数据引擎。这在百度,表明对相关产品最高的重视了。 这个发布是什么意思呢?简单地,...



    在昨天(4月24日)的百度技术开放日上,李彦宏现身并推出了百度大数据引擎。这在百度,表明对相关产品最高的重视了。

    这个发布是什么意思呢?简单地讲,大数据引擎将百度在大数据的数据、能力和技术开放给行业,行业可以近身距离甚远的大数据盛宴,百度则寻到了一个新的增长点。


    大数据引擎三件套

    百度大数据引擎一共分三个部分。

    开放云:百度的大规模分布式计算和超大规模存储云。过去的百度云主要面向开发者,大数据引擎的开放云则是面向有大数据存储和处理需求的“大开发者”。

    百度的开放云拥有超过1.2万台的单集群,超过阿里飞天计划的5k集群。百度开放云还拥有CPU利用率高、弹性高、成本低等特点。百度是全球首家大规模商用ARM服务器的公司,而ARM架构的特征是能耗小和存储密度大,同时百度还是首家将GPU(图形处理器)应用在机器学习领域的公司,实现了能耗节省的目的。

    数据工厂:开放云是基础设施和硬件能力,你可以把数据工厂理解为百度将海量数据组织起来的软件能力。就像数据库软件的位置一样。只不过数据工厂是被用作处理TB级甚至更大的数据。

    百度数据工厂支持单词百TB异构数据查询,支持SQL-like以及更复杂的查询语句,支持各种查询业务场景。同时百度数据工厂还将承载对于TB级别大表的并发查询和扫描,大查询、低并发时每秒可达百GB,在业界已经是很领先的能力了。

    百度大脑:有了大数据处理和存储的基础之后,还得有一套能够应用这些数据的算法。图灵奖获得者N.Wirth(沃斯)提出过“程序=数据结构+算法”的理论。如果说百度大数据引擎是一个程序,那么它的数据结构就是数据工厂+开放云,而算法则对应到百度大脑。

    百度大脑将百度此前在人工智能方面的能力开放出来,主要是大规模机器学习能力和深度学习能力。此前它们被应用在语音、图像、文本识别,以及自然语言和语义理解方面,被应用在不少App,还通过百度Inside等平台开放给了智能硬件。现在这些能力将被用来对大数据进行智能化的分析、学习、处理、利用。百度深度神经网络拥有200亿个参数,是全球规模最大的,它拥有独立的深度学习研究院(IDL)和较早的布局,在人工智能上百度已经快了一步,现在贡献给业界表明了它要开放的决心。


    大数据引擎可以干嘛

    百度将基础设施能力、软件系统能力以及智能算法技术打包在一起,通过大数据引擎开放出来之后,拥有大数据的行业可以将自己的数据接入到这个引擎进行处理。同时,一些企业在没有大数据的情况下,还可以使用百度的数据以及大数据成果。

    从架构来看,企业或组织也可以只选择三件套中的一样使用,例如数据存放在自己的云,但要运用百度大脑的一些智能算法应该也是支持的。

    举几个例子可能你更加清楚百度大数据引擎究竟是什么。

    许多政府部门拥有海量大数据——大数据经典之作《大数据》也是在讲美国政府的大数据。但政府部门几乎都没有大数据处理和挖掘技术。交通部门有车联网、物联网、路网监控、船联网、码头车站监控等地方的大数据,卫生部门拥有流感法定报告数据、全国流感样病例哨点监测和病原学监测数据,公安部门有大量的视频监控数据。如果这些数据与百度的搜索记录、全网数据、LBS数据结合,在利用百度大数据引擎的大数据能力,则可以实现智能路径规划、运力管理、流感预测、疫苗接种指导、安防追逃等等。

    许多企业也拥有海量大数据——通信、金融、物流、制造、农业等行业。不过,它们几乎都没有大数据能力,坐拥海量数据却一筹莫展。这时候如果能够应用百度大数据引擎,则可以对海量数据进行可靠低成本的存储,进行智能化的由浅入深的价值挖掘。在百度技术开放日上,中国平安便介绍了如何利用百度的大数据能力加强消费者理解和预测,细分客户群制定个性化产品和营销方案。

    可以看出,大数据引擎的输入实际上是百度拥有的大数据以及行业已有的大数据,而输出则是各种行业应用成果,也就是大数据的“价值”。


    与一些类似项目的对比

    在百度之前,业界已经有一些类似的思路,即有一些大数据能力的企业视图将自己在基础能力或者软件方面的优势释放出来。

    Google:

    大数据时代的奠基者。对应到百度开放云,它有举世闻名的数据中心以及基于Colossus的云;对应到百度数据工厂,Google近年来为迎接大数据时代不断改造核心技术,包括比MapReduce批处理索引系统搜索更快的Caffeine,专为BigTable设计的分布式存储Colossus比GFS还要先进,Dremel和PowerDrill管理和分析大数据,以及Instant和Pregel。对应到百度大脑,Google提供的大数据分析智能应用包括客户情绪分析、交易风险(欺诈分析)、产品推荐、消息路由、诊断、客户流失预测、法律文案分类、电子邮件内容过滤、政治倾向预测、物种鉴定等多个方面。技术有Big Query、趋势图等。

    可以说Google与百度的思路最为接近,不过Google目前还未将它的大数据能力打包起来以一个新“引擎”的方式共享。毫无疑问,这在不久之后就会发生。


    亚马逊:

    云计算的奠基者。亚马逊是IaaS(基础设施即服务),与阿里云非常相似。亚马逊在用户交易、个人偏好、经济领域的大数据能力可能比Google还要优秀,也被一些人视作这是亚马逊与Google竞争的唯一机会。亚马逊目前更多还是在云领域做贡献,虽然也有Redshift的方案,但在数据工厂和人工智能的开放上进展慢一些。


    阿里巴巴:

    亚马逊对应回中国自然是阿里巴巴。阿里云是国内最早的独立运作的云部门。数据则是阿里三大核心战略之一,大数据也被摆到了阿里十分重要的位置,不懂技术的马云经常谈及大数据都有人调侃他应该改名Data Ma。阿里在大数据基础设施领域确实取得了突飞猛进的进展,飞天、Apsara、跨机房5K集群都是知名的大数据项目,应对双十一、余额宝规模取现预测、广告业务高速增长等业务场景也证明了阿里的大数据能力。

    阿里大数据的思路便是做大数据的集市,让阿里系之外的大数据能够跑在阿里苦心搭建的大数据机器上运转起来。不久之前阿里与东软合作,后者的业务未来都将部署在阿里云。这意味着东软客户的数据很可能会进入阿里的大数据体系。可以确定阿里将会推出类似大数据引擎的平台,将大数据能力完全开放出来。

    相比百度,阿里在“数据工厂”这块应该是各有所长,在数据基础领域以及业务理解方面有着电商领域的专注,但人工智能这块跟百度比肯定会有不小差距。语音、图像和自然语言理解,阿里并没有多少积累,它更擅长处理结构化的数据。

    其他电商玩家如京东和苏宁也有类似的云,与阿里和百度完全不在一个级别就不比较了。


    Salesforce等软件公司:

    Salesforce近两年收购了超过5家与社交大数据相关的营销公司,目的是获取更多的数据。其他的软件厂商和方案厂商也有大数据引擎方面的布局,EMC、Oracle有对应的大数据处理软件,IBM有大数据行业方案,英特尔入股大了数据初创企业Cloudera,Cloudera推出的Impala比GoogleDremel还要快。Intel还推出了基于Hidoop的“大数据引擎”,加州伯克利大学AMPLab开发了名为Shark 的大数据分析系统。

    回到国内,华为在去年发布了大数据平台产品FusionInsight,还有百分点科技这样的基于大数据的推荐服务公司。而“天河2号”等独立超级计算机也对外宣称它们的超级计算能力将会逐步开放出来。

    不过,软件公司、方案公司以及超级计算机都无法做到像百度一样将大数据作为一种云端能力打包开放出来,也无法同时具备基础设施、数据工厂和智能算法的开放能力。尤其是“百度大脑”这部分,很少有其他具备这样的“数据智能”的能力。

    百度将用互联网的方式来做开放的大数据引擎。它不可能采取与软件方案公司一样的“一竿子买卖”方式进行合作。而是将大数据引擎做成一个开放平台,形成标准的接口,让每个行业不同企业可以根据自身需求各取所需。而它的首要目的是获取数据,然后是考虑变现。

    变现方式可能是增值服务、收费云、数据分析结果、技术咨询等方式,这将改变百度盈利模式过渡依赖“搜索广告”的现状。有消息称,大数据已经给Google每天带来2300万美元的收入,一年约为82亿美元。这已经远远超过百度2013年51亿美金的年收入了。因此,如果百度大数据引擎能够成功,很可能会为之带来源源不断的数据以及现金流。
    展开全文
  • 摘要 : 百度将用互联网的方式来做开放的大数据引擎。它不可能采取与软件方案公司一样的“一竿子...在昨天的百度技术开放日上,李彦宏现身并推出了百度大数据引擎。简单地将,大数据引擎将百度在大数据的数据、能力...
    摘要 : 百度将用互联网的方式来做开放的大数据引擎。它不可能采取与软件方案公司一样的“一竿子买卖”方式进行合作。而是将大数据引擎做成一个开放平台,形成标准的接口,让每个行业不同企业可以根据自身需求各取所需。而它的首要目的是获取数据,然后是考虑变现。

     

    百度在大数据领域迈出一大步。在昨天的百度技术开放日上,李彦宏现身并推出了百度大数据引擎。简单地将,大数据引擎将百度在大数据的数据、能力和技术开放给行业,行业尝尝距离甚远的大数据盛宴,百度则寻到了一个新的增长点。

    大数据引擎三件套

    一年前,BAT纷纷开挖大数据,一年后BAT在大数据应用上均取得了一些成绩。现在百度则率先将其大数据能力开放出来,百度大数据引擎一共分三个部分。

    开放云:百度的大规模分布式计算和超大规模存储云。过去的百度云主要面向开发者,大数据引擎的开放云则是面向有大数据存储和处理需求的“大开发者”。

    百度的开放云拥有超过1.2万台的单集群,超过阿里飞天计划的5k集群。百度开放云还拥有CPU利用率 高、弹性高、成本低等特点。百度是全球首家大规模商用ARM服务器的公司,而ARM架构的特征是能耗小和存储密度大,同时百度还是首家将GPU(图形处理 器)应用在机器学习领域的公司,实现了能耗节省的目的。

    数据工厂:开放云是基础设施和硬件能力,你可以把数据工厂理解为百度将海量数据组织起来的软件能力。就像数据库软件的位置一样。只不过数据工厂是被用作处理TB级甚至更大的数据。

    百度数据工厂支持单词百TB异构数据查询,支持SQL-like以及更复杂的查询语句,支持各种查询业务场景。同时百度数据工厂还将承载对于TB级别大表的并发查询和扫描,大查询、低并发时每秒可达百GB,在业界已经是很领先的能力了。

    百度大脑:有了大数据处理和存储的基础之后,还得有一套能够应用这些数据的算法。图灵奖获得者N.Wirth(沃斯)提出过“程序=数据结构+算法”的理论。如果说百度大数据引擎是一个程序,那么它的数据结构就是数据工厂+开放云,而算法则对应到百度大脑。

    百度大脑将百度此前在人工智能方面的能力开放出来,主要是大规模机器学习能力和深度学习能力。此前它们 被应用在语音、图像、文本识别,以及自然语言和语义理解方面,被应用在不少App,还通过百度Inside等平台开放给了智能硬件。现在这些能力将被用来 对大数据进行智能化的分析、学习、处理、利用。百度深度神经网络拥有200亿个参数,是全球规模最大的,它拥有独立的深度学习研究院(IDL)和较早的布 局,在人工智能上百度已经快了一步,现在贡献给业界表明了它要开放的决心。

    大数据引擎究竟是什么?

    百度将基础设施能力、软件系统能力以及智能算法技术打包在一起,通过大数据引擎开放出来之后,拥有大数据的行业可以将自己的数据接入到这个引擎进行处理。同时,一些企业在没有大数据的情况下,还可以使用百度的数据以及大数据成果。

    从架构来看,企业或组织也可以只选择三件套中的一样使用,例如数据存放在自己的云,但要运用百度大脑的一些智能算法应该也是支持的。

    举几个例子可能你更加清楚百度大数据引擎究竟是什么。

    许多政府部门拥有海量大数据——大数据经典之作《大数据》也是在讲美国政府的大数据。但政府部门几乎都 没有大数据处理和挖掘技术。交通部门有车联网、物联网、路网监控、船联网、码头车站监控等地方的大数据,卫生部门拥有流感法定报告数据、全国流感样病例哨 点监测和病原学监测数据,公安部门有大量的视频监控数据。如果这些数据与百度的搜索记录、全网数据、LBS数据结合,在利用百度大数据引擎的大数据能力, 则可以实现智能路径规划、运力管理、流感预测、疫苗接种指导、安防追逃等等。

    许多企业也拥有海量大数据——通信、金融、物流、制造、农业等行业。不过,它们几乎都没有大数据能力, 坐拥海量数据却一筹莫展。这时候如果能够应用百度大数据引擎,则可以对海量数据进行可靠低成本的存储,进行智能化的由浅入深的价值挖掘。在百度技术开放日 上,中国平安便介绍了如何利用百度的大数据能力加强消费者理解和预测,细分客户群制定个性化产品和营销方案。

    可以看出,大数据引擎的输入实际上是百度拥有的大数据以及行业已有的大数据,而输出则是各种行业应用成果,也就是大数据的“价值”。如果要为百度大数据引擎想一个SLOGAN,可以是“把大数据交给我们即可”。

    百度大数据引擎的出现并非一日之功。大数据技术本身已发展数年,而百度在大数据方面也进行了不少布局,例如百度云、深度学习、计算中心等等。同时与中国平安和一些政府部门此前也已进行一些大数据应用的初步尝试。

    与一些类似项目的对比

    在百度之前,业界已经有一些类似的思路,即有一些大数据能力的企业视图将自己在基础能力或者软件方面的优势释放出来。

    Google大数据时代的奠 基者。对应到百度开放云,它有举世闻名的数据中心以及基于Colossus的云;对应到百度数据工厂,Google近年来为迎接大数据时代不断改造核心技 术,包括比MapReduce批处理索引系统搜索更快的Caffeine,专为BigTable设计的分布式存储Colossus比GFS还要先 进,Dremel和PowerDrill管理和分析大数据,以及Instant和Pregel。对应到百度大脑,Google提供的大数据分析智能应用包 括客户情绪分析、交易风险(欺诈分析)、产品推荐、消息路由、诊断、客户流失预测、法律文案分类、电子邮件内容过滤、政治倾向预测、物种鉴定等多个方面。 技术有Big Query、趋势图等。

    可以说Google与百度的思路最为接近,不过Google目前还未将它的大数据能力打包起来以一个新“引擎”的方式共享。毫无疑问,这在不久之后就会发生。

    亚马逊:云计算的奠基者。亚马逊是IaaS(基础设施即服务),与 阿里云非常相似。亚马逊在用户交易、个人偏好、经济领域的大数据能力可能比Google还要优秀,也被一些人视作这是亚马逊与Google竞争的唯一机 会。亚马逊目前更多还是在云领域做贡献,虽然也有Redshift的方案,但在数据工厂和人工智能的开放上进展慢一些。

    阿里巴巴:

    亚马逊对应回中国自然是阿里巴巴。阿里云是国内最早的独立运作的云部门。数据则是阿里三大核心战略之 一,大数据也被摆到了阿里十分重要的位置,不懂技术的马云经常谈及大数据都有人调侃他应该改名Data Ma。阿里在大数据基础设施领域确实取得了突飞猛进的进展,飞天、Apsara、跨机房5K集群都是知名的大数据项目,应对双十一、余额宝规模取现预测、 广告业务高速增长等业务场景也证明了阿里的大数据能力。

    阿里大数据的思路便是做大数据的集市,让阿里系之外的大数据能够跑在阿里苦心搭建的大数据机器上运转起 来。不久之前阿里与东软合作,后者的业务未来都将部署在阿里云。这意味着东软客户的数据很可能会进入阿里的大数据体系。可以确定阿里将会推出类似大数据引 擎的平台,将大数据能力完全开放出来。

    相比百度,阿里在“数据工厂”这块应该是各有所长,在数据基础领域以及业务理解方面有着电商领域的专注,但人工智能这块跟百度比肯定会有不小差距。语音、图像和自然语言理解,阿里并没有多少积累,它更擅长处理结构化的数据。

    其他电商玩家如京东和苏宁也有类似的云,与阿里和百度完全不在一个级别就不比较了。

    Salesforce等软件公司:

    Salesforce近两年收购了超过5家与社交大数据相关的营销公司,目的是获取更多的数据。其他的 软件厂商和方案厂商也有大数据引擎方面的布局,EMC、Oracle有对应的大数据处理软件,IBM有大数据行业方案,英特尔入股大了数据初创企业 Cloudera,Cloudera推出的Impala比Google Dremel还要快。Intel还推出了基于Hidoop的“大数据引擎”,加州伯克利大学AMPLab开发了名为Shark 的大数据分析系统。

    回到国内,华为在去年发布了大数据平台产品FusionInsight,还有百分点科技这样的基于大数据的推荐服务公司。而“天河2号”等独立超级计算机也对外宣称它们的超级计算能力将会逐步开放出来。

    不过,软件公司、方案公司以及超级计算机都无法做到像百度一样将大数据作为一种云端能力打包开放出来,也无法同时具备基础设施、数据工厂和智能算法的开放能力。尤其是“百度大脑”这部分,很少有其他具备这样的“数据智能”的能力。

    百度将用互联网的方式来做开放的大数据引擎。它不可能采取与软件方案公司一样的“一竿子买卖”方式进行合作。而是将大数据引擎做成一个开放平台,形成标准的接口,让每个行业不同企业可以根据自身需求各取所需。而它的首要目的是获取数据,然后是考虑变现。

    变现方式可能是增值服务、收费云、数据分析结果、技术咨询等方式,这将改变百度盈利模式过渡依赖“搜索 广告”的现状。有消息称,大数据已经给Google每天带来2300万美元的收入,一年约为82亿美元。这已经远远超过百度2013年51亿美金的年收入 了。因此,如果百度大数据引擎能够成功,很可能会为之带来源源不断的数据以及现金流。基于此,可以认为大数据引擎是百度的新大陆,是李彦宏一直在寻找的 “百度的微信”。

    作者微博@互联网阿超,微信SuperSofter

     

    http://luochao.baijia.baidu.com/article/13275

    转载于:https://www.cnblogs.com/jsunday/p/3875158.html

    展开全文
  • 大数据时代

    2014-04-23 02:07:57
    今天看到李彦宏在浙大和学子一起交流,其中主持人给大家看了一张照片,讲述的是李彦宏给中央领导人讲述大数据大数据这个词在逐渐的普及,他就到一个例子,比如在节假日开始之前的几个月,我们普通的市

            之前看过一本叫《大数据时代》的书,讲述了不断变化的IT时代。目前到了信息爆炸,资源丰富的多元化社会,大数据的处理能力和分析能力也许在这个时代会得到逐渐的重视和看好,从事这项工作的工程师也会成为吃的香的职业。

            今天看到李彦宏在浙大和学子一起交流,其中主持人给大家看了一张照片,讲述的是李彦宏给中央领导人讲述大数据,大数据这个词在逐渐的普及,他就讲到一个例子,比如在节假日开始之前的几个月,我们普通的市民就一般通过百度搜索引擎找寻相关景点的信息,百度可以通过这个访问量或者浏览量,从而是否是一个热点,形成一个和前几年的一个对比,从而分析出这个景点是否会出现景点爆棚等现象,从而能告知相关景点做好安排工作,我想这次四川九寨沟的情况在得知相关信息后就不会出现了。百度也可以用这些数据做更多的工作,涉及各个领域。最近在阅读吴军博士的《浪潮之巅》,感觉我对计算机这个行业还有很多未了解的地方,书中基本是以一个企业的兴衰来讲述的,而且还讲到一些定律与法则,非常适合大学生的课外阅读,这里强烈推荐一下,这也是以前我们数据结构老师给我们推荐的书,嘿嘿。

            推荐《大数据时代》,大家能够发现现在很多的,丰富的资源充斥着互联网——这个我们经常接触的地方。

      

            

           

    (转载本站文章请注明作者和出处 Coder的不平凡 ,请勿用于任何商业用途)

    展开全文
  • 我简单介绍一下自己,我是清华硕士,在美国芝加哥大学读博士,后来在美国微软公司工作几年,...先一下大数据爆发原因。实际上数据的问题,包括大数据问题,是一直存在的。为什么最近大数据才在全球非常火爆? ...

    我简单介绍一下自己,我是清华硕士,在美国芝加哥大学读博士,后来在美国微软公司工作几年,主要做广告大数据平台。2012年和我们中心的林辉主任一起创立清华大学苏研院大数据处理中心,主要做央企,国家部委大型中央数据统计,后来做用户端行业大数据。


    640?wx_fmt=png&wxfrom=5&wx_lazy=1


    先讲一下大数据爆发原因。实际上数据的问题,包括大数据问题,是一直存在的。为什么最近大数据才在全球非常火爆?


    这里面我们总结有好几个方面的原因。


    第一是数据源种类和数量和整个容量在越来越大。现在,我们讲到的像互联网的数据非常大,每天像FACEBOOK,谷歌可能产生几十T,几百T数据,智能传感器,手机,GPS,还有智能电表,物理世界各种采集器也非常多。像手机的话,这是前两年数据,有好几十亿手机在全球。


    另外一个是科学仪器和医疗仪器产生数据也非常多,这一张图是美国大型强子对撞机,里面的探测器比这个楼都要大,这一个是用来发现上帝粒子的。


    另一个是美国在墨西哥州上面一个天文望远镜,要把地球1/4的天空都拍摄记录下来给公众开放。癌症治疗里面伽马刀是医疗数据的一个应用。


    这些数据源造成一个大数据的大爆发。原来我们数据很简单,做报表,做统计,做同比,环比,他们统计经常用到的一些手段。大数据爆发的另一个原因是数据分析的复杂度也非常高。


    这里面举一个癌症制药里面的例子,目前癌症治疗里面最先进的技术叫做靶向治疗,所谓的靶向治疗,就是药物是根据病人基因组定制出来的,病人把这个药服进去之后,能够有效的跟癌细胞绑定,要么是摧毁这个癌细胞,要么阻碍癌细胞增长,可以有效起到对癌细胞的控制作用,对病人的损害可以降低。


    为了和这个癌细胞匹配,要找到这个靶点有四百万的计算任务,单台计算机要算五十年,病人跑到医院,对他说等一会配一个药,要五十年以后才配出来就什么都晚了。


    640?wx_fmt=png&wxfrom=5&wx_lazy=1


    实际上个世纪80年代很多人就提出了数据爆炸或者数据暴雨各种概念,也就是现在的数据多的我们已经没有办法去处理了。上午朱博士也讲到。


    我们现在科学有一个新的分支是数据科学,最早是实验科学,通过物理,化学,实验,我们找到一个规律比如元素周期表。


    后来通过实验科学里面总结出经验上升到理论科学,我们才有现在的数学、物理、化学各方面的理论。尤其物理方面理论几十年没有新的进展,现在物理学的博士和博士后是最苦的,学校里面待六年,八年没有办法发现新的科学理论,博士毕业论文也很难写。


    到最后很多转成做计算机和做统计变成大数据科学家了。后来没有办法,像强子对撞机,先有理论模型,有预测,然后使用大型计算和物理设备采集验证模型,演变成了计算科学。


    计算科学其实核心最终处理是这个数据,像强子对撞机一年产生数据几十PB,现在常见硬盘几个T,几十PB相当几千块、几万块的硬盘数据,一年产生那么多。后来微软的数据科学家,也是图灵奖获得者Jim Gray把数据科学分离出来,把它定义成一门新的科学。


    微软研究院院长、副总裁TonyHey,他提出数据就像暴雨一样一直下,我们真正用到的数据就像打一把伞接一点水用来浇花,90%甚至99%的数据还没有被用起来,但我们具备这个采集数据的基础设备和工具,还有方法。这就是当前数据爆炸给我们带来的无法处理的问题。


    gif;base64,iVBORw0KGgoAAAANSUhEUgAAAAEAA


    另外大数据爆发的一个原因是现在所有的企业,个人,政府都意识到数据的价值。实际很多企业有特别宝贵的数据,是放在那里长灰。


    之前的信息系统叫做信息管理系统MIS,所谓的信息管理系统就是我买进计算机做一个数据库,把数据采集放在那里就完了。但现在数据实际在各个方面都对我们非常有价值,上午讲座也讲到,数据是新时代的黄金和石油。


    一个企业拥有数据就拥有黄金和石油,就存在爆发和价值增长潜力。数据现在影响到我们所有的方面,像个人生活相关的,我们用微信,还有旅游APP,携程,去哪儿这些,我们每天都用这些数据。


    企业发展的话,对于企业我们要做精准营销,互联网营销,新媒体营销,包括社会媒体营销,数据是决定我们企业的生死和发展。对于区域经济,就是像我们的智慧城市,和区域经济发展紧密相关,其核心就是依赖大数据来产生智慧的。


    从国家发展战略来说,大数据已经上升到美国的国家战略,同时世界财富论坛都把大数据列为未来新的经济增长点。


    对于我们国家来说,像李彦宏,马云,开会的时候经常跟几个常委建议大数据,现在大数据也逐渐上升成我们国家的整体战略。大数据在我们整个的生活各个方方面面都起到重要的作用,它的价值越来越被大家所认同。这是大数据爆发另外一个原因。


    gif;base64,iVBORw0KGgoAAAANSUhEUgAAAAEAA


    大数据爆发的最核心的原因是因为有这么多数据,同时我们对数据价值需求又越来越大,但现有系统和方法没有办法处理这个数据。


    我们总结很多这方面的问题,首先比如速度方面问题,原来有一个数据库,把数据写进去就行。现在一个城市比如南京,就有四十万摄像头,这个摄像头每分每秒都产生数据,你说要把数据都实时写到系统里面,做实时监控,这数据速度方面就处理不过来。


    比如云南火车站发生砍人事件,系统采集处理,过好几个小时以后才告诉你,那就晚了。这一方面的系统基本没有办法满足现在的需求。


    gif;base64,iVBORw0KGgoAAAANSUhEUgAAAAEAA

    gif;base64,iVBORw0KGgoAAAANSUhEUgAAAAEAA

    刚才我们也说数据种类和架构,有各种各样的数据源和数据结构。比如有文本,有语音,有图片的,有图像,各种生物指纹,传感器数据,种类完全不一样,原来拿一个格式化的数据库就存起来,现在可能需要各种新型的数据存储手段和处理手段。


    扩展性问题,原来处理数据买一台计算机就行,现在我们知道阿里淘宝双十一的时候,一天就是几百亿交易额,像微信红包,峰值春节当天达到每分钟八亿次,像这样的话,扩展性问题就是说后台,像腾讯和阿里,他们是需要几千台,几万台甚至几百万台计算机存储和处理数据,微信用户将近七亿,七亿用户每天发语音发图片发视频,数据存哪里?后台数据处理中心。


    现在腾讯新建中心的有二十多万台物理服务器。现在服务器都是八核、十六核,算起来二十万台就是相当于160万个计算机来处理和存储这样的数据。


    关于成本问题,最早的大型机只有美国军方,包括一些重要的科研单位才能买得起这样的计算机。到现在我们一个手机性能相当于一台超级计算机。


    要对整个IT信息,IT架构进行成本论证,像腾讯这样的数据中心也是由普通的服务器构建,整体我们处理信息的成本在下降,但是企业要把原有的信息系统全部迁移到大数据架构成本很高。


    企业不可能一天由原来信息系统一下子全部转变大数据信息系统,要把应用迁移,数据迁移,还要有相关IT人才,有对企业和自己应用了解的专业人员才能把它迁移过来,所以这一个成本和代价是很高的。


    关于价值挖掘这一问题,网上有一些笑话。有的企业非常重视大数据,请一些专业团队,花好几百万,对原有数据进行挖掘。挖掘出来结果没有什么用,并没有对企业的生产和效率起到提升的作用。


    所以我们不能光说大数据非常有用,真正大数据对自己的企业数据建模和数据分析出来结果,真正要被企业所用,对企业有好处,投入和产出要成正比,投入最好小,产出大,这样大数据迁移才有意义,否则就是浪费钱。另外关于安全隐私,不管知道不知道大数据这个概念,了解不了解这个行业的,都会提到数据安全和隐私怎么保证。


    钱存银行里面首先不能丢其次不能少,数据也一样,数据越集中越危险,微信里面通过所有微信信息可能知道你住什么地方,职业是什么,每天去什么地方,对哪些感兴趣,哪些朋友全知道,基本没有隐私可言,对数据保障还有数据安全,个人隐私不泄露也是一个问题。


    最后是智慧城市最核心问题。


    智慧城市实际上我们从2012年就开始介入,国家也是从第一批试点城市到现在有三批,应该第四批正在申报,加起来也有将近三百多个城市,但是真正能够建设出有效果的城市非常少,为什么?就是没有办法解决互联互通和共享问题。


    我们曾经做过四川的医疗网络系统。在一个医院里面,我们去调研,病人的信息,病历信息是一家公司开发的,病床信息一家公司开发,影像是一家,社保联通又是一家开发。


    最后院长说我想看一下我们全院统计信息。病人、病房、药品信息等要分别进入各个系统去看,费劲死了,要把所有的这些不同服务厂商的数据和系统都打通,这些厂商都不愿意公开它的这个数据结构。说是商业机密,一个医院想做互联互通都很难,全国想把医疗系统、医保系统打通,打通社区医院,乡村医院,不同医院,一个病人的病例全国医院都可以调看,不用再花钱,根本不可能。


    即使可以看到,但是你到协和医院,可能说原来那个医院采集数据不太准,影响医生判断,还得重新采一次。智慧城市、智慧医疗讲起来很简单,真正实施到处都是问题,主要的问题就是在于互联互通数据共享问题。


    gif;base64,iVBORw0KGgoAAAANSUhEUgAAAAEAA


    大数据一方面是数据源数据量越来越大,原有信息系统没有办法处理数据快速增长的问题,就爆发了。


    大数据问题凸显引发新一代信息技术的四驾马车。这些名词大家听过,物联网,云计算,移动互联网,大数据,其实我们现在天天生活都在接触这些信息技术。由于大数据问题的爆发他们才应运而生,而且可以部分解决大数据的问题。


    gif;base64,iVBORw0KGgoAAAANSUhEUgAAAAEAA


    几个系统到底什么关系,很多人搞不清楚,有的认为是平级,有的认为可能有一个包容关系。我们总结一下几个信息系统的关系。


    我们如果把智慧城市比作是一个人体的话,这一个物联网,就是我们的感官,通过物联网我们可以看见,听见,摸得见,感知得到这样的数据,采集起来。物联网还有很多传导和网络,能够把信息传输采集起来。


    我们把物联网叫做感官和神经。云计算是强健的体魄和心脏,没有这个能量也没有办法支撑运算,很多城市都建设云计算中心,是提供强大计算能力,有计算能力还要有核心数据,真正智慧怎么产生?就是通过对数据的加工,最后可以形成对我们生活工作各方面有益的决策,辅助,才能形成智慧,智慧核心是数据,大数据就是智慧城市的核心。


    这里面把大数据比喻成聪明的大脑。真正智慧装在大脑里面,你说大脑能不能离开我身体?不可能。大脑能不能离开我的这一个感官和神经?不能。但最核心是大脑对数据处理和加工才能带来智慧。


    所以现在我们说智慧城市,如果离开数据采集,数据分析和数据的使用,这一个智慧是空谈,只能够说我们是建设基础网络,建设基础数据采集,目前对数据的利用还是处在很低级很简单的程度。


    gif;base64,iVBORw0KGgoAAAANSUhEUgAAAAEAA

    gif;base64,iVBORw0KGgoAAAANSUhEUgAAAAEAA

    下面一节讲一下我们在做国家部委,央企,惠民工程过程当中总结的经验,数据为什么能够驱动创新。核心我们提出数据生产要素化,可能听着有一点晦涩,我们原来学资本论,定义生产要素是人,劳动力,资金,自然资源,比如一个农民拿着锄头在地里面种田,他能够产生作物,基本生产要素是土地,锄头这些工具还有劳动力。


    现在有数据,如果把数据也当成一个新的生产要素的话,整个什么要素的配比会发生变化,会引起变革。


    举一个简单的例子,比如阿里巴巴的小贷,余额宝上线几天就有了几百亿资本,阿里巴巴的放贷这个周期最快可以六分钟决定是否给一个企业放贷,传统银行要花一个月调查企业的生产状况,经营状况,资本周转状况,有没有被处罚信息,了解它的征信要花一个月。传统花一个月,但阿里上面有淘宝,天猫,一淘网所有的用户数据,他们的资金周转状况,运营状况,整个下一步的发展计划都可以看到也可以预测出来。


    原则上阿里小贷可以说你企业下一步需要多少钱都可以算出来提前给你准备好,数据把这个周期给提前了很多很多。他们开玩笑说马云做十五年原来最终目的想做金融,原来不在金融这个行业可以到这里面抢国有银行的钱,分国有银行利益,这是我们说数据生产要素化才能够真正起到这个数据变革和创新。


    gif;base64,iVBORw0KGgoAAAANSUhEUgAAAAEAA


    我们认为数据所起到创新的作用是各个方面。可以有管理创新,有机制创新,理念创新,模式创新和技术创新。如何实现创新,因为现在是互联网时代,很多人说互联网概念到底什么,互联网有很多核心的作用。


    我们认为比较核心的是扁平化。互联网把世界上每一个人和另外一个,和一些资源的距离,一些中间环节全部去掉。所以我们说现在互联网要实现创新的话,我和我们中心的林主任总结三个重要的概念,就是开源众包和长尾。


    开源比如原来苹果IOS系统,在手机占市场比例原来超过80%,谷歌刚刚领导安卓系统的时候,最初市场份额就一丁点。过两三年反超,现在安卓在整个手机操作系统里面占80%到90%,苹果也就占到不到10%,剩下的赛班,微软的Windows Phone基本只占一点点,Google把手机操作系统开源,全球所有牛人可以在这个操作系统上面贡献力量,才达到这个效果


    众包意思不是说一个人一个公司打天下,而是所有人贡献力量。比如小米手机为什么可以取得那么大成功,他有一百个人的市场调研团队,在互联网上问所有用户,你喜欢手机是什么样的颜色,什么样的配置,什么样的价格,这些人在互联网上搜集几十万用户反馈,最后才把小米手机生产出来。为什么小米手机有那么多的米粉?


    所有参与这个过程的用户都觉得我是这个手机的爸爸妈妈,因为我的点子放在这个手机里面最终形成这个手机,所以一个新的或者一个产品在各方面,是用全球的,集中全球所有人智力做这个事情,这就是众包。


    另外所谓长尾,现在我们都知道BAT太猛,阿里巴巴除了做金融也做医疗信息服务,也做现代农业,做物流,什么都做。是不是这个市场就阿里巴巴一家就完了,不用我们再干活?实际不是这样。


    整个市场是长尾,所谓的长尾就是大的市场可能被BAT这些大公司切去,未来的市场一定是行业细分垂直化的。


    比如电商,阿里巴巴主要做消费类的电商,你说我做金属材料电商或者我做电器的电商,如京东,未来茶叶电商,甚至火锅原料电商不可能阿里巴巴全做,剩下的中小公司可以在这些行业做创新做贡献,找到自己市场份额。我们总结有这三块来形成创新。


    gif;base64,iVBORw0KGgoAAAANSUhEUgAAAAEAA

    gif;base64,iVBORw0KGgoAAAANSUhEUgAAAAEAA


    还有一个更重要的,以前我们做产品设计的时候或者是做我们整个企业流程管理的时候,都是叫应用驱动开发。


    现在整个概念反过来了,叫做数据驱动开发。应用开发先从应用场景梳理,系统设计到结构分析最后再实现。举一个简单的例子,比如说公安系统,公安系统如果要做一个警务综合系统,所有警察办案,出警,接警,案件调查这个过程非常的复杂。对公安这个系统,如果是原始模式应用大概几千种,系统设计报告,这一桌子都铺不完,几个月做不完。


    稍微数据做改动这个系统要重新改动,要半个月到一个月才能完成,后来他们愁的不得了,这个怎么解决,我说反过来来看。怎么解决?


    用数据驱动开发。核心公安应用这个数据可以分析一下,哪些种类数据,按时间分析,对产生/使用频度,总体数据体量做分析,分析这些数据怎么用,数据的应用场景,比如对人口数据处理有十几种,对事件处理也几十种。


    通过对数据接口,数据标准,数据处理方式结合好之后再开发应用,这个应用都是分类别。有这个接口之后,我跟他说现在你就自由了,原来你找一家服务公司,做任何改动都这一家公司说了算,他说要多少钱就多少钱,但现在你可以找不同服务公司,找不同的外包厂商,根据你的接口和访问标准来开发应用。


    同时公安系统内部IT人员也可以每天加应用,这样就掌握灵活度了,因为是从数据来驱动的,这样来开发,就转变了原有的按应用场景来开发的模式。按应用场景梳理几千个应用搀杂一起完全找不到头绪,只能够应用服务公司来做。数据驱动才是最核心的,现在企业发展包括产品开发都是用数据来说话。


    我们如果在座有很多企业家的话,整个商业系统都在围绕数据产生重构,我们梳理几个,需求重构,供应重构,竞争重构,主体重构。包括余额宝,美甲,上门4S店洗车服务,原来没有接触过这个行业的冲入这个行业里面抢钱,是数据创新、数据颠覆模式。


    竞争重构:原来都是单一竞争,比如我做一个产品,你再做一个产品,价格比你低,成本比你低,可以抢你的钱,现在不一样,现在可以说整个一个生态竞争。比如说微信,腾讯本来已经有了QQ,而且有了几亿用户,干什么要出微信,现在都是移动端,出社交网络,自己革自己命,如果腾讯不出可能阿里会出一款产品,或者小米的米聊会胜出,腾讯本身生态就会被别人破坏,也许一天之内他就会死掉。


    我们知道现在FACEBOOK非常猛,FACEBOOK之前有一个社交网络叫做MySpace,可能很多人没有听说过,当时也是全球好几亿用户,后来最后卖掉的时候估值才几千万美元。因为那些用户都跑到FACEBOOK,新的社交平台上面,原来那个社交平台很快就不行了。所以是一个生态的竞争重构。


    供应重构这个例子后面会讲一讲。产品生产与交付按需提供,以前服装厂商包括雅戈尔和杉杉,我跟他们都有接触,新款服装从设计到成形到门店周期非常长,是跟不上整个时装界发展速度的。


    后面会讲ZARA的例子,再讲服务数字化带来的变革。这里面像在线教育,他们说未来预测学校都不会存在了。所有的人都在网上面上课,拿学位证毕业,想拿几个拿几个,只要有精力。滴滴也是,原来市场非常垄断,滴滴一个手机APP就可能把用户和出租车这两者联系起来,把出租车市场几乎颠覆了。


    滴滴出专车,很多交管局领导出来封堵说它非法,我用过这个专车,首都机场一下飞机叫一个专车已经门口停好,要么奥迪要么凯美瑞,中档车型,里面还提供水,非常人性化,这把原来商业模式颠覆了。


    营销模式变革,对传统企业的最大摧毁在这里。传统企业基本是4个P模式,产品,价格,渠道和促销。所有企业在做产品生产,促销是依赖传统的这些方式。这些方式都不管用了。


    举一个简单的例子,现在90后,00后不看报纸,不听电台,不看电视,都在社交网络上面活动,一个产品营销的时候根本到达不了他。


    现在一个产品如果根本卖不到90后,卖不到00后,作为一个企业怎么生存?


    现在要4个R的模式,口碑式营销。这4个R是通过产品的相关性,通过用户对产品的反应,通过你与用户建立联系,通过给用户带来价值回报来进行促销。整个商业模式,营销模式发生改变了。新的企业只能够朝着4个R模式做产品营销,才能够在新生代人群里面胜出,才能真正的竞争生存下去。


    gif;base64,iVBORw0KGgoAAAANSUhEUgAAAAEAA

    gif;base64,iVBORw0KGgoAAAANSUhEUgAAAAEAA


    前面说的都是数据能够引发创新,现在具体说我想进一个行业创新怎么创新。


    gif;base64,iVBORw0KGgoAAAANSUhEUgAAAAEAA


    我们梳理出十个方法论,但这些都还不是很完善,我们如何到一个市场上面抢钱,需要如何衡量,假如我想创业,这一个创业的点子靠谱不靠谱,有十个方面的指标。基础指标,我不全部讲。


    最简单一个价值密度,所谓的价值密度是在哪个行业钱最多,而且单位面积里面钱最多,我到那里抢钱,比如银行最有钱,到银行做创新抢钱;医疗,每个人每年花自己身上各种保健费用可能几千;教育,每个家长在孩子身上一年花费用都好几千,上万,这些就是我们抢钱的地方。


    还有第二个比如基础约束度,刚才我讲医疗的例子,你去医院里面,比如医疗最有钱,抢医院钱,给医院做信息化系统,那完了,因为一定要去跟医管局,卫生局,医院、各种标准,管理条款打交道,加上刚才我说的信息系统都不能互联互通,进去之后可能摸爬滚打两年还不能挣钱,所以还要考虑这个行业门槛和基础约束度能不能让你很顺利的进去抢钱。


    如果十个维度里面能够形成特别稳定的蜘蛛网的图,各个维度上面相比得分都比较高,就放心大胆冲进去抢钱、去创业,死的可能性比较小。如果是不稳定结构,有的维度打分很高有的打分非常低,你去创业有可能死半路上,被冲出来的竞争对手干倒。


    很鲜明一个例子,我们原来四川一个合作伙伴,给房地产服务商做数据服务。整个全程楼盘信息,地皮信息,商业住所,社区人群信息收集起来,每家房地产商用他们的服务都收费几十万,一年挣一千多万,当时踌躇满志说全国扩展,后来一家竞争公司改变模式,直接找房管局合作成立一家公司,ppp模式,数据拿过来,那是最全最快最实时,前面这些公司是靠地推人员到各个小区楼盘搜集信息,新出来公司照他模式,几个月时间把前一家公司80%市场抢过来。


    这里面存在一个行业门槛和技术约束,如果数据不是你的核心资源,被别人掌握,他拿出来数据你就死掉了,就这样一个道理。前面讲的数据驱动创新,是我们梳理的一些基本理论。


    gif;base64,iVBORw0KGgoAAAANSUhEUgAAAAEAA

    gif;base64,iVBORw0KGgoAAAANSUhEUgAAAAEAA

    最后讲智慧民生方面,有的是别人案例有的是我们自己的案例,都讲一下。我们梳理出来智慧城市七层架构,很多人知道有四层架构,感知,传输,处理,应用,我们把数据层分离出来做核心一个层面。底下的数据汇聚有三层,上面的数据交互及应用有三层,中间是数据层,也是整个智慧城市核心。


    基础层比如我们有数据中心,有云计算。传输层、采集层是数据入口。有了数据融合之后,我可以计算,应用,展示,像谷歌眼镜,可穿戴设备,甚至有可植入设备。


    国外一些比较时髦的年轻人把胳膊里面,脖子后面植入一个芯片,走到哪儿自动可以被扫描被识别,叫做可植入设备。这是我们梳理的模型,为什么数据要放在最核心部分?因为数据才能产生智慧,如果没有数据这个智慧谈不上。


    具体的大数据民生方面,首先讲大数据在电商里面所起到的作用,现在整个国家也在鼓励移动电商,跨境电商,是每个省市重点的行业,大数据在电商里面最核心价值我们梳理出来有下面几条。


    最核心的我们叫用户画像,一个比较时髦的词,给一个用户建立一套比较完整的画像,性别,年龄,居住区域,每年消费的状况,职业,这是基本属性。还有行为属性,喜欢什么,刚买车了,最近刚结婚这些行为属性也建立起来。


    有什么好处?


    亚马逊总裁贝索斯,有人预测说乔布斯已经不在了,贝索斯可能能做一些创新。他有一个终极概念说未来如果我有一百万用户,我就要建立一百个亚马逊主页。为什么?如果是老年用户上去之后可能是医疗保健这些,你放一些其他东西他不感兴趣,这个页面浪费了,女性用户上去放一堆摩托车,跑车,这页面就浪费了,当然也有个例。


    未来每个用户根据画像,所有页面展示是为你定制,最符合你的兴趣爱好。未来可以做到每个人都有一个淘宝页面或者一个亚马逊购物页面。


    gif;base64,iVBORw0KGgoAAAANSUhEUgAAAAEAA


    另一个作用是优化营销策略,企业营销要根据用户来定制你的营销策略。还有预测消费者行为,亚马逊都能够预测到你未来想购买什么物品,提前可以给你下单甚至送你家门口,你决定要还是不要,能够达到这个程度。


    再就是个性化营销,现在互联网跟个性化紧密不分开的,未来所有行业,所有服务都是个性化的。比如你去坐飞机,我坐飞机喜欢坐走道那个位置,有人喜欢坐窗户,有人喜欢坐中间,每次值机时个性化,一刷身份证都办好,喜欢前排靠窗还是后排靠中,都知道你的喜好不用你再选择。最后是广告精准投放,在当时的页面进行投放。


    我在微软工作时,看到谷歌这个投放引擎也有缺陷,前几年的技术,当时美联航出一起空难事故,读空难新闻时旁边还打美联航广告,起到了负面作用。因为刚出一个事故还打广告,反倒引起用户憎恨。如果美联航出事儿旁边打西南航空广告这起好效果,一下子西南航空销售就上去了。


    gif;base64,iVBORw0KGgoAAAANSUhEUgAAAAEAA


    ZARA是一个服装快销模式,从新品上线到最后人到门店里面能买,基本就两周时间。因为时装潮流非常快,一眨眼可能就变成新的潮流,如果跟不上这个库存一积压,想做时装就很难生存。


    gif;base64,iVBORw0KGgoAAAANSUhEUgAAAAEAA


    再下来智慧社区,这跟我们的生活是紧密相关的。智慧社区分四个层面,有居室,有小区,五百米生活圈跟两公里生活圈。做社区O2O的非常多,电商,旅游医疗,教育APP,各种各样的APP。谷歌花了32亿美金收购智能温控公司NEST,为什么花这么多钱?


    我认为最核心的就是前面嘉宾讲到的,原来这些设备、手机是控制它,要主动操作。现在新的设备是感知和适应,不需要做任何工作,温度可以感知你的最喜好的舒适程度,感知空气温度,帮你自动做调整,不用你做任何的事情,这就是所谓的智慧家居、智慧小区它的终极概念。环境和设备是自动适应人的,不需要你操作和控制,也是个性化的核心概念。


    下面是我们一个合作伙伴,他在整个城市铺设免费看视频、电视的一个平台,对智慧民生非常有帮助,比如医院,机场,办公楼,小区,随时可以看到免费视频,可以把各种精准广告还有应用,游戏,彩票都可以嫁接上面形成一个新的门户。


    gif;base64,iVBORw0KGgoAAAANSUhEUgAAAAEAA


    还有移动医疗行业,最近热门的春雨医生、大姨吗、丁香园都拿到了千万美元的投资。但西医App模式的短板是没有体检化验没法诊断、开处方。


    这家公司做的中医APP,注重中医健康养生,中医本来就是问诊模式,你上去问我有一点头疼,中医会问你家族病史,你的生活习惯,饮食习惯,给你开一个健康调养方案,未来对每个用户就可以形成个性化的养生、治疗方案,所以能够在这个移动医疗领域进行创新,移动领域也能够逐渐颠覆传统的模式。


    gif;base64,iVBORw0KGgoAAAANSUhEUgAAAAEAA

    最后讲一下清华大数据处理中心,我们孵化的新公司是做中小学,个性化的评测和辅导平台。


    传统教育市场,在线教育创业的人太多了,但都是网上课件或者把老师和学生对接一下这样的平台。没有起到关键作用,教育最关键是什么问题?


    教师资源很紧缺,老师没有时间改卷子,孩子每天做题恨不得一天做二十套,书山题海里面不能自拔,家长掌握不了孩子情况,送培训班一小时七八百,不知道干什么,学什么东西。

    gif;base64,iVBORw0KGgoAAAANSUhEUgAAAAEAA


    K12教学的困境:根据统计,老师一对一对孩子教学不超过5%,老师没有时间进行个性化的教学,学生主要做题目,没有时间思考,思考时间只占他时间的1%。家长每天每年花的钱都是在好几千块,占一多半。这就是我们教育市场的现状。


    gif;base64,iVBORw0KGgoAAAANSUhEUgAAAAEAA


    如何解决这一个问题,美国IBM出了一个大数据产品,叫机器人医生,可以做癌症诊断。我们做的是机器人老师,可以自动判卷,对数学、物理、化学题目,主要是主观题,逐行阅卷找出问题,针对每个孩子的问题做个性化辅导,我们做的是这样的一个产品。


    教师不用改卷子,现在成都七中老师周考还有家庭作业都是机器人改,老师可以有大量时间跟学生一对一辅导,解决每一个步骤里面的问题,还可以根据他的学习状况加餐,每个孩子学习过程都不一样。


    对于家长来说对孩子每个状况和问题都会发到家长手机上面,可以精确了解孩子问题。对学校可以生成各种报表,做教育效果评估,综合全国中小学数据,教材选择都可以通过大数据提出指导意见。


    后台技术像智能笔,公式识别,自然语言处理,机器学习,人工智能,云计算,大数据挖掘这些都结合起来,未来我们想做全国教育的一个名片,采用综合方法来处理中小学教育问题。


    gif;base64,iVBORw0KGgoAAAANSUhEUgAAAAEAA

    gif;base64,iVBORw0KGgoAAAANSUhEUgAAAAEAA



    640?wx_fmt=png&wxfrom=5&wx_lazy=1


    最后做一个小广告,我们中心,还有其他的作者,我们出版了一本书叫做《大数据革命-理论模式与技术创新》,去年9月份出版,里面有我讲的很多内容,包括数据科学理论,还有数据创新的一些知识写在里面,感兴趣可以在京东和当当上面购买这一本书。我的演讲到这里,谢谢大家。


    原文发布时间为:2017-03-03

    本文来自云栖社区合作伙伴“数据派THU”,了解相关信息可以关注“数据派THU”微信公众号

    展开全文
  • 文章的是人工智能+大数据 首个自动驾驶平台诞生,在2016百度世界大会上,百度公司创始人、董事长兼首席执行官李彦宏先生与NVIDIA联合创始人、总裁兼首席执行官黄仁勋先生共同表示,双方将达成合作,共同创建从云端...
  • 点进来的同学,大部分是为了学编程而来的,这里面有一部分学编程是出于兴趣爱好,但大部分...在为你为什么要学习大数据前给分享一个大数据资料分享群119599574每天分享大数据学习资料和学习方法 ,让我们一起成长...
  • 本文转自36大数据,已获授权。作者:麒麟。 看中国科技企业发展,先看BAT。三家公司各自占据自己的领域,成为了无数小公司叹为仰止的高山,在大数据的领域里,又尤以BAT最为耀眼。在前不久的一次公开会议上,李彦宏...
  • 2012年大数据是个流行词,没想到4年过后,在一些大数据论坛上还有人会说“如果我有大数据,我会怎样怎样……”好吧,如果还停留在如果上,就不该随便上论坛演讲,不好说不准工作都没了。现在大数据挖掘的技术都很...
  • 很多初学者,对大数据的概念都是模糊不清的,大数据是什么,能做什么,学的时候,该按照什么线路去学习,学完往哪方面发展,想深入了解,想学习的同学欢迎加入大数据学习qq群:458345782,有大量干货...
  • 三家公司各自占据自己的领域,成为了无数小公司叹为仰止的高山,在大数据的领域里,又尤以BAT最为耀眼。 在前不久的一次公开会议上,李彦宏、马云、马化腾又对数据的应用产生了公开分歧,三者分别...
  • 在上面的小节中我们到移动通信网络的发展,带来了数据大爆炸,另一方面大数据处理技术的快速发展让大数据的处理成为可能,人类社会自然而然的进入了大数据时代。事物都具有两面性。 大数据给人们的生活带来了诸多...
  • 天津举行的首届世界智能大会上,李彦宏和马云先后登台演讲,自上个月的大数据之争后,马云再次呛声李彦宏,建议其多花时间在客户和未来上,而不是竞争对手。李彦宏作为开场嘉宾发表了...
  • 我感觉很多朋友,对“大数据”、“机器学习”、“深度学习”等概念挺晕的,没有感官的认识,这里,我简单说一下: “大数据”、“人工智能”、“机器学习”、“神经网络”、“深度学习”。这几个词往往掺杂在一起,...
  • 最近朋友老周和我聊天,闲聊间,他说最近给老婆普及了一下大数据的知识。 事情是这样的。 前些日子他老婆给他买了几件衣服和裤子,但是裤子穿着有点小,他心里想凑合凑合算了,也就没退。没想到他老婆第二天再看手机...
  • 关于大数据、人工智能的好书不多,每每流连于亚马逊等网站半天,却没找到值得读的,估计很多人跟我一样吧,今天推荐最近读过的八本,有科普类的,也有实操的,实在言之无物的就不提了!   1、吴军的《智能时代》 ...
  • 机器学习的应用–大数据6.机器学习的子类–深度学习7.机器学习的父类–人工智能8.机器学习的思考–计算机的潜意识9.总结10.后记作者:计算机的潜意识在本篇文章中,我将对机器学习做个概要的介绍。本文的目的是能让
  • 原文链接 摘要: 做个二十名的人其实蛮好的。大数据时代,最重要的是让每个人做最好的自己。 6月29日上午,天津“世界智能大会”现场,马云作了万字演讲,以下是...大数据时代,最重要的是让每个人做最好的自己
1 2 3 4 5 ... 20
收藏数 1,219
精华内容 487
热门标签
关键字:

李彦宏讲大数据