精华内容
下载资源
问答
  • 没有接触过大数据的人,都很难清楚地知道,究竟多大数据量才可以称之为大数据。那么,根据数据收集的端口,企业端与个人端之间,大数据的数量级别是不同的。 企业端(B端)数据近十万的级别,就可以称为大数据;...

    大数据是什么?

    多大的数据叫大数据?

    很多没有接触过大数据的人,都很难清楚地知道,究竟多大的数据量才可以称之为大数据。那么,根据数据收集的端口,企业端与个人端之间,大数据的数量级别是不同的。

    企业端(B端)数据近十万的级别,就可以称为大数据;个人端(C端)的大数据要达到千万级别。收集渠道没有特定要求,PC端、移动端或传统渠道都可以,重点要达到这样数量级的有效数据,形成数据服务即可。很有趣,大家可以看到2B和2C,两类大数据差了两个数量级。

    有些小公司,数据只有千到万级的规模,但经过收集分析,也能从中有针对性的总结出这一群体的原则,同样能指导企业进行一定程度的用户分析、获取或者是服务工作,但这并不是大数据,而是一般性的数据挖掘。

    刚刚天小妹分享的那个案例,说今年年初有个用50块本金摆地摊卖水果的中年人,他并不懂得大数据,但是他对水果的收成了若指掌:他知道哪个地方下了多少雨,水果的甜度会到多少,哪些地方的消费者会喜欢吃这个甜度的水果。卖到最后卖出了137家门店、4.7亿的年销售额。

    这确实是一种小的数据挖掘,但并不是数据分析。大数据分析虽然脱胎于此,但大数据面向的是更海量的一个数据,借助了更广义的知识数据库的分析方法。大部分的数据公司的数据来源是海量的,它的收集和分析,并不是局限于个体,而是以一个非常非常广泛的群体为对象展开的。

    大数据的产业链是怎样的?

    我在接受采访的时候,依照大数据公司在产业链的上下游关系,提出把它们分成三种不同类别:

    大数据采集公司

    所谓“找数据”,内部可以再分两种:

    1).在自身正常运营的过程中就能产生大量数据源;

    2).通过跟电信运营商、金融企业合作,获取数据源。

    大数据分析公司

    这一类公司,基本上都有自己的套模型,但大部分数据库模型源于相同的几个机理,包括统计学模型、深度学习算法等等。也基于美国IBM、cloudera公司开发的应用型分析模块等等。

    大数据销售公司

    虽然说是卖数据,但出售的并不是单一数据,而是基于数据的全套解决方案,比如精准营销等等。

    这三类公司是如何协作,并把大数据作用于我们的生活呢?最容易理解的就是现在在微信朋友圈上投放的广告。

    腾讯在把广告推广给每个用户的时候,都已经对用户做过精准的分析。通过收集人们在微信上使用习惯,进而分析用户的消费能力、消费习惯,形成一套精准营销方案后,给广告商生成一些定向的广告。

    比如说,兰蔻的广告就从来不会推广给男性用户、豪车广告也不会推给应届毕业生。整个的微信广告体系都用到了大数据的分析模式,大家普遍反馈,在腾讯上投放的广告比网易、新浪等平台上投放的广告转化率高,正是得益于腾讯的大数据基础。

    大数据公司的投资价值

    如何理解大数据的投资价值?

    大数据如今这么火,其商业价值显而易见,但是能真正兑现的人并不多。

    要兑现大数据的商业价值,第一个要求,就是达到大数据的数据量级。那么目前,在数据量上最有优势是BAT三家。在PC时代,百度在数据上的优势非常强,但到移动时代,腾讯和阿里实现了反超。

    腾讯有微信、QQ,拿到了移动端数据生成量的九成;阿里利用它的消费数据资源,更有垂直性。那么对于中小企业、创业企业而言,兑现商业价值的重点就变成了,如何在自身规模较小的时候,利用别人的大数据资源为自己的创业更好的服务。这是需要深层次判断和挖掘的。

    所以,对于数据相关的公司,在投资判断的时候,不单是看现有业务的发展,更重要的是在他不断的发展的过程中,能不能积累有效数据、积累高准确性的数据,实现数据的实时更新性。这样的企业才能够更好地建立起竞争壁垒。

    比如,在开发者服务领域,比如talkingdata极光等等,我们复星昆仲在看项目时非常看重的一点,就是现在项目所经营的业务是单一为开发者提供服务?还是在服务之余,给自己的积累有效数据,形成长期壁垒?

    2B是大数据行业的突破口

    我之前有提到BAT对大数据收集是垄断性的,创业企业想要在C端达到海量数据(千万级甚至上亿的C端用户)非常难。目前,国内月活真正过亿的app只有15个,渗透率前10的app都是BAT所控制的,比如微信、QQ、淘宝、UC浏览器等。如果绕开BAT,能拥有C端海量数据的,就只有相对传统的电信业、金融业等等。

    可见,如果想投资大数据领域的公司,从C端下手难度很高。所以,我觉得在如果想在大数据行业布局,2B领域才是关键:一方面2B发展较晚,BAT还没有形成垄断;第二,开发门槛相对较高的;第三,数据量需求量相对较少,达到十万级别就可以为大数据的分析服务,所以如果想在大数据领域进行投资,要关注的主要领域是2B领域。

    在2B领域,有三个不同的类别:

    第一类,是现在很火的企业服务,以SaaS为主;比如客户管理的CRM、人力板块的HRM等等。他们在得到用户许可并保证数据安全的前提下,通过服务大量的企业来积累企业用户,和企业员工数据。比如理才网等等。

    第二类,是B2B交易平台;目前的趋势,基本上是行业垂直领域的电子商务交易平台,核心竞争力就是打破买卖双方的信息不对称、不透明。所以这种领域公司的关键点并不是记录交易量,而是每一个有效的数据信息。在这个领域,我们投资过惠民网,主要服务于中小商超和其供货商的交易平台,再比如各种“找”系列项目等等。

    第三类,是针对于开发者的服务;云存储、运行数据的统计推送以及app内的即时通信等。

    复星昆仲主要是在这三类的2B项目当中的进行投资,因为这些项目的2B业务模式可以有效积累大数据。这就是为什么复星同时关注大数据和2B领域的企业服务——因为在2B领域的企业服务,能够找到最好最有效的大数据。

    2B行业的未来投资标的

    如果我们预测一下这个行业的未来,我有以下几个观点。

    拥有丰富大数据源的企业,会成为整个行业内最炙手可热的投资标的。

    在大数据行业里,分析算法上的差别,造成的分析结果准确性、实用性的差异是93分和95分的区别。而因数据源质量造成的差别,是60分和90分的不同。特别是,一个不断更新的大数据,是能够验证这个算法准确性并不断优化大数据分析结果的有效途径。

    先行绑定最急需数据的需求方的项目,将获得胜利。

    目前,在大数据领域最愿意买单的基本都是金融领域的客户,银行、保险公司等等。他们要对用户进行多方位的分析和服务,所以购买意愿非常强。下一层,是新兴的互联网公司,为了更精准的获取用户、提高转化率,也比较愿意买单,比如说像新美大等等。下一步,可能会过渡到消费品行业当中去。

    基于大数据的那些商机

    SaaS类项目凭什么火?

    很多人其实不明白SaaS模式和传统的软件服务到底有什么区别,为什么说它是一个基于大数据而兴起的行业呢?

    SaaS和传统软件服务,中间有非常多的区别。最基础的区别,就是他们整个架构是不同的:SaaS是建立在公有云上的,标准化的模块服务,数据也储存在SaaS的公有云平台上。而传统的软件服务基本上是部署在局域网内的。这种架构上的区别决定所有的其他区别。

    比如,因为SaaS架构在云端,而且秉承标准化、普适化原则,所以,实施过程非常快。至少,实施前的现场搭建工作要少很多,那么获取用户也相应的加快。能传统模式要很长时间才能累计几百个客户,而SaaS模式可以在短时间内累积上千、上万的客户都不难。

    再比如,付费模式上的不同,传统软件有前期实施费、每年更新的费用、专门的定制服务费用、故障解决费用等等。整体来讲,费用高、缴费繁复,往往只有大企业才消费的起。而SaaS一方面减少了初期部署成本、且系统和架构可以服务于多个用户。它的收费模式基本上,是收月费或者年费,一个月只有几百块,很多中小企业,都可以享受到服务。

    智能硬件和人工智能的收获期还很漫长

    大数据和智能硬件相结合的模式,其实目前还很有挑战性,最主要的原因还是出在大数据的数量级上。目前智能硬件的出货量远不能匹配大数据所需的数量级。目前,国内出货量最大的是小米手环,第二是360儿童卫士。剩下的智能硬件出货量,往往在十几万到几十万就是比较好的量级。这跟C端大数据千万、亿级的要求还相差百倍呢。

    人工智能领域相对好一些,属于如日方升的情况。在海外的谷歌、亚马逊、软银,已经在投资一些投资标的,但是依然是一些概念领域的项目,不是立即可以商业化的服务。包括谷歌的无人车,就算已经能够积累了上百万英里的安全驾驶里程,但要应用还是有一定过程。国内也有少数的天使、早期机构,已经看好这个领域开始投资,但它的开花结果期那可能还要至少再等五年。

    所以,这个领域的投资要有一定耐心,目前比较有希望兑现的领域,包括语音语义识别、AR/VR、无人机等。

    Q&A环节

    Q:小散参与大数据、AI的SaaS的投资是否可行呢?

    A:我觉得,目前小散想要参与这一领域投资的唯一途径,可能就是通过股权众筹。这些项目的行业门槛决定了,小散要想投这类项目最好还是通过专业性的众筹平台。

    具体而言,原因有几个方面:

    项目的门槛高。我们小散接触项目往往是通过自己的朋友圈子,但这类项目的创业者基本都是专业人员,我们的小散是接触不到的。

    这类项目对创始人的专业经验要求高,小散难以进行这种专业性的项目尽调。而专业的众筹平台,在把项目推广给各位于中小投资人之前,就已经对项目做过背景调查。实现对于小散投资实现一个保护。

    总而言之,这类项目行业门槛高,专业性要求高,小散想投资一定要找天使客这样负责任的众筹平台

    Q:大家都说我们现在处于互联网时代,您强调我们现在是数据信息时代。这怎么理解?

    A:我们现在就已经处在大数据信息时代,大数据和互联网移动互联网是不相冲突的,而且恰恰是互联网,特别是移动互联网的出现,使得可以有效采集的大数据大大提升,所以大数据时代是和移动互联网手挽手一起走过来的。

    推荐阅读文章

    年薪40+W的大数据开发【教程】,都在这儿!

    Hadoop教程

     

    展开全文
  • 没有接触过大数据的人,都很难清楚地知道,究竟多大数据量才可以称之为大数据。那么,根据数据收集的端口,企业端与个人端之间,大数据的数量级别是不同的。 大数据是什么? 多大数据大数据? 很没有...

    很多没有接触过大数据的人,都很难清楚地知道,究竟多大的数据量才可以称之为大数据。那么,根据数据收集的端口,企业端与个人端之间,大数据的数量级别是不同的。

    大数据是什么?

    多大的数据叫大数据?

    很多没有接触过大数据的人,都很难清楚地知道,究竟多大的数据量才可以称之为大数据。那么,根据数据收集的端口,企业端与个人端之间,大数据的数量级别是不同的。

    企业端(B端)数据近十万的级别,就可以称为大数据;个人端(C端)的大数据要达到千万级别。收集渠道没有特定要求,PC端、移动端或传统渠道都可以,重点要达到这样数量级的有效数据,形成数据服务即可。很有趣,大家可以看到2B和2C,两类大数据差了两个数量级。

    有些小公司,数据只有千到万级的规模,但经过收集分析,也能从中有针对性的总结出这一群体的原则,同样能指导企业进行一定程度的用户分析、获取或者是服务工作,但这并不是大数据,而是一般性的数据挖掘。

    刚刚天小妹分享的那个案例,说今年年初有个用50块本金摆地摊卖水果的中年人,他并不懂得大数据,但是他对水果的收成了若指掌:他知道哪个地方下了多少雨,水果的甜度会到多少,哪些地方的消费者会喜欢吃这个甜度的水果。卖到最后卖出了137家门店、4.7亿的年销售额。

    这确实是一种小的数据挖掘,但并不是数据分析。大数据分析虽然脱胎于此,但大数据面向的是更海量的一个数据,借助了更广义的知识数据库的分析方法。大部分的数据公司的数据来源是海量的,它的收集和分析,并不是局限于个体,而是以一个非常非常广泛的群体为对象展开的。

    大数据的产业链是怎样的?

    我在接受采访的时候,依照大数据公司在产业链的上下游关系,提出把它们分成三种不同类别:

    大数据采集公司

    所谓“找数据”,内部可以再分两种:

    1).在自身正常运营的过程中就能产生大量数据源;

    2).通过跟电信运营商、金融企业合作,获取数据源。

    大数据分析公司

    这一类公司,基本上都有自己的套模型,但大部分数据库模型源于相同的几个机理,包括统计学模型、深度学习算法等等。也基于美国IBM、cloudera公司开发的应用型分析模块等等。

    大数据销售公司

    虽然说是卖数据,但出售的并不是单一数据,而是基于数据的全套解决方案,比如精准营销等等。

    这三类公司是如何协作,并把大数据作用于我们的生活呢?最容易理解的就是现在在微信朋友圈上投放的广告。

    腾讯在把广告推广给每个用户的时候,都已经对用户做过精准的分析。通过收集人们在微信上使用习惯,进而分析用户的消费能力、消费习惯,形成一套精准营销方案后,给广告商生成一些定向的广告。

    比如说,兰蔻的广告就从来不会推广给男性用户、豪车广告也不会推给应届毕业生。整个的微信广告体系都用到了大数据的分析模式,大家普遍反馈,在腾讯上投放的广告比网易、新浪等平台上投放的广告转化率高,正是得益于腾讯的大数据基础。

    大数据公司的投资价值

    如何理解大数据的投资价值?

    大数据如今这么火,其商业价值显而易见,但是能真正兑现的人并不多。

    要兑现大数据的商业价值,第一个要求,就是达到大数据的数据量级。那么目前,在数据量上最有优势是BAT三家。在PC时代,百度在数据上的优势非常强,但到移动时代,腾讯和阿里实现了反超。

    腾讯有微信、QQ,拿到了移动端数据生成量的九成;阿里利用它的消费数据资源,更有垂直性。那么对于中小企业、创业企业而言,兑现商业价值的重点就变成了,如何在自身规模较小的时候,利用别人的大数据资源为自己的创业更好的服务。这是需要深层次判断和挖掘的。

    所以,对于数据相关的公司,在投资判断的时候,不单是看现有业务的发展,更重要的是在他不断的发展的过程中,能不能积累有效数据、积累高准确性的数据,实现数据的实时更新性。这样的企业才能够更好地建立起竞争壁垒。

    比如,在开发者服务领域,比如talkingdata极光等等,我们复星昆仲在看项目时非常看重的一点,就是现在项目所经营的业务是单一为开发者提供服务?还是在服务之余,给自己的积累有效数据,形成长期壁垒?

    2B是大数据行业的突破口

    我之前有提到BAT对大数据收集是垄断性的,创业企业想要在C端达到海量数据(千万级甚至上亿的C端用户)非常难。目前,国内月活真正过亿的app只有15个,渗透率前10的app都是BAT所控制的,比如微信、QQ、淘宝、UC浏览器等。如果绕开BAT,能拥有C端海量数据的,就只有相对传统的电信业、金融业等等。

    可见,如果想投资大数据领域的公司,从C端下手难度很高。所以,我觉得在如果想在大数据行业布局,2B领域才是关键:一方面2B发展较晚,BAT还没有形成垄断;第二,开发门槛相对较高的;第三,数据量需求量相对较少,达到十万级别就可以为大数据的分析服务,所以如果想在大数据领域进行投资,要关注的主要领域是2B领域。

    在2B领域,有三个不同的类别:

    第一类,是现在很火的企业服务,以SaaS为主;比如客户管理的CRM、人力板块的HRM等等。他们在得到用户许可并保证数据安全的前提下,通过服务大量的企业来积累企业用户,和企业员工数据。比如理才网等等。

    第二类,是B2B交易平台;目前的趋势,基本上是行业垂直领域的电子商务交易平台,核心竞争力就是打破买卖双方的信息不对称、不透明。所以这种领域公司的关键点并不是记录交易量,而是每一个有效的数据信息。在这个领域,我们投资过惠民网,主要服务于中小商超和其供货商的交易平台,再比如各种“找”系列项目等等。

    第三类,是针对于开发者的服务;云存储、运行数据的统计推送以及app内的即时通信等。

    复星昆仲主要是在这三类的2B项目当中的进行投资,因为这些项目的2B业务模式可以有效积累大数据。这就是为什么复星同时关注大数据和2B领域的企业服务——因为在2B领域的企业服务,能够找到最好最有效的大数据。

    2B行业的未来投资标的

    如果我们预测一下这个行业的未来,我有以下几个观点。

    拥有丰富大数据源的企业,会成为整个行业内最炙手可热的投资标的。

    在大数据行业里,分析算法上的差别,造成的分析结果准确性、实用性的差异是93分和95分的区别。而因数据源质量造成的差别,是60分和90分的不同。特别是,一个不断更新的大数据,是能够验证这个算法准确性并不断优化大数据分析结果的有效途径。

    先行绑定最急需数据的需求方的项目,将获得胜利。

    目前,在大数据领域最愿意买单的基本都是金融领域的客户,银行、保险公司等等。他们要对用户进行多方位的分析和服务,所以购买意愿非常强。下一层,是新兴的互联网公司,为了更精准的获取用户、提高转化率,也比较愿意买单,比如说像新美大等等。下一步,可能会过渡到消费品行业当中去。

    基于大数据的那些商机

    SaaS类项目凭什么火?

    很多人其实不明白SaaS模式和传统的软件服务到底有什么区别,为什么说它是一个基于大数据而兴起的行业呢?

    SaaS和传统软件服务,中间有非常多的区别。最基础的区别,就是他们整个架构是不同的:SaaS是建立在公有云上的,标准化的模块服务,数据也储存在SaaS的公有云平台上。而传统的软件服务基本上是部署在局域网内的。这种架构上的区别决定所有的其他区别。

    比如,因为SaaS架构在云端,而且秉承标准化、普适化原则,所以,实施过程非常快。至少,实施前的现场搭建工作要少很多,那么获取用户也相应的加快。能传统模式要很长时间才能累计几百个客户,而SaaS模式可以在短时间内累积上千、上万的客户都不难。

    再比如,付费模式上的不同,传统软件有前期实施费、每年更新的费用、专门的定制服务费用、故障解决费用等等。整体来讲,费用高、缴费繁复,往往只有大企业才消费的起。而SaaS一方面减少了初期部署成本、且系统和架构可以服务于多个用户。它的收费模式基本上,是收月费或者年费,一个月只有几百块,很多中小企业,都可以享受到服务。

    智能硬件和人工智能的收获期还很漫长

    大数据和智能硬件相结合的模式,其实目前还很有挑战性,最主要的原因还是出在大数据的数量级上。目前智能硬件的出货量远不能匹配大数据所需的数量级。目前,国内出货量最大的是小米手环,第二是360儿童卫士。剩下的智能硬件出货量,往往在十几万到几十万就是比较好的量级。这跟C端大数据千万、亿级的要求还相差百倍呢。

    人工智能领域相对好一些,属于如日方升的情况。在海外的谷歌、亚马逊、软银,已经在投资一些投资标的,但是依然是一些概念领域的项目,不是立即可以商业化的服务。包括谷歌的无人车,就算已经能够积累了上百万英里的安全驾驶里程,但要应用还是有一定过程。国内也有少数的天使、早期机构,已经看好这个领域开始投资,但它的开花结果期那可能还要至少再等五年。

    所以,这个领域的投资要有一定耐心,目前比较有希望兑现的领域,包括语音语义识别、AR/VR、无人机等。

    Q&A环节

    Q:小散参与大数据、AI的SaaS的投资是否可行呢?

    A:我觉得,目前小散想要参与这一领域投资的唯一途径,可能就是通过股权众筹。这些项目的行业门槛决定了,小散要想投这类项目最好还是通过专业性的众筹平台。

    具体而言,原因有几个方面:

    项目的门槛高。我们小散接触项目往往是通过自己的朋友圈子,但这类项目的创业者基本都是专业人员,我们的小散是接触不到的。

    这类项目对创始人的专业经验要求高,小散难以进行这种专业性的项目尽调。而专业的众筹平台,在把项目推广给各位于中小投资人之前,就已经对项目做过背景调查。实现对于小散投资实现一个保护。

    总而言之,这类项目行业门槛高,专业性要求高,小散想投资一定要找天使客这样负责任的众筹平台

    Q:大家都说我们现在处于互联网时代,您强调我们现在是数据信息时代。这怎么理解?

    A:我们现在就已经处在大数据信息时代,大数据和互联网移动互联网是不相冲突的,而且恰恰是互联网,特别是移动互联网的出现,使得可以有效采集的大数据大大提升,所以大数据时代是和移动互联网手挽手一起走过来的。

    在这里我还是要推荐下我自己建的大数据学习交流qq裙:522189307 , 裙 里都是学大数据开发的,如果你正在学习大数据 ,小编欢迎你加入,大家都是软件开发党,不定期分享干货(只有大数据开发相关的),包括我自己整理的一份最新的大数据进阶资料和高级开发教程,欢迎进阶中和进想深入大数据的小伙伴。上述资料加群可以领取

    展开全文
  • 多大数据大数据?红火一时的数据分析走向了我们,纷纷称不分析数据企业将长久不了,可是究竟什么样的数据才是大数据呢,什么样的数据才是最大的呢? 如果你没有接触过大数据,那么你就不知道大数据究竟有多大,...

    大数据,什么是大数据呢?多大的数据叫大数据?红火一时的数据分析走向了我们,纷纷称不分析数据企业将长久不了,可是究竟什么样的数据才是大数据呢,什么样的数据才是最大的呢?

    如果你没有接触过大数据,那么你就不知道大数据究竟有多大,大到什么样的数据才能称之为大数据。那么,根据数据收集的端口,企业端与个人端之间,大数据的数量级别是不同的。

    大数据开发学习有一定难度,零基础入门首先要学习Java语言打基础,一般而言,Java学习SE、EE,需要约3个月的时间;然后进入大数据技术体系的学习,主要学习Hadoop、Spark、Storm等。

    什么是大数据 究竟多大才算是大数据

    大数据是什么?

    多大的数据叫大数据?

    很多没有接触过大数据的人,都很难清楚地知道,究竟多大的数据量才可以称之为大数据。那么,根据数据收集的端口,企业端与个人端之间,大数据的数量级别是不同的。

    企业端(B端)数据近十万的级别,就可以称为大数据;个人端(C端)的大数据要达到千万级别。收集渠道没有特定要求,PC端、移动端或传统渠道都可以,重点要达到这样数量级的有效数据,形成数据服务即可。很有趣,大家可以看到2B和2C,两类大数据差了两个数量级。

    有些小公司,数据只有千到万级的规模,但经过收集分析,也能从中有针对性的总结出这一群体的原则,同样能指导企业进行一定程度的用户分析、获取或者是服务工作,但这并不是大数据,而是一般性的数据挖掘。

    刚刚天小妹分享的那个案例,说今年年初有个用50块本金摆地摊卖水果的中年人,他并不懂得大数据,但是他对水果的收成了若指掌:他知道哪个地方下了多少雨,水果的甜度会到多少,如果你对大数据开发感兴趣,想系统学习大数据的话,可以加入大数据技术学习交流扣群:458数字345数字782获取学习资源哪些地方的消费者会喜欢吃这个甜度的水果。卖到最后卖出了137家门店、4.7亿的年销售额。

    这确实是一种小的数据挖掘,但并不是数据分析。大数据分析虽然脱胎于此,但大数据面向的是更海量的一个数据,借助了更广义的知识数据库的分析方法。大部分的数据公司的数据来源是海量的,它的收集和分析,并不是局限于个体,而是以一个非常非常广泛的群体为对象展开的。

    大数据的产业链是怎样的?

    我在接受采访的时候,依照大数据公司在产业链的上下游关系,提出把它们分成三种不同类别:

    大数据采集公司

    所谓“找数据”,内部可以再分两种:

    在自身正常运营的过程中就能产生大量数据源;

    通过跟电信运营商、金融企业合作,获取数据源。

    大数据分析公司

    这一类公司,基本上都有自己的套模型,但大部分数据库模型源于相同的几个机理,包括统计学模型、深度学习算法等等。也基于美国IBM、cloudera公司开发的应用型分析模块等等。

    大数据销售公司

    虽然说是卖数据,但出售的并不是单一数据,而是基于数据的全套解决方案,比如精准营销等等。

    这三类公司是如何协作,并把大数据作用于我们的生活呢?最容易理解的就是现在在微信朋友圈上投放的广告。

    腾讯在把广告推广给每个用户的时候,都已经对用户做过精准的分析。通过收集人们在微信上使用习惯,进而分析用户的消费能力、消费习惯,形成一套精准营销方案后,给广告商生成一些定向的广告。

    比如说,兰蔻的广告就从来不会推广给男性用户、豪车广告也不会推给应届毕业生。整个的微信广告体系都用到了大数据的分析模式,大家普遍反馈,在腾讯上投放的广告比网易、新浪等平台上投放的广告转化率高,正是得益于腾讯的大数据基础。

    大数据公司的投资价值

    如何理解大数据的投资价值?

    大数据如今这么火,其商业价值显而易见,但是能真正兑现的人并不多。

    要兑现大数据的商业价值,第一个要求,就是达到大数据的数据量级。那么目前,在数据量上最有优势是BAT三家。在PC时代,百度在数据上的优势非常强,但到移动时代,腾讯和阿里实现了反超。

    腾讯有微信、QQ,拿到了移动端数据生成量的九成;阿里利用它的消费数据资源,更有垂直性。那么对于中小企业、创业企业而言,兑现商业价值的重点就变成了,如何在自身规模较小的时候,利用别人的大数据资源为自己的创业更好的服务。这是需要深层次判断和挖掘的。

    所以,对于数据相关的公司,在投资判断的时候,不单是看现有业务的发展,更重要的是在他不断的发展的过程中,能不能积累有效数据、积累高准确性的数据,实现数据的实时更新性。这样的企业才能够更好地建立起竞争壁垒。

    比如,在开发者服务领域,比如talkingdata极光等等,我们复星昆仲在看项目时非常看重的一点,就是现在项目所经营的业务是单一为开发者提供服务?还是在服务之余,给自己的积累有效数据,形成长期壁垒?

    2B是大数据行业的突破口

    我之前有提到BAT对大数据收集是垄断性的,创业企业想要在C端达到海量数据(千万级甚至上亿的C端用户)非常难。目前,国内月活真正过亿的app只有15个,渗透率前10的app都是BAT所控制的,比如微信、QQ、淘宝、UC浏览器等。如果绕开BAT,能拥有C端海量数据的,就只有相对传统的电信业、金融业等等。

    可见,如果想投资大数据领域的公司,从C端下手难度很高。所以,我觉得在如果想在大数据行业布局,2B领域才是关键:一方面2B发展较晚,BAT还没有形成垄断;第二,开发门槛相对较高的;第三,数据量需求量相对较少,达到十万级别就可以为大数据的分析服务,所以如果想在大数据领域进行投资,要关注的主要领域是2B领域。

    在2B领域,有三个不同的类别:

    第一类,是B2B交易平台;目前的趋势,基本上是行业垂直领域的电子商务交易平台,核心竞争力就是打破买卖双方的信息不对称、不透明。所以这种领域公司的关键点并不是记录交易量,而是每一个有效的数据信息。在这个领域,我们投资过惠民网,主要服务于中小商超和其供货商的交易平台,再比如各种“找”系列项目等等。

    第二类,是现在很火的企业服务,以SaaS为主;比如客户管理的CRM、人力板块的HRM等等。他们在得到用户许可并保证数据安全的前提下,通过服务大量的企业来积累企业用户,和企业员工数据。比如理才网等等。

    第三类,是针对于开发者的服务;云存储、运行数据的统计推送以及app内的即时通信等。

    复星昆仲主要是在这三类的2B项目当中的进行投资,因为这些项目的2B业务模式可以有效积累大数据。这就是为什么复星同时关注大数据和2B领域的企业服务——因为在2B领域的企业服务,能够找到最好最有效的大数据。

    2B行业的未来投资标的

    如果我们预测一下这个行业的未来,我有以下几个观点。

    拥有丰富大数据源的企业,会成为整个行业内最炙手可热的投资标的。

    在大数据行业里,分析算法上的差别,造成的分析结果准确性、实用性的差异是93分和95分的区别。而因数据源质量造成的差别,是60分和90分的不同。特别是,一个不断更新的大数据,是能够验证这个算法准确性并不断优化大数据分析结果的有效途径。

    先行绑定最急需数据的需求方的项目,将获得胜利。

    目前,在大数据领域最愿意买单的基本都是金融领域的客户,银行、保险公司等等。他们要对用户进行多方位的分析和服务,所以购买意愿非常强。下一层,是新兴的互联网公司,为了更精准的获取用户、提高转化率,也比较愿意买单,比如说像新美大等等。下一步,可能会过渡到消费品行业当中去。

    基于大数据的那些商机

    智能硬件和人工智能的收获期还很漫长

    大数据和智能硬件相结合的模式,其实目前还很有挑战性,最主要的原因还是出在大数据的数量级上。目前智能硬件的出货量远不能匹配大数据所需的数量级。目前,国内出货量最大的是小米手环,第二是360儿童卫士。剩下的智能硬件出货量,往往在十几万到几十万就是比较好的量级。这跟C端大数据千万、亿级的要求还相差百倍呢。

    人工智能领域相对好一些,属于如日方升的情况。在海外的谷歌、亚马逊、软银,已经在投资一些投资标的,但是依然是一些概念领域的项目,不是立即可以商业化的服务。包括谷歌的无人车,就算已经能够积累了上百万英里的安全驾驶里程,但要应用还是有一定过程。国内也有少数的天使、早期机构,已经看好这个领域开始投资,但它的开花结果期那可能还要至少再等五年。

    所以,这个领域的投资要有一定耐心,目前比较有希望兑现的领域,包括语音语义识别、AR/VR、无人机等。

    SaaS类项目凭什么火?

    很多人其实不明白SaaS模式和传统的软件服务到底有什么区别,为什么说它是一个基于大数据而兴起的行业呢?

    SaaS和传统软件服务,中间有非常多的区别。最基础的区别,就是他们整个架构是不同的:SaaS是建立在公有云上的,标准化的模块服务,数据也储存在SaaS的公有云平台上。而传统的软件服务基本上是部署在局域网内的。这种架构上的区别决定所有的其他区别。

    比如,因为SaaS架构在云端,而且秉承标准化、普适化原则,所以,实施过程非常快。至少,实施前的现场搭建工作要少很多,那么获取用户也相应的加快。能传统模式要很长时间才能累计几百个客户,而SaaS模式可以在短时间内累积上千、上万的客户都不难。

    再比如,付费模式上的不同,传统软件有前期实施费、每年更新的费用、专门的定制服务费用、故障解决费用等等。整体来讲,费用高、缴费繁复,往往只有大企业才消费的起。而SaaS一方面减少了初期部署成本、且系统和架构可以服务于多个用户。它的收费模式基本上,是收月费或者年费,一个月只有几百块,很多中小企业,都可以享受到服务。

    Q&A环节

    Q:小散参与大数据、AI的SaaS的投资是否可行呢?

    A:我觉得,目前小散想要参与这一领域投资的唯一途径,可能就是通过股权众筹。这些项目的行业门槛决定了,小散要想投这类项目最好还是通过专业性的众筹平台。

    具体而言,原因有几个方面:

    项目的门槛高。我们小散接触项目往往是通过自己的朋友圈子,但这类项目的创业者基本都是专业人员,我们的小散是接触不到的。

    这类项目对创始人的专业经验要求高,小散难以进行这种专业性的项目尽调。而专业的众筹平台,在把项目推广给各位于中小投资人之前,就已经对项目做过背景调查。实现对于小散投资实现一个保护。

    总而言之,这类项目行业门槛高,专业性要求高,小散想投资一定要找天使客这样负责任的众筹平台

    Q:大家都说我们现在处于互联网时代,您强调我们现在是数据信息时代。这怎么理解?

    A:我们现在就已经处在大数据信息时代,大数据和互联网移动互联网是不相冲突的,而且恰恰是互联网,特别是移动互联网的出现,使得可以有效采集的大数据大大提升,所以大数据时代是和移动互联网手挽手一起走过来的。

    什么是大数据,究竟多大的数据才能称之为大数据,你知道了吗,如果想要学习大数据技术,那就努力吧,在未来的路上,懂得分析数据,你才能掌握未来!

     

    展开全文
  • 了解传统数据大数据

    千次阅读 2020-10-09 21:20:00
    了解传统数据大数据 传统数据大数据相比 数据量 传统数据gb-tb 大数据tb-pb以上 增长速度 传统数据数据量稳定 增长缓慢 大数据 持续实时生产数据 多样化 传统数据主要为结构化数据 大数据 半结构化,非结构化,...

    了解传统数据与大数据

    传统数据与大数据相比
    数据量 传统数据gb-tb 大数据tb-pb以上
    增长速度 传统数据数据量稳定 增长缓慢 大数据 持续实时生产数据
    多样化 传统数据主要为结构化数据 大数据 半结构化,非结构化,多维数据
    价值 传统数据 统计和报表 大数据 数据挖掘预测分析

    大数据服务器安装规范
    系统硬盘
    两个硬盘做一个raid1
    引导分区:200M
    交换分区:可以不设置或设置的很小,在使用大数据时需要将其关闭
    根分区:/
    数据硬盘
    多个硬盘,每个硬盘独立挂载,有多少个硬盘挂载多少个目录
    数据硬盘优先不做raid处理,必须做时,做raid0
    做raid
    优点:数据读写效率稍高
    缺点:不支持热插拔,一块硬盘损坏,服务器需要关机才能处理该硬盘
    不做raid
    优点:支持热插拔,若一块硬盘损坏可即插即拔,不需要关机
    缺点:数据的读写效率稍低

    传统数据与大数据处理方式的对比
    扩展性 传统数据纵向扩展(服务器数量不变,配置越来越高) 大数据横向扩展(配置不变,服务器数量越来越多)
    分布式 传统数据资源集中 大数据资源分布
    可用性 传统数据单份数据 大数据数据复制
    模型 传统数据移动数据 大数据移动计算程序

    大数据技术快的原因是
    分布式存储
    分布式并行计算
    移动程序到数据端
    更先进,更前卫的实现思路
    更细分的业务场景
    更先进的软件和硬件技术

    Hadoop的内部组成
    hdfs 海量数据的存储
    mapreduce 海量数据的离线计算
    yarn 集群资源调度

    HDFS的全称
    hadoop distribute file system 即hadoop分布式文件系统
    作用:海量数据的存储
    能存储海量数据的原因是
    它的空间大,空间大的原因是磁盘多,服务器多,并且支持扩展

    HDFS的组成部分
    管理者-master namenode 一个集群中有1~2个,为管理集群的工作者
    行动者-slave datanode 一个集群有n个,用于计算和储存数据的
    secondarynamenode 一个集群中有0~1个,用于辅助管理者

    HDFS的存储方式
    HDFS以数据块的方式存储,一个数据块默认128M,且该数值可修改
    128M是数据切割的阈值
    一个大的数据被切割为多个128M的数据块存储在集群的多个节点的不同位置
    数据副本机制
    数据副本默认为3份
    一个数据存储到HDFS上会自己复制两份数据到集群的多个节点的不同位置共三份

    数据副本存放机制
    若客户端也在集群内的节点,那么第一个副本就在客户端所在的机柜选一节点储存,若不在根据一定的计算选择一个节点
    第二格副本和第一个副本相同机柜的不同节点
    第三个副本要求选择逻辑距离最近的机柜上的某一节点

    什么是名字空间
    HDFS文件系统的目录树,目录结构

    namenode的作用
    维护目录树,维护命名空间。
    确定指定的文件块到datanode之间的映射关系
    检查datanode节点的状态报告

    datanode的作用
    通过流水线复制完成文件块在datanode节点上的三份数据副本
    向namenode报告datanode的状态
    负责管理他所在节点上的读写,及存储数据

    展开全文
  • 传统数据大数据的差别

    千次阅读 2020-10-12 18:27:49
    文章目录一、传统数据与大数据的对比二、传统数据与大数据处理方式对比 一、传统数据与大数据的对比 二、传统数据与大数据处理方式对比
  • 大数据开发、大数据分析、大数据运维都围绕着大数据展开。如果我们把大数据去掉,就只剩下,开发,分析,运维。当然还有其它的工作,例如运营,产品,讲师,测试等。 加上了大数据,只是我们的工作内容,或者说是...
  • 数据大数据的本质到底是什么?

    千次阅读 2019-02-22 17:43:23
    技术进步,主要是计算机、网络和各种类型的传感器以及云技术、分布式计算与存储等海量存储技术的广泛应用和运算能力极速进步,使得数据概念被大数据概念取代。数据量增加速度之快,大致可以这样描述:最近两年生成的...
  • 比较传统数据大数据

    万次阅读 2019-10-11 19:55:49
    二、比较传统数据挖掘与大数据挖掘 1、技术背景的差异: 传统数据挖掘基于数据库、数据仓库及互联网发展背景下,实现从独立、横向到纵向数据挖掘的发展。 大数据是在大数据背景下得益于云计算、物联网、移动终端...
  • 随着大数据技术的不断发展壮大, Hive不再是大数据技术生态圈中一个普通的工具,而是在大数据分析和大数据仓库中占据着几乎不可替代的重要作用,大数据分析中Hive和Hbase、Hive和Spark SQL、Hive和Impala的结合使用...
  • 传统数据大数据的区别

    千次阅读 2020-10-09 08:10:48
    个硬盘制作一个逻辑卷,即将个物理硬盘制作成一个的逻辑硬盘 大数据 系统硬盘 两块硬盘做一个RAID1 引导分区 200M 交换分区 可以不设置或设置的很小。因为在大数据中需要将其关闭 根分区 /(所有...
  • 大数据人才缺口多大?data大数据工程师好就业吗? 小编来告诉你,大数据工程师年薪50万以上,技术人员缺口150万,高端技术人才未来会遭到企业疯抢。大数据方向由于人才稀缺度较高,薪资普遍更高,待遇涨幅也会超过...
  • 基于大数据挖掘----浅谈大数据大数据挖掘

    万次阅读 多人点赞 2019-01-21 14:38:51
    基于大数据挖掘----浅谈大数据大数据挖掘 一、大数据技术 1.1大数据的定义 大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现...
  • 传统数据处理介绍 数据来源: 1、企业内部管理系统 ,如员工考勤(打卡)记录。 2、客户管理系统(CRM) 数据特征: 1、数据增长速度比较...1、数据量越来越数据处理的速度越来越慢。 2、数据种类越来越,出现...
  • 大数据开发好还是大数据分析比较好一些?哪个薪资高? 零基础学习大数据开发,还是大数据分析?哪方面比较好? 今天我们来从技术角度和薪资角度全面进行分析,方便你的选择。 技术区别 在做选择之前,需要了解...
  • 大数据分析1】大数据基础理论

    千次阅读 2019-10-10 22:28:29
    大数据分析-考点 序号 大分类 分类 掌握程度 内容 完成进度 备注 1 大数据基础理论 大数据分析基础 领会 大数据技术诞生技术背景     大数据技术实际应用     ...
  • 大数据采集 01 — 概览 02 — 相关延展 系统日志数据的采集  Scribe是Facebook开源的日志收集系统,在Facebook内部已经得到大量的应用。它够从各种日志源上收集日志,存储到一个中央存储系统上,以便于...
  • 大数据时代的数据单位是多大

    千次阅读 2013-08-10 15:32:43
    其实也第一次听说PB,有这个无标准说法尚待证实,但不妨听听这个PB是多大。 专家说:“大数据时代已经来临,以后的信息量是以PB为单位的,一个PB是1024TB,现在最大的单位YB是2的80次方个B。”   2的80...
  • 大数据简介与大数据分析

    千次阅读 2014-11-21 22:37:33
     "大数据"是一个体量特别数据类别特别数据集,并且这样的数据集无法用传统数据库工具对其内容进行抓取、管理和处理。 "大数据"首先是指数据体量(volumes)?,指代大型数据集,一般在10TB?规模左右,但在...
  • 大数据开发、大数据分析、大数据运维都围绕着大数据展开。如果我们把大数据去掉,就只剩下,开发,分析,运维。当然还有其它的工作,例如运营,产品,讲师,测试等。 加上了大数据,只是我们的工作内容,或者说是...
  • 你的是商业智能还是大数据 ? 你的是数据分析还是大数据? 你的是统计分析、报表而已还是大数据? 原来的OLAP都改名成大数据了 ? 原来的数据仓库都改名成大数据了 ?
  • 大数据的特点: 数据集主要特点 Volume(大量): 数据量巨大,从TB到PB级别。 Velocity(高速): 数据量在持续增加(两位数的年增长率)。 Variety(多样): 数据类型复杂,超过80%的数据是非结构化的。 Value(低...
  • 大数据开发和大数据分析的区别?

    千次阅读 2019-05-28 21:59:39
    大数据分析工程师和大数据开发工程师分别能做什么? 有没有具体的项目案例之类 通俗解释开发和分析 非要把他俩分开的话,一个是偏向于数据,一个偏向于工程。好比要炒个菜,工程师是烧火、垫勺的那个,偏向于工具...
  • 什么是大数据

    千次阅读 2019-11-11 21:00:28
    什么是大数据: 大数据特点: 主要特点 海量化(Volume) 数据量从TB到PB级别 多样化(Variety) 数据类型复杂,超过80%的数据是非结构化的 快速化(Velocity) 数据量在持续增加(两位数的年增长率) 数据的处理速度要求...
  • 课程背景:本人目前从业于数据仓库和大数据开发工作,是从零基础自学出来的。本次课程也是自己的学习心得体会,给有上进精神的伙伴提供一个指路明灯。本课程的整理花费了本人不少的时间、金钱和心血。从一个懵懵懂懂...
  • 1、大数据时代的数据特点 (4V) 1.1 规模性(Volume):即大数据具有相当的规模,其数据量非常巨大。数据的数量级别可划分为B 、KB 、MB 、GB 、TB 、PB 、EB 、ZB 等,而数据的数量级别为PB 级别的才能称得上是...
  • 传统数据与大数据处理方式对比 纵向扩展: 表示在需要处理更负载时通过提高单个系统处理能力的方法来解决问题。最简单的情况就是为应用系统提供更为强大的硬件。例如如果数据库所在的服务器实例只有2G内存、...
  • 我在之前的数据仓库基础入门中写过,数据仓库技术在大数据背景下发生了很改变,我粗糙的把数据仓库分成传统数据仓库和大数据数据仓库,其区别主要数数仓数据存储的地方不同,传统数仓数据存储在mysql等关系型...
  • 大数据的处理的过程中,主要是围绕着数据资产进行管理的,同时对大数据时代的大数据管理制度,进行全面的规划行、设计、创新,这样对其它信息技术管理领域,提供了便利的条件。其实,大数据时代的大数据管...
  • 大数据时代已经来临,我们仅有大数据采集的优势,并不能代表我们在大数据方面有优势。如果我们的基础数据都不靠谱,只能导致谬.误,比无知距离真理更远。如果我们的大数据仅仅是去追逐更大的利益,而不是真理,那也...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 496,550
精华内容 198,620
关键字:

多大的数据是大数据