2016-02-16 10:06:28 clq9761 阅读数 37

第一部分  从数据化运营到运营数据

 

1、大数据,为什么很多人只会谈,不会做

(1)大数据的经典定义4V:海量的数据规模(Volume)、快速的数据流转和动态的数据体系(Velocity)、
多样的数据类型(Variety)和巨大的数据价值(Value)。
(2) 断层是大数据所面临的严重问题,收集数据的人不知道将来的人怎么使用数据,创建模型的人也不
知道自己所采用的数据在未来是否稳定,使用模型的人也不知道整个数据的来路或加工过程。

 

2、大数据的本质是还原用户的真实需求
(1)识别,让似是而非的行为数据串联起来,企业有多大的能力去识别一个“碎片化了的个人”,是否
知道用户是谁,决定了企业数据收集行为的意义大小。
(2)数据收集的价值包含两个维度。一是企业价值,衡量这个数据对企业产生的价值,实现的是企业资
源的合理分配。二是客户价值,衡量这个数据对顾客的价值,如何帮助企业为客户提供更好的服务,
实现的是顾客体验的提升。
(3)如何更好地识别各个设备的使用者是否为同一个人,如何更好地理解用户在各个不同场景下表现出
来的不同需求,如何更好地理解数据融合后产生的价值,将是未来商业中每一个企业都必须考虑的问题。
 
3、“活”的数据才是大数据
(1)“死”数据就是单纯存储在数据库中,无法进行分析和使用,并且不能够产生价值的数据。
(2) “活”做数据收集,就是企业不要局限于只收集自己用户产生的数据,还要把“别人”的数据收集
过来进行综合分析。
(3)“活”看数据指标,就是指企业不要局限于已有的数据框架,而应该结合用户需求的不同场景来
灵活应用收集到的“活”数据。

 

4、无线数据,大数据的颠覆者
(1)保证PC和无线两份数的完整,通过用户体系将两份数据关联起来,就可以在分析的时候用彼此的
融合来还原用户的行为。
(2)面对无线数据, 要解决的两个问题:一是做到高效准确的收集,二是培养数据分析师的多屏思维。

 

5、数据分类与数据价值,什么才是你的核心数据
(1)数据分类的4大维度:按照是否可以再生的标准来看,可以分为不可再生数据和可再生数据。按照
数据所处的存储层次来看,可以分为基础层、中间层和应用层。按照数据业务归属来看,可以分为各个
数据主体。按照是否为隐私来区分,可以分为隐私数据和非隐私数据。
(2)数据的5大价值:一、识别与串联价值,在信息多元化的时代,单纯运用cookie来识别用户行为的
方式已经过时,能够辨别关系和身份的数据是最重要的,应该是有多少存多少,永远不要放弃。
二、描述价值,可以用来刻画研究对象,描述数据不是越多越好,而是应该收集和业务紧密相关的数据,
在复杂的数据中抽象出核心的点,分析数据的框架。三、时间价值,除了体现历史的数据之外,还有一个
价值是“即时”,对用户的现实场景进行即时数据推送。四、预测价值,能够对公司整体的经营策略及
未来的预判产生非常大的影响。五、产出数据的价值,很多数据本身并没有特别的含义,但是在几个数据
组合在一起或者对部分数据进行整合之后就产生了新的价值,比如商品的评价数据。

 

6、从用数据到养数据
(1)大数据背景下,必须考虑数据之间的关联性。一个单独的数据是没有意义的,要把数据放在一个
“数据框架”(场景)之中,才能看出存在的问题。
(2)养数据通常有两类,一类是网站自身没有的数据,需要用户主动提供的;另一类是公司拥有的,
但没有进行收集的数据。
(3)“用数据”更多的是一种方法论,而“养数据”则是一种数据战略,是基于深入业务理解的更高
层次的商业决策。
(4)我们做的很多决策都是yes或No,在面对或选择的时候,我们更容易被惯性牵绊,很多时候,我们
需要远离“或”的概念,要打破局限,不要把自己封闭在狭隘的思想中,才不会被困住而浑然不觉。

 

7、数据的盲点,负面数据的力量
(1)在数据中,盲点可以分为二类:一类是物理盲点,指在数据库中不存在这样的数据,即企业没有收集
到应该收集的数据,另一类是逻辑盲点,指有数据但是没有被很好的挖掘出来,很多时候与数据分析师
或者数据使用者的经验和敏感度有关系。
(2)面对数据盲点,正能量思考告诉你怎么做可以达到成功的终点,负能量思考则告诉你怎么做才不会
失败。当失败的代价越大、风险越高时,高风险能让一个人对不可预测性非常敏感,那时候的负能量思考
和避风险能力就自然而然地出现了。
(3)是否看到数据盲点价值的核心是,有没有看到应该看到的数据,有没有错失不应该错失的数据。


第二部分 阿里巴巴的大数据秘密

 

8、阿里巴巴的大数据实践
(1)“先开枪,后瞄准”,对于创业公司来说,管理者不需要把眼光放得过于长远。如果从短期目标出
发,在不断的观察之中发现问题,并且解决问题,很可能会更容易获得成功。

 

9、混、通、晒,阿里巴巴数据化运营的内三板斧
(1),混出数据,只有具备商业敏感的数据分析师,才会懂得使用什么数据来驱动公司实现经营
目标。数据部的人要和业务部的人经常“混”在一起。
(2),打“通”“混”的数据,知道带着业务问题来看数据或者带着数据来看业务,把数据打通,
一是商业理解和数据之间的“通”,另一种就是部门数据和部门数据的交叉。
(3),是一种在“混”和“通”的基础上产生出来的最终的数据表现,是基于人、商业和数据结合
后的一种看数据和用数据的方法论。通过业务和数据的结合,将数据“晒”出来,创造出新的商业价值。
(4)思考,要学会关窗口,“关窗口”在计算机世界中很容易执行,关掉多余的窗口可大大减轻电脑的
运行负担。现实工作中,也不要将有限的思考资源浪费在不能产生价值的思考上面,将更多的时间留下来
做更有价值的决策。

 

10、存、管、用、阿里巴巴运营数据的外三板斧
(1),数据收集的开始,收集数据不是目的,让收集起来的数据如何产生价值才是最终的目的。
(2),保护好存储数据,学会用数据产品来解决获取及使用数据的问题。
(3),从收集数据到管理数据,在“用”数据的问题上,数据的分裂和重组,都能做到颠覆性创新。
第一步,建立用户的标签。1、通过业务规则结合数据分析来建立标签。2、通过模型来建立标签。
3、通过模型的组合来生成新的标签。
第二步,标签的应用。最核心的就是数据中间层和前台业务层的对接,让数据从成本转化成利润,
才能真正发挥出大数据的价值。
(4)用化骨绵掌解决本质问题,一方面,要找到本质问题,就需要我们在思考时排除过多的东西,
使我们能够更好地集中精力去解决重要的问题;另一方面,我们要有方法去发现本质问题,不断地用
逻辑方法将问题进行分解,直到不能分解为止,然后从根本处去解决这个问题。

 

11、大数据,未来商业的利器
(1)大数据价值的体现,在于数据与数据的连接。重要的是数据和数据之间的关系,而不是数据本身。
(2)数据的标签化管理,是一个非常重要的趋势。数据的属性标签是人类经验判断的数据,是数据后的数据。
(3)未来是人机的结合体,人和机器的结合,或者人和数据的结合将是未来的一种进步模式,人类将通过
数据变得更加智能。未来人类身上流动着的是血液以及数据。我们要学会人机分工,让人做人最擅长的
事情,让机器做机器最擅长的事情。

 

12、其它
(1)成功路上,有4种东西是可以积累的,分别是财富、人际关系、知识以及思维方式。在大数据时代,
信息泛滥,很多人完全没有关注过如何积累、分类及使用当前越来越容易获得的大数据,更别说让大数据
变得能为个人所用。
(2)做好个人大数据管理,关注某一领域,对某一种知识进行积累,须对所在行业中呈现出的信息进行
积累,要完成这个大数据积累的闭环,要求放进去的数据,一定要能够非常快速、实时地调用出来。
(3)在“养数据”的过程中,关键词标签是进行数据管理最重要的工具,透过标签我们可以快速定义一篇
报告的内容,。
(4)眼睛与大脑是互相影响的,你看到的将影响你的思考,反过来你的思考方式又影响着你看到的东西。
如果你不断地积累知识,你也会发现你的思考结构发生了改变,不仅仅是知识量上的改变,而且是思维方式
的颠覆式改变。
(5)“以无法为有法,以无限为有限”是李小龙创立格斗术“截拳道”的纲领和要义,他认为这种方法
不特别固定的格斗术的精髓就在于在动态中制胜。像李小龙的格斗一样去思考问题,不断的去问问题,
知道问题到底出在哪里,以找出每一个问题背后不一样的原因。例如被问到按钮是放在左边好还是右边
好时,我们就要了解放左边和放右边的区别是什么,如果得到的答案不足以让我们获得足够的信息时,
那我们就会针对答案不断地提出新问题。这就是思考问题时常会用到的方法论,称为“迂回”,
不是直奔一个目标,而是通过不断地寻找落地点慢慢行进。
(6)寻找爆发点,未来的数据角色对企业而言就像决斗一样,如果两个人的水平差不多,多“算”的人就
胜利了,而数据就是“算”的核心。“打蛇打七寸”,抓住主干,然后通过主干解决一系列的问题,
称为“爆发”。
(7)数据扮演的三种角色,第一阶段有多少数据收集多少数据。第二阶段,数据精准化,数据之间建立
关系,从点到线到面。第三阶段,建立数据模型,分析外围数据,为公司的下一步战略找到出路。

 

 

 

 

2018-12-28 00:25:37 xiaohuanglv 阅读数 190

决战大数据(升级版):大数据的关键思考-车品觉

            在线阅读                   百度网盘下载(c7hh)


image.png

书名:决战大数据(升级版):大数据的关键思考

作者:车品觉

格式:EPUB, HTMLZ, PDF

路径:点击打开

排序作者:车品觉

排序书名:决战大数据(升级版):大数据的关键思考

日期:08 12月 2018

uuid:96a4a1ec-219b-4f77-b5b1-16e61e76dd37

id:476

出版日期:4月 2016

修改日期:08 12月 2018

大小:5.79MB

语言:中文


我在阿里的6年

回顾我在阿里的6年,从经历来说,是先负责支付宝,继而负责淘宝,最终负责整个阿里集团的数据工作。实际上,这个过程同样也是我对数据应用的一个历程:第一阶段用数据,第二阶段养数据,第三阶段从看数据到用数据。

我在支付宝

加入支付宝之前,业内都认可我是一个比较懂得用数据去设计、优化、迭代产品的首席产品官。彼时我在支付宝,大胆地把产品与数据分析部门结合,积累了不少经验。

● 数据产品化,这个理念随我加入支付宝

说起加入支付宝,其实有些偶然。当时,支付宝邀请我去分享如何用数据做产品。分享会之后,我去了华星大厦的一个会议室,里面坐着Lucy(彭蕾,时任支付宝CEO)、Eric(井贤栋,时任蚂蚁金融COO)。在那个会议室里,他们问了我几个如何能用好数据的问题。当时,我反问了Lucy一个问题:“你每天大概会看多少数据?”

“大概几十个吧。”

“不对,你不应该一天看几十个数据那么多,我觉得你应该只看几个数据就够了。”

或许,他们已经不记得我提出的这个问题了,但是我却记得非常清楚。因为在支付宝的两年里,这是我做数据产品时一直遵循的原则。

正式加入支付宝后,我面对的第一件事情就是着手组建数据分析师团队。2010年的支付宝,公司大部分业务团队对数据团队都不太满意,而且高层对数据能产生的价值也没有太多认识。而数据负责人的调职,也导致了支付宝的数据分析和数据技术部门被分开管理。

面对数据分析和数据技术团队的目标不一致,加上业务部门对为什么要使用数据及如何用好数据充满疑问,甚至有人认为数据分析仅仅是门面功夫,所以技术团队有时候会跟我的团队“对着干”,因为两个团队的老板不是同一个人,他们也没有义务一定要支持我,所以甚至有时候会撇开我们直接跟业务部门对接。

但是最后,我坚持的数据分析产品化路线最终得到了双方的认同,技术团队甚至还主动过来问我:“我们怎么合作比较好?”所以那时,双方的关系从“对着干”变成了“我们会全力支持你”。

终于有一天,Lucy走进我办公室跟我说:“你知道吗?你们做的产品让我觉得很爽,我很喜欢这个产品。”而当我在支付宝的第二个产品“地动仪”出来时,她对我说:“这就是我梦寐以求的数据产品。”

同事和老板对结果的支持,让我肯定自己在支付宝走的这条路是对的。如果让我总结这其中的精髓,我的秘诀就是:数据分析也要讲求用户体验。

简单来说就是,别说是数据产品,哪怕一个小小的数据报告,我们都必须要知道以下5个问题:

● 这是什么问题?

● 这是谁的问题?

● 这个问题现在必须马上解决吗?

● 这个问题我们能解决吗?

● 我们有足够的数据来解决吗?

当我“苛刻”地提出“把月度经营报告当成产品来做,目的是让这份报告像iPhone一样好用”的要求时,整个团队都傻了:报告怎么能像产品一样呢?!那么,为什么数据报告不可以做到行云流水,让人看起来很爽呢?

所以,我是这么要求的:首先,报告的前3页一定要吸引人,让人有欲望继续看下去;其次,当别人看到一个数据,心里在猜测数据背后的各种原因时,我的下一页报告就要解答他心中的疑问。

因此,如果要用产品管理的理念来运行分析团队的话,必须要问“问题是什么”,并以此作为切入点。接着,解决用户的问题,得到用户的信任,然后就可以做更多的好产品。这是一套做产品的理念,因为产品需要不断迭代,并非一劳永逸。

那么,我怎么评估报告是否获得成功呢?简单来说,如果一个月度经营报告仅仅5分钟就被pass掉了,那它肯定是不成功的。

我在支付宝,几乎每一个月度报告都会让管理层讨论三四个小时,一份数据报告居然会成为管理层讨论焦点,每次都会有很多高层管理者关注我讲什么,这时我就知道自己肯定成功了。

当然,我也同时会提醒分析师们,千万别以为靠一份报告就可以解决所有事情,你一定要让业务部门认为这份业务报告是大家一起探索的,这是我管理团队的一个基本理念。

我相信一切善良的力量都会有善果,生命中那些有声和无声的人,都会以他们的方式存在、生活,在你和他人修行的道路上,看见彼此、发现彼此和祝福彼此。

结缘甘孜

9年前,我只身来到上海。有一天,忙累之余,我学佛的上师忽然问我:“品觉,你要不要去甘孜看一下?”我当时没有想太多,就回答说:“好啊,去就去吧。”是的,正是这一去完全改变了我后来的生活。

我的上师是雪谦寺的活佛,在我与他结缘时,甚至连甘孜的“孜”怎么念都不知道。上师很少和我说一些大道理,第一次去甘孜,他只是带着我,也不让我问行程。到了甘孜之后,上师让我去看看当地的孩子们。说实话,他们的生活状态给了我极大的冲击:五六十个孩子没有鞋子穿,也吃不饱,和老师们一起挤在破帐篷里。吃、住和教学都在40平方米的破帐篷里,映入眼帘的是他们破旧的穿着和脸上的笑容……我当时什么都没有说,作为一个饱经沧桑的老男人,在那一刻,我竟然哭了。

我不骗你,现在回想起来,我都不知道自己为什么会流泪,也正是从那个时候起,我就下定决心:我要为这些孩子们做些什么,而且不能再等了。有些事情,可能是冥冥之中注定的,从2009年开始,我开始拉身边的人捐款,不够的就自己贴,以此保证每个月给100个学生每人100元钱的生活费。

你可能会问:“为什么那个时候,你如此信任那些帮你们管理捐助金的人?”因为那个时候的管理者是五明佛学院的大湛布,他们负责帮助学校设计课程,管理孩子们的衣食住行,对于学佛的人而言,这一点,非常可靠,也让我们这些捐助者没有后顾之忧。

自此,在工作之余,我的生命里多了一股无法妥协的力量——如果月底不按时把钱汇过去,孩子们就会没饭吃。这种原动力,就像一个幸福的鞭子,一直在身后激励着我。

信任,电商人的温暖

甘孜受助的孩子中,有的是孤儿,有的家境极其困难。2011

年,我发现自己贴的钱越来越多,因为孩子人数从100个增加到了200个,而且还在不断地增加。当时我日思夜想的就是,我必须要想办法让增加的孩子也能吃饱饭。

经常有人问我:“为什么要自己掏钱?你也只是一个普通的打工者而已,这就是一个无底洞。”我说不清楚,也答不上来,再说普通话也不好,也就无从为自己辩护。可是每一次去甘孜,看到孩子们的身体越来越好,老师们也很认真地在教学,再看看孩子们考试时自信的样子,我就知道,我必须坚持下去。这种力量,是亲眼所见带给我的,也是外人无法体会的。

后来,我觉得不能太依靠身边人的捐助,我必须建立一个长期滚动的体系。因此,2011年,在家人及朋友的支持下,我开了淘宝店“桑珠贝玛”。这个店铺里主要是销售一些佛珠和茶叶,很多朋友也会将商品放到上面来义卖,所得款项全部捐给甘孜的孩子们。正是因为这个淘宝店,我开始养成早上四点半起床做“品觉晨读”的习惯,主要是为店铺引流量,偶尔也做做客服,并利用空余时间去采购,当时我几乎是一个人把所有事情都搞定了。所以,从另一个侧面来看,我深深地了解到做一个淘宝卖家有多难。就这样不断坚持,之后店铺里每个月都有了七八千到一万元的收入,也算大大缓解了当时的危机。

但我明白,桑珠贝玛淘宝店能有如此的收入,大部分并不是因为我,而是归功于身边的好心人,而且我估计有一半的订单都是阿里巴巴的同事以及电商圈子里的朋友们下的。本来,在阿里巴巴,我作为一个高管,本人以及亲人都是不能开淘宝店的。在开店时,我对阿里巴巴廉政部说,如果我开店会给其他高管以借口,我宁可不开店。可是廉政部的同事对我说:“你继续做吧,只要每个月把收支公布出来,后面的事情我们来处理。”听完他们的话,我觉得自己没有来错阿里巴巴。

就在前不久,忽然有人给我的支付宝捐了两万元,这两万元让我惊喜不已。后来我才知道,原来是我在支付宝时的老板和同事们捐的。他们现在常常开玩笑说:“以后同事之间打赌,输钱的一方都给车品觉助学用。”虽然只是一句玩笑话,但同事们却真的这么做了,这让我很是感动。总之,阿里巴巴这家公司让我觉得自己没有来错。

还有一些电商圈的朋友,看都没看过甘孜的孩子,而且一次都没去过甘孜,却都在慷慨捐助。比如,唯品会的沈

亚、亿邦动力网的郑敏、廖斌等好心人一直在暗中帮助我。有一次,唯品会的财务在做薪酬系统改动,到了月底捐助的钱还没有汇过来,沈亚对财务说,先把孩子们的钱给支出来,其他再说。他们对我没有任何怀疑,就这样相信我,这种信任是支撑我后来能够在助学路上一直坚持走下去的很重要的力量。

因为有一帮这样善良的人在帮助我,我更是要让每一元钱都对得起捐助的人。有时候,账目错了,少了点儿钱,我就自己补进去。佛教里面说:“别人捐的钱是公德,一毛钱都不能进自己的口袋。”这也就是很多时候,我们在讲善的用心。

做公益,第一重要的其实不是钱

在甘孜助学的过程中,我和我的一些朋友们开始明白,做公益,钱很重要,但真的不是最重要的,比钱更重要的还有两样东西。

一是要专业。记得2013年,一个朋友捐了上百个羽绒睡袋,那时恰逢天气忽然从十几度骤降到零下几度。说实话,物资从那么远的地方运到甘孜,其实很不容易。当我们发睡袋时,我的心温暖极了。从收到睡袋到发放,我们都有条不紊,大家配合得也很好。还有一次,我们给孩子们捐衣服,但是发到最后,恰好少了一件,有一个孩子没拿到,他哭得很厉害。当时,我们把自己身上的衣服脱给他,但他就是不肯要。可能有人会嗔怪,孩子不懂感恩。但事实并非如此,孩子是很单纯的,他只是想追求和普通人一样的东西。所以说,做公益真的不是一件容易的事情,其中需要计划得很细致,还要考虑到各个方面。因此,专业很重要,否则非常容易在过程中无意伤到孩子。

另一样重要的东西就是爱和用心。在甘孜助学的路上,这么多年,我有幸可以碰到许多有心的人。他们甚至从来不询问结果,只是选择无条件地信任。有很多人,捐钱捐东西,从来不会去寻求所谓的回馈和回报。在这些人心里,只有一个信念:“你做了,我相信你,我相信只要对孩子们好,我们用心就好了。”这让我很感动。2010年,我们去甘孜的每个学校看孩子,很多学校连路都没有,中途迷路了,凌晨两点才到了一个小镇,安顿下来后我做了西红柿炒鸡蛋给同行的志愿者吃,他们说这是他们吃过最好吃的东西。这盘菜真的炒得那么好吗?不过是在那种情景下,大家都感觉有一种使命,必须找到那所学校,而围在一起吃一盘菜的温馨画面确实让人动容。有很多人都在默默地做着很多事情,有的爱很直观,有的爱默默无闻。比如,我曾经和银泰网的Robin和今夜特价酒店的Mars说,我们自己是靠专业技能吃饭的,我的愿望就是,不仅是要让不能读书的孩子能读书,还要让他们也能靠自己的专业技能谋生,这才是真正的好事。随后,他们两个人都开始把出去讲课赚的钱捐了出来。

同行的很多人,总是令我觉得自己做得还不够。今年,我们再一次一起去甘孜,去之前我就在筹划写一本数据方面的书,筹划这本书的初衷是:一方面,利用自己这么多年做数据的经验和专业知识,把一些方法集合出来分享给大家;另一方面就是想筹集更多的钱来帮助更多的孩子吃饱饭,接受教育。而在这本书的筹备中,很多人都在出力。在去甘孜的路上,上师对我说:“不忘初心,才会收获善果。”这句话,深深地植入我心,因为任何一个人善意的初心,一定会换来善果的。

我也改变了自己

我的一生并不像别人那样按部就班的学习、毕业、工作,一路走来我都是跌跌撞撞。我想,如果运气不好,现在的我很可能在路边帮人修车,在厨房给人炒菜,甚至加入黑社会。我大学毕业时,连我老爸都哭了,他感觉这个孩子是被救回来的。我曾经有机会好好读书,但却没有,之后才浪子回头,我深深知道读书对于人有多重要,那是进入社会的门票。而现在,我看到这些孩子们连读书的机会都没有,顿觉世界的不公。这大概就是我与这群孩子结缘的原因吧。

有人问我,是不是看到一个孩子在自己的帮助下成长,会很有成就感。实际上,我们并没有特别关注哪个孩子,大家之间交流比较少,因为语言不通,只是每年会去看望他们一次。我最大的快乐就是,这些孩子能吃饱,而在吃饱的同时还能接受教育。

也正因为结了这样的缘,忙与累也变成了一种快乐。比如,这些年我每天坚持四点半起床,把每天重要的电商新闻摘出来发微博,因为我知道,每天只发一条淘宝店义卖的微博是不会有人看的,只有积累,大家才会看到你的用心。除此之外,我还养成了长期坚持早上阅读和打坐的习惯,这也让我对行业的了解更深,对于我的工作和生活来说都是好事情。

来源:我是码农,转载请保留出处和链接!

本文链接:http://www.54manong.com/?id=1156

'); (window.slotbydup = window.slotbydup || []).push({ id: "u3646208", container: s }); })();
'); (window.slotbydup = window.slotbydup || []).push({ id: "u3646147", container: s }); })();
2018-09-11 09:15:00 weixin_30600197 阅读数 157

链接:https://pan.baidu.com/s/1RlGdyXSh8qpL4doE6UPczA 

密码:gc7j

分享《决战大数据大数据的关键思考 升级版》PDF电子书,本书为高清PDF电子书,内容截图如下

 

转载于:https://www.cnblogs.com/meidongdiluo/p/9625576.html

2018-05-27 12:44:49 wujiandao 阅读数 647

满大街都能听到大数据, big data 的言论,去问问这些谈论的人,什么是大数据,能用来做什么,十有八九的回答,都会说这些数据量大,所以才叫大数据。
不仅仅是行业外的业余人员这么看大数据,业内专业IT人员,都这么叫,包括知名的招聘网站,所以看到这类招聘,直接忽略,不专业!
你知道“大数据”怎么备份吗,知道“大数据”怎么采集吗,知道模型为什么这么用呢?
不知道,你还一口一个大数据!连养数据的概念和意识都没有,扯什么大数据?

现实情况是,采集数据的人只负责采集,不问下游即数据应用怎么玩的;
应用数据做计算的人,只负责处理模型,反复验证模型的可用性和可靠性,不管上游数据怎么采集来的,有多少做了预处理,预处理方案是什么,脏数据怎么洗掉的?
上游采集系统的渠道,质量和全面性都直接决定了下游模型结果的质量,毫不犹豫的会影响最终决策的制定。

上游数据采集不全面,导致下游模型该用的特征没有历史数据做铺垫,数到用时方恨少!这就是采集方案的不到位。
试问,一个 ETL 怎么可能知道哪些数据要抽呢,还不是跟着模型的需求来?
而做模型的人,是否能一开始就想明白数据采集的覆盖面有多广,要多深?大多数是做不到的。
随着业务的深入,需要采集的数据量不仅增大,数据维度也变宽,建模人员也就不能一开始就面面俱到,规定哪些数据要采了。

一个转变,从数据化运营到运营数据,即从用数据到养数据的转变。

余晟对《决战大数据》的评论,有对原文的陈述,即引用原文的例子和概念,大量夹杂的是自己对大数据行业的理解和扩展。能从书中见到书外,功底深厚,学识不仅丰富,写作角度更显得引人入胜。
如果能对书中的概念,提出自己的看法,那是最好不过的。每一个认真看书的人,都会针对特别难懂的地方,提出自己的理解,以求别人来解惑,或者认证,认同。而这一点,余晟是没有写到的。可能他的领悟已经超出我对本书的理解范围了

如果你对业务不理解,不能很好的提出精准解决问题的问题,甚至当前面临的困境都不能准确描述出来,那么思考是懒惰的,是无效的。
在数据时代,用数据化思考问题,是一门崭新的领域。很多解决方案都是在问题里。你要做的就是用数据来填充和回答这些问题
而往往大多数的人,都还只在寻找答案的过程中。因为到达顶峰那一路上的问题,都需要你自己去回答! 有时候你可能连问都懒得问自己!

数据对于企业和用户来说,意味着什么?
企业价值就是利益最大化,在奉数据为瑰宝的电商平台,企业价值就是点击购买率。
用户价值就是提高用户体验,让用户买到自己急需的产品或者服务。

有时候企业价值与用户价值是有强烈冲突的。企业追求的利润最大化理念,会引导用户购买产品,推荐系统就是干这事的,而忽略了用户的意愿。
很多人在网络上逗着逗着,就迷失了自我,对于电商推荐的产品,碰到新奇事物就会下单购买,比如我,看到有趣的书,就照单收了。
你说这些书对我有什么急需的功效吗,好像有也好像没有,但是买来储存着以后看,说不定哪天还绝版了呢。
既扩展了用户价值,还提高了企业价值。
大数据的本质,就是用来分析用户,还原真实的屏幕数字背后的逻辑。
不用“大”来形容,数据的本质就是洞悉用户,与大小无关。

cookies是一个既好与坏的东西,他能帮我们省去重复填写个人资料的流程,但也容易被不法分子窃取个人资料,导致滥用。
扫描一遍cookies就获知了用户的基本信息,非常低成本的手段。
衍生一点,如果不懂计算机技术,怎么知道获取用户信息的手段呢?作为运营人员,怎么知道还有cookies这么好用的技术手段来帮他们实现用户鉴别的功能
这就是人在企业活动中,不知不觉形成的断层。如果不去摸索,不去跨专业的研究,人最终被固化在一个领域中,突破不了专业的壁垒,打通不了上下链的耦合,看不到业务链上的全景色,颇为遗憾!

而大数据的目的就是为了能够让人打通这一系列的业务关节,使得链条通畅,最终还原用户的真实需求。
还原用户的真实需求,关键一点是甄别当前用户的唯一性,即识别同一个人的使用场景。这是比较难的一部分。
现在的通信手段非常发达,有手机,pad, pc甚至 Mac.
我们如何确保收集到的数据能够按人汇总呢,即一个人的行为数据,不论他是使用如何方式在使用网络,都能被准确归总到一起,而不和其他网络用户混淆?
在IoT(Internet of Things) 万物联网的时代,每个设备公司都捏着一部分的用户数据,在这一点数据中找生存,异常艰难。
这里的每个设备公司,掌握的仅仅是“碎片化的个人”而已,窥探不到整个人。
将来的数据,必定是公司与公司之间共享,或者“一桶化”包办,比如支付宝,微信。

回归到企业价值上来,对企业价值负责的还是人,首领是CEO。那么CEO最关心哪些数据呢?
我们是技术人员,怎么能想明白CEO关心的是什么,不在其位不谋其政。
问题就在这里,你是当上CEO了之后,才有了CEO应该有的本事,还是在当之前就已经有了CEO的能力?

还是那句话,通往巅峰之路上的问题,每一个都算数,都需要我们自己去想明白,并解决掉!

作为一个数据分析师,顶级的数据分析师,需要向最高领导 CEO 汇报的数据师,你会交上一份什么样的商业分析报告?
如果你对当前企业面临的问题不是很敏感,对 CEO 的困惑担忧,不是特别重视,你的商业报告有什么用?

如果我们不是数据分析师,而是数据系统架构师,那么同样,面临 CTO 的例会,我们同样也要交上一份合理的分析报告。
只不过架构师,面临的问题不再纯粹是业务问题,还需要重点突出对业务所在系统架构的瓶颈做出分析判断,并提供解决措施。
若平时不对系统的瓶颈做关注与分析,不敏感数据对于用户的体验,这份报告也难以做的令人满意。

《决战大数据》这本书,理论上看起来都很完美,但是如果不能用现实的案例来验证,这本书就是一本“别人的书”。因为书里的思想,有可能是过期的,有可能是别人编撰的,成为不了你的思想。每个人的思想都是独一无二的,哪怕是“乌合之众”的一员,同样也带有自己的情感诉求,放到陌生的环境,依然有自己处理问题的方法方式。

在《别再死盯着ROI》这篇文章里,车品觉谈到了他当年的一个决定,根据复购率最高的30%的广告关键词进行跟踪,看看跟着这些广告词而来购物的用户,在三个月后,是不是还会再次进行登录并购物。

这个故事背后的实现,完全靠技术。技术人员在此场景中,完全是产品经理的枪,指哪打哪。做的好,都是产品经理的功劳,当然一部分的产品经理都是在背着风险,因为产品经理或者营运做不好,是直接和收入挂钩的,而技术,则永远是在背后做贡献。

技术员有着明确的敌人,就是技术难题;而产品,则有太多的敌人,有时候看不清敌人在哪;有时候明知道敌人就在哪里,却苦思冥想而不得战术要领。两者都是在费脑子,只不过这么看来,技术的脑子费得不如产品那么多,那么强度大。

如果技术要赶上产品或者运营的思路或者能做得更好,当然最好。但是术业有专攻,这样的人凤毛麟角,不是嘛。

《别再做“碰巧游戏》开篇就给了我们一个很好的方向:趋势。
大量的产品经理,高级开发在一个招聘网站开始活跃,说明某一家公司内部出现了一股趋势。抓住这股趋势就能干点事情。所谓的趋势,就是人气。人气往哪里跑,那里就肯定有市场。如果拿不到政府公布的新生婴儿出生率,那么单看网络上6岁以下妈妈群,妈妈团的数量,就能知道是不是围绕着儿童这一主题市场,做点事情。如果每年大量的毕业生找不到工作,失业率上升,是不是可以考虑培训机构。数字背后意味着市场都懂,关键是怎么去分析得到趋势所向。

互联网未来的人才之战,应该在于分析师,即”市场解码员“。而这些”市场解码员“的最终杀手锏应该是一张或者多张”仪表盘“。在大数据工程师眼中最没有技术含量的”仪表盘“,技术简单,实现方便,现成的js库一拉,什么都能给你解决的了。但是”仪表盘“上为什么有这表那表,这图那图,大数据工程师一般都不会去深究的,他们木讷的脸上只有这两个字:”需求“!

《全域大数据》,即数据的上帝视角。每个人的行为数据都掌握在一家公司收下,这家公司不火才奇怪。根据你的消费行为,直接量身打造属于你的消费圈,你所到的每个地方都能满足你的购物,旅游,保险需求,那你的口袋还能扎紧嘛?

而目前的现状是,这些数据都需要流通成本。无论是消费数据,医疗数据的买卖,每个公司得到的都只是片面的生活场景,而且能否鉴定是同一个消费者,都存在技术困难。那么使用成本就更高了。

《数据分类与数据价值》:毫无疑问,数据的价值来自于数据分类与数据融合。数据分类实现是, 提炼精简的前提;数据的融合,是产生价值的必要条件,任何孤立的数据,不利于很好的扩展数据的应用。

细节的实现上,经常会有主数据管理一说。我觉得主数据管理很虚,因为并不是特别量化的行为。我们用主数据,到底用来做什么呢?

得到一些灵感还是来自于这篇文章:
https://blog.csdn.net/bbqk9/article/details/6031944

文中指出元数据与主数据的不同,似乎一下就能帮你明白主数据的范畴。元数据是数据的数据,即定义数据的数据,比如HR系统中的雇员,定义雇员的表或者试图,这些数据库对象就是元数据。而雇员在每个部门的应用软件中,昵称,职位和编号,都会有不同,如何在每个系统中都准确无误的描述这个人,就要用到主数据。一旦某一个系统更改了有关这名雇员的信息,这份更正的雇员信息,需要同步到其他系统里面。

精确的维护主数据是产生数据价值的前提,是定制客户化营销策略的一种保障。主数据也是分类数据的一种,因此维护它具有极高的战略意义。

2019-11-07 17:53:56 hello3389 阅读数 13

《决战大数据(升级版):大数据的关键思考》读后感

在这里插入图片描述
https://item.jd.com/11916182.html?dist=jd
https://book.douban.com/subject/26774911/

这是一本车品觉先生在电商领域多年大数据、数据分析的实战经验总结,可以说是数据系统顶层设计的精髓,这本书通篇全是干活,干到从阅读前言起,就需要不断地思考,二十万字的一本书,前前后后读了一个月才读完,几乎每页都要做笔记写思考结果,每页都有值得反复琢磨的点,推荐每位工作中涉及大数据、数据分析工作的人都应该读读。
作者车品觉先生的履历网上直接可以查,可以说在数据相关领域耕耘多年,又有淘宝、支付宝这种顶级数据量公司的实战经验,视角和思考方式都是业界翘楚,从书前的推荐人名单也不难看出车先生在业界的地位和人脉。
不管是做大数据、数据分析、数据产品,有一条指导思想:

数据分析也要讲求用户体验

做数据也要有产品思维,以用户为向导,根据用户需求产出“产品”,“产品”可以是分析报告、存储系统、数据中台等等。对数据相关产出,要有运营意识,优化、迭代、体验,都可以体现在数据分析报告中。而且要有产品的全生命周期的意识,从需求收集到交到用户手中,到回收反馈等等,形成闭环。一个数据“产品”的最终目标,永远是如何解决用户的问题。取悦我们用户的办法就是帮他们解决问题。

一切的分析都是从定义问题开始,问题问好了,答案就在里面。

一定要对定义、概念敏感,有了清晰的定义、概念,问问往往不攻自破,或者能够提供分析的指导思想,之前在网上看到一张图,感觉很经典,也很能说明问题:
在这里插入图片描述

由于部门之间的差异,关于数据的具体定义也要事先统一口径。

将各部门协调到统一认知。然后将问题分解,分解到分无可分为止,最终直面问题,实事求是的剖析,才能从根本上解决问题。
做数据分析,一定要深入到业务中,所有的分析结果最终都是为业务服务的,只有深入业务,才能更有效更准确的进行分析工作。

业务是用来赚钱的,而数据分析就是要养业务挣更多的钱。

数据分析还可以从数据的负面考虑,一般企业只关心转化率,其实也可以研究分析一下未转化率,分析一下未转化的原因。收集数据不是目的,收集起来的数据如何产生价值才是最终的目标。

大数据的意义在于连结,将分散的、多样性的数据连结起来。

大数据其实和江湖算命有点相似,江湖算命将就把簧,就是利用各种方式收集各种信息,经过关联性分析后汇总出结果,推荐两本书《江湖丛谈》《命相骗术大全》,里边的把点开活、拴马桩都可以看看。数据关联书中有个例子:

要想知道香港某家酒楼生意好不好,问问门口卖报纸的人就知道了。

过去,我们是带着问题去寻找能够描述、验证问题的数据,现在是有问题可以用数据去解决,未来是可以提前预测问题的发生。

书中的内容实在是太多,也产生了远远不止我上边写的这些感想,信息量太大,还得好好消化消化,但是车品觉先生这种高屋建瓴的观点,真得值得每一位数据人学习。

感触

阅读数 965

没有更多推荐了,返回首页