• 以下数据显示,中国大数据IT应用投资规模,应用以五大...根据国际知名咨询公司麦肯锡的报告显示:在大数据应用综合价值潜力方面,信息技术、金融保险、政府批发贸易四大行业潜力最高,具体到行业内每家公司的数据量

    以下数据显示,中国大数据IT应用投资规模,应用以五大行业最高,其中以互联网行业占比最高,占大数据IT应用投资规模的28.9%,其次是电信领域(19.9%),第三为金融领域(17.5%),政府和医疗分别为第四和第五,请看如下图:

    大数据在金融行业的应用

     

    根据国际知名咨询公司麦肯锡的报告显示:在大数据应用综合价值潜力方面,信息技术、金融保险、政府及批发贸易四大行业潜力最高,具体到行业内每家公司的数据量来看,信息、金融保险、计算机及电子设备、公用事业四类的数据量最大,因此:无论是投资规模和应用潜力来看,信息行业(互联网和电信)和金融行业都是大数据应用的重点行业。

    例:证券行业大数据应用

    大数据时代,券商们已意识到大数据的重要性,券商对于大数据的研究与应用正在处于起步阶段,相对于银行和保险业,证券行业的大数据应用起步相对较晚。目前国内外证券行业的大数据应用大致有以下三个方向:

    第一方面:利用大众社交情绪指数数据来预测股票

    华尔街的数学精英设计了社交情绪指数基金,其数据来源于人们在社交网络上每天早晨的情绪表达。基金购买的投资产品是经过投资银行家精挑细选的,同大众情绪相关度较高的股票。经过半年左右的测试,投资银行家发现社交情绪走势和股票基金的走势一致,相关度非常高。于是银行家将社交情绪指数基金投入实战,3个月就获得了十亿美元的收益。社交网络的情绪数据用在股票投资上,充分体现了大数据时代社交行为数据分析的商业价值。现在伦敦股票交易所大约有40%的股票基金是量化投资基金,投资决策来源于其背后的数学模型,社交网络的情绪指数也作为其中的一个重要输入数据。

    第二方面:客户关系管理

    (1)客户细分。通过分析客户的账户状态(类型、生命周期、投资时间)、账户价值(资产峰值、资产均值、交易量、佣金贡献和成本等)、交易习惯(周转率、市场关注度、仓位、平均持股市值、平均持股时间、单笔交易均值和日均成交量等)、投资偏好(偏好品种、下单渠道和是否申购)以及投资收益(本期相对和绝对收益、今年相对和绝对收益和投资能力等),来进行客户聚类和细分,从而发现客户交易模式类型,找出最有价值和盈利潜力的客户群, 以及他们最需要的服务, 更好地配置资源和政策, 改进服务,抓住最有价值的客户。

    (2)流失客户预测。券商可根据客户历史交易行为和流失情况来建模从而预测客户流失的概率。如2012年海通证券自主开发的“给予数据挖掘算法的证券客户行为特征分析技术”主要应用在客户深度画像以及基于画像的用户流失概率预测。通过对海通100多万样本客户、半年交易记录的海量信息分析,建立了客户分类、客户偏好、客户流失概率的模型。该项技术最大初衷是希望通过客户行为的量化分析,来测算客户将来可能流失的概率。

     

    例:基于大数据的精准营销一

    采集和处理数据、建模分析数据、解读数据这么三个大层面。通过对客户特征、产品特征、消费行为特征数据的采集和处理,可以进行多维度的客户消费特征分析、产品策略分析和销售策略指导分析。通过准确把握客户需求、增加客户互动的方式推动营销策略的策划和执行。

    1、数据层:采集和处理数据

    大数据处理的数据类型包括:括图片、文本、网页、社交网络,还有传统的交易数据,不局限在传统采集数据的过程一般是有限的、有意识的、结构化的进行数据采集

    2、业务层:建模分析数据

    使用的数据分析模型,例如基本统计、机器学习、例如数据挖掘的分类、聚类、关联、预测等算法。

    3、应用层:解读数据

    数据指导营销最重要的是解读。传统一般是定义营销问题之后,采集对应的数据,然后根据确定的建模或分析框架,数据进行分析,验证假设,进行解读。解读的空间是有限的,而大数据提供了一种可能性,既可以根据营销问题,封闭性地去挖掘对应数据进行验证,也可以开放性地探索,得出一些可能与常识或经验判断完全相异的结论出来。可解读的点变得非常丰富。

     

    例:基于大数据的精准营销二

    美国T-mobiles采用Informatica - The Data Integration Company平台开展大数据工作,通过集成数据综合分析客户流失的原因,根据分析结果优化网络布局为客户提供了更好的体验,在一个季度内将流失率减半;韩国 SK telecom新成立一家公司SK Planet,通过大数据分析用户的使用行为,在用户做出决定之前推出符合用户兴趣的业务防止用户流失。美国AT&T公司将记录用户在Wifi网络中的地理位置、网络浏览历史记录以及使用的应用等数据销售给广告客户。比如当用户距离商家很近时,就有可能收到该商家提供的折扣很大的电子优惠券。

    以上等等,例举出大数据的应用。

    咱们国家在大数据方面刚刚起步,现阶段正是缺乏大数据人才之际,让我们紧跟技术潮流,走在别人的前面,现在正是学习大数据的最好机遇,不花一分钱就可以成为大数据高手,挑战自我,实现年薪50--100万的梦想。

    王家林的第一个中国梦:免费为全社会培养100万名优秀的大数据从业人员!

    您可以通过王家林老师的微信号18610086859发红包捐助大数据、互联网+、O2O、工业4.0、微营销、移动互联网等系列免费实战课程, 目前已经发布的王家林免费视频全集如下:

    1,《大数据不眠夜:Spark内核天机解密(共100讲)》:http://pan.baidu.com/s/1eQsHZAq  

    2,《Hadoop深入浅出实战经典》http://pan.baidu.com/s/1mgpfRPu 

    3,《Spark纯实战公益大讲坛》http://pan.baidu.com/s/1jGpNGwu 

    4,《Scala深入浅出实战经典》http://pan.baidu.com/s/1sjDWG25 

    5,《Docker公益大讲坛》http://pan.baidu.com/s/1kTpL8UF 

    6,《Spark亚太研究院Spark公益大讲堂》http://pan.baidu.com/s/1i30Ewsd 

    7,DT大数据梦工厂Spark、Scala、Hadoop的所有视频、PPT和代码在百度云网盘的链接:
    http://pan.baidu.com/share/home?uk=4013289088#category/type=0&qq-pf-to=pcqq.group 

    王家林免费在51CTO发布的1000集合大数据spark、hadoop、scala、docker视频: 

    1,《Scala深入浅出实战初级入门经典视频课程》http://edu.51cto.com/lesson/id-66538.html 

    2,《Scala深入浅出实战中级进阶经典视频课程》http://edu.51cto.com/lesson/id-67139.html 

    3,《Akka深入浅出实战经典视频课程》http://edu.51cto.com/lesson/id-77672.html 

    4,《Spark亚太研究院决胜大数据时代公益大讲堂》http://edu.51cto.com/lesson/id-30815.html 

    5,《云计算Docker虚拟化公益大讲坛 》http://edu.51cto.com/lesson/id-61776.html 

    6,《Spark 大讲堂(纯实战手动操作)》http://edu.51cto.com/lesson/id-78653.html 

    7,《Hadoop深入浅出实战经典视频课程-集群、HDFS、Yarn、MapReduce》http://edu.51cto.com/lesson/id-77141.html 

    8,《从技术角度思考Hadoop到底是什么》http://edu.51cto.com/course/course_id-1151.html 

     

    “DT大数据梦工厂”团队第一个中国梦:免费为社会培养100万名优秀的大数据从业人员。每天早上4点起持续分享大数据、互联网+、O2O、工业4.0、微营销、移动互联网等领域的

    精华内容,帮助您和公司在DT时代打造智慧大脑,将生产力提高百倍以上!

    DT大数据梦工厂微信公众号:DT_Spark,二维码如下,期待大家加入!




    展开全文
  • 文 | 中关村老李 (本文为作者独家投稿36大数据) 2017年已过去大半,是时候该回顾一下大数据在半年中的发展了。只有清楚了现在的位置,清楚行业发展的环境,才好对未来的决策做出准确的判断。(本文是针对一...

    640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1


    文 | 中关村老李 (本文为作者独家投稿36大数据)


    2017年已过去大半,是时候该回顾一下大数据在半年中的发展了。只有清楚了现在的位置,清楚行业发展的环境,才好对未来的决策做出准确的判断。(本文是针对一月份所写的2017年的展望做出的进一步细化和调整,相关内容可以参见大浪淘沙,一文)。


    如年初所料,大数据的高潮并未到来。就在刚刚结束的一次大数据峰会上,恒泰证券的牛总也坦承线上数据还远未达到线下数据的成熟度。一个客户去线下的券商柜台办业务,简单几分钟的行为,如果用线上去刻画,则需要很大量的数据去支持,而目前的数据成熟度显然没有达到。


    大数据的真正高潮,一定首先是数据极大地丰富和成熟。


    为了有比较,还是拿一月份那篇文章的几个维度来作对比,说明过去半年中大数据产业都有了哪些变化。


    1   产业链


    在年初的时候,根据产业的发展我将去年认为的产业链中四个环节压缩至了两个,即数据服务平台提供商和数据解决方案提供商。

    0?wx_fmt=png

    通过上半年进一步观察发现,虽然市场上确实以这两种角色为主体,但在具体项目中,这二者基本没有形成上下游产业链的局面,取而代之的却是单独的行为。比方说,在一些行业市场中,数据服务平台提供商向前跨越,直接面对行业客户,向他们提供其所拥有的外部数据(往往本身就拥有海量的2C数据入口,可以源源不断地生产2C数据)、数据处理服务;而在另一部分行业市场中,数据解决方案提供商(缺乏2C数据,可能拥有部分2B数据),使用行业用户自身的数据,部分外部公开的数据以及自己强大的数据处理服务能力,为行业客户提供某个方向的解决方案。上面两个角色之间基本没有合作,没有交集,很少在市场上直接竞争。


    究其原因,个人认为有两个方面,一个是市场的成熟度决定的,还有一个就是由法律或者说政策环境决定的。


    首先,这是由市场的成熟度决定的。目前的行业应用市场还处于早期,一部分行业用户的需求还集中在直接用外部数据的简单加工,与其内部数据打通,为其提供服务,因而还不需要在本行业更为专业的解决方案提供商的存在;而另一种情况,由客户自身提供数据,结合自身掌握的公开的数据,提供数据集成服务的解决方案提供商,也是由于客户自身的技术实力还不足而出现的市场。这都从不同程度,反映了市场发展的成熟度不足的问题。


    其次,数据的交易目前在我国还是一个敏感的话题。虽然数据服务平台提供商拥有海量的2C数据,可如何与第三方合作,为行业客户提供他们所需要的解决方案,还是个无法触碰的禁区。


    6月1日生效的个人隐私安全法(下面简称隐私法),只说明了“干什么”不行,但并没有规定“如何做”才是可以的。而这个“如何做”才行的体系,需要经过几年时间的建立才可能完成。法律环境的滞后,也限制了行业的进一步发展,资源将进一步向掌握数据的巨头集中。虽然这样做便于管理,数据集中在几个巨头手里好监管,不会产生隐私数据满天飞的乱象。但缺点也是显而易见的,数据无法打通,就会形成一个个信息孤岛;数据无法流动,就使数据应用受到很大局限。这一点,恐怕是监管部门最应该尽快解决的问题。

    0?wx_fmt=jpeg


    2   模式


    在业务模式方面,基本也由掌握数据资源的情况决定了采取的业务模式。


    • 如果你本来拥有海量2C的入口,一般多会采取B2B2C的业务模式(数据服务平台提供商多以此模式);

    • 如果你没有2C入口,基本多以采取2B的模式居多(数据解决方案提供商多为此)。


    业务模式确定了,其实所做的市场也就确定了。这就是我在上面说的,这二者之间并无直接的冲突,因为覆盖的市场不同。


    也由于二者的资源不同,起点不同,服务的对象不同,所以,所拥有的技术优势也截然不同。相对而言,数据服务提供商一般会更多地覆盖精准营销、个人风控等领域的技术;


    而数据解决方案提供商一般会更多地运用行业客户自身的数据,利用强大的数据处理能力,向行业的纵深走,解决某一行业的特定问题,形成初步的行业解决方案。


    从发展的角度讲,B2B2C的模式显然要快于纯2B的节奏。这是行业市场发展的阶段决定的。直接用外部数据,经过简单处理,就可以帮助部分用户解决他们已有的问题;而纯2B的市场,不是数据的简单集成能形成的解决方案或者产品,需要经过数据的深层次加工,所以目前还多以项目的形式出现,还处于行业产品的第一轮迭代当中,要滞后于B2B2C市场的发展速度。这并不是说2B市场不好,而是市场发展阶段不同。一旦行业市场成熟,数据市场也成熟的话,简单的数据产品很快就会贬值;复杂的数据加工产品,就会凸显其价值。只有2B才可能会产生深入行业的复杂的数据加工产品,只是先后体现的问题,都有其自身的价值。

    0?wx_fmt=jpeg

    3   用户需要什么样的数据伙伴


    我们经常都想卖给客户产品,希望客户接受我们的理念,可反过来想,客户需要什么样的数据合作伙伴?要保持一个什么样的关系?


    在刚刚过去的一次大数据峰会上,惊喜地发现,很多行业客户已经意识到这个问题,大数据不同于以往的IT项目,不能单纯地以甲乙方的形式存在,已经超出了传统的建设和被建设的关系。而代之的,是一个合作共赢,长期共存的生态链。客户是在清楚了整个体系的全貌才做出这样的取舍,显然是理性的,成熟的。


    由于资源(外部数据)的局限,客户不可能通过服务提供商的一次建设,就能够完全掌握并独立运营。时代的发展也不允许客户有时间去慢慢消化,学习,独立运营所有的系统,他们必须要引入数据服务合作伙伴,整合双方的资源,而迅速地形成生产力。社会的成熟,分工进一步细化。TIME to Market决定了你没必要每一件事儿都自己去做。行业客户将注意力更好地聚焦在起主业上,而数据部分,会依赖数据合作伙伴来一起参与,共同经营。


    由这一目标就决定了,这部分客户对外部数据服务提供商的诉求,是“外部数据”+数据处理”(包括数据处理系统以及数据处理能力)+“数据融合”(这并不等同于数据处理,主要侧重于数据应用;不但需要数据服务提供商具有丰富的数据应用经验,还需要数据服务提供商具有丰富的行业经验)。


    这一点,上面的两个角色都可以满足,只是数据服务平台提供商侧重于外部数据资源,而解决方案提供商侧重于对数据的理解和数据的融合能力。

    0?wx_fmt=jpeg

    4   方向


    我依然坚持年初的观点,我们正在经历一个从IT到DT的跨越的时代。大数据,机器学习,人工智能,都是这一跨越中的工具。


    在过去的一年多的时间里,不管2B也好,B2B2C也好,不可否认的是,客户的数据思维正在建立。虽然市场上很多人分不清楚什么是典型的传统数据业务,什么是典型的大数据业务。但起码,现在越来越多的人开始拿数据来说话。


    这一点在刚刚结束的大数据峰会上得到了印证。这绝非一句空话。在我们感叹德勤财务机器人的时候,其实数据思维远不止于此!


    我所知道的一个银行客户,仅仅利用大数据技术,对存量客户进行了挖掘,并且用数据思维重构、优化了原有的流程。在几个支行的试点中,仅用了3-6个月,在经济下滑的今天,就取得了平均增速提高30%-100%的耀眼业绩!用数据去提升生产力,用数据思维去重构你原有的业务流程。你理解的越深,意识的越早,你在这次变革中,就越可能占据先机。这绝不是一个简单的战术行为,而是一次战略的转折!


    数据技术是战术,而数据思维是战略。


    无论是数据服务平台提供商,还是数据解决方案提供商,都在各自的方向上走出了坚实的一步,其价值已经得到了各自市场的认可,进入了良性的循环。虽然,短时间内还处于投入大于产出的局面,但曙光在前,已经在一个量变到质变的积累过程当中。随着技术和数据的进一步成熟,随着行业的深入,相信不远的未来(可能是2-3年)将会迎来数据时代的真正高潮!


    关于作者:


    中关村老李,前海航云商大数据业务总裁,目前就职于BBD出任助理总裁。老李既有二十余年多行业系统集成的经验,又有十多年开拓新市场新业务的经验,做事沉稳扎实,对新市场和新业务有着敏锐的感知和深入的洞察力。老李于2012年加入百分点,负责移动端个性化推荐业务; 2015年加入海航,组建大数据业务部,在很短的时间内就在出行行业反欺诈、金融科技等领域取得突破,并完成了商业闭环。2017年加入BBD,继续在大数据应用领域探索践行。


     End 

    阅读排行榜/精华推荐1入门学习

    如果有人质疑大数据?不妨把这两个视频转给他 

    视频:大数据到底是什么 都说干大数据挣钱 1分钟告诉你都在干什么

    人人都需要知道 关于大数据最常见的10个问题

    2进阶修炼

    从底层到应用,那些数据人的必备技能

    如何高效地学好 R?

    一个程序员怎样才算精通Python?

    3数据源爬取/收集

    排名前50的开源Web爬虫用于数据挖掘

    33款可用来抓数据的开源爬虫软件工具

    在中国我们如何收集数据?全球数据收集大教程

    4干货教程

    PPT:数据可视化,到底该用什么软件来展示数据?

    干货|电信运营商数据价值跨行业运营的现状与思考

    大数据分析的集中化之路 建设银行大数据应用实践PPT

    【实战PPT】看工商银行如何利用大数据洞察客户心声?              

    六步,让你用Excel做出强大漂亮的数据地图

     数据商业的崛起 解密中国大数据第一股——国双

    双11剁手幕后的阿里“黑科技” OceanBase/金融云架构/ODPS/dataV

    金融行业大数据用户画像实践


    讲述大数据在金融、电信、工业、商业、电子商务、网络游戏、移动互联网等多个领域的应用,以中立、客观、专业、可信赖的态度,多层次、多维度地影响着最广泛的大数据人群

    640?wx_fmt=jpeg

    36大数据

    长按识别二维码,关注36大数据


    搜索「36大数据」或输入36dsj.com查看更多内容。

    投稿/商务/合作:dashuju36@qq.com


    点击下方“阅读原文”查看更多

    ↓↓↓

    展开全文
  • CTO 曹犟在神策 2019 数据驱动大会的精英训练营上发表的《数据治理中的一些挑战与应用》主题演讲整理而成。本文将为你重点介绍:·数据治理的概念与重要性·数据治理面临的挑战·数据治理与组织架构·数据治理中的...
    640?wx_fmt=png
    640?wx_fmt=gif
    本文根据神策数据联合创始人 & CTO 曹犟在神策 2019 数据驱动大会的精英训练营上发表的《数据治理中的一些挑战与应用》主题演讲整理而成。本文将为你重点介绍:
    ·      数据治理的概念与重要性
    ·      数据治理面临的挑战
    ·      数据治理与组织架构
    ·      数据治理中的应对
    许多大数据公司在过去一段时间都得到了较好的发展,究其原因是因为恰逢专注于业务流的信息化建设正在向数据化转型。但在很多时候,数据其实还只是 IT 化的“副产品”,早期的工作思路仍然围绕如何将业务 IT 化,而数据只是这个过程中自然而然产生的结果,即所谓的“副产品”。由于在数据生产的过程中并未做到足够重视,数据质量与可靠性则很难得到保证,这也是数据治理在现在得以被重视的重要原因。在业务 IT 化的过程中,企业通过第三方厂商、自研等方式构建多种数据系统,采用多种系统中的数据化治理,是实现数据效能、数据驱动业务的关键步骤。
    早期,企业用信息技术去构建业务流,而现在,我们试图用信息技术,特别是互联网行业中的一些大数据处理以及分布式处理技术构建数据流,但在构建过程中,过多强调技术本身而忽视了对数据的治理。
    数据治理是整体性问题,并非仅是技术问题,市面上数不胜数的商业组件可以解决如何对数据进行存储、查询等问题,但是在实际的业务情况下对于数据治理这样一个系统性工程,目前却并无现成的产品或技术可以直接解决。

    640?wx_fmt=png

    我们可以尝试用数据治理的角度来解读上图。
    构建数据流的过程,很大意义上是为了解决分布在 IT 系统里各个不同子系统之间的数据孤岛问题,用一条完整的数据流将不同子系统之间的数据孤岛打通,同时应用于不同的应用场景,这个打通的过程,就是某种意义上的数据治理。这也反映了我之前尤为推崇的一个观点——构建数据仓库本身就是一个数据治理的过程。
    另外,对于数据的本质,我一直推崇如下两个定义,第一“信息是用来消除不确定性的”,第二“大数据的本质,就是用信息来消除不确定性”。同样,对于数据驱动在业务决策和产品智能两大方面的应用,也都将建立在数据治理的基础上才有意义。
    640?wx_fmt=png

    一、什么是数据治理?

    数据治理的本质是组织对数据的可用性、完整性和安全性的整体管理。
    1. 数据治理的本质
    可用性指数据可用、可信且有质量保证,不会因为分析结果的准确性造成偏差,从业者可以放心地根据数据结果做业务决策;完整性分为两个方面,一方面指数据需覆盖各类数据应用的需要,另一方面指不会因为数据治理没有到位而造成数据资产的流失,也即影响数据资产的积累,这也是神策数据在创业伊始便开展私有化部署的原因;安全性指治理和分享过程需安全可控,不侵犯用户隐私,且不会给组织留下安全隐患。
    2. 数据治理的重要性
    数据治理是所有数据应用的根基,数据治理的好坏直接影响所有数据应用的价值。
    无论是基于数据看报表,还是做交互式的多维分析,还是做更复杂的个性化推荐,所有的数据应用都需要有一个良好的数据治理结果。神策本身就拥有一款推荐产品——神策智能推荐,通过这款产品的实践,我们发现,它的实施周期相比其它几个产品普遍偏长,这也是因为个性化推荐对于数据的质量和准确性要求相对更高。简而言之,数据应用做得越深入,所需数据就会更多,对数据质量也会有更高的要求。
    数据治理是组织数据资产沉淀的基础,数据治理的好坏直接决定了组织的数据资产能否得到沉淀,能否充分地发挥价值。
    经常会有客户主动来询问:“领导说我们要做一个数据中台沉淀数据,但不知具体原因,亦不清楚搭建中台的具体目的,可能要等搭建之后寻找数据价值时,再去探索具体应用。”个人认为,在经费条件允许的情况下,当然可以将企业的所有数据整合在一起,通过良好的权限管控,充分的共享,聚合所有的业务部门一起去探索数据的应用,因为数据中台本身就承载着组织内部所有数据的整合分享角色。

    二、数据治理面临的挑战

    本部分的内容将数据治理面临的挑战分为两类,一类因“技术”而起,一类因“人”而起。由客观的技术问题对数据治理带来的挑战普遍较好解决,比如如何采集数据、如何存储数据等,都可通过更先进的工具、更新的技术等方式解决。而由人或组织架构带来的问题相对复杂,它的背后包含的是企业在文化、流程上的问题,可以通过以下实例说明。
    1. 多业务系统多数据源的整合挑战
    企业想要做的数据应用越多,所需的数据就会越多,所要去获取的数据源也会增多,而相应的数据处理也会越多,这是一个极为显而易见的问题。对于神策数据而言,我们在数据应用方面相对“单纯”,主要针对用户行为领域,采集用户行为数据,从客户端、服务端、数据库等做对接。但即使是这样一个限定特殊领域的应用,我们在整合多方面数据源上也会碰到非常多的挑战,可想而知在面对多业务系统多数据源的情况下将更加困难。

    640?wx_fmt=png

    2. 数据采集技术上的挑战
    近年来,许多公司都在尝试将自己的业务线上化,都需要通过数据对用户进行分析与运营,如何精准采集可用的用户数据以及其他相关数据,都将是数据采集在技术层面上面临的挑战。

    640?wx_fmt=png

    3. 用户隐私与安全挑战
    用户隐私与安全不仅是对技术挑战,更多的是一种意识上的挑战。企业需要准确把控数据采集的红线,比如针对欧盟范围内的国际业务,就需要参考 GDPR 的相关规范。
    在国内,很多银行券商等企业也同样拥有一套完善的数据合规要求,甚至已经细化到“某个特定字段对于某一个特定人可看但不可下载”的程度,这些都是需要在进行数据治理时考虑的因素。另外,如果需要在公网传输交换数据,也同样需要思考数据如何防止窃取和伪造的问题

    640?wx_fmt=png

    4. 组织架构与部门隔阂带来的配合
    部分组织在数据治理的过程中速度过慢,成效不好,其中一个很重要的原因是权责、部门配合等方面存在问题。很多情况下,生产数据、使用数据、分析数据的工作人员分布在不同的职能线与部门,角色不同,立场也不同,这些客观存在的影响因素都会影响整个数据治理的最终结果。

    640?wx_fmt=png

    5.业务持续迭代中带来的挑战
    在互联网行业中,尤其是业务迭代较为迅速的团队里,通常存在“1.0 版本的数据质量最优,1.1 版本不行,2.0 版本完全不可用”的说法,说明第一次做数据治理时,极重视数据质量,会有完善的流程来保证埋点的准确性,本身也没有太多的包袱;而在后续的产品迭代中,如果流程和标准的迭代相对滞后,整个数据治理的结果也会随着受影响,最终导致整个数据质量低劣,直至所谓的“完全不可用”。

    640?wx_fmt=png

    下面举两个具体实例说明。
    实例 1.
    某公司的业务部门向第三方数据分析平台提出数据需求,该公司内部有多个 App 频道,每个频道隶属于一个单独的部门,而第三方数据分析平台在埋点采集阶段需要不同部门的团队相互配合。由于缺乏统一各部门需求与任务的统筹角色,实施过程中很难清楚划分相关责任,再加上管理、测试等工具的缺失,最终导致每次发版都会发生埋点丢失和报错。

    实例 2.
    某企业的所有用户相关数据分散在不同的系统里面,试图通过第三方数据分析平台整合统一的用户标签数据系统。然而在收集数据的过程中,每跨一次部门就需要提一次全套的审批流程,好不容易收集齐各部门各系统中的数据之后,却发现数据统计口径不一致,无法得到一个公司统一的用户标签数据。

    三、数据治理与组织架构

    上述内容已经提到关于组织架构的内容,因其重要性将在本部分单独说明。
    1. 数据治理是一个动态的过程
    数据治理实际反映的是组织问题、文化问题,这也是许多公司为了明确权责划分而建立数据治理委员会的原因。同时,还需要明确的程序与执行程序的计划,明确的程序指对数据进行治理所需经历的阶段、问题有明细的了解,执行程序的计划指每一步需要解决哪些问题。当公司的主流业务发生变化时,组织架构会随之改变,接而带来数据治理层面的变更,所以,数据治理是一个动态的过程,伴随整个业务变更与组织架构变更。
    2. 数据治理中的两个核心角色
    第一,数据使用者,通常集中在产品经理、数据分析师、营销经理、运营经理等岗位,有查看报表、数据分析、用户画像、用户运营等需求,他们属于数据治理的受益者。
    第二,数据生产者,通常集中在前端开发、后端开发、数据工程师、ETL 工程师,有埋点、打日志、做数据 ETL 的需求,他们属于数据治理的付出者,可能看不到直接收益,反而增加工作负担。
    由于数据使用者属于数据治理中受益的一方,多数情况下需由其来推动数据治理任务进行。
    在神策数据的具体实践中,我们非常强调对客户接口人,通常情况下也就是数据使用者的培训,由他去推动整个流程,去了解数据生产者的实际情况,从而让数据治理工作更好地进行。

    四、数据治理中的应对

    首先,数据治理的核心认识是,数据治理是一个持续并且长久的一个过程,不同的产品可以解决比如采集、传输等数据治理层面上的不同问题,但并不存在一款所谓的“数据治理产品”,可以用来解决所有问题。
    其次,数据治理的整体方法论是“从应用倒推”。先确定数据应用、数据资产的需求,接着确定需要哪些数据,之后确定需要从哪种数据源获取数据,最终确定具体的数据治理方案。
    神策凭借近年在实际业务中的经验,围绕用户行为分析领域,总结出一套数据治理方法论。

    640?wx_fmt=png

    第一步,确定分析需求。通过了解数据使用者需要看哪些指标、用在哪些场景、使用哪些分析模型等方面来了解具体的数据使用需求,完成需求梳理。
    第二步,映射数据模型。在该步骤需确定采集的事件和属性,并完成事件设计。
    第三步,确定数据采集技术方案。根据要采的事件和属性,结合现有实际业务系统,去确定到底要从何种系统里以何种技术方案采集数据。
    第四步,数据采集与集成。这一步就是指具体的开发、集成工作,包括完成相应的 SDK 集成、数据采集工具的开发、数据 ETL 开发等。
    第五步,数据校验和上线。这一步中需要使用必要的测试工具、利用埋点管理平台做数据对比等。
    下面,举例说明数据治理的三大原则。
    数据治理原则 1:不要先污染后治理,要从源头控制
    在创立神策数据之前,我们曾长期参与百度的日志数据相关的工作。在最开始的阶段,所谓的日志处理就是通过中控机器,从不同的业务系统里下载文本日志,跑完脚本后生成报表,再通过邮件的形式分发。
    2008 年,团队解决了之前方案中的技术架构的问题,把以前的单机系统变成了分布式系统,提高了整体性能与计算效率,用分布式的方式下载日志,用分布式的方式来计算报表。但是,我们本质上只提供了一个计算的调度平台。就数据本身而言,没有人知道这些海量数据其中的细节,数据没有得到充分的复用,造成了许多计算资源的浪费。所以,这部分的工作其实只是解决了一个技术问题,但并没有解决任何数据治理方面的问题。
    意识到数据治理的问题之后,团队中开始了百度用户数据仓库的构建工作。有工程师每天将文本日志用程序转成结构化日志,并在进行必要的数据清洗、Union、Join 等 ETL 的工作之后,将这些结构化日志统一映射到一张大表(今天 event 模型前身),并对外提供集中访问。但随着产品线不断增多,入库周期变得更长,到后期,每增加一条产品线,都需要付出至少一周时间去解决。同时,由于数据在产生后需要做 ETL,从产生到传输到统一的 Hadoop 集群需要时间, ETL 的计算也同样需要时间,即使在最佳情况下也只能保证半小时的时效性。这是一个典型的数据“先污染后治理”的例子,不仅在治理上需要付出更多的代价和成本,数据本身的可用性和时效性也会受到影响。
    之后,我们尝试通过推行全百度统一的 Logging 平台,从打日志开始就保证数据的正确性,并且直接将数据传输到分布式集群上以保证数据的可用,这就是从源头来治理数据的思路。
    在创立神策之后,我们就充分吸取了这些教训,通过 SDK 或者其他工具去严格控制数据埋点格式及数据模型,尽最大努力减少 ETL 的代价,从而保证查询时效性与导入时效性。所以,数据治理要从源头开始,不要先污染后治理。
    数据治理原则 2:数据治理的过程要贯穿到整个业务迭代的过程中
    以软件开发流程为例。首先,在产品需求阶段,同样需要去明确数据需求。在具体设计阶段,完成产品交互系统架构变更的同时,去确定要加哪些日志、字段等。在实际开发阶段,完成相应的代码开发、日志变更,单元测试应包括相应的日志变更部分,并进行日志审计,不要将埋点当成一个单独的开发任务,而是伴随的过程。在测试阶段,当测试整体性能的正确性的同时,测试数据、日志的正确性,确保功能符合预期、日志打印正确,可以满足分需求。在上线阶段,要实际查看上线的埋点、日志是否正确,并对功能进行确认。最后,在项目总结阶段,用数据说明转化率变化、流程优化情况,对功能完成程度的总结,尝试真正地用数据说话。
    数据治理原则 3:以产品化、组件化的思路来解决,不能依赖于人工
    以产品的方式解决客户端数据采集问题。神策的开源 SDK 被许多业界同仁参考学习,究其原因是因为它用产品的方式解决客户端数据采集问题的思维,无论是电商、社交、金融、游戏,还是哪一种产品,都会在客户端采集用户数据时面临匿名 ID 生成、基础属性采集、数据打包压缩加密、本地缓存、网络传输、时间校准、根据数据模型限定了采集数据的 Schema、通过全埋点等方式提供了对常见数据的自动采集功能、结合后端提供了对于采集端调试功能等场景,所以,可以用产品思维来解决的问题,不依赖人工。
    在创办神策之前,我和团队曾经利用一个日志库去解决日志格式的问题,类似现在市面上流行的一些Java 的日志库,从 server 中获取所有日志的 Schema,并使用 Schema 打日志,保证日志在格式上的正确性和统一性。
    如今,神策内部的 SDG 产品希望用产品的方式来解决样埋点管理、ETL、数据校验一系列的问题。以往,我们自己的客户群中有销售、客户成功、分析师、实施工程师等多种角色,目的是最大限度减少上线前在设计、采集、校验、交付等场景中可能出现的问题。但商业的本质是效率,需要用产品去解放众多客户群中大批量的人力,通过一个完整的平台,去查看整个数据治理的过程,去解决客户们诸如“我上线的时候,把他的类型搞错了怎么办?”“怎么把错误的数据拿出来修改后再填进去?”等问题。

    640?wx_fmt=png

    以某大型的连锁商超客户的数据治理为例。
    该商超当时存在的现状问题有三个:第一,时间多、缺乏规范和管理;第二,埋点需求的沟通成本大且埋点代码经常被破坏;第三,无法进行有效的业务测试,上线后出现问题修复周期很长。
    在解决过程中,神策团队从最终的应用倒推,首先重新梳理事件设计方案,接着废除原有混乱埋点,依据新的埋点方案和规范,重新进行埋点,之后开发埋点管理平台,包括创建埋点需求、埋点需求审核等,最终在数据校验阶段,测试团队开发测试工具以便校验数据,并通过网络抓包摘取 SDK 上传的数据,利用埋点管理平台导出的配置(事件设计)进行对比测试。
    另一个例子,以某支付平台客户数据治理案例为例。
    该案例当时存在的主要问题有两点,首先,每次发版会有埋点丢失和报错,其次研发把错误的数据传到生产系统。团队通过分析发现,引发这两点问题的主要原因是部门隔阂以及多角色执行不到位导致。于是,团队成员通过需求提出、事件设计、需求澄清、数据采集、数据校验等步骤重新构建需求运转流程,梳理治理方案,从角色赋能、工具选择等多方面对支付平台的客户数据进行科学治理。
    另外,神策内部一直强调“价值交付”,“价值”不仅仅指通过神策的产品解决现状问题、改善业务指标,广义而言,还包括神策团队如何帮助客户搭建数据仓库,做好数据治理,以及赋予客户一套完备的交付流程。
    神策团队结合具体业务实践,针对企业不同的发展状态,总结出两类数据治理层面的实践方法论。
    首先,对于初创企业而言,在组织层面需要数据使用者从需求开始负责推动数据治理,相关的数据生产者积极配合。在流程历史层面应侧重于从源头控制数据的产生与采集,并在软件开发流程中将数据治理贯彻下去。在工具层面,需在 BI 工具、分析工具等方面做较多投入。
    其次,对于成熟企业而言,在组织层面需要“一把手”工程,可成立单独的数据治理委员会,贯穿不同部门。在流程层面,成熟企业的“数据包袱”较多,应侧重于对已有数据和系统的治理,同时需要从上到下的推动,将数据治理结果与绩效挂钩。在工具层面,整体架构需要结合自己的实际情况做统一设计,外采的工具主要作为整体架构的必要补充,除了数据应用之外,在审计、风控等方面也需要有较多的投入。
    以上为神策数据联合创始人 & CTO 曹犟在神策 2019 数据驱动大会的精英训练营上发表的《数据治理中的一些挑战与应用》主题演讲,点击【阅读原文】可下载原版 PPT 资料。 
    「PPT 下载」请点击阅读原文获取 

    六大城市联动时间预告

    640?wx_fmt=png

    上海 ☞2019 年 11 月 8日(周五)
    深圳 ☞2019 年 11 月 8 日(周五)
    成都 ☞2019 年 11 月 15 日(周五)
    杭州 ☞2019 年 11 月 15 日(周五)
    合肥 ☞2019 年 11 月 22 日(周五)
    武汉 ☞2019 年 11 月 29 日(周五)
    温馨提示
    展开全文
  • 文|鲍忠铁(微信号:daxiakanke),TalkingData首席金融行业布道师,上海大数据产业联盟金融行业专家,金融行业大数据实践推动者。鲍忠铁同时也是36大数据的专栏作者。进入 鲍忠铁 先生在36大数据的专栏>>> 进入...

    文|鲍忠铁(微信号:daxiakanke),TalkingData首席金融行业布道师,上海大数据产业联盟金融行业专家,金融行业大数据实践推动者。鲍忠铁同时也是36大数据的专栏作者。进入 鲍忠铁 先生在36大数据的专栏>>>

    进入移动互联网时代之后,金融业务地域限制被打破。金融企业没有固定业务区域,金融服务面对所有用户是平的。

    金融消费者逐渐年轻化,80、90后成为客户主力,他们的消费意识和金融意识正在增强。金融服务正在从以产品为中心,转向以消费者为中心。所有金融行业面对的最大挑战是消费者的消费行为和消费需求的转变,金融企业迫切需要为产品寻找目标客户和为客户定制产品。

    一、用户画像背后的原因

    1、金融消费行为的改变,企业无法接触到客户

    80后、90后总计共有3.4亿人口,并日益成为金融企业主要的消费者,但是他们的金融消费习惯正在改变,他们不愿意到金融网点办理业务,不喜欢被动接受金融产品和服务。年轻人将主要的时间都消费在移动互联网,消费在智能手机上。平均每个人,每天使用智能手机的时间超过了3小时,年轻人可能会超过4个小时。浏览手机已经成为工作和睡觉之后的,人类第三大生活习惯,移动APP也成为所有金融企业的客户入口、服务入口、消费入口、数据入口。

    金融企业越来越难面对面接触到年轻人,无法像过去一样,从对话中了解年轻人的想法,了解年轻人金融产品的需求。

    2、消费者需求出现分化,需要寻找目标客户

    客户群体正在出现分化,市场上很少有一种产品和一种金融服务可以满足所有用户的需求。金融产品也需要进行细化,为不同客户提供不同产品。

    金融企业面对的客户群体基数很大,有的客户高风险偏好高,希望高风险高收益;有的客户风险偏好低,希望稳健收益;有的客户金融理财意识低,只需服务较好即可;有的客户完全没有主意,你说是啥就是啥;有的客户注重体验,有的客户注重实惠,有的客户注重品牌,有的客户注重风险等等。不同年龄,不同收入,不同职业,不同资产的客户对金融产品的需求都不尽相同。金融企业需要为不同的客户定制产品,满足不同客户的需要。对于金融企业,理财和消费是主要的业务需求。

    客户消费习惯的改变,企业无法接触到客户,无法了解客户需求;

    客户需求的分化,企业需要细分客户,为目标客户开发设计产品。

    金融企业需要借助于户画像,来了解客户,找到目标客户,触达客户。

    大数据大数据
    二、用户画像的目的

    用户画像是在解客户需求和消费能力,以及客户信用额度的基础上,寻找潜在产品的目标客户,并利用画像信息为客户开发产品。

    提到用户画像,很多厂商都会提到360度用户画像,其实经常360度客户画像是一个广告宣传用语,根本不存数据可以全面描述客户,透彻了解客户。人是非常复杂的动物,信息纬度非常复杂,仅仅依靠外部信息来刻画客户内心需要根本不可能。

    用户画像一词具有很重的场景因素,不同企业对于用户画像有着不同对理解和需求。举个例子,金融行业和汽车行业对于用户画像需求的信息完全不一样,信息纬度也不同,对画像结果要求也不同。每个行业都有一套适合自己行业的用户画像方法,但是其核心都是为客户服务,为业务场景服务。

    用户画像本质就是从业务角度出发对用户进行分析,了解用户需求,寻找目标客户。另外一个方面就是,金融企业利用统计的信息,开发出适合目标客户的产品。

    从商业角度出发的用户画像对企业具有很大的价值,用户画像目的有两个。

    一个是业务场景出发,寻找目标客户。另外一个就是,参考用户画像的信息,为用户设计产品或开展营销活动。

    大数据

    三、用户画像工作坚持的原则

    市场上用户画像的方法很多,许多企业也提供用户画像服务,将用户画像提升到很有逼格一件事。金融企业是最早开始用户画像的行业,由于拥有丰富的数据,金融企业在进行用户画像时,对众多纬度的数据无从下手,总是认为用户画像数据纬度越多越好,画像数据越丰富越好,某些输入的数据还设定了权重甚至建立了模型,搞的用户画像是一个巨大而负责的工程。但是费力很大力气进行了画像之后,却发现只剩下了用户画像,和业务相聚甚远,没有办法直接支持业务运营,投入精力巨大但是回报微小,可以说是得不偿失,无法向领导交代。

    事实上,用户画像涉及数据的纬度需要业务场景结合,既要简单干练又要和业务强相关,既要筛选便捷又要方便进一步操作。用户画像需要坚持三个原则,分别是人口属性和信用信息为主,强相关信息为主,定性数据为主。下面就分别展开进行解释和分析。

    1、信用信息和人口属性为主

    描述一个用户的信息很多,信用信息是用户画像中重要的信息,信用信息是描述一个人在社会中的消费能力信息。任何企业进行用户画像的目的是寻找目标客户,其必须是具有潜在消费能力的用户。信用信息可以直接证明客户的消费能力,是用户画像中最重要和基础的信息。一句戏言,所有的信息都是信用信息就是这个道理。其包含消费者工作、收入、学历、财产等信息。

    定位完目标客户之后,金融企业需要触达客户,人口属性信息就是起到触达客户的作用,人口属性信息包含姓名、性别,电话号码,邮件地址,家庭住址等信息。这些信息可以帮助金融企业联系客户,将产品和服务推销给客户。

    2、采用强相关信息,忽略弱相关信息

    我们需要介绍一下强相关信息和弱相关信息。强相关信息就是同场景需求直接相关的信息,其可以是因果信息,也可以是相关程度很高的信息。

    如果定义采用0到1作为相关系数取值范围的化,0.6以上的相关系数就应该定义为强相关信息。例如在其他条件相同的前提下,35岁左右人的平均工资高于平均年龄为30岁的人,计算机专业毕业的学生平均工资高于哲学专业学生,从事金融行业工作的平均工资高于从事纺织行业的平均工资,上海的平均工资超过海南省平均工资。从这些信息可以看出来人的年龄、学历、职业、地点对收入的影响较大,同收入高低是强相关关系。简单的将,对信用信息影响较大的信息就是强相关信息,反之则是弱相关信息。

    用户其他的信息,例如用户的身高、体重、姓名、星座等信息,很难从概率上分析出其对消费能力的影响,这些弱相关信息,这些信息就不应该放到用户画像中进行分析,对用户的信用消费能力影响很小,不具有较大的商业价值。

    用户画像和用户分析时,需要考虑强相关信息,不要考虑弱相关信息,这是用户画像的一个原则。

    3、将定量的信息归类为定性的信息

    用户画像的目的是为产品筛选出目标客户,定量的信息不利于对客户进行筛选,需要将定量信息转化为定性信息,通过信息类别来筛选人群。

    例如可以将年龄段对客户进行划分,18岁-25岁定义为年轻人,25岁-35岁定义为中青年,36-45定义为中年人等。可以参考个人收入信息,将人群定义为高收入人群,中等收入人群,低收入人群。参考资产信息也可以将客户定义为高、中、低级别。定性信息的类别和方式方法,金融可以从自身业务出发,没有固定的模式。

    将金融企业各类定量信息,集中在一起,对定性信息进行分类,并进行定性化,有利与对用户进行筛选,快速定位目标客户,是用户画像的另外一个原则。

    大数据

    大数据
    四、用户画像的方法介绍,不要太复杂

    金融企业需要结合业务需求进行用户画像,从实用角度出发,我们可以将用户画像信息分成五类信息。分别是人口属性,信用属性,消费特征,兴趣爱好,社交属性。它们基本覆盖了业务需求所需要的强相关信息,结合外部场景数据将会产生巨大的商业价值。我们先了解下用户画像的五大类信息的作用,以及涉及的强相关信息。特别复杂的用户画像纬度例如八个纬度,十个纬度信息都不利于商业应用,不建议金融企业进行采用,其他具有价值的信息,基本上都可以归纳到这五个纬度。金融企业达到其商业需求,从这五个纬度信息进行应用就可以了,不需要过于复杂用户画像这个工作,同时商业意义也不太大。

    1、人口属性:用于描述一个人基本特征的信息,主要作用是帮助金融企业知道客户是谁,如何触达用户。姓名,性别,年龄,电话号码,邮箱,家庭住址都属于人口属性信息。

    2、信用属性:用于描述用户收入潜力和收入情况,支付能力。帮助企业了解客户资产情况和信用情况,有利于定位目标客户。客户职业、收入、资产、负债、学历、信用评分等都属于信用信息。

    3、消费特征:用于描述客户主要消费习惯和消费偏好,用于寻找高频和高价值客户。帮助企业依据客户消费特点推荐相关金融产品和服务,转化率将非常高。为了便于筛选客户,可以参考客户的消费记录将客户直接定性为某些消费特征人群,例如差旅人群,境外游人群,旅游人群,餐饮用户,汽车用户,母婴用户,理财人群等。

    4、兴趣爱好:用于描述客户具有哪方面的兴趣爱好,在这些兴趣方面可能消费偏好比较高。帮助企业了解客户兴趣和消费倾向,定向进行活动营销。兴趣爱好的信息可能会和消费特征中部分信息有重复,区别在于数据来源不同。消费特征来源于已有的消费记录,但是购买的物品和服务不一定是自己享用,但是兴趣爱好代表本人的真实兴趣。例如户外运动爱好者,旅游爱好者,电影爱好者,科技发烧友,健身爱好者,奢侈品爱好者等。兴趣爱好的信息可能来源于社交信息和客户位置信息。

    5、社交信息:用于描述用户在社交媒体的评论,这些信息往往代表用户内心的想法和需求,具有实时性高,转化率高的特点。例如客户询问上海哪里好玩?澳大利亚墨尔本的交通?房屋贷款哪家优惠多?那个理财产品好?这些社交信息都是代表客户多需求,如果企业可以及时了解到,将会有助于产品推广。

    大数据

    这些用户画像信息归类基本覆盖了业务需求和产品开发所需要的信息,需要对这些信息进行进行整理和处理。根据业务场景,将定量的数据转化为定性的数据,并将强相关数据进行整理。

    五、金融企业用户画像的基本步骤如下

    参考金融企业的数据类型和业务需求,可以将金融企业用户画像工作进行细化。基本上从数据集中到数据处理,从强相关数据到定性分类数据,从引入外部数据到依据业务场景进行筛选目标用户。

    1)画像相关数据的整理和集中

    金融企业内部的信息分布在不同的系统中,一般情况下,人口属性信息主要集中在客户关系管理系统,信用信息主要集中在交易系统和产品系统之中,也集中在客户关系管理系统中,消费特征主要集中在渠道和产品系统中。

    兴趣爱好和社交信息需要从外部引入,例如客户的行为轨迹可以代表其兴趣爱好和品牌爱好,移动设备到位置信息可以提供较为准确的兴趣爱好信息。社交信息,可以借助于金融行业自身的文本挖掘能力进行采集和分析,也是可以借助于厂商的技术能力在社交网站上直接获得。社交信息往往是实时信息,商业价值较高,转化率也较高,是大数据预测方面的主要信息来源。例如用用户在社交网站上提出罗马哪里好玩的问题,就代表用户未来可能有出国旅游的需求;如果客户在对比两款汽车的优良,客户购买汽车的可能性就较大。金融企业可以及时介入,为客户提供金融服务。

    客户画像数据主要分为五类,人口属性、信用信息、消费特征、兴趣爱好、社交信息。这些数据都分布在不同的信息系统,金融企业都上线了数据仓库(DW),所有画像相关的强相关信息都可以从数据仓库里面整理和集中,并且依据画像商业需求,利用跑批作业,加工数据,生成用户画像的原始数据。

    数据仓库成为用户画像数据的主要处理工具,依据业务场景和画像需求将原始数据进行分类、筛选、归纳、加工等,生成用户画像需要的原始数据。

    用户画像的纬度信息不是越多越好,只需要找到可五大类画像信息强相关信息,同业务场景强相关信息,同产品和目标客户强相关信息即可。根本不存在360度的用户画像信息,也不存在丰富的信息可以完全了解客户,另外数据的实效性也要重点考虑。

    2)找到同业务场景强相关数据

    依据用户画像的原则,所有画像信息应该是5大分类的强相关信息。强相关信息是指同业务场景强相关信息,可以帮助金融行业定位目标客户,了解客户潜在需求,开发需求产品。

    只有强相关信息才能帮助金融企业有效结合业务需求,创造商业价值。例如姓名、手机号、家庭地址就是能够触达客户的强人口属性信息,收入、学历、职业、资产就是客户信用信息的强相关信息。差旅人群、境外游人群、汽车用户、旅游人群、母婴人群就是消费特征的强相关信息。摄影爱好者、游戏爱好者、健身爱好者、电影人群、户外爱好者就是客户兴趣爱好的强相关信息。社交媒体上发表的旅游需求,旅游攻略,理财咨询,汽车需求,房产需求等信息代表了用户的内心需求,是社交信息场景应用的强相关信息。

    金融企业内部信息较多,在用户画像阶段不需要对所有信息都采用,只需要采用同业务场景和目标客户强相关的信息即可,这样有助于提高产品转化率,降低ROI,有利于简单找到业务应用场景,在数据变现过程中也容易实现。

    千万不要将用户画像工作搞的过于复杂,同业务场景关系不大,这样就让很多金融企业特别是领导失去用户画像的兴趣,看不到用户画像的商业,不愿意在大数据领域投资。为企业带来商业价值才是用户画像工作的主要动力和主要目的。

    3)对数据进行分类和标签化(定量to定性)

    金融企业集中了所有信息之后,依据业务需求,对信息进行加工整理,需要对定量的信息进行定性,方便信息分类和筛选。这部分工作建议在数据仓库进行,不建议在大数据管理平台(DMP)里进行加工。

    定性信息进行定量分类是用户画像的一个重要工作环节,具有较高的业务场景要求,考验用户画像商业需求的转化。其主要目的是帮助企业将复杂数据简单化,将交易数据定性进行归类,并且融入商业分析的要求,对数据进行商业加工。例如可以将客户按照年龄区间分为学生,青年,中青年,中年,中老年,老年等人生阶段。源于各人生阶段的金融服务需求不同,在寻找目标客户时,可以通过人生阶段进行目标客户定位。企业可以利用客户的收入、学历、资产等情况将客户分为低、中、高端客户,并依据其金融服务需求,提供不同的金融服务。可以参考其金融消费记录和资产信息,以及交易产品,购买的产品,将客户消费特征进行定性描述,区分出电商客户,理财客户,保险客户,稳健投资客户,激进投资客户,餐饮客户,旅游客户,高端客户,公务员客户等。利用外部的数据可以将定性客户的兴趣爱好,例如户外爱好者,奢侈品爱好者,科技产品发烧友,摄影爱好者,高端汽车需求者等信息。

    将定量信息归纳为定性信息,并依据业务需求进行标签化,有助于金融企业找到目标客户,并且了解客户的潜在需求,为金融行业的产品找到目标客户,进行精准营销,降低营销成本,提高产品转化率。另外金融企业还可以依据客户的消费特征、兴趣爱好、社交信息及时为客户推荐产品,设计产品,优化产品流程。提高产品销售的活跃率,帮助金融企业更好地为客户设计产品。

    4)依据业务需求引入外部数据

    利用数据进行画像目的主要时为业务场景提供数据支持,包括寻找到产品的目标客户和触达客户。金融企业自身的数据不足以了解客户的消费特征、兴趣爱好、社交信息。

    金融企业可以引入外部信息来丰富客户画像信息,例如引入银联和电商的信息来丰富消费特征信息,引入移动大数据的位置信息来丰富客户的兴趣爱好信息,引入外部厂商的数据来丰富社交信息等。

    外部信息的纬度较多,内容也很丰富,但是如何引入外部信息是一项具有挑战的工作。外部信息在引入时需要考虑几个问题,分别是外部数据的覆盖里,如何和内部数据打通,和内部信息的匹配率,以及信息的相关程度,还有数据的鲜活度,这些都是引入外部信息的主要考虑纬度。外部数据鱼龙混杂,数据的合规性也是金融企业在引入外部数据时的一个重要考虑,敏感的信息例如手机号、家庭住址、身份证号在引入或匹配时都应该注意隐私问题,基本的原则是不进行数据交换,可以进行数据匹配和验证。

    外部数据不会集中在某一家,需要金融企业花费大量时间进行寻找。外部数据和内部数据的打通是个很复杂的问题,手机号/设备号/身份证号的MD5数值匹配是一种好的方法,不涉及隐私数据的交换,可以进行唯一匹配。依据行业内部的经验,没有一家企业外部数据可以满足企业要求,外部数据的引入需要多方面数据。一般情况下,数据覆盖率达到70%以上,就是一个非常高的覆盖率。覆盖率达到20%以上就可以进行商业应用了。

    金融行业外部数据源较好合作方有银联、芝麻信用、运营商、中航信、腾云天下、腾讯、微博、前海征信,各大电商平台等。市场上数据提供商已经很多,并且数据质量都不错,需要金融行业一家一家去挖掘,或者委托一个厂商代理引入也可以。独立第三方帮助金融行业引入外部数据可以降低数据交易成本,同时也可以降低数据合规风险,是一个不错得尝试。另外各大城市和区域的大数据交易平台,也是一个较好的外部数据引入方式。

    5)按照业务需求进行筛选客户(DMP的作用)

    用户画像主要目的是让金融企业挖掘已有的数据价值,利用数据画像技术寻找到目标客户和客户到潜在需求,进行产品推销和设计改良产品。

    用户画像从业务场景出发,实现数据商业变现重要方式。用户画像是数据思维运营过程中到一个重要闭环,帮助金融企业利用数据进行精细化运营和市场营销,以及产品设计。用户画像就是一切以数据商业化运营为中心,以商业场景为中,帮助金融企业深度分析客户,找到目标客户。

    DMP(大数据管理平台)在整个用户画像过程中起到了一个数据变现的作用。从技术角度来讲,DMP将画像数据进行标签化,利用机器学习算法来找到相似人群,同业务场景深度结合,筛选出具有价值的数据和客户,定位目标客户,触达客户,对营销效果进行记录和反馈。大数据管理平台DMP过去主要应用在广告行业,在金融行业应用不多,未来会成为数据商业应用的主要平台。

    DMP可以帮助信用卡公司筛选出未来一个月可能进行分期付款的客户,电子产品重度购买客户,筛选出金融理财客户,筛选出高端客户(在本行资产很少,但是在他行资产很多),筛选出保障险种,寿险,教育险,车险等客户,筛选出稳健投资人,激进投资人,财富管理等方面等客户,并且可以触达这些客户,提高产品转化率,利用数据进行价值变现。DMP还可以了解客户的消费习惯、兴趣爱好、以及近期需求,为客户定制金融产品和服务,进行跨界营销。利用客户的消费偏好,提高产品转化率,提高用户黏度。

    DMP还作为引入外部数据的平台,将外部具有价值的数据引入到金融企业内部,补充用户画像数据,创建不同业务应用场景和商业需求,特别是移动大数据、电商数据、社交数据的应用,可以帮助金融企业来进行数据价值变现,让用户画像离商业应用更加近一些,体现用户画像的商业价值。

    用户画像的关键不是360度分析客户,而是为企业带来商业价值,离开了商业价值谈用户画像就是耍流氓。金融企业用户画像项目出发点一定要从业务需求出发,从强相关数据出发,从业务场景应用出发。用户画像的本质就是深度分析客户,掌握具有价值数据,找到目标客户,按照客户需求来定制产品,利用数据实现价值变现。

    大数据

    大数据
    五、金融行业用户画像实践

    1)银行用户画像实践介绍

    银行具有丰富的交易数据、个人属性数据、消费数据、信用数据和客户数据,用户画像的需求较大。但是缺少社交信息和兴趣爱好信息。

    到银行网点来办业务的人年纪偏大,未来消费者主要在网上进行业务办理。银行接触不到客户,无法了解客户需求,缺少触达客户的手段。分析客户、了解客户、找到目标客户、为客户设计其需要的产品,成了银行进行用户画像的主要目的。银行的主要业务需求集中在消费金融、财富管理、融资服务,用户画像要从这几个角度出发,寻找目标客户。

    银行的客户数据很丰富,数据类型和总量较多,系统也很多。可以严格遵循用户画像的五大步骤。先利用数据仓库进行数据集中,筛选出强相关信息,对定量信息定性化,生成DMP需要的数据。利用DMP进行基础标签和应用定制,结合业务场景需求,进行目标客户筛选或对用户进行深度分析。同时利用DMP引入外部数据,完善数据场景设计,提高目标客户精准度。找到触达客户的方式,对客户进行营销,并对营销效果进行反馈,衡量数据产品的商业价值。利用反馈数据来修正营销活动和提高ROI。形成市场营销的闭环,实现数据商业价值变现的闭环。另外DMP还可以深度分析客户,依据客户的消费特征、兴趣爱好、社交需求、信用信息来开发设计产品,为金融企业的产品开发提供数据支撑,并为产品销售方式提供场景数据。

    简单介绍一些DMP可以做到的数据场景变现。

    A:寻找分期客户

    利用银联数据+自身数据+信用卡数据,发现信用卡消费超过其月收入的用户,推荐其进行消费分期。

    B:寻找高端资产客户

    利用银联数据+移动位置数据(别墅/高档小区)+物业费代扣数据+银行自身数据+汽车型号数据,发现在银行资产较少,在其他行资产较多的用户,为其提供高端资产管理服务

    C:需找理财客户

    利用自身数据(交易+工资)+移动端理财客户端/电商活跃数据。发现客户将工资/资产转到外部,但是电商消费不活跃客户,其互联网理财可能性较大,可以为其提供理财服务,将资金留在本行。

    D:寻找境外游客户

    利用自身卡消费数据+移动设备位置信息+社交好境外强相关数据(攻略,航线,景点,费用),寻找境外游客户为其提供金融服务。

    E:寻找贷款客户:

    利用自身数据(人口属性+信用信息)+移动设备位置信息+社交购房/消费强相关信息,寻找即将购车/购房的目标客户,为其提供金融服务(抵押贷款/消费贷款)。

    大数据

    2)保险行业用户画像实践

    保险行业的产品是一个长周期产品,保险客户再次购买保险产品的转化率很高,经营好老客户是保险公司一项重要任务。保险公司内部的交易系统不多,交易方式不是很复杂,数据主要集中在产品系统和交易系统之中,客户关系管理系统中也包含丰富了信息,但是数据集中在很多保险公司还没有完成,数据仓库建设可能需要在用户画像建设前完成。

    保险公司主要数据有人口属性信息,信用信息,产品销售信息,客户家人信息。缺少兴趣爱好、消费特征、社交信息等信息。保险产品主要有寿险,车险,保障,财产险,意外险,养老险,旅游险。

    保险行业DMP用户画像的业务场景都是围绕保险产品进行的,简单的应用场景可以是。

    A:依据自身数据(个人属性)+外部养车App活跃情况,为保险公司找到车险客户

    B:依据自身数据(个人属性)+移动设备位置信息—户外运动人群,为保险企业找到商旅人群,推销意外险和保障险。

    C:依据自身数据(家人数据)+人生阶段信息,为用户推荐理财保险,寿险,保障保险,养老险,教育险

    D:依据自身数据+外部数据,为高端人士提供财产险和寿险

    大数据
    3)证券行业用户画像

    2015年4月13日,一码通实施之后,证券行业面临了互联网证券平台的强力竞争,依据TalkingData发布的金融App排行榜,移动互联网证券App,排名前5位的证券类App,只有一家传统券商华泰证券。排名第一的互联网券商同化顺覆装机量是排名第一传统券商的6倍,前三名的互联券商总体覆盖用户接近6000万用户。用户总数还在不断增加。传统证券行业现在面临的主要挑战是用户交易账户的争夺,证券行业如何增加新用户?如何留住用户?如何提高证券行业用户的活跃?如何提高单个客户的收入?是证券行业主要的业务需求。
    证券行业拥有的数据类型有个人属性信息例如用户名称,手机号码,家庭地址,邮件地址等。证券公司还拥有交易用户的资产和交易纪录,同时还拥有用户收益数据,利用这些数据和外部数据,证券公司可以利用数据建立业务场景,筛选目标客户,为用户提供适合的产品,同时提高单个客户收入。

    证券公司可以利用用户画像数据来进行产品设计,下面举几个例子,看看用户画像和用户分析来帮助证券公司创造商业价值。

    大数据
    六、外部数据介绍

    金融企业内部数据主要集中在个人属性,信用属性和消费特征上,缺少社交属性和兴趣偏好等信息,这些信息可以通过第三方获得。

    社交数据就是客户在社交媒体上发表的言论和行为,可以是评论,文章,图片,甚至可以是表情符号,音频和视频。社交数据可以依靠第三方平台,在社交网站上利用爬虫技术进行获得(Spider)。社交数据的打通是一个挑战,如果能够客户的授权最好,金融企业就可以将社交数据纳入到用户画像之中。社交数据具有实时和反映内心需要的特点,富国银行已经将社交数据作为分析客户需求的一个重要数据纬度。例如如果某一个客户在社交媒体上发表了一个问题,罗马有哪些好玩的地方,金融企业就会推测客户可能近期会有出境游的计划,就会向客户推销一些旅游相关产品。

    社交媒体数据正在成为金融企业积极争取获得的数据,除了利用网络爬虫技术到微博上进行数据采集之外,金融企业自身网站上到文本数据采集和呼叫中心(callcenter)纪录的信息都可以进行文本挖掘。通过客户编号,进行打通,将其补充到客户画像之中。社交数据需要通过数据挖掘将其定义为结构化数据,并且同业务场景、客户需求向结合,清晰进行分类。例如将母婴论坛发言活跃的用户定义为潜在教育需求客户,将学生论坛活跃的客户定义为学区房需要客户,将境外自助游论坛上活跃的客户定义为境外旅游客户,将雪球上活跃的客户定义为理财客户等。金融企业完全可以从社交数据中挖掘出客户近期的消费需求,及时进行市场营销和定制产品。

    兴趣爱好数据可以借助于移动大数据位置信息获得,客户手机设备的位置轨迹信息可以揭示客户喜欢何种品牌,喜欢吃辣还是吃火锅,客户喜欢旅游还是喜欢宅在家里,客户喜欢看电影还是喜欢运动。客户喜欢中档品牌还是高档品牌,客户喜欢喝茶还是喝咖啡。移动手机上App的安装情况和活动频次一样可以揭示客户的兴趣和爱好。同时移动大数据进行加工之后还可以告诉金融企业,客户近期的需求是买车还是买房。

    外部数据引入过程中,金融企业面临的巨大挑战是外部数据的覆盖率,如何打通内外部数据,外部数据同内部客户的匹配率,外部数据同业务的相关度,外部数据的活跃程度等。用户画像平台(DMP)可以通过技术手段将外部数据引入到金融企业内部,建立标准的标签体系,提供灵活的用户画像方式,按照业务场景进行筛选客户。

    七、移动大数据的商业价值

    移动互联网时代,移动大数据具有较高的商业价值。如果一个用户不喜欢一个App,其不会装在手机上。客户经常使用的App可以推测用户的兴趣爱好和消费偏好。另外移动设备的位置信息可以帮助金融企业了解客户行为轨迹、兴趣爱好、品牌偏好和消费需求。

    1)移动App提供一切服务,App可以反映用户喜好

    智能手机上安装的App正在代替PC互联网为所有客户提供服务,清晨起床可以看看墨迹天气,了解一下今天的天气情况。出门时可以通过嘀嘀打车来预定出租车,安排出行。或者通过百度地图来了解路况信息,决定进行从哪条路到公司。快到中午时,可以通过饿了吗或者百度外卖预定午餐,如果想出去吃饭可以利用大众点评订餐和买单。中午可以利用携程App预定家庭旅行机票和酒店,还可以将通过App看看理财产品。如果需要看电影,可以通过格瓦拉来预定要电影票,如果需要看医生,可以通过微医网预约医生。晚上可以通过淘宝来购物,通过学习宝来监督子女教育等。可以看出移动App已经可以满足人们大部分生活需要,提供了人们的衣食住行、教育、医疗、旅游、金融等服务。移动App包围了人们的日常生活,成为人们消费的主要场所。

    智能手机上App使用的频率,可以代表用户的喜好。例如喜欢理财的客户,其智能手机上一定会安装理财App,并经常使用;母婴人群也会安装和母婴相关的App,频繁使用;商旅人群使用商旅App的频率一定会高于其他移动用户。80后、90后的消费行为将会以移动互联网为主,App的安装和活跃数据更加能够反应出年轻人的消费偏好。

    2)智能设备的位置信息,商业价值广大

    智能手机设备的位置信息代表了消费者的位置轨迹,这个轨迹可以推测出消费者的消费偏好和习惯。在美国,移动设备位置信息的商业化较为成熟,GPS数据正在帮助很多企业进行数据变现,提高社会运营效率。在中国,移动大数据的商业应用刚刚开始,在房地产业、零售行业、金融行业、市场分析等领域取得了一些效果。移动大数据中的位置信息代表了用户轨迹,商业应用较早。2014年,美国移动设备位置信息的市场规模接近1000亿美金。但中国移动设备位置信息的商业应用才刚刚开始。目前主要的应用在互联网金融的反欺诈领域。

    线上的欺诈行为具有较高的隐蔽性,很难识别和侦测。P2P贷款用户很大一部分来源于线上,因此恶意欺诈事件发生在线上的风险远远大于线下。中国的很多数据处于封闭状态,P2P公司在客户真实信息验证方面面临较大的挑战。

    移动大数据可以验证P2P客户的居住地点,例如某个客户在利用手机申请贷款时,填写自己居住地是上海。但是P2P企业依据其提供的手机设备信息,发现其过去三个月从来没有居住在上海,这个人提交的信息可能是假信息,发生恶意欺诈的风险较高。移动设备的位置信息可以辨识出设备持有人的居住地点,帮助P2P公司验证贷款申请人的居住地。

    借款用户的工作单位是用户还款能力的强相关信息,具有高薪工作的用户,其贷款信用违约率较低。这些客户成为很多贷款平台积极争取的客户,也是恶意欺诈团伙主要假冒的客户。

    某个用户在申请贷款时,如果声明自己是工作在上海陆家嘴金融企业的高薪人士,其贷款审批会很快并且额度也会较高。但是P2P公司利用移动大数据,发现这个用户在过去的三个月里面,从来没有出现在陆家嘴,大多数时间在城乡结合处活动,那么这个用户恶意欺诈的可能性就较大。

    移动大数据可以帮助P2P公司在一定程度上来验证贷款用户真实工作地点,降低犯罪分子利用高薪工作进行恶意欺诈的风险。

    P2P企业可以利用移动设备的位置信息,了解过去3个月用户的行为轨迹。如果某个用户经常在半夜2点出现在酒吧等危险区域,并且经常有飙车行为,这个客户定义成高风险客户的概率就较高。移动App的使用习惯和某些高风险App也可以帮助P2P企业识别出用户的高风险行为。如果用户经常在半夜2点频繁使用App,其成为高风险客户的概率就较大。

    移动大数据在预防互联网恶意欺诈和高风险客户识别方面,已经有了成熟的应用场景。前海征信、宜信、聚信立、闪银已经开始利用TalkingData的数据,预防互联网恶意欺诈和识别高风险客户,并取得了较好的效果。移动大数据应用场景正在被逐步挖掘出来,未来移动大数商业应用将更加广阔。

    用户画像是大数据商业应用的重要领域,其实并没有多么复杂,只要掌握用户画像的原则和方法,以及实施步骤。结合金融企业的业务场景,用户画像可以帮助金融企业创造商业价值,实现大数据直接变现。

    相关阅读:

    大数据为你解读迷之人物王思聪 国民老公的微博画像

    易观智库:大数据下的用户分析及用户画像(18页PPT附下载)

    大数据在京东的典型应用:京东用户画像技术曝光

    用户画像数据建模方法

    展开全文
  • 公司在上市之前要做充分的准备,大量的数据分析阶段,如果采用大数据软件应用,可以起到快速和高效的效果。 一般来说,公司上市分为六个阶段:第一阶段:成立股份公司1、确定成立途径(股份改革);2、制定改制方案;3、...

    公司在上市之前要做充分的准备,大量的数据分析阶段,如果采用大数据软件应用,可以起到快速和高效的效果。

    一般来说,公司上市分为六个阶段:第一阶段:成立股份公司1、确定成立途径(股份改革);2、制定改制方案;3、聘请中介机构验资、资产评估、审计;4、申请设立资料;5、召开创立大会。第二阶段:1,、聘请券商辅导超过1年;2、董事会给出上市方案与可研报告。第三阶段:股票发行的准备1、确定结构;2、确定目的;3、确定发行规模;4、分销架构;5、投资者兴趣;6、估值。第四阶段:1、申报;2、开始审议程序;3、估值; 4、监管部门会提出意见做好准备回应; 5、进行招股。 第五阶段:促销和发行1、审核通过后发行;2、推出研究报告;3、准备分析员到时进行说明;4、向研究分析员介绍公司和发行的安排;5、询价、促销; 6、确定规模和定价范围。第六阶段:1、定价;2、进行股份配置;3、交易和稳定股价;4、发行结束;5、研究报道;6、后市支持。

    在分析上市公司影响因素方面,KGB知识图谱加工厂能够实现对IPO文档进行知识抽取,构建企业上市知识图谱,助力律所等中介机构深入研究IPO上市影响因素。

    KGB知识图谱加工厂服务介绍

    知识图谱加工厂对用户领域海量文档进行解析与知识抽取,深入挖掘知识关联与知识推理,并实现知识的智能校验,为客户提供高效的专业知识图谱服务。
    用户只需提供数据与需求,可快速获取知识图谱成果。

    文档解析

    KGB知识图谱引擎,可解析多种格式与版本文档:TXT、DOC、EXCEL、PPT、PDF、XML等。对于图片信息,OCR可自动识别并抽取图片中的文字信息。

    知识抽取

    KGB知识图谱引擎自适应解读并抽取文档关键知识(主体、金额、条款等),实现知识的快速生成,完成非结构化文本到结构化表格的转换。

    知识关联

    KGB知识图谱引擎深入挖掘知识关联,将知识实体链接为有意义的知识事实。并具有强大的知识推理能力,推理暗含的知识与结论,丰富知识图谱!

    知识校验

    KGB知识图谱加工厂能够对多种知识错误与冲突进行自动智能核查与校验,更有知识工程师进行知识精准校验,保证知识图谱的准确性。

    展开全文
  • 3月27日,由Testin云测主办的2019年Testin云测技术沙龙在上海环球港凯悦酒店圆满落幕。浦发银行、光大证券、兴业证券等众多知名金融企业到场出席。Testin云测云监控业务专家方顺、谭宏志,DevOps与测试行业资深咨询...
  • 数据分析侠A的成长故事面包君 同学A:22岁,男,大四准备实习,计算机专业,迷茫期作为一个很普通的即将迈入职场的他来说,看到周边的同学都找了技术开发的岗位,顿觉自己很迷茫,因为自己不是那么喜欢钻研写代码,...
  • 本文根据神策数据分析师朱静芸在神策 2018 数据驱动大会现场,发表题为《消费者全渠道精细化运营方案》的演讲整理所得。温馨提示:点击文末“阅读原文”,可下载完整版 PPT...
  • 行业报告归档 2017.3.21

    2019-04-19 14:29:42
    感谢 Boyka 整理这些报告。 2016年H2中国二手车电子商务行业白皮书 Gitee 下载 Github 下载 SourceForge 下载 2017 年上半年中国信托行业业绩回顾 ...2017-2018中国粤港澳大湾区专题研究报告 ...2017Q1中...
  • 反正每年管理咨询公司们、科技企业们、网红技术大牛们总得发明几个Sexy的概念引领潮流,可是“中台”它本尊,具体的“实物”形态是什么?“战略”又是如何?围绕它的组织长啥样的?在金融机构里又是如何结合行业特点...
  • 智能投顾面面观之AI慕课 <!-- 作者区域 --> <div class="author"> <a class="avatar" href="/u/be1ed69aa45c">...img src="//upload.jianshu.io/users/upload_avatars/3719463...
  • ”主题沙龙,由阿里巴巴技术专家从云效新概念的提出,到阿里巴巴DevOps落地实践、到企业如何利用云效进行高效研发、再到阿里巴巴CI/CD之分层自动化,帮助参会者从理念、策略、实践、效果等方面,全面深入的了解...
  • 转自: http://chuangyepu.com/articles/55035.html 人工智能步入金融领域的主流玩法: 1. 投资银行和卖方研究尝试自动报告生成,2. 金融智能搜索;...在投资银行的投行业务与证券
  • 那些时光 噢,很久没有看过书了——此刻的你心里是否会发出这样的感慨?...但是当某一天,你会发现越来越跟不上项目的节奏,越来越看不懂同事使用的什么技术竟然可以把一个复杂的功能实现得这么优雅,
  • 大数据对企业商业决策才有价值,而距离我们个人就很遥远吗? 其实,如果你留意我们公众号往期推送的数据分析报告(见文末),可以发现,无论是学习、工作还是生活,无论是娱乐八卦新闻、体育赛事预测还是商业分析...
  • 导读:资料搜集是个相当繁琐与累的工作,也是数据分析入门的基本,良好的信息资料搜集能力有利于我们快速了解基本情况,为后续的调研一手资料的获得打下较好的基础。作者:王术,发表于知乎来源:h...
  • 区块链技术

    2018-01-10 17:37:15
    https://www.zhihu.com/question/37290469 作者:汪乐-LaiW3n 链接:https://www.zhihu.com/question/37290469/answer/107612456 ...商业转载请联系作者获得授权,非商业转载请注明出处。...--
  • 2016年,容器化技术如火如荼,诞生于2013年的Docker成了行业的宠儿,它让炒了8年的DevOps有了更具体可落地可执行的工具。虽然有一定程度的过火现象(所谓的hype),虽然有很多IT人(尤其是在传统垂直行业的信息技术...
  • 书籍推荐

    2019-06-10 08:14:05
    1. 《Java核心技术 卷1 基础知识》 2. 《Java核心技术 卷II 高级特性》 Java 领域最有影响力和价值的著作之一。其中《卷1》主讲基础知识,全面讲解 Java 语言的核心概念、语法、重要特性和开发方法,是 Java ...
1 2 3
收藏数 42
精华内容 16
关键字:

ppt 券商大数据技术及应用