精华内容
下载资源
问答
  • 如何七成为数据分析师05数据可视化之打造升职加薪的报表 本文是如何七成为数据分析师的第五篇教程如果想要了解写作初衷可以先行阅读七指南温馨提示如果您已经熟悉数据可视化大可不必再看这篇文章或只挑选部分 ...
  • 成为数据分析师 第七:Python- CSDN博客 七成为数据分析师 第六:统计学- CSDN博客 七成为数据分析师 第五:Mysql- CSDN博客 七成为数据分析师 第四:数据可视化- CSDN博客 七成为数据分析...

    七周成为数据分析师 第七周:Python - CSDN博客

    七周成为数据分析师 第六周:统计学 - CSDN博客

    七周成为数据分析师 第五周:Mysql - CSDN博客

    七周成为数据分析师 第四周:数据可视化 - CSDN博客

    七周成为数据分析师 第三周:Excel篇 - CSDN博客

    七周成为数据分析师 第二周:业务篇-指标 - CSDN博客

    七周成为数据分析师 第二周:业务篇-框架与模型 - CSDN博客

    七周成为数据分析师 第一周:数据分析思维 - CSDN博客

    1.有用的图表

    ​ 对于数据可视化,大多数人下意识是要好看,下意识的去追求美感,觉得高大上。美丽的图表应该是有用的图表。​ 数据可视化的目的是让数据更高效,让读者更高效的进行阅读。好的可视化能突出背后的规律,突出重要的因素,最后才是美观。

    ​数据可视化的最终目的数据作用的最大化

    基础概念:

    • Dimension:描述分析的角度和属性,分类数据(时间、地理位置、产品类别等)
    • Measure:具体的参考数值,数值数据(元、销量、销售金额等)

    2.常见的图表

    1)散点图

    核心:解释数据之间的规律

    案例:

    • 维度:0+,作为颜色 
    • 度量:2

    呈现出一定规律的散点图可增加趋势线,并通过选项将规律用公式表示出来。

    改进图:

    1.1)气泡图:散点图的变种,引入第三个度量单位作为气泡的大小

    案例:

    • 维度:1+,作为颜色度量:3,其中1个是气泡大小

    1.2)单轴散点图:维度作Y轴,更倾向于洞察数据在不同类别下的数据规律

    案例:

    • 维度:1+,Y轴 度量:2

    2)折线图

    折线图:折线图经常用来观察数据随时间变化的趋势。 折线图中的维度不宜过多,否则会非常混乱和复杂。

    • 维度:1+,可对比;度量:1+ 时间维度:X轴

     2.1)面积图:面积图是折线图的变种。 面积图更注重数据类别之间随着时间趋势的变化关系。

    • 维度:1 度量:2

    3)柱形图

    柱形图:柱形图是类别之间的关 系。

    • 维度:2 度量:1+

    3.1)直方图

    • 维度:0 度量:1

    3.2)其他

    4)饼形图

    饼图可以理解为环状的柱形图。饼图的类别不宜过多。饼图除了PPT, 分析时基本没用。

    • 维度:1 度量:1

    用面积区分大小,很多情况下肉眼是很难区分的,上图为玫瑰图—饼图的变种

    5)漏斗图

    漏斗图是对转化过程的直观展示。单一的漏斗 图基本没用,也是面向 PPT。漏斗图的转化步骤不应该超过七个。

    • 维度:1 度量:1

    6)雷达图

    适用于个体的数据和属性可视化,比较偏描述性数据,常见于CRM, 用户画像。

    • 维度:1+ 度量:1+

     

    3.高级图表

    1)树形图

    image.png

    数据量较大、数据类别较多时,能更好的体现数据分类情况。常和多维分析结合。

    2)桑基图

    image.png

    绘制流量变动最开始,网站的流量,监视用户的行为分析,表示用户在网站上的行为轨迹,一对多或多对一的关系

    3)热力图

    image.png

    数据上下波动可用折线图观察,但是中间的某种关系展示揭示特殊关系使用热力图则可看出来。

    4)关系图

    image.png

    社交,社会媒体,微博的传播,用户和用户之间的关注等。

    5)箱线图

    揭示数据的分布情况

    6)标靶图

     销售业绩挂钩,基本让部门和老板看。

    7)词云图

    8)地理图

    image.png

    数据和空间的关系

    4.图表绘制工具与技巧

    1)绘制工具

    • 初级—Excel
    • 中高级—编程python、R和BI工具

    2)绘制技巧

    1.颜色搭配:color.adobe.com上有多种主流颜色搭配

    2.颜色搭配原则

    • 把需要聚焦的数据进行颜色凸显
    • 去掉多余没有用的元素
    • 横纵辅助线如果对肉眼观察无帮助则去掉
    • 在报告中,内容交给单元格来解决
    • 有设计规范

    3 . 组合绘制:结合多张图表

    • 次坐标轴的使用,使得数据能体现更多细节。
    • 误差线的使用。
    • 辅助列的使用。
    • 案例:组合图、甘特图、标靶图。

    3)杜邦分析法

    基础拓展:

    一、什么是杜邦分析法?

    杜邦分析法,又称杜邦模型,是将企业的获利水平、经营效率和风险承受能力综合在一起评价企业财务管理效果的方法。

    二、杜邦分析的历史背景是什么?

    1912年,杜邦公司的销售人员法兰克·唐纳德森·布朗为了向公司管理层阐述公司运营效率问题,写了一份报告。报告中写道“要分析用公司自己的钱赚取的利润率”,并且他将这个比率进行拆解。大家能想象到这个公式从发明到现在已经有100多年历史了么?

    三、杜邦分析阐述的问题是什么?

    1、公司业务有没有盈利;

    2、公司资产使用效率如何;

    3、公司债务负担有没有风险。

    通俗的说法就是:公司用自己的钱赚了多少,所占的比率是多少(净资产收益率)

    四、杜邦分析的公式是什么?

    净资产收益率(ROE)

    • ①= 销售净利率(NPM)×资产周转率(AU)×权益乘数(EM)
    • ②= 资产净利率×权益乘数
    • ③= 净利润/净资产

    五、每个比率的意义是什么?

    ROE就是说投入的1块钱自有资本能够带来几块钱的利润。

    举个简单的例子:你出资100万,再找老张借了100万办了一个面包店,从会计的角度股东的投入是100万,公司负债100万,第一年扣除各种费用和还老张的利息还赚了24万,这时候公司的ROE(净资产收益率)就是24%(24万利润/个人出资100万)。你的竞争对手隔壁的李四也是投资100万,同样跟老张借款100万,一年赚了50万,那么李四的面包铺ROE就是50%。

    1、销售净利率(NPM)——公司到底赚不赚钱

    (1)公式:

    销售净利率=净利润÷销售收入×100%

    (2)专业说明:

    “销售收入”是利润表的第一行数字,“净利润”是利润表的最后一行数字,两者相除可以概括企业的全部经营成果,它表明1元销售收入与其成本费用之间可以挤出来的净利润。

    (3)白话说明:

    每卖出一块钱的面包,你能赚几毛钱?

    2、总资产周转率(AU)——公司的资产得没得到有效的适用

    (1)公式:

    总资产周转次数=销售收入÷总资产×100%

    (2)专业说明:

    资产净利率是企业盈利能力的关键,虽然股东报酬由总资产净利率和财务杠杆共同决定,但提高财务杠杆会同时提高企业风险,往往并不增加企业价值。此外,财务杠杆的提高有诸多限制,企业经常处于财务杠杆不可能再提高的临界状态。因此,提高权益净利率的基本动力是总资产周转率。

    (3)白话说明:

    你跟李四的总资产都是200万,为啥李四一年能卖100万,你却只能卖50万呢?这是不是说明你营运的效率太低了呢?

    3、权益乘数(EM)——公司欠了多少债务,还不上钱的风险高不高?

    (1)公式:

    权益乘数=总资产÷股东权益×100%

    (2)专业说明:

    由于所有者权益等于总资产减去总负债,因此这个指标其实是资产负债率的变体,当负债占比越大,所有者权益越小,权益乘数就会越大,杠杆越大,说明企业借钱生钱的能力越强。财务杠杆即表明债务多少,与偿债能力有关,财务杠杆影响总资产净利率和权益净利率之间的关系,还表明权益净利率的风险高低,与盈利能力有关。

    (3)白话说明:

    你的面包店和李四的面包店财务杠杆都是200/100=2,为啥人家的ROE是50%呢?

    六、对比的结果是什么呢?

    你的面包店ROE=48%*0.25*2=24%

    其中:48%是销售净利率,0.25=销售收入(50万)/总资产(200万),2=总资产(200)/权益(100)

    李四的面包店ROE=50%*0.5*2=50%

    其中:50%是销售净利率,0.5=销售收入(100万)/总资产(200万),2=总资产(200)/权益(100)

    通过对比后发现,销售净利率和权益乘数的比率相差不大,主要差异在于总资产周转率。李四是学销售出身,谙熟消费者的心态,知道怎么营销,能抓到客户心理。你如想改善经营,你应当在扩大销售额方面下功夫。这就是杜邦分析体系的威力所在,将”资产负债表”和“利润表”有机的结合,从不同的角度审视自己公司和同行业公司的优缺点,发现后进行改善或保持。

    5. Power BI(windows)

    1)BI基本功能要素

    • 单一图表没有意义,三表成虎,通过多表多因素展现分析。注意设计的表格揭示的是现象?还是原因?
    • BI中,power BI和Tableau是最著名的BI软件。其中,Power BI免费易用适合新手入门。

    BI中的数据链接,最好直接连接数据库或者CSV文件,尽量不要xls文件。

    power BI 的功能特点:

    • 制作的图表可以进行联动
    • 多对对的关系不能进行关联
    • power BI内的函数使用与Excel的函数应用基本一致,不建议话太多的精力去学power BI里面的函数。
    • 建议使用Excel将数据进行清洗后,再已.csv的形式导入BI内进行操作。
    • power BI可以引入第三方的一些高级功能(80%都是微软自己的)来满足使用者需求,例如添加更多的图表形式,词云图等等。

    2)Dashbord

    • 布局和设计要素:主次分明+贴合场景+指标结构
    • 建议先自己规划好(自己用草稿纸动手去画,思路会更好的捋顺清楚)

    1.场景案例

    • 考虑是谁在使用?
    • 用户的目的是什么?
    • 是希望进行监控?还是希望分析?
    • 用户怎么使用?
    • 怎么改善BI?很多BI是有监控的,看使用人都干什么,使用那些报表,会使用后台监控日志去调整改善BI的布局

    2.指标结构案例

    Dashbord是一个不断迭代的设计过程,需要根据目的,不断进化。

    这里由于本人是mac,就没麻烦装win系统了,可能会用同类产品tableau替代这个工具~ 

    展开全文
  • 成为数据分析师 第七:Python- CSDN博客 七成为数据分析师 第六:统计学- CSDN博客 七成为数据分析师 第五:Mysql- CSDN博客 七成为数据分析师 第四:数据可视化- CSDN博客 七成为数据分析...

    七周成为数据分析师 第七周:Python - CSDN博客

    七周成为数据分析师 第六周:统计学 - CSDN博客

    七周成为数据分析师 第五周:Mysql - CSDN博客

    七周成为数据分析师 第四周:数据可视化 - CSDN博客

    七周成为数据分析师 第三周:Excel篇 - CSDN博客

    七周成为数据分析师 第二周:业务篇-指标 - CSDN博客

    七周成为数据分析师 第二周:业务篇-框架与模型 - CSDN博客

    七周成为数据分析师 第一周:数据分析思维 - CSDN博客

    导言:

    Excel常用于敏捷,快速,需要短时间相应的场景下是非常便捷的数据处理工具。相对于语言类例如python和R等则用于常规的,规律的场景中应用,便于形成日常规则统计分析。

    对于学习的路径:Excel函数—>SQL函数——>python

    必知必会内容:保证使用版本是2013+;培养好的数据表格习惯;主动性的搜索;多练习 

    Excel常见函数

    1.文本清洗类

    主要是文本、格式以及脏数据的清洗和转换。很多数据并不是直接拿来就能用的,需要经过数据分析人员的清理。数据越多,这个步骤花费的时间越长。

    • 查找文本位置:find(“字符”,位置),常与left()提取所需要的位数组合使用;Search和Find类似,区别是Search大小写不敏感,但支持*通配符
    • 文本拼接函数:concatenate
    • 文本替换函数:replace、substitute(全局替换)
    • 删除字符串中多余的(前后的)空格:trim
    • 文本长度:len()、lenb()
    • Left/Right/Mid=Mid(指定字符串,开始位置,截取长度)截取字符串中的字符。Left/Right(指定字符串,截取长度)。left为从左,right为从右,mid如上文示意。MySQL中有同名函数。

    2.关联匹配类

    在进行多表关联或者行列比对时用到的函数,越复杂的表用得越多。多说一句,良好的表习惯可以减少这类函数的使用。

    • Lookup = Lookup(查找的值,值所在的位置,返回相应位置的值)最被忽略的函数,功能性和Vlookup一样,但是引申有数组匹配和二分法。
    • Vlookup=Vlookup(查找的值,哪里找,找哪个位置的值,是否精准匹配)Excel第一大难关,因为涉及的逻辑对新手较复杂,通俗的理解是查找到某个值然后黏贴过来。
    • Index=Index(查找的区域,区域内第几行,区域内第几列)和Match组合,媲美Vlookup,但是功能更强大。
    • Match=Match(查找指定的值,查找所在区域,查找方式的参数)和Lookup类似,但是可以按照指定方式查找,比如大于、小于或等于。返回值所在的位置。
    • Row返回单元格所在的行
    • Column返回单元格所在的列
    • Offset=Offset(指定点,偏移多少行,偏移多少列,返回多少行,返回多少列)建立坐标系,以坐标系为原点,返回距离原点的值或者区域。正数代表向下或向右,负数则相反。

    3.逻辑运算类

    数据分析中不得不用到逻辑运算,逻辑运算返回的均是布尔类型,True和False。很多复杂的数据分析会牵扯到较多的逻辑运算

    • ture—-1 false—–0 判断是真是假
    • 通常配合其他函数进行判断,相加判断满足条件的个数
    • IF :也有ifs用法,取代if(and())的写法。MySQL、Python中有同名函数。
    • And:全部参数为True,则返回True,经常用于多条件判断。MySQL中有同名函数,Python中有同名函数。
    • Or:只要参数有一个True,则返回Ture,经常用于多条件判断。MySQL中有同名函数,Python中有同名函数。
    • IS系列:常用判断检验,返回的都是布尔数值True和False。常用ISERR,ISERROR,ISNA,ISTEXT,可以和IF嵌套使用。

    4.计算统计类

    常用的基础计算、分析、统计函数,以描述性统计为准。具体含义在后续的统计章节再展开。

    • Sum/Sumif/Sumifs

    统计满足条件的单元格总和,SQL有中同名函数。MySQL中有同名函数,Python中有同名函数。

    • Sumproduct

    统计总和相关,特殊用法—-直接累加对应相乘,如果有两列数据销量和单价,现在要求卖出增加,用sumproduct是最方便的。MySQL中有同名函数。

    • Count/Countif/Countifs

    统计满足条件的字符串个数。MySQL中有同名函数,Python中有同名函数。

    • Max

    返回数组或引用区域的最大值。MySQL中有同名函数,Python中有同名函数。

    • Min

    返回数组或引用区域的最小值。MySQL中有同名函数,Python中有同名函数。

    • Rank

    排序,返回指定值在引用区域的排名,重复值同一排名。SQL中有近似函数row_number() 。

    • Rand/Randbetween

    常用随机抽样,前者返回0~1之间的随机值,后者可以指定范围。MySQL中有同名函数。

    • Averagea

    求平均值,也有Averageaif,Averageaifs。MySQL中有同名函数,python有近似函数mean。

    • Quartile

    =Quartile(指定区域,分位参数)计算四分位数,比如1~100的数字中,25分位就是按从小到大排列,在25%位置的数字,即25。参数0代表最小值,参数4代表最大值,1~3对应25、50(中位数)、75分位

    • Stdev

    求标准差,统计型函数,后续数据分析再讲到。

    • Substotal

    =Substotal(引用区域,参数)汇总型函数,将平均值、计数、最大最小、相乘、标准差、求和、方差等参数化,换言之,只要会了这个函数,上面的都可以抛弃掉了。

    • Int/Round

    取整函数,int向下取整,round按小数位取数。round(3.1415,2) =3.14;round(3.1415,1)=3.1。

    • rand:随机数字,用来随机抽样使用

    多条件就和和多条件计数的情况下是非常多的,所以countifs和sumifs用的是非常的多,基本能搞定所有的统计报表,达到实时统计。缺点就是数据量达到一定程度后,Excel运行会比较慢

    5.时间序列类

    时间的本质是数字,周函数中,中国的习惯方式参数常选择2

    常用时间序列函数:

    • year 年
    • month 月
    • day 日
    • date 日期
    • weekday 周几
    • now 现在的时间
    • weeknum
    • today 今天
    • Datedif:=Datedif(开始日期,结束日期,参数)日期计算函数,计算两日期的差。参数决定返回的是年还是月等。MySQL中有近似函数 DateDiff。

    6.Excel使用常见技巧

    快捷键

    • ctrl+方向键,光标快速移动
    • ctrl+shift+方向键,快速框选
    • ctrl+空格键,选定整列
    • shift+空格键,选定整行
    • ctrl+A 选择整张表
    • alt+enter 换行

    功能

    7.Excel常见工具

    • 数据切片:进行快速筛选(一般和多维分析关联在一起的),可以和作图工具进行相关联

      应用场景:做统计报表和仪表盘的统计筛选功能

    • 数据分析:直接对多想进行描述性统计

    • 自定义名称:再次使用可对其直接引用

    • 删除重复值:

    • 下拉列表:

    • 迷你图:

    8.总结与练习

    ​ 个人觉得主要还是在于实践当中的灵活运用,作为学习,掌握有什么样的函数用来做什么就可以了,工作中遇到的时候可能忘了怎么拼,但是能直接搜索把函数找出来用知道在哪里面找就好。当然,记得更多的函数好处就是能迅速的通过函数的用法把函数灵活的组合去解决问题。其实最重要的也是通过逻辑关系把各种函数进行组合去解决问题。

    练习:

    数据表下载:

    现在你有一份的餐食数据,我想通过excel知道

    提示:先选取要分析的数据重建表。

    • 全国点评数最高的饭店是哪家?  =INDEX(C:D,MATCH(MAX(D:D),D:D),1)
    • 哪个城市的饭店人均口味最好?  数据透视表
    • 哪个类型的餐饮评价最好? 
    • 类型为川菜的店中,有多少个带「辣」字,又有多少个带「麻」字?   =FIND('麻',C2,1) 
    • 口味、环境、服务,三个评价都在8.0以上的饭店有几家?它们在哪个城市的占比最多?  筛选过滤、数据透视表 
    • 上海地区中,各个类型饭店服务前五名? (分组)   类型排序-->服务排序->序列化(=IF(B3=B2,E2+1,1))-->筛选1-5 或数据透视表

    • 没有评价的饭店有几家?  COUNT 或筛选
    • 将人均价格划分成0~50,50~100,100~150,150~200,200+这几个档次, 各个城市分别有几家?其中占比又是多少?    档次=INT(E2/50)+1 (应该先去掉没评分的店铺);数据透视(城市-档次);
    • 将点评、人均、口味、环境、服务这几个指标加工出一个综合评价系数,并且计算哪十家店是最好的(开放题)。

    (1)清除脏数据;

    (2)口味、环境、服务、点评是正比,人均是反比

    (3)A :口味+环境+服务;B:点评(范围比较大),所以采用log(点评),ln(人均);C:log4(人均降权);(可以根据偏好适当加权)

    (4)综合评价:(int(Ai+Bi-Ci)-MAX(A+B-C))/(MAX(A+B-C) - MIN(A+B-C))

    (5)排序

    • 对上海地区的日本料理,做一次描述性分析(开放题)    数据分析-->描述统计

    案例学习:

     

    知乎百万用户分析

    葡萄牙某银行电话营销

     

    电信运营商用户流失-数据分析(excel)

    Excel数据分析实例——各省人口数量及增长求职网站上关于数据分析的数据 

    展开全文
  • 真诚的向大家推荐,《腾讯课堂数据分析师认证课程》,该课程也是腾讯课堂指定认证课程。专为在校学生、0~3年职场新人量身定制,真正体系化、专业化帮大家提升数据分析能力,成为大厂抢手的数据分析人...

    真诚的向大家推荐,《腾讯课堂数据分析师认证课程》,该课程也是腾讯课堂指定认证课程。专为在校学生、0~3年职场新人量身定制,真正体系化、专业化帮大家提升数据分析能力,成为大厂抢手的数据分析人才。

    10种商业模型

    面对不同的场景,应用不同分析模型解决问题

    5W2H分析模型、AARRR分析模型、RFM客户价值模型、A/B 测试模型、用户分成模型、SWOT分析模型、购物篮分析模型、波士顿矩阵分析、生命周期模型、企业战略模型

    9大企业项目实战

    全程直播教学

    每个项目均由多位专业数据分析师精心挑选,从数据到课程知识点设计,涵盖0-8年数据分析师必备专业技能和真实工作中的业务场景和所可能遇到的问题。

    【项目 一】哔哩哔哩广告投放优化数据分析

    【项目 二】哔哩哔哩会员购平台订单报表分析项目

    【项目 三】亚马逊入驻商数据化运营体系构建

    【项目 四】亚马逊入驻商用户画像分析体系构建

    【项目 五】Kindle电子书多渠道发售商业分析项目

    【项目 六】淘宝用户行为的用户价值分析

    【项目 七】员工薪水探索性分析

    【项目 八】门户网站的广告效果聚类分析

    【项目 九】健身房会员体系消费行为分析

    认证证书????

    《数据分析师认证课程

    专注于培养行业TOP10%的数据分析师

    长按识别,添加课程老师微信

    报名、课程咨询

    ????????????

    《数据分析师认证课程

    专注于培养行业TOP10%的数据分析师

    长按识别,添加课程老师微信

    报名、课程咨询

    ????????????

    终生学习辅导

    主课程《10周成为数据分析师》,另外还附赠数据分析师高阶录播课程,覆盖0-8年数据分析师必备专业技能。每期的学习都会为学员开通学习权限。课程会不断更新市场上新的技术或业务模型,且所有更新内容可以免费学习

    更多高阶课程不断更新中......

    值得一提的是每个课程的含金量和内容丰富程度都远超同类型课程。

    完备的教学服务

    1.学习全程私教辅导

    主讲导师+班主任+职业规划师)

    2.腾讯权威认证证书

    (学业结束通过考核获得腾讯认证证书)

    3.就业辅导定向内推

    (一对一就业辅导简历优化、推荐就业)

    4.高端社区、线下交流大会

    (免费参加线下分享交流论坛、同学聚会)

    5.个人IP打造书籍出版指导

    (入学开始即为学员规划打造个人影响力)

    ●●●

    《数据分析师认证课程

    专注于培养行业TOP10%的数据分析师

    长按识别,添加课程老师微信

    报名、课程咨询

    ????????????

    展开全文
  • 统计报表数据分析平台是银行各部门及业务人员常用的两种分析方式,本节主要介绍这两种分析方式的重点功能和架构设计。

           在银行日常经营中,每个部门、分支行随时随地都需要进行数据统计和分析,才能对银行当前业务状况及时了解,以进行后续经营策略、营销活动、风险策略的调整和决策。那在平时进行数据分析时除了各数据应用系统(如各类监管报表系统、财务系统、营销系统等)进行专门的数据加工和操作,主要还有报表和自助分析2种方式来分析数据,支持业务运行。

     

    1、统计报表

           统计报表是最常用的数据分析方式,按业务需求中确定的维度和属性进行数据加工并展示。报表周期最常见的是按天、月、年来统计,也有部分按周、季、半年来统计。所以日期或周期是每个报表中都有的维度。另外在大部分银行中还有一个重要的维度是支行,因为支行是最底层的经营机构,许多分析都会支行级别。但在互联网银行没有网点,所以更多的是按地区来统计,因为各地区的政策、环境有所不同,也需要重点关注业务在各地区的发展和问题。

             那报表平台重点需要考虑的功能有:

            (1)报表的图形化展示:现在许多报表工具除了常规的柱状图、饼图、折线图等,也提供很多展示方式和非常酷炫的界面设计,如热力图、地图、轨迹图等。可以让数据分析结果更一目了然。

            (2)明细数据快速查询:报表平台汇总数据的报表较多,但随着交易系统的功能优化,越来越多的明细数据查询也转移到报表系统中,如柜面交易明细、大额支付系统交易明细等,因此报表平台也需要支持大批量数据快速查询的需求,在工具选择或优化中需要考虑到该功能。

            (3)移动端报表:移动端报表目前也是趋势之一,但手机屏幕较小,展示信息有限,目前只展示及时性高但比较简单的汇总的数据。移动端可以在APP实现,也可以在微信通过公众号或企业号来实现。

            (4)邮件报表:邮件系统每家银行都在使用,而且都有看邮件的习惯,因此从使用者的角度来看非常方便,因此许多经营日报是直接通过邮件发出,所以需要将展示的报表通过截图或HTML方式嵌入到邮件中主动发送给用户。

           (5)电子报表:电子报表主要是指按一定格式导出到文件并压缩,各网点业务人员需要自己下载进行分析或直接上报给当地的监管机构。电子报表一般是明细数据,可能含有敏感的客户信息,因此这个数据需要行内安全进行审核。

           (6)管理驾驶仓:管理驾驶仓指将反映全行或全公司业绩的主要的指标进行汇总展示,它不仅仅限于单个部门,而是涉及公司所有的经营业务条线。因此它也经常是报表系统进入后的首页面,或者是公司大屏展示的界面。

           (7)电子报告,这个功能是将结果数据进行自动转化为的分析报告,这个主要通过模板进行填充,目前只能展示基本信息和简单分析,更多的分析还是需要人工补充。目前使用还比较少,但随着AI技术的发展,后续也可能会越来越智能。

            (8)自助查询:自助查询是指提供一个宽表多维度的数据,由业务人员可以通过系统直接进行筛选、钻取或者可写sql进行查询统计。钻取是改变维的层次,变换分析的粒度。它包括向上钻取和向下钻取。向上钻取是在某一维上将低层次的细节数据概括到高层次的汇总数据,或者减少维数。如从分析上海的客户贷款上钻到所有网点城市;而向下钻取则相反,它从汇总数据深入到细节数据进行观察或增加新的维度。例如,分析“各支行、存款情况”时,可以对某一个支行的存款余额细分为各个存款产品(活期、1年定期、3年定期等)进行分析。通过钻取的功能,使用户能更灵活进行数据分析。

            那自助查询首先需要加工好多维度的宽表,也称为CUBE。如果维度太多且数据量太大则加工效率会比较高,如果是实时根据条件筛选则需要依赖数据平台的处理能力。因此需要根据数据量进行平台和服务器资源的选择。

           第2节系统架构中也提到了几个常见的商用及开源报表软件,在报表软件选型部署和架构设计时还需要重点关注:

            (1)作为一个公共服务提供给全行使用:可以连接任何的数据库或大数据平台,同时可以将展现的报表无缝嵌入到数据应用系统或交易系统中。

            (2)技术选型中尽量统一平台,减少运维成本和软件成本,部署可以根据报表数量及数据量按部门分为多套也可以集中在一套环境中。

           (3)报表平台建设时需要进行需求管理并重点监控报表的使用率,一个银行或公司并不是报表越多越好,更重要在于使用和分析效果,因此对于各部门的报表需求需要统一管理,对于重复或相似的需求尽量复用报表,减少工作量投入。对于一些不使用的报表进行下线,以便释放计算资源和存储资源。由于业务部门人员变化和产品变化,一些报表不再使用但业务人员往往会疏忽下线流程。因此定期出使用率的报告可以及时暂停不使用的报表。

     

    2、数据自助分析平台/数据实验室

            报表是各个银行部门最常使用的方式,但随着互联网的加快融合,数据分析越来越复杂,分析工具和算法也越来越丰富,而且业务人员的分析技能也提升很大,那传统的报表已经不能满足数据分析的需要,因此许多银行都为业务人员提供了自助的数据分析平台,有的银行也称为数据实验室。那在建设数据分析平台时需要关注:

            (1)由于分析的数据量大且有敏感信息,拿到测试环境进行分析不仅耗时长且存在数据脱敏不足导致敏感数据泄露的风险,因此数据分析平台都是在生产环境搭建;

            (2)数据分析平台的数据源为数据仓库,为了不影响数据仓库生产环境批处理,因此需要在物理上将数据分析平台和数据仓库进行隔离。同时数据仓库与数据分析平台需要建立快速的数据通道,以便每天更新数据分析平台数据;

            (3)不同的业务部门为了集约资源,减少重复数据的存储,可以统一在一个物理平台进行数据分析,但必须通过用户以及权限进行数据隔离。由于分析经常会使用明细数据以及数据仓库加工后的数据,因此数据量比较大,一般也会使用MPP数据库或大数据平台进行数据分析。

            (4)数据分析工具:业务人员一般会需要使用到SAS、PYTHON、R等分析工具,现在也有很多AI厂商或数据分析工具厂商提供的自助分析工具,这些工具需要安装好给业务人员使用。同时也要统一管理这些工具的版本以及license。

            (5)数据脱敏工具:由于敏感信息不能直接给到业务人员进行数据分析,如内部员工工资、客户联系方式等,因此对于每个敏感字段需要配置脱敏规则(可以在元数据管理平台实现),并在从数据仓库导出时自动调用脱敏工具进行脱敏。

            (6)数据获取管理工具:分析平台从数据仓库导出到分析平台时,一般会有数据审核,因为不同部门之间数据是各自管理,需要系统和数据的主管部门知晓并同意。可以基于元数据管理平台增加数据订单的功能,由业务部门使用人员选取需要分析的数据表、更新周期等信息,然后提交申请,审批后自动进行调用脱敏和数据传输工具传输数据。

            (7)数据分层:数据分析平台一般分为基础数据层和分析层,基础数据层是从数据仓库导入的基础数据,数据不能修改,业务人员只能通过申请权限后才能访问。分析层是给每位业务用户进行自助分析的空间,保留分析过程中和结果数据。对于分析层中的空间也需要进行空间控制和定期监控,以免存储不足导致业务不能分析。

             (8)数据导出,业务分析结果一般需要导出到办公环境,因此也需要有扫描工具或审批,以免敏感数据未经允许从生产导出。

    目前字节跳动数据团队(上海)有内推职位,主要面向字节所有产品数据仓库及大数据开发岗位,如tiktok等,包括社招,校招,实习,大家可在2021年5月23号之前私信联系,内推方式成功率更高,机会有限,先到先得!

    展开全文
  • 如何7成为数据分析

    千次阅读 2017-04-06 19:03:20
    |沙龙精选自公众号秦路(ID:tracykanc) ...得承认我有标题党之嫌,更准确说,这是一份七的互联网数据分析能力养成提纲。 我会按照提纲针对性的增加互联网侧的内容,比如网站分析,用户行为序列等。我也不
  • 本文是《如何快速成为数据分析师》的第五篇教程,如果想要了解写作初衷,可以先行阅读七指南。温馨提示:如果您已经熟悉数据可视化,大可不必再看这篇文章,或只挑选部分。 前一篇文章列举了常用的分析图表,今天...
  • 那在平时进行数据分析时除了各数据应用系统(如各类监管报表系统、财务系统、营销系统等)进行专门的数据加工和操作,主要还有报表和自助分析2种方式来分析数据,支持业务运行。 1、统计报表 统计报表是最常用的...
  • 销售模块主要作用就是通过对各个维度、指标的分析,找优势、发现劣势,不断...此次项目主要是针对传化化学品的需求,目的是通过对历史数据分析,从中发现有价值的信息,以辅助领导进行决策、给以业务员实时的提醒。
  • 无小意 个人博客:无小意 知乎主页:无小意丶 公众号: 数据路(shuju_lu) 百日计划第一总结 ...2.总结与《七周数据分析师》一起完成。 《七周数据分析师》总结 第一:数...
  • 转载:《七成为数据分析师》

    千次阅读 2018-06-07 18:19:14
    《七周数据分析师》总结第一数据分析思维1.核心数据分析思维结构化公式化业务化2.数据分析思维七大技巧象限法多维法假设法指数法80/20法则(帕累托法则)对比法漏斗法3.数据分析思维锻炼方法好奇...
  • 个人公众号:数据路 知乎:无小意。 百日计划第一总结 1. 计划 1.彻底结束之前预定暑假完成的天善学院课程《七周数据分析师》 ...2.总结《七周数据分析师》。...2.总结与《七周数据分析师》一起...
  • 数据分析报表设计开发要素

    千次阅读 2018-06-08 10:37:37
    1. 背景 随着企业对数据价值的认识越来越高,数据分析类项目也随之增加,尤其是...作为数据分析项目,包括了原始数据获取及处理,数据分析整理,报表展现等多个部分组成,但是从用户角度来讲,他只能看到报表展现,...
  • 核心知识点覆盖Excel、Python、SQL、Pandas、Numpy、Matplotlib、PyEcharts可视化、数据指标、波士顿矩阵、数据建模、AARRR模型、漏斗模型、RFM...
  • 4、依据已录入的监测数据生成监测日报表、周报表及月报表;5、各阶段工作量统计;6、查询单点历史监测数据和各阶段监测数据;7、监测时程曲线图生成。下载地址:链接:https://pan.baidu.com/s/13JC...
  • 双十一狂欢到天善,全场五折欢乐带回家点击图片,查看课程详情作者:秦路,天善智能特约专家。资深数据分析师,数据化运营专家。擅长结合运营和数据,建立数据化运营体系。个人公众号...
  • 调研发现,很多人对BI的理解侧重于数据的分析和展示,BI更多地被等同于数据分析与数据可视化。因此在大多数企业中,BI更多地是指分析和前端展示工具,而不是一个完整的体系。 《商业智能白皮书》对商业智能BI工具的...
  • 本文是《七成为数据分析师》的第二篇教程,如果想要了解写作初衷,可以先行阅读七指南。温馨提示:如果您已经熟悉Excel,大可不必再看这篇文章,或只挑选部分。 上一篇文章《七成为数据分析师—Excel函数篇》...
  • 成为数据分析师—Excel实战篇

    千次阅读 2017-08-28 10:31:30
    本文是《七成为数据分析师》的第三篇教程,如果想要了解写作初衷,可以先行阅读七指南。温馨提示:如果您已经熟悉Excel,大可不必再看这篇文章,或只挑选部分。 在Excel技巧和Excel函数后,今天这篇文章讲解...
  • CDA Level 1 数据分析师:7. 业务分析报告与数据可视化报表1. 业务图标决策树 1. 业务图标决策树 1. 四类划分: 1. 比较类图标(作比较,目标比,同环比) 2. 序列图表(折线图、面积图、柱状图、漏斗图):时间...
  • 来到工位,打开邮箱和企业微信看看有没有新的报表需求 群里沟通需求 梳理指标和思路开始动手 忙了一上午,模板基本做的差不多了 中午吃饭,业务过来找我加需求 下午,取数做报表 业务...
  • Cognos Analysis Studio是Cognos用于数据多维分析和探查的基于Web的工具。我们可以在交互式的环境中通过拖放的方式浏览、分析以及比较维度数据,以查找业务问题的答案。例如,可以从产品属性和销售属性对销售情况...
  • 秦路主讲,七成为数据分析师课程特色:明星讲师。资深数据分析师,数据化运营专家秦路老师,潜心磨剑打造精品课程;规划全面。涵盖基础、业务、思维、工具、方法等方方面面,提纲挈领,为数据分析师之路奠定坚实...
  • 网站数据分析指标体系

    千次阅读 2017-08-27 12:26:17
    标签: 郑来轶 数据分析 分析报告 数据报表 网站分析 分类: 03.数据分析 【编者注】网站流量统计,是指对网站访问的相关指标进行统计。本文整理自网友分享的一份 Word 文档,主要介绍了网站分析的 KPI 指标、...
  • 数据分析师里的数据挖掘、BI、爬虫、可视化报表都需要用到编程。如果掌握一门优秀的编程语言,那将会使得数据分析工作效率得到提高。 正如标题所说,数据分析领域最热门的两大语言是R和Python。为什么是这两种语言...
  • 数据分析、大数据、人工智能这些概念不可谓不火,那么,学习数据分析的学习步骤有哪些呢? 数据分析定义及目的: 数据分析是指用适当的统计分析对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细...
  • 其实excel不只是一个数据统计工具,它的数据分析能力十分强大,除了基本的数据计算之外,还可以进行数据清洗、数据可视化等等,财务人、业务人等都很喜欢用excel做报表。 虽然Excel不能实现大数据量的数据分析,...
  • 系列一:《python数据分析基础与实践》 章节1Python概况 课时2Python简介 章节2Python安装 课时3安装Anaconda 课时4使用Anaconda 章节3数据准备 课时5数据类型 – 布尔型 课时6数据类型 – 数值型 课时7数据类型 – ...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 13,728
精华内容 5,491
关键字:

周报表数据分析