-
2022-03-30 11:33:25
目录
前言
由于最近在备考系统分析师,需要准备一些论文,所以后面会写一个系列的文章,对于工作多年的项目一个总结,也锻炼一下写作水平,准备备考2022年上半年系统分析师的同学,可以参考一下,欢迎交流
试题
需求分析师提炼、分析和仔细审查已经获取到的需求的过程,需求分析的目的师确保所有的项目干系人(利益相关者)都理解需求的含义并找出其中的错误、遗漏或其它不足的地方。需求分析的关键在于对问题域的研究与理解。为了便于理解问题域,现代软件工程所推荐的需求分析方法是对问题域进行抽象,将其分解为若干基本元素,然后对元素之间的关系进行建模。常见的需求分析方法包括面向对象的分析方法、面向问题域的分析方法、结构化分析方法等。而无论采用何种方法,需求分析的主要工作内容都基本相同。
请围绕“需求分析方法及应用”论题,依次从以下三个方面进行论述
- 简要叙述你参与管理和开发的软件系统开发项目以及你在其中所承担的主要工作
- 概要论述需求分析工作过程所包含的主要工作内容。
- 结合你具体参与管理和开发的实际项目,说明采用了何种需求分析方法,并举例详细 描述具体的需求分析过程。
范例:
摘要部分:
2018年6月,我参与全球旅游玩乐系统项目的研发,该系统主要是使用中台的方式进行供应商、经销商的整合,自动化上架、下架、更新价格、库存的系统。我在项目中担任系统分析师的角色,全程参与了系统整体的分析规划以及设计工作。本文以该系统为例,主要论述了结构化分析方法在该系统的具体应用。通过采用数据流描述系统的功能组成;采用状态转换图对用户状态进行判断;采用数据字典对数据进行详细和准确的描述。通过以上技术的使用,使得需求分析的质量得到保证,对后续项目顺利实施提供了有力的支撑,最终项目于2019年5月正式上线,获得集团公司各级领导的好评; (注意:实际写作中相关项目情况应该介绍清楚,摘要字数(包括标点符号)一般写300到320个字;
正文部分:
2018年左右随着国内旅游的蓬勃发展,传统的旅游系统很难支撑大规模的产品上、下架以及产品的价格、库存的变动的业务处理,由于产品量可以达到几十万种左右,并且在变化中,所以使用人力来进行系统的维护会耗费很多的人力、物力,并且人力的操作容易产生误差以及不及时的情况。旅游集团最终决定将自动化的系统进行上线研发的项目规划,以解决传统旅游行业的系统老旧、不及时、很难支持的问题;
2018年6月,我所在的旅游集团决定进行全球旅游系统的研发,我在项目中担任系统分析师岗位,主要负责该项目需求分析调研,详细设计、主要研发的工作。该系统是一个大型的系统一共有30多个人的研发团队,耗时9个月的研发最终在2019年5月份上线;该系统支持供应商的系统上线产品的自动化同步以及我们系统的主动拉取更新产品的价格、库存、上架、下架的操作;也支持经销商的产品推送上架、下架以及新产品的库存、价格的更新,经销商的下单流程自动化的操作;供应商的产品接入主要使用的适配器的方式进行转换为行业标准化的产品;经销商下单使用的是反射进行策略模式进行不同经销商的下单实体的转换处理;一直到出票,支付、财务的结算处理;中间很少的业务人员参与;
要做好这个项目,需求分析非常关键。需求分析就是将杂乱无章的用户要求和期望转化为用户需求,那要怎么才能完成需求分析工作呢?可以通过绘制上下文范围关系图,定义系统与系统外部实体间的界限和接口,来确定需求范围;创建用户界面,帮助用户理解系统;分析需求的可行性,技术、经济、法律等;确定需求优先级,制定出系统研发的迭代计划;建立需求模型,帮助系统分析师理解系统,为软件设计提供系统的表示视图;创建数据字典以确保开发人员使用统一的数据定义;并使用QFD将 产品的特性、属性和对用户的重要性联系起来;
全球旅游玩乐系统项目前期,专家组会同线程运维人员对系统做了一次性能评审,并由专家组提供性能评估报告。报告指出系统在去年做过一次系统升级,现有的系统版本包括两个数据中心,一个中心的处理峰值,每天5亿的数据量请求的处理;每天有50万笔订单;均使用的分布式的系统;通过这个报告项目团队对现场的情况有了更为详细的了解,经过项目团队主要负责人会议充分讨论后,决定在需求文档里尽量使用图形来替代冗长枯燥的文字描述复杂的系统功能,最终通过评审,我们选择在需求分析时主要使用结构化分析方法,围绕数据字典建设、运用数据流图、状态转换图来进行需求分析工作。
数据流图的运用,为了向客户清楚地描述系统的那些功能部分组成,我们能利益DFD将产品的采集、接收、入库、分发、处理、转换、加工、校验、消息提醒几个模块的输入输出用一系列的处理连接起来,用图形符号准确地描述系统内各功能部件以及数据在它们之间的传递情况,简明易懂。在利用DFD分别对采集、解码、查重、业务分析、价格处理、详细入库推送到经销商以及集团官网上面售卖。通过DFD图进行数据处理进行分解,使得整个系统的复杂处理过程得以采用图形化的方式来描述,减少了大量篇幅的文字描述,使需求分析文档看起来非常简洁。同样我们用数据数据流图将在产品管理、订单管理、财务单据管理、信息流管理等系统进行了分解描述。使得整个需求文档看上去更加清晰,尽量避免让客户以及业务人员去看那些枯燥冗长的文章,让即使是不懂技术的客户、业务、研发、产品看完这些图,也能理解系统的数据处理过程。
状态转换图的运用。DFD仅仅描述了系统的功能组成部分以及功能之间的联系,而系统运行过程中需要对用户的状态做大量的批判,如产品的库存、价格情况、订单的支付金额、状态情况、上架的状态情况等等,这些状态判断依靠事件驱动,为将这些状态描述清楚,我们在需求分析过程中还使用了状态转换图,STD描述了系统如何在各种状态之间移动,如用户订购了A产品的订单,产生了A产品的费用,系统在分析时需要根据订单的属性将用户使用到的A订单产品解析出来,比如有机票、地接服务、门票等;然后进行各个单资源进行价格的计算。而当用户订购了A产品已经售卖为空,系统分析就会进行A产品的分析时显示订单产品异常,会有业务人员进行参与进来解决;通过使用STD,能清楚地描述了用户状态的转换过程,选择合理的输出。整个订单的下单过程非常复杂,需要分析判断的用户状态也非常多。
数据字典的运用。数据字典是结构化分析方法的核心,数据字典完成了DFD对数据详细内容无法具体、准确的描述,是对DFD的强力的补充。项目的数据结构非常的复杂,数据字典的设计要求非常高。包括系统域、产品域、资费域,控制域共涉及数据表300张。为了保证数据字典完整性和一致性,我安排了专门的数据库管理员对数据字典进行管理,项目团队任何人要调整数据字典都必须交由该专人进行调整,并且对所有的变更都必须有项目经理签字,变更记录必须邮件及时发送给其他团队负责人以及本组成员。为保障后续的数据割接工作不出问题,数据字典的涉及必须有系统的实际情况,为此,特地安排了2名现场维护人员参与数据字典涉及并负责后期的数据交割工作,一方面方便交流,另一方面可以充分考虑现场的实际情况并为后期的数据割接做足准备。
通过使用结构化方法,使得需求分析工作完成得非常顺利,需求分析的质量得到保证,对后续项目的顺利实施提供了有力的支撑。项目域2019年5月完成割接上线,在生产环境运行了3个月,各项指标性能达到了集团要求,并经受住了国庆假、五一节日黄金周的考验,订单的自动化问题、消息消费不及时的问题得到解决,最终通过了验收,项目获得了集团各层领导的好评。
在项目结束后的讨论会议上,大家也指出了项目中存在一些不足,如订单模块在性能上面没有达到预期的目标,导致的客户详单查收效率低下,上线后又经过了几轮优化处理,才在性能上面满足需求。另外,外围欸抽取订单详情数据时,没有一个可视化的数据流图,为此,我们不得不花费精力在下单的流程中添加日志的流程图日志处理,每个重要的节点会进行日志的记录,比如说,支付节点、出团书节点、库存、价格校验节点等,每个节点都会又详细的请求、响应日志以及时间响应的时长。为了后续的运维同事可以通过图形化的界面进行查看订单的实际情况。总的来说,这些问题主要还是需求分析时对订单功能模块考虑不够透彻,测试没有做彻底,埋下的隐患。所以,在以后的项目里面,需求分析质量得到保障的情况,还要把控好测试质量,把握好实施的每个细节。
更多相关内容 -
ANSYS非线性有限元分析方法及范例应用 pdf电子书
2015-10-07 19:53:57ANSYS非线性有限元分析方法及范例应用978-7-5170-0380-9_13442539 -
9种常用的数据分析方法
2020-08-17 11:09:23举例:分析某产品的销售额较低的原因,用公式法分解 图片.png 二、对比分析 对比法就是用两组或两组以上的数据进行比较,是最通用的方法。 我们知道孤立的数据没有意义,有对比才有差异。比如在时间维度上的...一、公式拆解
所谓公式拆解法就是针对某个指标,用公式层层分解该指标的影响因素。
举例:分析某产品的销售额较低的原因,用公式法分解图片.png
二、对比分析
对比法就是用两组或两组以上的数据进行比较,是最通用的方法。
我们知道孤立的数据没有意义,有对比才有差异。比如在时间维度上的同比和环比、增长率、定基比,与竞争对手的对比、类别之间的对比、特征和属性对比等。对比法可以发现数据变化规律,使用频繁,经常和其他方法搭配使用。
下图的AB公司销售额对比,虽然A公司销售额总体上涨且高于B公司,但是B公司的增速迅猛,高于A公司,即使后期增速下降了,最后的销售额还是赶超。
图片.png
三、A/Btest
A/Btest,是将Web或App界面或流程的两个或多个版本,在同一时间维度,分别让类似访客群组来访问,收集各群组的用户体验数据和业务数据,最后分析评估出最好版本正式采用。A/Btest的流程如下:
(1)现状分析并建立假设:分析业务数据,确定当前最关键的改进点,作出优化改进的假设,提出优化建议;比如说我们发现用户的转化率不高,我们假设是因为推广的着陆页面带来的转化率太低,下面就要想办法来进行改进了
(2)设定目标,制定方案:设置主要目标,用来衡量各优化版本的优劣;设置辅助目标,用来评估优化版本对其他方面的影响。
(3)设计与开发:制作2个或多个优化版本的设计原型并完成技术实现。
(4)分配流量:确定每个线上测试版本的分流比例,初始阶段,优化方案的流量设置可以较小,根据情况逐渐增加流量。
(5)采集并分析数据:收集实验数据,进行有效性和效果判断:统计显著性达到95%或以上并且维持一段时间,实验可以结束;如果在95%以下,则可能需要延长测试时间;如果很长时间统计显著性不能达到95%甚至90%,则需要决定是否中止试验。
(6)最后:根据试验结果确定发布新版本、调整分流比例继续测试或者在试验效果未达成的情况下继续优化迭代方案重新开发上线试验。
流程图如下:image.png
四、象限分析
通过对两种及以上维度的划分,运用坐标的方式表达出想要的价值。由价值直接转变为策略,从而进行一些落地的推动。象限法是一种策略驱动的思维,常与产品分析、市场分析、客户管理、商品管理等。比如,下图是一个广告点击的四象限分布,X轴从左到右表示从低到高,Y轴从下到上表示从低到高。
image.png
高点击率高转化的广告,说明人群相对精准,是一个高效率的广告。高点击率低转化的广告,说明点击进来的人大多被广告吸引了,转化低说明广告内容针对的人群和产品实际受众有些不符。高转化低点击的广告,说明广告内容针对的人群和产品实际受众符合程度较高,但需要优化广告内容,吸引更多人点击。低点击率低转化的广告,可以放弃了。还有经典的RFM模型,把客户按最近一次消费(Recency)、消费频率(Frequency)、消费金额 (Monetary)三个维度分成八个象限。
image.png
象限法的优势:
(1)找到问题的共性原因通过象限分析法,将有相同特征的事件进行归因分析,总结其中的共性原因。例如上面广告的案例中,第一象限的事件可以提炼出有效的推广渠道与推广策略,第三和第四象限可以排除一些无效的推广渠道;
(2)建立分组优化策略
针对投放的象限分析法可以针对不同象限建立优化策略,例如RFM客户管理模型中按照象限将客户分为重点发展客户、重点保持客户、一般发展客户、一般保持客户等不同类型。给重点发展客户倾斜更多的资源,比如VIP服务、个性化服务、附加销售等。给潜力客户销售价值更高的产品,或一些优惠措施来吸引他们回归。五、帕累托分析
帕累托法则,源于经典的二八法则。比如在个人财富上可以说世界上20%的人掌握着80%的财富。而在数据分析中,则可以理解为20%的数据产生了80%的效果需要围绕这20%的数据进行挖掘。往往在使用二八法则的时候和排名有关系,排在前20%的才算是有效数据。二八法是抓重点分析,适用于任何行业。找到重点,发现其特征,然后可以思考如何让其余的80%向这20%转化,提高效果。
一般地,会用在产品分类上,去测量并构建ABC模型。比如某零售企业有500个SKU以及这些SKU对应的销售额,那么哪些SKU是重要的呢,这就是在业务运营中分清主次的问题。
常见的做法是将产品SKU作为维度,并将对应的销售额作为基础度量指标,将这些销售额指标从大到小排列,并计算截止当前产品SKU的销售额累计合计占总销售额的百分比。
百分比在 70%(含)以内,划分为 A 类。百分比在 70~90%(含)以内,划分为 B 类。百分比在 90~100%(含)以内,划分为 C 类。以上百分比也可以根据自己的实际情况调整。
ABC分析模型,不光可以用来划分产品和销售额,还可以划分客户及客户交易额等。比如给企业贡献80%利润的客户是哪些,占比多少。假设有20%,那么在资源有限的情况下,就知道要重点维护这20%类客户。
image.png
六、漏斗分析
漏斗法即是漏斗图,有点像倒金字塔,是一个流程化的思考方式,常用于像新用户的开发、购物转化率这些有变化和一定流程的分析中。
image.png
上图是经典的营销漏斗,形象展示了从获取用户到最终转化成购买这整个流程中的一个个子环节。相邻环节的转化率则就是指用数据指标来量化每一个步骤的表现。所以整个漏斗模型就是先将整个购买流程拆分成一个个步骤,然后用转化率来衡量每一个步骤的表现,最后通过异常的数据指标找出有问题的环节,从而解决问题,优化该步骤,最终达到提升整体购买转化率的目的。
整体漏斗模型的核心思想其实可以归为分解和量化。比如分析电商的转化,我们要做的就是监控每个层级上的用户转化,寻找每个层级的可优化点。对于没有按照流程操作的用户,专门绘制他们的转化模型,缩短路径提升用户体验。
还有经典的黑客增长模型,AARRR模型,指Acquisition、Activation、Retention、Revenue、Referral,即用户获取、用户激活、用户留存、用户收益以及用户传播。这是产品运营中比较常见的一个模型,结合产品本身的特点以及产品的生命周期位置,来关注不同的数据指标,最终制定不同的运营策略。
从下面这幅AARRR模型图中,能够比较明显的看出来整个用户的生命周期是呈现逐渐递减趋势的。通过拆解和量化整个用户生命周期各环节,可以进行数据的横向和纵向对比,从而发现对应的问题,最终进行不断的优化迭代。
image.png
七、路径分析
用户路径分析追踪用户从某个开始事件直到结束事件的行为路径,即对用户流向进行监测,可以用来衡量网站优化的效果或营销推广的效果,以及了解用户行为偏好,其最终目的是达成业务目标,引导用户更高效地完成产品的最优路径,最终促使用户付费。如何进行用户行为路径分析?
(1)计算用户使用网站或APP时的每个第一步,然后依次计算每一步的流向和转化,通过数据,真实地再现用户从打开APP到离开的整个过程。
(2)查看用户在使用产品时的路径分布情况。例如:在访问了某个电商产品首页的用户后,有多大比例的用户进行了搜索,有多大比例的用户访问了分类页,有多大比例的用户直接访问的商品详情页。
(3)进行路径优化分析。例如:哪条路径是用户最多访问的;走到哪一步时,用户最容易流失。
(4)通过路径识别用户行为特征。例如:分析用户是用完即走的目标导向型,还是无目的浏览型。
(5)对用户进行细分。通常按照APP的使用目的来对用户进行分类。如汽车APP的用户可以细分为关注型、意向型、购买型用户,并对每类用户进行不同访问任务的路径分析,比如意向型的用户,他进行不同车型的比较都有哪些路径,存在什么问题。还有一种方法是利用算法,基于用户所有访问路径进行聚类分析,依据访问路径的相似性对用户进行分类,再对每类用户进行分析。以电商为例,买家从登录网站/APP到支付成功要经过首页浏览、搜索商品、加入购物车、提交订单、支付订单等过程。而在用户真实的选购过程是一个交缠反复的过程,例如提交订单后,用户可能会返回首页继续搜索商品,也可能去取消订单,每一个路径背后都有不同的动机。与其他分析模型配合进行深入分析后,能为找到快速用户动机,从而引领用户走向最优路径或者期望中的路径。
用户行为路径图示例:image.png
八、留存分析
用户留存指的是新会员/用户在经过一定时间之后,仍然具有访问、登录、使用或转化等特定属性和行为,留存用户占当时新用户的比例就是留存率。留存率按照不同的周期分为三类,以登录行为认定的留存为例:
第一种 日留存,日留存又可以细分为以下几种:
(1)次日留存率:(当天新增的用户中,第2天还登录的用户数)/第一天新增总用户数
(2)第3日留存率:(第一天新增用户中,第3天还有登录的用户数)/第一天新增总用户数
(3)第7日留存率:(第一天新增用户中,第7天还有登录的用户数)/第一天新增总用户数
(4)第14日留存率:(第一天新增用户中,第14天还有登录的用户数)/第一天新增总用户数
(5)第30日留存率:(第一天新增用户中,第30天还有登录的用户数)/第一天新增总用户数第二种 周留存,以周度为单位的留存率,指的是每个周相对于第一个周的新增用户中,仍然还有登录的用户数。
第三种 月留存,以月度为单位的留存率,指的是每个月相对于第一个周的新增用户中,仍然还有登录的用户数。留存率是针对新用户的,其结果是一个矩阵式半面报告(只有一半有数据),每个数据记录行是日期、列为对应的不同时间周期下的留存率。正常情况下,留存率会随着时间周期的推移而逐渐降低。下面以月留存为例生成的月用户留存曲线:
image.png
九、聚类分析
聚类分析属于探索性的数据分析方法。通常,我们利用聚类分析将看似无序的对象进行分组、归类,以达到更好地理解研究对象的目的。聚类结果要求组内对象相似性较高,组间对象相似性较低。在用户研究中,很多问题可以借助聚类分析来解决,比如,网站的信息分类问题、网页的点击行为关联性问题以及用户分类问题等等。其中,用户分类是最常见的情况。
常见的聚类方法有不少,比如K均值(K-Means),谱聚类(Spectral Clustering),层次聚类(Hierarchical Clustering)。以最为常见的K-means为例,如下图:
image.png
可以看到,数据可以被分到红蓝绿三个不同的簇(cluster)中,每个簇应有其特有的性质。显然,聚类分析是一种无监督学习,是在缺乏标签的前提下的一种分类模型。当我们对数据进行聚类后并得到簇后,一般会单独对每个簇进行深入分析,从而得到更加细致的结果。
作者:数据蝉
链接:https://www.jianshu.com/p/d27563e492a0
来源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 -
常用的统计分析方法总结(聚类分析、主成分分析、因子分析)
2020-11-20 13:30:281.2聚类分析按研究方法分类 1.系统聚类法:由N类–1类 2.分解法:由1类—N类 3.K-均值法:事先在聚类过程中确定在K类,适用于数据量大的数据 4.有序样品的聚类:N个样品排序,次序相邻的样品聚成一类 5.模糊聚类法:...一.聚类分析
- 聚类的目的
1.间隔尺度:变量用连续的量来表示【常用】
2.有序尺度:有次序关系,指标有有序的等级来表示
3.名义尺度:指标用一些类来表示,这些没有等级和数量的关系
1.1聚类分析的类型
- Q型聚类:对样品的聚类
- R型聚类:对变量的聚类
1.2聚类分析按研究方法分类
1.系统聚类法:由N类–1类
2.分解法:由1类—N类
3.K-均值法:事先在聚类过程中确定在K类,适用于数据量大的数据
4.有序样品的聚类:N个样品排序,次序相邻的样品聚成一类
5.模糊聚类法:模糊数学的方法,多用于定性变量
6.加入法:样品依次加入,全部加入完得到聚类图。1.4相似性度量
1.4.1 样品相似性的度量【Q】
1.4.2 变量相似性的度量【R】
a.夹角余弦
b.相关系数1.4.3类间距离
a.常用的类间距离定义有8种之多,与之相应的系统聚类法 也有8种,分别为
a.中间距离法
b.最短距离法:类与类之间的距离最近两个样品的距离。
c.最长距离法:类与类之间的距离最远两个样品的距离。【先距离最短,后距离最远合并】
d.类平均法:两类元素中任两个样品距离的平均。
e.重心法:两个重心xp 和xq 的距离。
f.可变类平均法
e.离差平方和法(Ward法): 该方法的基本思想来自于方差分析,如果分类正确,同 类样品的离差平方和应当较小,类与类的离差平方和较大。 具体做法是先将 n 个样品各自成一类,然后每次缩小一类,每 缩小一类,离差平方和就要增大,选择使方差增加最小的两 类合并,直到所有的样品归为一类为止。1.5最短距离法vs最长聚类法
a. 最短距离法的主要缺点是它有链接聚合的趋势,容易形 成一个比较大的类,大部分样品都被聚在一类中,所以最短 距离法的聚类效果并不好,实际中不提倡使用。
b. 最长距离法克服了最短距离法链接聚合的缺陷,两类合 并以后与其他类的距离是原来两个类中的距离最大者,加大 了合并后的类与其他类的距离。二.主成分分析
2.1.主成分分析的基本思想
a. 定义:主成分分析(Principal Component Analysis,简记 PCA)是将多个指标化为少数几个综合指标的一种统计分析方法,通常我们把转化成的综合指标称为主成分。
b. 本质:降维
c. 表达:主成分为原始变量的线性组合
d. 即信息量在空间降维以后信息量没有发生改变,所有主成分的方差之和与原始的方差之和e. 多个变量之间有一定的相关性,利用原始变量 的线性组合形成几个综合指标(主成分),在保留原始变量主要信息的前提下起到降维与简化问题的作用。
f. 累积贡献率一般是**85%**以上
2.2主成分与原始变量之间有如下基本关系:
(1)每一个主成分都是各原始变量的线性组合
(2)主成分的数目大大少于原始变量的数目
(3)主成分保留了原始变量绝大多数信息
(4)各主成分之间互不相关- 变量的变异性越大,说明它提供的信息量就越大
- 主成分分析将按照变量方差的大小顺序挑选几个主成分。
三.因子分析
3.1 因子分析的基础理念
a. 基本目的:用少数几个综合因子去描述多个随机变量之间的相关关系。
b. 定义:多个变量————少数综合因子(不存在的因子)
c. 显在变量:原始变量X;潜在变量:因子F
d. X=AF+e【公共因子+特殊因子】
e. 应用:因子分析主要用于相关性很强的多指标数据的降维处理。
f. 通过研究原始变量相关矩阵内部 的依赖关系,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。
g. 定义:原始的变量是可观测的显在变量,而综合的因子是不可观测的潜在变量,称为因子。3.2 因子分析的基本思想
i. 根据相关性大小把原始变量分组,使得同组内的变量之间相关性较高,而不同组的变量间的相关性则较低。
ii. 公共因子:每组变量代表一个基本结构,并用一个不可观测的综合变量表示。
iii. 对于所研究的某一具体问题,原始变量分解成两部分:- 一部分是少数几个不可测的所谓公共因子的线性函数。
- 另一部分是与公共因子无关的特殊因子。
3.2.1因子分析的研究关系
i. R 型因子分析——研究变量之间的相关关系
ii. Q 型因子分析——研究样品之间的相关关系3.3统计意义
#####3.3.1因子载荷aij的统计意义
a. 因子载荷 是第i个变量与第j个公共因子的相关系数,绝对值越大,相关的密切程度越高。
b.3.3.2 变量共同度hi的统计意义【横着求和】
a. 变量 Xi 的共同度是因子载荷矩阵的第i行的元素的平方和。记为
b. 所有的公共因子与特殊因子对变量 Xi 的贡献和为1。
3.3.3 公共因子FJ方法贡献gi2的统计意义【竖着求和】
3.4因子分析三个步骤
a. 确定因子载荷
b. 因子旋转
c. 计算因子得分3.5因子旋转
3.5.1旋转的目的
a. 寻找简单结构的载荷矩阵:载荷矩阵A的所有元素都接 近0或±1,则模型的公共因子就易于解释。
b. 如果各主因子的典型代表变量不突出,就需要进行旋转使因子载荷矩阵中载荷的绝对值向0和1两个方向分化。3.5.2旋转的方法
a.意义:对公共因子作正交旋转相当于对载荷矩阵 A 作一正交变换 ,右乘正交矩阵 T ,使 A* = AT 能有更鲜明的实际意义。
b.几何意义:是在 m 维空间上对原因子轴作一刚性旋转。 因子旋转不改变公共因子的共同度,这是因为 AA’=ATT’A’=AA’
c. 旋转方法有:正交旋转和斜交旋转
d. 最普遍的是:最大方差旋转法3.5.3最大方差旋转法:
a. 定义:通过坐标变换使各个因子载荷的方差之和最大。
b. 任何一个变量只在一个因子上有高贡献率,而在 其它因子上的载荷几乎为0;
c. 任何一个因子只在少数变量上有高载荷,而在其 它变量上的载荷几乎为0。3.5.4因子分析的逻辑图:
因子分析和主成分分析的区别和联系
1.联系
思想相同:降维
前提条件:各变量间必须有相关性,否则各变量之间没有共享信息2.区别
-
主成分分析:将主成分表示成原始变量的的线性组合
-
因子分析:将原始变量表示成公共因子与特殊因子的线性组合,且公共因子不可观测。
-
主成分分析:主成分个数与变量个数相同(实际中取前面若干几个)
-
因子分析:公因子个数少于变量个数
- 聚类的目的
-
精心整理了7种常用数据分析方法(建议收藏)
2019-11-08 08:30:00有一位朋友最近吐槽,他...今天DataHunter数猎哥就来给大家分享7种最常用的数据分析方法,让你轻松运用数据分析解决实际工作问题,提升核心竞争力。一、漏斗分析法漏斗分析法能够科学反映用户行为状态,以及从起点...
有一位朋友最近吐槽,他提交了一份7月数据分析报告给领导,报告里面放了很多图表,也摆了很多数据,结果被痛批了一顿,觉得很委屈。其实,这位朋友与很多小伙伴一样,做数据分析时,拿着手里的数据不知道怎么分析、从什么维度分析。
今天DataHunter数猎哥就来给大家分享7种最常用的数据分析方法,让你轻松运用数据分析解决实际工作问题,提升核心竞争力。
一、漏斗分析法
漏斗分析法能够科学反映用户行为状态,以及从起点到终点各阶段用户转化率情况,是一种重要的分析模型。漏斗分析模型已经广泛应用于网站和APP的用户行为分析中,例如流量监控、CRM系统、SEO优化、产品营销和销售等日常数据运营与数据分析工作中。
例如:Data Analytics为网站制作的“促销活动分析”
比如,对一些电商产品来说,最终目的是让用户下单并支付,但转化率取决于整个流程。这时,我们就可以通过漏斗模型一步一步地进行监测。如下图所示,我们可以监控用户在流程中各个层级上的行为路径,寻找每个层级的可优化点。对没有按照流程操作的用户绘制他们的转化路径,找到可提升用户体验,缩短路径的空间,最终提升整体转化率。
漏斗模型除了在电商中应用的比较多以外,在落地页、H5等也应用的比较多。我们可以反复优化落地页当中的图片、文案、布局,进一步的提高整体转化率。
二、留存分析法
留存分析法是一种用来分析用户参与情况和活跃程度的分析模型,考察进行初始行为的用户中,有多少人会进行后续行为。从用户的角度来说,留存率越高就说明这个产品对用户的核心需求也把握的越好,转化成产品的活跃用户也会更多,最终能帮助公司更好的盈利。
这里需要注意的是,在做留存分析之前,我们首先需要了解用户留存的特点:
比如,我们可以通过观察不同时间段用户留存的情况,通过对比各个渠道、活动、关键行为的用户后续留存变化,发现提升用户留存率的影响因素,例如观察领取过优惠券的用户留存率是否比没有领取优惠券的用户留存率更高。
除此以外,还可以针对流失高/留存高的用户群组进行一对一的用户行为分析,统计留存/流失用户的行为特征,特别是针对流失用户,通过流失用户的行为分析总结流失原因,从而提升留存率。具体步骤如下图所示:
三、分组分析法
分组分析法是根据数据分析对象的特征,按照一定的标志(指标),把数据分析对象划分为不同的部分和类型来进行研究,以揭示其内在的联系和规律性。
分组的目的就是为了便于对比,把总体中具有不同性质的对象区分开,把性质相同的对象合并在一起,保持各组内对象属性的一致性、组与组之间属性的差异性,以便进一步运用各种数据分析方法来揭示内在的数量关系,因此分组法必须与对比法结合运用。
如图所示,分组分析在日常工作中应用的比较多的是用户分层与分群,比如在发优惠券的时候,可以通过红包,满减,限时券还有积分券等方式。我们可以针对不同的用户发送不同的优惠券以达到精细化运营的效果。那么当我们在做数据分析时,也可以从结果将用户进行分层来进行判断,这时同样也可以得到优化和改进业务的建议。
说了完用户分层,接下来我们说说用户分群。用户分群和用户分层其实是相关联的,用户分群是对用户分层的补充,当用户差异性较大,层级上不能再做用户细分时,可以考虑将同一个分层内的群体继续切分,满足更高的精细化运营需要。
例如:Data Analytics制作的“客户RFM群体分析”
RFM模型是客户管理中的一个经典方法,它用以衡量消费用户的价值和创利能力,是一个典型的用户分群。它依托收费的三个核心指标:最近一次消费时间(Recency)、消费频率(Frequency)和消费金额(Monetary)。
消费金额Monetary:衡量用户对企业利润的贡献,消费金额越高的用户,价值也就越高。
消费频率Frequency:衡量用户的忠诚度,是用户在限定的期间内购买的次数,最常购买的用户,忠诚度也越高。
最近一次消费时间Recency:衡量用户的流失,消费时间越接近当前的用户,越容易维系与其的关系。1年前消费的用户价值肯定不如一个月才消费的用户。
四、矩阵分析法
矩阵分析法是指根据事物(如产品、服务等)的两个重要属性(指标)作为分析的依据,进行分类关联分析,找出解决问题的一种分析方法,也称为矩阵关联分析法,简称矩阵分析法。
矩阵关联分析法在解决问题和资源分配时,可以为决策者提供重要参考依据——先解决主要矛盾,再解决次要矛盾,这样有利于提高工作效率,并将资源分配到最能产生绩效的部门、工作中,最终有利于决策者进行资源优化配置。
比如在电商行业,我们可以使用浏览量和加购数这两个维度来进行矩阵分析,如图所示,左上角的是浏览量低的,然后加购次数多的,这说明产品其实是有很大潜力的,这时需要将这部分产品放在更好的位置让给用户进行浏览;右下角的浏览量高,但加购数低的,说明这个时候他的资源位置是好的,但是用户对这部分的产品并不感兴趣的,我们就需要对其进行相应的位置调整。
五、关联分析法
关联分析法是一种简单、实用的分析技术,是指从大量数据集中发现项集之间的关联性或相关性。若两个或多个变量的取值之间存在某种规律性,就称为关联。关联可分为简单关联、时序关联、因果关联等。
关联分析的一个典型例子是购物篮分析。该过程通过发现顾客放入其购物篮中的不同商品之间的联系,分析顾客的购买习惯。通过了解哪些商品频繁地被顾客同时购买,帮助零售商制定营销策略。其他的应用还包括价目表设计、商品促销、商品的排放和基于购买模式的顾客划分。
可从数据库中关联分析出形如"由于某些事件的发生而引起另外一些事件的发生"之类的规则。如“67%的顾客在购买啤酒的同时也会购买尿布”,因此通过合理的“啤酒和尿布”的货架摆放或捆绑销售可提高超市的服务质量和效益。
六、指标分析法
在实际工作中,当拿到一些可视化数据图表或者是Excel表格时,我们可以直接运用统计学中的一些基础指标来做数据分析,比如平均数、众数、中位数、最大值、最小值等,下面我们分别来介绍:
1.平均数
平均数、也叫平均分析法,是指运用计算平均数的方法来反映总体在一定时间、地点条件下某一数量特征的一般水平的分析方法。平均分析法常用指标有算术平均数、调和平均数、几何平均数、众数和中位数等,其中最为常见的是算术平均数,也就是日常所说的平均数或平均值。
平均数指标可用于对比同类现象在不同地区、不同行业、不同单位等之间的差异程度,比用总量指标对比更具说服力。除此以外,利用平均指标对比某些现象在不同历史时期的变化,也更能说明其发现趋势和规律。
比如,汽车行业的自媒体如果想要分析数据,可从两个方面来分析:①外部:行业内整体公众号的平均打开率是多少,我们距离行业平均水平相差多少,该如何去做一些优化;②内部:针对每个月都在尝试的各种选题和内容运营策略,可以分析本月比上月平均打开率又增加了多少,这个月的选题是否有一些爆款,爆款文章平均打开率是多少,标题有什么特点等等。
2.众数、中位数
众数也就是数据中的一种代表数,它反应的是数据的一种集中程度。比如说最佳,最受欢迎,最满意都与众数有关。众数本质上来说,反映的是数据中发生频率最高的一些数据指标,在做数据分析时,我们可以对这些数据指标提取一些共性的特点,然后进行提炼和总结,然后得出一些改进的意见。
中位数主要是反映的是一组数据的集中趋势,像我们比较常见的正态分布,比如说我们想去统计某市的人均收入,其实,大部分的人均收入都是在一定范围之内的,只有少部分是处于最低的和最高的,其实这是中位数带来的意义。
在做数据分析时,如果各个数据之间的差异程度较小,用平均值就有较好的代表性;而如果数据之间的差异程度较大,特别是有个别的极端值的情况,用中位数或众数有较好的代表性。
3.最大(小)值
最大(小)值在平时做数据分析工作时比较常见,只是我们没有特别去注意。最值是作为典型代表和异常值进行分析的,比如说销售团队里的销售冠军,电商爆款商品等,如图所示,我们可以将销售额最大的几款商品提出来,然后我们去总结共性,找到原因,然后复制到其他的商品,最终提高平均转化率。
七、对比分析法
对比分析法是指将两个或两个以上的数据进行比较,分析它们的差异,从而揭示这些数据所代表的事物发展变化情况和规律性。它可以非常直观地看出事物某方面的变化或差距,并且可以准确、量化地表示出这种变化或差距是多少?对比分析法可分为静态比较和动态比较两类。
静态比较:在同一时间条件下对不同总体指标的比较,如不同部门、不同地区、不同国家的比较、也叫横向比较,简称横比;
动态比较:在同一总体条件下对不同时期指标数值的比较,也叫纵向比较,简称纵比。
这两种方法既可单独使用,也可结合使用。
进行对比分析时,可以单独使用总量指标、相对指标或平均指标,也可将它们结合起来进行对比。比较的结果可用相对数表示,如百分数、倍数等指标。
在使用对比分析法时,需要先注意以下几个方面:①指标的口径范围、计算方法、计量单位必须一致,即要用同一种单位或标准去衡量;②对比的对象要有可比性;③对比的指标类型必须一致。无论绝对数指标、相对数指标、平均数指标,还是其他不同类型的指标,在进行对比时,双方必须统一。
1.时间维度对比
同一指标在不同时间维度下的对比,如同比、环比、定基比等。同比就是与去年的同一个时间段进行对比分析,可以是季、月、周、天;环比就是和上一个时间段来对比(也有和下一个时间段对比的,也叫后比),例如本月和上月,本周和上周对比;定基比是和某个指定的时期进行对比分析,比如2013年每个月都和2013年1月的销售额进行对比取值。
如图为各月销售额对比,时间范围一致(均为月汇总)、指标一致、指标含义一致、其表现的为整个企业信息,总体性质可比。
2.空间对比
就是不同空间数据的对比,比如华北区和华南区对比,北京和上海,上海古北店和成都春熙路店进行对比。相似空间的对比对象必须是形态上比较接近,先进空间则是和同一种形态中的优秀空间进行对比,与扩大空间的对比,比如北京和全国的数据对比,北京王府井店和全北京的数据对比,和竞争对手的对比也在此列。
如图为2018年全年各销售小组销售额对比,其对比的时间范围一致、指标一致、指标含义一致、维度为各个销售小组,具有相同性质。
3.计划对比
和计划标准的对比是销售追踪中非常重要的一环,所有的绩效考核都是计划标准,例如销售实际达成金额与销售计划达成金额对比,看销售是否完成当初指定的计划,如果没有完成,原因在哪里。
4.与经验值或理论值对比
其中的经验标准是在大量的实践过程中总结出来的值,而理论标准则是根据理论推断出来的值,平均值则是某一空间或时间的平均值。如,一单一品率:所有销售小票中只有一个商品的小票数量占比。参考值为小于40%,如果数据超过了40%,则需要考虑如何调整策略,帮助客户做关联购买。而参考值小于40%,就是一个理论值。
以上就是7种常见的数据分析方法,在不同领域的工作中,它们通常都是以不同的形式展现出来的,我们需要在拥有数据面前,清晰知道应用哪一个或几个方法来分析实际问题最为有效,结合场景灵活运用,没有最好的分析方法只有最适合的。
--end--
推荐阅读: -
什么是数据分析方法论
2018-09-04 09:26:21数据分析方法论 确定分析思路需要以营销、管理等理论为指导。这些 跟数据分析相 关的营销、管理等理论统称为数据分析方法论。可以把方法论理解为指南针,在分析方法论的指导下我们才去开展数据分析,这样分析的结果... -
常用的5种数据分析方法有哪些?
2020-12-22 11:15:10常用的数据分析方法有5种。 1.对比分析法 对比分析法指通过指标的对比来反映事物数量上的变化,属于统计分析中常用的方法。常见的对比有横向对比和纵向对比。 横向对比指的是不同事物在固定时间上的对比... -
数据分析方法论(6种方法,8个思路)
2020-02-26 17:23:05在介绍数据分析方法论和思路之前,我们还是先不厌其烦地看一下数据分析的流程,简单来说分为以下六个步骤: 1、明确分析的目的,提出问题。只有弄清楚了分析的目的是什么,才能准确定位分析因子,提出有价值的问题... -
数据相关性分析方法
2018-11-22 12:05:005种常用的相关分析方法 转载:http://bluewhale.cc/2016-06-30/analysis-of-correlation.html 相关分析(Analysis of Correlation)是网站分析中经常使用的分析方法之一。通过对不同特征或数据间的关系进行分析,... -
定性和定量大数据分析方法指南
2020-09-17 17:10:52定性和定量大数据分析方法?我们看到数据时想到的第一件事是什么?第一个本能是找到模式,联系和关系。我们查看数据以发现其中的含义。 同样,在研究中,一旦收集了数据,下一步就是从中获取见解。例如,如果服装... -
时频分析方法简介
2019-03-29 11:12:40时频联合分析 本文转载自:https://blog.csdn.net/wordwarwordwar/article/details/66583536 摘要:常规傅立叶变换方法不能刻画任一时刻的频率成分,无法对其... -
常见复杂网络分析方法
2019-09-18 15:38:07常见的复杂网络分析方法基本分析方法关联分析方法 注:本文部分内容来自《复杂网络分析与应用》与《中国航空复杂网络的结构特征与应用分析》 1.赵正旭,郭阳,等.复杂网络分析与应用[M]北京:科学出版社,2018. 2.陈... -
16种常用的数据统计分析方法汇总
2019-04-24 16:43:00经常会有朋友问到一个朋友,数据分析常用的分析方法有哪些,我需要学习哪个等等之类的问题,今天数据分析精选给大家整理了十六种常用的数据分析方法,供大家参考学习。 (注:这些统计分析方法基本都是统计学的方法... -
7大需求分析方法与5大分析过程
2020-06-15 18:09:49以下就是为大家推荐的8大类需求分析方法: 流程图 原型 用例图 用户故事(3C原则) 词汇表 实体关系图ERD 分解图 下面着重介绍最常见的3种方法:流程图、原型、用例图方法:... -
5种常用的相关分析方法
2018-09-09 15:32:50相关分析(Analysis of Correlation)是网站分析中经常使用的分析方法之一。通过对不同特征或数据间的关系进行分析,发现业务运营中的关键影响及驱动因素。并对业务的发展进行预测。本篇文章将介绍5种常用的分析方法... -
16种常用的数据分析方法-相关分析
2020-05-26 21:13:17相关分析是一种简单易行的测量定量数据之间的关系情况的分析方法。可以分析包括变量间的关系情况以及关系强弱程度等。 如:身高和体重的相关性;降水量与河流水位的相关性;工作压力与心理健康的相关性等。 ... -
8种常见的药物分析方法
2020-11-07 16:08:41药物分析是以药品质量标准为依据,对药物中的相关成分、含量进行检测与分析,以对药品质量的优劣及真伪做出评定。药物分析检测可研究药品及其制剂的组成、理化性质、真伪鉴别、纯度检查及测定其有效成分的含量,并... -
统计学 常用的数据分析方法大总结,推荐收藏
2019-09-10 11:35:29作者:阿平@zhihu来源:知乎一、描述统计描述统计是通过图表或数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。描... -
10个统计分析方法
2018-06-01 15:42:14首先,为了知道如何以及何时使用各种分析方法,理解各种分析方法背后的思想很重要。要想掌握更精巧复杂的方法,你必须先理解较简单的方法;其次,当你想准确地评估一种分析方法的效果时,你得知道其运行的多好或者... -
时频分析方法
2019-04-12 16:00:53FFT—傅里叶变换,可以将时域信号转为频域进行分析,所用的基函数是弦函数,且各弦函数之间是正交关系,因此比较适合处理平稳信号。对于非平稳信号处理效果就很差。类似的例子如“吉布斯现象”:当一个常数函数,其... -
16种常用的数据分析方法汇总
2017-04-04 16:16:33经常会有朋友问到一个朋友,数据分析常用的分析方法有哪些,我需要学习哪个等等之类的问题,今天数据分析精选给大家整理了十六种常用的数据分析方法,供大家参考学习。 一、描述统计 描述性统计是指运用制表和... -
10种常用数据分析方法
2018-12-07 16:15:57道家强调四个字,叫“道、法、术、器”。 层次区别: “器”是指物品或工具,在数据分析...“法”是指选择的方法,有句话说“选择比努力重要”; “道”是指方向,是指导思想,是战略。 在数... -
常见的9种大数据分析方法
2019-01-23 16:01:30数据分析是从数据中提取有价值信息的过程,过程中需要对数据进行各种处理和归类,只有掌握了正确的数据分类方法和数据处理模式,才能起到事半功倍的效果...回归是一种运用广泛的统计分析方法,可以通过规定因变量和... -
三大战略分析方法——SWOT、PEST、波特五力模型
2019-09-08 08:44:581. SWOT分析模型 「SWOT分析模型简介」 「SWOT模型含义介绍」 「SWOT分析步骤」 2. PEST分析模型 PEST分析的内容 3. 波特五力模型 [定义] [五力模型] 1. SWOT分析模型 「SWOT分析模型简介」 (也称TOWS... -
什么是聚类分析?聚类分析方法的类别
2019-07-03 21:09:55聚类分析是指将数据对象的集合分组为由类似的对象组成的多个类的分析过程。 基本概念 聚类(Clustering)就是一种寻找数据之间内在结构的技术。聚类把全体数据实例组织成一些相似组,而这些相似组被称作簇。处于... -
几种常用的差异分析方法简介
2021-04-06 11:01:15几种常用的差异分析方法简介 如今在生物学研究中,差异分析越来越普遍,也有许多做差异分析的方法可供选择。但是在实际应用中,大多数人不知道该使用哪种方法来处理自己的数据,所以今天我就来介绍下目前几种常用的... -
结构化分析方法及其图形工具
2019-06-12 17:35:57结构化分析方法 是一种用图形化的方式来表示软件开发的方法,指注重软件设计的结构的合理性。 优点: 图形化的表达更加直观,清晰,往往一张图比文字更具说服力; 有些图能表达系统立体的结构设计,强调逻辑功能; ... -
数据统计分析方法
2018-08-10 20:17:52数据统计分析方法: 描述统计、假设检验、相关分析、方差分析、回归分析、聚类分析、主成分与因子分析、时间序列分析、决策树。 回归分析 研究自变量与因变量之间的关系、可以用来预测因变量的值、 线性回归使用...