精华内容
下载资源
问答
  • 常见的定性分析方法
    千次阅读
    2022-04-23 16:38:27

    一、对比分析

    什么是对比分析?
    对比分析就是将两个及以上数据进行比较,通过其中差异揭示业务发展趋势及问题。

    优点:简单、直观、量化的特点。
    缺点:不易得知问题的严重程度。

    对比原则:
    1、对比对象要有相似性,如:偏远山区的人均收入和超一线城市的人均收入没有可比性。
    2、对比指标同质性,
    一是指标口径要一致。如:今天的收入和上个月的收入比,没有可比性。
    二是计算方式要一致。如:今天部门总收入和公司人均收入,一个是加法,一个是除法,计算方式不同。
    三是计量单位要一致。如:当月收入,不同国家的汇率不同。

    问题一:比什么?
    (1)绝对值:本身具备价值的数字。如:销售金额、阅读数、DAU、MAU、
    (2)比例值:在具体环境中看比例才具备对比价值。如:活跃占比、注册转化率
       举例:今日日活下降100人,如果平常日活只有110人,问题就大了,如果平常日活10000人,可能就是正常的数据波动。
       缺点:易受到极端值影响
    (3)波动对比:通过计算一定时期内标准差、方差、极差、变异系数等指标,比较波动情况。
    (4)趋势对比:趋势对比又可从时间、空间维度进行划分。

    问题二:怎么比?
    环比:连续2个统计周期(比如连续两周)内的量的变化比。
       对短期内具备连续性的数据进行分析。
       需要根据相邻时间范围的数字对当前时间范围的指标进行设定。
    同比:本年第n月与过去某年的第n月比。同比发展速度主要是为了消除季节变动的影响,用以说明本期发展水平与同期发展水平对比而达到
       的相对发展速度。
       观察更为长期的数据集
       观察的时间周期里有较多干扰,希望某种程度上消除这些干扰。

    问题三:和谁比?
    1、和自己比
    (1)从时间维度。如:推送的活动本周和上周活跃人数的比较。
    (2)从不同业务线。如:两种方案哪种获得的客户较多。
    (3)从过往经验估计(非连续数据)
    2、和行业比
    (1)是自身因素,还是行业趋势?
    (2)都跌,自己跌的幅度和同行怎么样
    (3)都涨,自己涨的幅度和同行怎么样

    二、多维度拆解

    注意:
    (1)维度拆解分析是可以叠加的。
    (2)辛普森悖论:在某些情况下,如果没有详细拆解内部数据,得出的结论会背离实际情况。
    举例:
    (1)DAU(Day Active User)用户使用手机的类型看出我们的目标群体。
    (2)启动我们app的方式,桌面还是通知栏,看出客户倾向于怎么查看我们的产品。
    (3)城市维度,我们主推的城市和其他城市的对比,是否存在地区性的差异。
    (4)新老用户的维度,随着这一轮市场推广,日活整体型化不大,但这是因为老用户占比下降、新用户占比不断上升,掩盖了流失。
    (5)对业务流程,拆解维度,初期–>中期–>后期,据业务sop看。
    (6)设备(ios/android)。
    (7)地域维度,省份,城市
    (8)性别维度,男,女等
    (9)渠道维度,线下,线上,还可以继续具体细分
    (10)政策、经济(短期内主要是竞争环境,如对竞争对手的活动)、社会、技术
    多维度拆解的适用场景
    1、分析单一指标的构成
      适用于,计算分栏目的播放量,新老用户比例、转化率、新客户客单价、老客户复购率等。

    2、针对流程进行拆解分析
      不同渠道的浏览、购买转化率,如:某渠道流量很高但是转化率低,可考虑减少该渠道投放。
      不同省份的活动参与漏斗

    3、还原行为发生时的场景
      打赏主播的等级、性别、频道、直播类型
      是否在WiFi或4G环境下
      活动时下单还是活动结束

    运作原理
      指标/业务流程需要按照多维度拆分,来观察变动
    适用场景
      需要分析单一指标的构成、比例时
      需要针对流程进行拆解分析
      需要还原行为发生时的场景

    数据涨跌异动如何处理
    搞明白每一次涨跌背后的业务逻辑
    一般流程:发现问题–>确定问题–>确定原因–>针对性解决问题 -->执行
    (1)跌:采取动作,减缓趋势
    (2)涨:弄清原因,并放大

    案例:对收入减少10%的应对(背景是某电商)
    问题严重么?
    〔假设〕如果是个例,往期应该没这么大跌幅
    〔证明〕周同比、月同比,确实都没有如此跌幅
    〔结论〕严重,确实是个问题

    猜测:是不是服务挂了?
    〔假设〕如果是技术问题,应该存在“断崖式下跌”,且修复后会恢复
    〔证明〕按小时查看,符合平时流量规律
    〔结论〕服务没有问题

    猜测:是不是渠道问题?
    〔假设〕如果是渠道问题,应该存在某个渠道远低于平时的流量
    〔证明〕按渠道维度拆解,XX渠道明显下降将近20%
    〔结论〕XX渠道下跌

    猜测:是不是哪里缺货?
    〔假设〕如果是发货问题,应该存在某个地区远低于平时的销量
    〔证明〕按地域维度拆解流量,XX省低了不少
    〔结论〕怀疑与当地动作有关

    常见的假设
    活动影响:查对应活动页面及对应动作的数据波动,关注活动是否有地域属性
    版本发布:将版本号作为维度,区分查看
    渠道投放:查看渠道来源变化
    策略调整:策略上线时间节点,区分前后关键指标波动
    服务故障:明确故障时间,按时间为维度进行小时或者分钟级别的拆分

    三、漏斗观察

    什么是漏斗观察?
      漏斗是一连串向后影响的用户行为,也就是前一步对后一步有限制作用。它能够科学反映用户行为状态以及从起点到终点各阶段用户转化率情况的重要分析方法。

    漏斗观察法的适用场景
      适用场景:一般适用于有明确的业务流程和业务目标需要监控的。
      不太适用场景:不太适用于没明确的流程或跳转关系纷繁复杂的业务,比如像新闻类、阅读类的产品等。

    漏斗分析流程
      第一步:梳理业务流程关键节点与路径。根据业务场景的设定规则或节点的定义,绘制事件的流程;
      第二步:收集各关键节点的痕迹数据,进行数据分析。针对整个漏斗形成过程首先要进行指标的定义和数据的收集。
      第三步:确定需要优化的节点。通过在关键指标上与同类用户的平均水平、行业平均水平等进行比较,分析差距、找到自身的
          薄弱环节;通过与自身历史同期水平进行比较,确定某一流程中需要优化的节点,采取措施进行针对性整改。

    建立漏斗时容易掉的坑

    【坑1】漏斗一定是有时间窗口的
      1、根据业务实际情况,选择对应的时间窗口,太长会包含无用信息,太短会丢失有用的信息,时间窗口没有固定的长度。
      2、极端情况:23:59分执行第一步,次日0:01分执行第二步,具体计算到哪一天据业务情况。
      3、按天:对用户心智的影响只在短期内有效(如短期活动,红包当日有效)
      4、按周:业务本身复杂/决策成本高/多日才能完成(如理财/美股开户)
      5、按月:决策周期更长(如装修买房)

    【坑2】漏斗一定是有严格顺序的
      举例:比如视频点赞,想计算点赞后商品的付费情况,流程应该是点赞–>浏览–>下单–>付费,计算每个环节的转化率,但是,点赞的平台和渠道很多,商家也不会只在一个渠道做推广,就不能把所有的渠道计算在一起,区分不开哪个渠道应该多投入,所以要把每条业务线计算清楚。

    【坑3】漏斗的计数单位可以基于「用户」、也可以基于「事件」
      基于用户:关注整个业务流程的推动
      基于事件:关注某一步具体的转化率
    何时基于「用户」,何时基于「事件」?
      这个问题主要是取决于关注的点,如果是关注整个业务流程的推动就是基于用户的角度。如果是关注某一步具体的转化率,就是基于事件的角度,但是基于事件可能无法获知事件流转的真实情况。

    【坑4】结果指标的数据不符合预期
      如果结果指标的数据不符合预期,需要有一个自查的过程,需要考虑是否只有这一个漏斗能够到达最终目标?
      举例:业务sop最终目标是客户付款,但是我们只关注了某一条业务流程最后付钱的转化率,结果肯定是不符合我们的预期的,这时候就要考虑是不是少计算了某些业务线,或者忽略了业务流程中的某个重要环节。

    如何评估渠道质量确定投放优先级
    1、常见的渠道划分方式
    (1)来源(source)
      具体的流量实体,如:百度、头条、线下
    (2)媒介(medium)
      实体中承载推广的实体,如:SEM、自然搜索结果、Bannner
    (3)其他参数
      营销活动名称、广告关键词等
    2、渠道质量跟踪
    (1)选择关键事件,选取反映你产品目标人群会做的行为的数据,如果完成了关键事件我们认为是目标的用户,关键事件门槛不能太高,也不能太低。比如(电商)购买、(社区)发帖(可衡量各渠道来的用户是否为目标用户),完成为期三个月的健身课程(门槛太高/流程太深,转化率极低,无区分度),打开APP/访问首页(门槛太低,同样缺乏区分度)
    (2)查看产生关键事件的用户来源是哪

    四、分布情况

    分布分析用来解释数据的分布特征和分布类型,显示其分布情况。
    分布分析主要分为两种:对定量数据的分布分析和对定性数据的分布分析。
    运作原理
      从事件在不同维度中的分布来观察,以便理解该事件除了累计数量和频次外,更多维度的信息。
    适用场景
      已经知道一群用户完成了指定事件,但需要对用户群体进行细分,按不同的维度和价值将他们划为不同群体,分别进行后续的维护或分析。
      已经知道单个事件的完成次数,希望知道这些次数拆分到不同维度上后的分布情况,以便更清晰地了解该事件的完成情况。

    (1)定量分析的指标:
    中心位置/集中趋势 :均值、中位数、众数、四分位数
    分散程度/离中趋势:方差、标准差、极差、变异系数{标准差/平均值}
    同一对象不同时间的波动:
    方差大:受外界因素影响较大,可以通过特征的贡献度分析析,寻找影响波动的原因。
    方差小:波动状况不明显。
    同一对象相同时间的波动:
    方差大:各个对象间的差异较大,可以寻找差异大的原因,异常值中一般蕴藏着机会。
    方差小:各对象之间的差异不大,对象的属性对结果的影响不大。

    定性分析:
    主要是划分不同的群体,对比不同群体间的差异,或渠道之间的差距。

    常见的群体划分
    事件频率、一天内的时间分布、消费金额的区间

    五、用户留存

    适用场景
    验证产品长期价值,找出用户流失环节原因,产品、运营、技术、市场每个环节都会对留存造成影响。

    一般的计算方式
    (1)将某一时间段的用户ID与另一时间段的用户ID做交叉去重
    (2)过滤进行过指定行为的用户ID,再计算。
    一般行为:
      1.某功能频次越高,说明用户越对某功能感兴趣,可以根据使用频次,预判新用户取向;
      2.流程转化速度代表商品推送的准确度;
      3.分析新用户的实际数据,看绝大多数早期激活行为发生的时间窗口,也就是确定新用户的决策期;
    (3)将用户分为不同的群体后,观察其之间留存的区别。

    运作原理
    大盘留存:将某时间段与另一时间段的用户ID交叉去重
    精准留存:针对某指定行为或sop中的某环节过滤用户ID,再将用户分为不同群体后,观察其之间留存的区别。

    适用场景
      评估产品功能粘性
      验证产品长期价值

    功能/内容上线后,如何评估其短期效果/长期价值/未来潜力
    (1)功能/内容的目标与价值清晰明确
      借助漏斗分析对比(转化关系明确时)
      借助用户分群对比(转化关系较复杂时)
    (2)上线后关注其对产品价值的提升
      借助精准留存对比
      上线以探索更长期的产品潜力
      借助分布情况分析,对比其是否优化了使用频次/场景的分布

    六、用户画像

      通过给用户各类特征贴上标签,通过这些标签将用户分为不同的群体,以便对不同的群体针对性的进行产品/运营动作。

    标签都有啥?
    基础属性
      年龄、性别、生日、星座、教育、身高、地域、收入、职业、性格、爱好、品牌偏好等
    社会关系
      婚姻、有无小孩、有无女孩、家有老人、性取向、社交群体
    行为特征
    (1)基本行为:注册时间
    (2)业务行为:买过特惠商品、充值会员(月度、年度、自动续费)
    业务相关
      胖瘦高矮、体脂率、每日运动时长,运动时间、存货量、天气

    标签从哪儿来?
    (1)直接填写:注册、外卖、问卷调查、关注的话题、装修计算器、电话访谈、朋友推荐。
    (2)通过用户自己的已有特征推得:做活动、简单的个性化运营、业务分析、用户研究。
    (3)通过用户身边的人推断:距离相近、某些属性,周围的人都具备,用户大概率也具备。
    (4)行为相似、通过协同过滤,找到行为相似的目标用户。

    做用户画像作用:
    (1)广告投放,对潜在用户进行拉新。
    (2)精准营销,刺激消费。
    (3)个性化推荐,增加用户粘性,促交。
    (4)风控检测,是否发放贷款。
    (5)产品设计,针对互联网产品的三大要素,用户,需求,场景,更新迭代产品。
    (6)数据分析,更加清晰的刻画用户画像。
    (7)从现有用户中找到我们真正的用户:高留存、核心行为频次完成率高。

    七、归因查找

    含义:找出事件发生的主要原因,哪些渠道或节点的原因导致了这个结果。

    归因查找的适用场景
      对业务中明确的业务目标(购买、留资料、充值等)归因,便可…
      将目标的达成拆分到各个模块,方便统计各模块的贡献
      获悉当前指标达成的主要因素,获得如何提升业务指标的洞见

    归因方法
    (1)末次归因转化路径短,且事件间关联性强的场景
      找出事件最近的一次动作,也称最后点击模型,这种归因模型将功劳100%分配给转化前的最后一个渠道,即不管用户发生什么行为,只关注最后一次。这是最简单、直接,也是应用最为广泛的归因模型。
    (2)递减归因转化路径长,非目标事件差异不大,没有完全主导的
      比如提供了书写功能、查找功能、闹钟功能然后充钱能去掉 广告、目标是去掉广告,不能归因为闹钟
    (3)首次归因强流量依赖的业务场景,拉人比后续所有事都重要
      也称首次点击模型,这种归因模型将功劳100%分配给第一个触达渠道,即不管用户发生了啥行为,只关注第一次。
    (4)线性归因
      线性归因是多触点归因模型中的一种,也是最简单的一种,他将功劳平均分配给用户路径中的每一个触点。
    (5)时间衰减归因
      对于路径上的渠道,距离转化的时间越短的渠道,可以获得越多的功劳权重。时间衰减归因模型基于一种假设,他认为触点越接近转化,对转化的影响力就越大。这种模型基于一个指数衰减的概念,一般默认周期是7天。也就是说,以转化当天相比,转化前7天的渠道,能分配50%权重,前14天的渠道分25%的权重,以此类推。
    (6)位置归因
    基于位置的归因模型,也叫U型归因模型,是一种重视最初带来线索和最终促成成交渠道的模型,一般它会给首次和末次互动渠道各分配40%的权重,给中间的渠道分配20%的权重,也可以根据实际情况来调整这里的比例。

    运作原理
    将事件拆解,并根据业务性质,确定影响事件完成的关键部分(首次归因、递减归因、末次归因)

    适用场景
    将目标的达成拆分到各个模块,方便统计各模块的贡献
    获悉当前指标达成的主要因素,获得如何提升业务指标的洞见

    精准运营推送

    如何盘活运营资源?
      如果想盘活运营资源,就要尽可能的把一个资源分成N个资源来用,就是不同人在同一个运营资源位上得到不同的信息。也就是我们常说的千人千面,但是很多公司做到千人千面很难,有时候只能做到千人几面,或者干脆是千人一面。千人一面不可取,千人千面又挺难的,所以我们需要在千人千面和千人一面之间找到ROI(投入和会报)的平衡,千人十面往往就已经解决了80%的问题,7~8个标签往往足矣。

    推送内容针对特定用户:
      基于用户真实的动作,调整推送内容,使其感到推送是专门为我而推送的,而不是使客户感觉自己是被批量推送的分母之一。

    运营资源盘活
    【问题】整个公司的内部营销资源存在上限,会出现各个业务线去抢推送资源的问题
    (1)常规做法出台一套运营资源使用规则,一天最多只能推5条,同一个类型的营销在一周(一月)内不得重复推送。
    (2)推荐做法精细化的用户分群运营,既能提升整个公司的可用资源,也能提升收到推送的用户自己的体验
    (3)理想:每个标签都去做不同的推送内容
    (4)运营力量有限︰哪怕将用户精确地分成一千个群体,运营团队也很难每天都去编一千条不同的推送文案和页面,但是如果运营策略能自动化地运行,可以实现。

    现实:在ROI上找到一个平衡点,先选择容易出成绩的
    容易出成绩的标签:如电商的性别标签
    容易出成绩的运营位:如首页/每日推送

    如何让营销内容与用户更加相关?
    向我说话
     利用用户之前留下的信息,在推送文案中使用对应名称
    由我触发
     通过挖掘用户的行为序列,将推送与你的某个行为挂钩
    和我有关
     这次推送的活动,真正和我的需求有关

    八、路径挖掘

    适合没有明确的业务流程和业务目标,但是有一个明确的起始落地页,一个明确的结束事件,起始往后面推或者结束往前面推。

    运作原理
    ·逐级展开某一事件的前一级(后一级)事件,观察其流向
    适用场景
    ·有明确的起始场景,希望观察这个场景它之后发生了什么
    ·有明确的结果目标,希望观察来的用户是如何到达的

    九、行为序列

    运作原理
    将单一用户的所有行为以时间维度的形式进行排列。

    适用场景
    (1)观察掩盖在统计信息下更细致的信息,还原用户具体的使用场景
    (2)通过观察具体的行为特征,找到提升产品价值的机会点
    (3)辅助产品设计决策

    随着技术的发展,有很多软件刷流量等数据指标的行为存在,那么如何抓作弊?
    第一步:发现数据异常
     一般通过,流量监控、员工审核、员工举报
    第二步:找到方法
    (1)异常数据来源分析,机刷、人刷、突增、ip异常、
    (2)行为多少,
     多:显著与普通用户相异的动作,如通过商家变现、发布特定内容等
     少:留存低、非核心业务(如帮助界面)几乎不访问
    第三步:确认作弊用户
     开发部门爬取并人工审核,我们提供特征,给开发然后取出数据人工审核
    第四步:关闭作弊用户权限/封号
     封禁/封禁权限/屏蔽/定向屏蔽/…

    如何防止用户作弊?
    (1)找到作弊用户就封禁
    (2)提高关键成本
       前:注册7日后方可发帖,然后如果发广告帖就封号
       中:减少存在bug的商品的库存
       后:提高提现的审核力度/周期
    (3)不做处理

    本文基于网络教学视频整理发布分享,如果侵犯作者相关权力请联系删除。

    更多相关内容
  • 时间序列分类被用于各种应用程序,导致许多用于时间序列分析的数据挖掘技术的发展。 在广泛的时间序列分类算法中,最近的研究正在考虑深度学习方法对时间序列分类... 定性分析通过详细描述突出引用率最高的论文类别。
  • 2.定量分析与定性分析一个通俗的解释;3.定量分析与定性分析; 统计方法大多是定量的比如提供与数据集相关的统计数据的平均值中位数或众数 但也可以是定性的例如利用回归性分析和相关性分析来推断数据集中的模式和关系...
  • 定性和定量大数据分析方法指南

    千次阅读 2020-09-17 17:10:52
    定性和定量大数据分析方法?我们看到数据时想到的第一件事是什么?第一个本能是找到模式,联系和关系。我们查看数据以发现其中的含义。  同样,在研究中,一旦收集了数据,下一步就是从中获取见解。例如,如果服装...

      定性和定量大数据分析方法?我们看到数据时想到的第一件事是什么?第一个本能是找到模式,联系和关系。我们查看数据以发现其中的含义。

      同样,在研究中,一旦收集了数据,下一步就是从中获取见解。例如,如果服装品牌试图确定年轻女性的最新趋势,那么该品牌将首先与年轻女性接触,并向她们询问与研究目标相关的问题。在收集了这些信息之后,该品牌将分析该数据以识别样式-例如,它可能会发现大多数年轻女性希望看到更多的牛仔裤。

      大数据分析是研究人员从大量数据到有意义的见解的方式。取决于研究类型,有许多不同的大数据分析方法。您可以使用以下几种方法来分析定量和定性数据。

      分析不良数据非常困难。通过我们的博客“ 4种数据收集技术:哪个适合您?”,确保您正在收集高质量的数据 。

      分析定量数据

      资料准备

      分析数据的第一步是数据准备,其目的是将原始数据转换为有意义且可读的内容。它包括四个步骤:

      步骤1:资料验证

      数据验证的目的是尽可能地找出数据收集是否按照预设的标准进行并且没有任何偏差。这是一个四步过程,其中包括…

      欺诈,以推断每个受访者是否真正接受了采访。

      筛选,以确保根据研究标准选择了受访者。

      Procedure,以检查是否已正确执行数据收集过程。

      完整性,以确保访调员向受访者提出所有问题,而不仅仅是几个必填问题。

      为此,研究人员需要从已完成的调查中随机抽取一个样本并验证收集到的数据。(请注意,这对于包含大量回复的调查可能会非常耗时。)例如,假设有一个200名受访者被分为两个城市的调查。研究人员可以从每个城市中随机抽取20名受访者作为样本。此后,研究人员可以通过电子邮件或电话与他们联系,并检查他们对某些问题的回答。

      首先检查18个数据验证,这些数据验证可防止不良数据进入您的数据集。

      

    大数据分析

     

      步骤2:资料编辑

      通常,大数据集包含错误。例如,受访者可能会错误填写字段或意外跳过字段。为了确保没有此类错误,研究人员应进行基本数据检查,检查异常值,并编辑原始研究数据,以识别和清除所有可能影响结果准确性的数据点。

      例如,错误可能是被调查者留空的字段。编辑数据时,确保删除或填充所有空白字段非常重要。(这里有4种方法来处理丢失的数据。)

      步骤3:资料编码

      这是数据准备中最重要的步骤之一。它是指对调查的答复进行分组和分配值。

      例如,如果研究人员访问了1000人,现在想查找受访者的平均年龄,则研究人员将创建年龄段,并根据这些代码对每个受访者的年龄进行分类。(例如,年龄在13-15岁之间的受访者将其年龄编码为0,将16-18编码为1,将18-20编码为2,等等)

      然后,在分析过程中,研究人员可以处理简化的年龄段,而不是处理大量的个人年龄段。

      定量大数据分析方法

      完成这些步骤后,就可以进行大数据分析了。两种最常用的定量大数据分析方法是描述性统计和推断性统计。

      描述性统计

      通常,描述性统计(也称为描述性分析)是分析的第一级。它可以帮助研究人员汇总数据并找到模式。一些常用的描述性统计数据是:

      平均值:一组值的数值平均值。

      中位数:一组数值的中点。

      模式:一组值中最常见的值。

      百分比:用于表示数据中的一个值或一组答复者与较大的一组答复者之间的关系。

      频率:找到值的次数。

      范围:一组值中的最高和最低值。

      描述性统计信息提供绝对数字。但是,他们没有解释这些数字背后的理由或理由。在应用描述性统计之前,重要的是要考虑哪一个最适合您的研究问题以及您想展示什么。例如,百分比是显示受访者性别分布的好方法。

      当研究仅限于样本并且不需要推广到更大的人群时,描述性统计最有用。例如,如果您比较两个不同村庄中接种疫苗的儿童的百分比,则描述性统计就足够了。

      由于描述性分析主要用于分析单个变量,因此通常称为单变量分析。

      

    大数据分析

     

      分析定性数据

      定性大数据分析的工作原理与定量数据有所不同,主要是因为定性数据是由单词,观察值,图像甚至符号组成的。从这样的数据中得出绝对含义几乎是不可能的。因此,它主要用于探索性研究。虽然在定量研究中,数据准备阶段和大数据分析阶段之间存在明显的区别,但定性研究的分析通常在数据可用后立即开始。

      数据准备和基本大数据分析

      分析和准备工作并行进行,包括以下步骤:

      熟悉数据:由于大多数定性数据只是文字,因此研究人员应先读取数据几次以熟悉数据,然后开始寻找基本的观察结果或模式。这也包括转录数据。

      重新研究目标:在这里,研究人员重新审查研究目标,并确定可以通过收集的数据回答的问题。

      开发框架:也称为编码或索引,在这里研究人员识别出广泛的想法,概念,行为或短语,并为其分配代码。例如,编码年龄,性别,社会经济地位,甚至概念,例如对问题的肯定或否定回答。编码有助于结构化和标记数据。

      识别模式和联系:对数据进行编码后,研究就可以开始确定主题,寻找最常见的问题答案,识别可以回答研究问题的数据或模式,并找到可以进一步探索的领域。

      

    大数据分析

     

      定性大数据分析方法

      有几种方法可用于分析定性数据。最常用的大数据分析方法是:

      内容分析:这是分析定性数据的最常用方法之一。它用于分析文本,媒体甚至物理项目形式的文档信息。何时使用此方法取决于研究问题。内容分析通常用于分析受访者的回答。

      叙事分析:此方法用于分析各种来源的内容,例如受访者的访谈,实地观察或调查。它着重于利用人们分享的故事和经验来回答研究问题。

      话语分析:话语分析与叙事分析一样,用于分析与人的互动。但是,它着重于分析研究者与受访者之间进行交流的社会环境。话语分析还会查看受访者的日常环境,并在分析过程中使用该信息。

      扎根理论:这是指使用定性数据来解释为什么发生某种现象。它通过在不同的环境中研究各种相似的案例并使用数据得出因果关系来做到这一点。研究人员在研究更多案例时可能会更改解释或创建新的解释,直到得出适合所有案例的解释。

      这些方法是最常用的方法。但是,也可以使用其他大数据分析方法,例如会话分析。

      大数据分析也许是研究中最重要的组成部分。较弱的分析会产生不准确的结果,不仅会影响研究的真实性,还会使发现无法使用。必须谨慎选择大数据分析方法,以确保您的发现具有洞察力和可操作性。

     

    摘自:https://www.aaa-cg.com.cn/data/2163.html

    展开全文
  • SPSS常见数据分析方法比较汇总

    万次阅读 多人点赞 2017-04-09 00:54:22
    SPSS作为一款成熟的数据分析工具,其主要特点就是将各种各样的统计分析方法流程化模块化。 一、SPSS常用多变量分析技术比较汇总表 注: 卡方分析:定量两个定性变量的关联程度 简单相关分析:计量两个计量...

    SPSS作为一款成熟的数据分析工具,其主要特点就是将各种各样的统计分析方法流程化模块化。
    一、SPSS常用多变量分析技术比较汇总表
    20151110spss01注:

    卡方分析:定量两个定性变量的关联程度

    简单相关分析:计量两个计量变量的相关程度

    独立样本T检验:比较两组平均数是否相等

    ONEWAY ANOVA:可以比较三组以上的平均数是否相等,并进行多重比较检验

    TWOWAY ANOVA:可以比较两因素的平均数是否相等,并检验主效应和交互效应

    判别分析与logistic回归:应用于检验一组计量的自变量(可含虚拟变量)是否可以正确区别一个定性的因变量

    多维量表法(MDS):试图将个体中的变异数据,经过转为为一个多维度的空间图,且转化的个体在空间中的相对关系仍与原始数据尽量配合一致。
    二、SPSS常用统计技术(变量个数与测量量表)比较汇总表
    20151110spss02

    注:理论模型中变量通常很难测量,这类变量称为潜变量,如绩效、满意度、忠诚度等。

    三、SPSS学习的大致框架
    20151110spss03

    展开全文
  • 常用的统计分析方法

    千次阅读 2020-12-27 12:53:30
    分析方法 频率分析 主要用于查看数据基本分布特征,数据清晰,各种统计量、基本报告数据源等 数据探索 探索性分析主要是从统计的角度查看统计量来评估数据分布,主要用于异常值侦测、正态分布检验、数据分段、分位点...

    分析方法

    频率分析

    主要用于查看数据基本分布特征,数据清晰,各种统计量、基本报告数据源等

    数据探索

    探索性分析主要是从统计的角度查看统计量来评估数据分布,主要用于异常值侦测、正态分布检验、数据分段、分位点测算等

    交叉表分析

    交叉分析、是市场研究的主要工作,大部分研究分析均使用,主要用于分析报告和分析数据源,各种图表等,当然其中也有卡方检验和T检验,寻找差异

    表(Table)分析

    类似于Excel的数据透视表,连续数据和离散数据均可使用,也可以用作卡方检验和T检验

    卡方检验

    它属于非参数检验的范畴,主要是比较两个以及两个以上样本率(构成比)以及两个分类变量的关联性分析。其根本思想就是在于比较理论频数实际频数的吻合程度或拟合优度问题

    T检验

    假设检验方法,主要用于比较两个总体均值的差异是否显著

    方差分析

    超过两个总体的均值检验,也经常用于实验设计后的检验问题

    相关分析

    线性相关性,只有变量呈现相关我们呢才能进行影响关系的研究,但是记住主要是线性相关,不相关不代表没有关系

    变量处理

    在这里插入图片描述

    相关性分析

    研究不同变量间是否有关系,以及关系密切程度的一种常用的统计方法

    适用场景

    发现数据间的关系,发现市场上决定性的或显著的属性,例如对于选择不同品牌的重要和有显著区别的属性
    在这里插入图片描述

    回归分析

    回归分析是确定两种或者两种以上变量间相互依赖的定量关系的一种统计分析方法。相关分析研究的是现象之间是否相关,一般不区别自变量或者因变量,而回归分析要分析现象之间相关的具体形式,确定其因果关系,并且用数据模型来表现其具体关系。应用于满意度研究、消费者研究、市场预测以及一些专业技术研究等方面。在实际应用中,回归分析根据变量的数目划分为二元变量回归和多元变量回归,回归的形式包括线性回归和非线性回归等。

    • 通常,线性回归是常用的一种方法,二元线性回归的方程表示为:Y = C + bx + e
    • 多元线性回归方程与线性回归相似,但是有更多的独立变量,其线性方程表示为:Y = c + b1x1 + b2x2 + b3x3 +…+ e
      在这里插入图片描述
      在这里插入图片描述

    聚类分析

    是指把具有某种类似相似特征的物体或者事物归为一类的方法和技巧。目的在于辨别在某些特性上相似的事物,并且按照这些特性将样本划分为若干类(群),使得在同一类内的事物具有高度的同质性,而不同类的事物则有高度的异质性。

    聚类分析主要用于

    • 进行市场细分
    • 定量用户画像
    • 流失用户分群
    • 为市场测试确定相匹配的城市
    • 在市场结构分析中识别竞争者
    • 对产品进行分类
    • 确定分层抽样的层次

    因子分析

    其基本目的就是用少数几个因子去描述许多指标或因素之间的联系(即抽象和降维)。常用其他技术联合使用,应用于满意度研究,市场细分研究中

    • 目前因子分析包括探索性因子分析(Exploratory Factor Ana-lysis, EFA)和验证性因子分析(Confirmatory Factor Analysis, CFA)
    • 在实际应用中,通过因子得分可以得出不同因子的重要性指标,而管理者则根据这些指标的重要性决策需要首先解决的市场问题或者产品问题

    判别分析

    这种分析方法能够依据样本某种特性,以判别样本所属类型。与聚类分析不同的是,判别分析是在已知研究对象可用某种方法分成若干类的前提下,建立判别函数,用以判定未知对象属性已知分类中的哪一类

    • 在市场研究中,判别分析主要用于对一个企业进行市场细分,以选择目标市场,有针对性地进行广告、促销等活动。
    • 判别分析的普通公式为:Z = b1 * X1 + b2 * X2 + b3 *X3 + …+bn * Xn其中,Z为判别值;b为判断系数,x为自变量

    对应分析

    这是一种多元统计分析技术,主要分析定性数据Category Data方法,也是强有力的数据图示技术,也是强有力的市场研究分析技术。

    • 对应分析的基本思想是将一个联列表的行和列中各元素的比例结构以点的形式在较低维的空间中表示
    • 它最大特点是能把众多的样品和众多的变量同时作到同一张图解上,将样品的大类及其属性在图上直观而且又明了的表示出来,具有直观性
    • 对应分析应用在市场细分,产品定位等场景
    • 对应分析可以分为简单对应分析和多重对应分析
    • 当研究设计的分类变量类别比较多的时候,可以得到更加精确,更加全面的分类变量间关联的结果

    路径分析

    路径分析是探索和分析事物内部复杂的因果关系的一种统计方法。多元回归分析将所有自变量置于相同的位置,其假设过于简单,不能揭示事物之间的复杂因果关系,例如自变量和因变量之间相互影响关系的情况
    在这里插入图片描述

    结构方程

    结构方程模型是一种建立、估计和检验因果关系模型的方法。模型中既包含有可观测的因变量,也可能包含无法直接观测的潜在变量,能够同时处理多个因变量。结构方程模型可以代替多重回归、通径分析、因子分析、协方差分析等方法,清晰分析单项指标对总体的作用和单项指标间的相互关系

    • 使用Amos或者LISRAL来完成,可以用来分析复杂的变量关系

    应用场景

    • 用户满意度模型指标的建立
    • 产品使用驱动力研究
    • 流失用户影响因素分析
      在这里插入图片描述

    应用场景总结

    在这里插入图片描述

    分析路线指导图

    在这里插入图片描述

    展开全文
  • 数据分析常见方法及模型分类

    千次阅读 2020-08-05 10:33:26
    今天跟大家分享一下比较常见的数据分析方法以及模型分类。...一般来说,我们可以将数据分析方法分为对比分析、相关分析、分类分析以及综合分析四类,其中前三类主要是以定性的数据分析方法和模型为主,而对于...
  • 在这个现代化的数字化世界中,几乎每个... 使用框架分析方法来查看学生对社交媒体广告结果的常见反应。 结果表明,在社交媒体上投放广告可以提高客户的积极性,并提高观众对公司的认知度,从而最终提高客户的购买意愿。
  • 描述统计是通过图表或数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。描述统计分为集中趋势分析和离中趋势分析和相关分析三大部分。 集中趋势分析:...
  • 文章目录系列文章目录前言一、光谱数据读入1.1 光谱数据读入1.2 光谱可视化二、定性分析模型建立2.1 光谱定性分析模块2 .2 光谱定性模块的使用实列总结 前言 典型的光谱分析模型(以近红外光谱作为示意,可见光、...
  • 3种常见的统计学方法

    2022-05-19 17:53:44
    最近学习了3种常见的统计学方法:主成分分析法(PCA)、熵值法、层次分析法(AHP,又称专家打分法)。都可以用来计算指标(或属性)的权重,只有主成分分析法可以降维。PCA/熵值法都需要有对应的样本数据,比如10个...
  • 数学建模13种常见方法

    万次阅读 多人点赞 2018-11-24 10:22:00
    下面来介绍一下数学建模大赛中常用的13中建模方法: 1、层次分析法,简称AHP,是指将与决策总是有关的元素分解成目标、...课题时,应用网络系统理论和多目标综合评价方法,提出的一种层次权重决策分析方法。 2、多...
  • 数据分析方法有非常多,但大致可以分为两类 第一
  • 风险定性分析 透过风险清单的功能,可以将现有的风险清单整合到ORACLE风险管理模块当中,同时也可以持续定义新的风险。一般来说,风险类型主要包括:预估的不确定性(estimate uncertainty)、作业存在性(task ...
  • 数学建模主要有哪些分析方法

    千次阅读 2020-07-03 18:57:50
    数学建模主要有哪些分析方法? pan2041551 2常用的建模方法 (I)初等数学法。主5261要用于一些静态、线4102性、确定性的模型。 例如,席位分配问题,学生成绩的比较,一些简单的传染病静态模型。 (2)数据分析法...
  • 一文速览-数据分析基本思维以及方法

    千次阅读 多人点赞 2022-01-02 13:12:59
    数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。 1.数据分析主要包括: 描述性统计分析 频数分析 相关性分析 (偏...
  • 选择了三种分析方法(两种定量方法和一种定性方法)来评估净化后设备上的残留生物负荷。 结果:在所有测试方案中,只有阳性对照以及Soap and Bleach方案达到了消毒目标。 对于每种方案,每次试验的大多数清洁结果均...
  • XPS是什么?XPS, 全称为X-ray Photoelectron Spectroscopy(X射线光电子能谱), 早期也被称为ESCA(Electron Spectroscopy for Chemical ...XPS可用于定性分析以及半定量分析, 一般从XPS图谱的峰位和峰形获得样品表面元...
  • 统计学中数据分析方法汇总!

    千次阅读 2021-07-27 00:21:32
    ↑↑↑关注后"星标"Datawhale 每日干货 & 每月组队学习,不错过 Datawhale干货 来源:数据派THU,编辑:数据Seminar 本文约10500字,建议阅读15+分钟 统计学中常用的数据分析方法汇总。 Part1描述统计 描述统计...
  • 统计学中常用的数据分析方法汇总

    千次阅读 2020-06-21 15:38:22
    描述统计是通过图表或数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。描述统计分为集中趋势分析、离中趋势分析和相关分析三大部分。 集中趋势分析集中...
  • 市场调查——定性研究方法

    千次阅读 2019-12-02 18:42:20
    定性研究方法是根据社会现象或事物所具有的属性和在运动中的矛盾变化,从事物的内在规定性来研究事物的一种方法或角度。 它以普遍承认的公理、一套演绎逻辑和大量的历史事实为分析基础,从事物的矛盾性出发,描述...
  • 大数据常见的处理方法有哪些

    千次阅读 2022-03-17 10:11:09
    常用的数据处理方法如下:  1)聚类分析:按照数据对象的相似度,把数据对象划分聚集簇,簇内对象尽量相似,簇间对象尽量相异。发现任意形状的簇、处理高维数据、具有处理噪声的能力以及聚类结果可解释、易使用是...
  • 以具体采煤机调高装置为实例,介绍了采煤机调高装置运行中常见的故障类型,而后分析静态故障树分析方法,并通过静态故障树分析法分析研究了采煤机调高装置故障,通过定性和定量分析确定底事件对顶事件的影响大小,快速...
  • 常见的研究方法有哪些?

    千次阅读 2019-10-04 10:46:51
    研究方法,哲学术语,是指在研究中发现新现象、新事物,或提出新理论、新观点,揭示事物内在规律的工具和手段。 这是运用智慧进行科学思维的技巧,一般包括文献调查法、观察法、思辨法、行为研究法、历史研究法、...
  • 数据特征分析方法总结

    千次阅读 2022-04-04 01:29:25
    数据特征分析方法总结 21世纪是大数据的时代,因为这些大数据中蕴含着时代发展的信息。如何科学地分析数据特征是数据分析师必须掌握的基础技能之一。因此,我今天主要希望通过理论推导并实现一些常用的数据特征分析...
  • 统计学中的十几个数据分析方法

    千次阅读 2021-08-27 10:43:50
    列联表分析7 相关分析8 方差分析9 回归分析聚类分析11 判别分析12 主成分分析13 因子分析14 时间序列分析15 生存分析16 典型相关分析17 ROC分析18 其他分析方法 1. 描述统计 描述统计是通过图表或数学方法,对数据...
  • 来源:数据Seminar 本文约10500字,建议阅读15+分钟统计学中常用的数据分析方法汇总。 Part1描述统计描述统计是通过图表或数学方法,对数据资料进行整理、分析,并对数据的分...
  • 本文针对性的讲讲数据分析整个流程最关键的阶段: 数据处理与分析阶段。该阶段我分成了三块:数据采集、数据处理、数据分析,都围绕着“数据”进行,对海量或杂乱数据进行处理分析,从中找出痛点,洞察问题。 一、...
  • 统计学中数据分析方法大全!

    千次阅读 2021-07-28 00:26:33
    来源:数据派THU 我是小z 之前有断断续续讲过统计学中的数据分析方法,今天分享的这篇更加全面、系统,涉及到18个方面,收藏就完事儿了~ Part1描述统计描述统计是通过图表或数学方法,...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 12,401
精华内容 4,960
热门标签
关键字:

常见的定性分析方法