精华内容
下载资源
问答
  • SPSS数据分析-交叉表分析

    千次阅读 2020-08-20 12:16:03
    交叉表(交叉列联表) 分析法是一种以表格的形式同时描述两个或多个变量的联合分布及其结果的统计分析方法,此表格反映了这些只有有限分类或取值的离散变量的联合分布。 当交叉表只涉及两个定类变量时,交叉表又叫做...

    交叉表(交叉列联表) 分析法是一种以表格的形式同时描述两个或多个变量的联合分布及其结果的统计分析方法,此表格反映了这些只有有限分类或取值的离散变量的联合分布。
    当交叉表只涉及两个定类变量时,交叉表又叫做相依表
    交叉列联表分析易于理解,便于解释,操作简单却可以解释比较复杂的现象,因而在市场调查中应用非常广泛。
    频数分布一次描述一个变量,交叉表可同时描述两个或更多变量
    交叉表法的起点是单变量数据,然后依研究目的将这些数据分成两个或多个细目。

    交叉表是一种行列交叉的分类汇总表格,行和列上至少各有一个分类变量,在行和列的交叉处可以对数据进行多种汇总计算,例如:求和、求平均值、计数等。
    在这里插入图片描述
    步骤:

    1. 单击分析,选择描述统计,然后选中描述交叉表模块,弹出交叉表的选项窗口
      在这里插入图片描述
      在这里插入图片描述
      在【交叉表】中,将Q13婚姻状况 移至【行】框中,将Q2性别 移至【列】框中。
      在这里插入图片描述
      【单元格】按钮,弹出【交叉表:单元格显示】对话框。
      SPSS默认选中【实测】(即实际值),我们还可以勾选【百分比】下的【列】复选框,以显示百分比,行百分比和总计百分比可根据分析的需要进行选择。其他选择与描述性分析的关系不大,故在此不做选择。
      在这里插入图片描述
      单击【继续】,返回【交叉表】对话框,单击下方【确定】,输出结果如下图:
      在这里插入图片描述
      个案处理摘要:
      对个案进行汇总,显示有效个案数和数量与百分比。
      在这里插入图片描述
      从交叉表中我们可以看到,在四种婚姻状况中,“未婚单身”占比45.2%,所占比重最大;其次是“已婚已育”,占比27.5%,在此基础上增加性别角度,进一步查看数据的分布,在四种婚姻状况男、女的比例较为平衡。

    数据参照来源:《谁说菜鸟不会数据分析之SPSS篇》

    展开全文
  • 在spss中打开数据,然后依次打开:analyze--descriptive--crosstabs,打开交叉表对话框2将性别放到行列表,将对读物的选择变量放到列,这样就构成了一个交叉表3接下来我们要设置输出的结果,点击statistics,打开一...

    在spss中打开数据,然后依次打开:analyze--descriptive--crosstabs,打开交叉表对话框

    2将性别放到行列表,将对读物的选择变量放到列,这样就构成了一个交叉表

    3接下来我们要设置输出的结果,点击statistics,打开一个新的对话框

    4勾选chi-square(卡方检验),勾选phi and cramer's V(衡量交互分析中两个变量关系强度的指标),点击continue,回到交叉表对话框

    5点击cells,设置cell中要展示的数据

    6在这里勾选observed(各单元格的观测次数),勾选row(行单元格的百分比),点击continue,回到交叉表对话框

    7点击ok按钮,输出检验结果

    8先看到的第一个表格就是交叉表,性别为行、选择的读物为列

    9卡方检验结果:我们主要是看pearson卡方检验,sig值小于0.05,因此我们认为不同的性别的人对周末读物的选择有显著的差别

    10最后一个表格,输出的是phi值和V值,两个都是代表两个变量之间的关系的紧密度的,数值小于0.1说明关系不紧密,即性别与周末读物的选择没有明显的关系,这个结论和上面的卡方检验有出入,所以我们需要进一步进行两两比较。

    展开全文
  • spss中交叉分析主要用来检验两个变量...spss交叉表分析方法与步骤:1、在spss中打开数据,然后依次打开:analyze--descriptive--crosstabs,打开交叉表对话框2、将性别放到行列表,将对读物的选择变量放到列,这样...

    spss中交叉分析主要用来检验两个变量之间是否存在关系,或者说是否独立,其零假设为两个变量之间没有关系。在实际工作中,经常用交叉表来分析比例是否相等。例如分析不同的性别对不同的报纸的选择有什么不同。

    spss交叉表分析方法与步骤:

    1、在spss中打开数据,然后依次打开:analyze--descriptive--crosstabs,打开交叉表对话框

    2、将性别放到行列表,将对读物的选择变量放到列,这样就构成了一个交叉表

    3、设置输出的结果,点击statistics,打开一个新的对话框

    4、勾选chi-square(卡方检验),勾选phi and cramer's V(衡量交互分析中两个变量关系强度的指标),点击continue,回到交叉表对话框

    5、点击cells,设置cell中要展示的数据

    6、在这里勾选observed(各单元格的观测次数),勾选row(行单元格的百分比),点击continue,回到交叉表对话框

    7、点击ok按钮,输出检验结果

    8、先看到的第一个表格就是交叉表,性别为行、选择的读物为列

    9、卡方检验结果:主要看pearson卡方检验,sig值小于0.05,因此认为不同的性别的人对周末读物的选择有显著的差别

    10、最后一个表格,输出的是phi值和V值,两个都代表两个变量之间的关系的紧密度,数值小于0.1说明关系不紧密,即性别与周末读物的选择没有明显的关系,这个结论和上面的卡方检验有出入,所以需要进一步进行两两比较。

    ▼2、将性别放到行列表,将对读物的选择变量放到列,这样就构成了一个交叉表

    ▼4、勾选chi-square(卡方检验),勾选phi and cramer's V(衡量交互分析中两个变量关系强度的指标),点击continue,回到交叉表对话框

    ▼6、在这里勾选observed(各单元格的观测次数),勾选row(行单元格的百分比),点击continue,回到交叉表对话框 

    ▼8、先看到的第一个表格就是交叉表,性别为行、选择的读物为列 

    ▼9、卡方检验结果:主要看pearson卡方检验,sig值小于0.05,因此认为不同的性别的人对周末读物的选择有显著的差别 

    ▼10、最后一个表格,输出的是phi值和V值,两个都代表两个变量之间的关系的紧密度,数值小于0.1说明关系不紧密,即性别与周末读物的选择没有明显的关系,这个结论和上面的卡方检验有出入,所以需要进一步进行两两比较。

    中文:

    是否死亡放置于行好一些;“精确”为默认,“统计量”选卡方和Phi;“单元显示”将计数和百分比全选,“格式”为默认。 

    选择上右图风险==》unadjusted odds

    ratios (OR) and 95% confidence intervals (95% CI) of

    variables.

    结果:

    Value=卡方值;df=自由度;ASYMP.sig=P值=相伴性概率。p大于0.05(自己设定的显著性水平),接受原假设,否则拒绝,即P值小于0.05认为结果有显著性差异。注意表格下面的注解:b.

    0 cells (.0%) have expected count less than 5. The minimum expected

    count is 191.89,这句话很重要,关系到结果是否可靠!理论频数小于5的cells(格子)比例不超过20,即小于5的格值数不应超过25%,或四分之一(25%)的格子理论数小于5

    。结果可靠,采用Pearson Chi-Square的P值-ASYMP.sig。当理论频数小于5的cells(格子)比例超过20%,应看Exact

    Test(确切概率法-Fisher's Exact

    Test)or

    连续性校正的值(Continuity Correction)。 需要在未校正卡方、校正卡方和确切概率法三种方法之间选择即可。

    给出的Asymp. Sig

    是通过卡方值算的。

    ▼天数与死亡的关系

    最常用的医学统计:

    TTest - 独立样板T检验,推断两个总体的总体的独立样本均值是否存在显著差异。Analyze→Compare

    mean→Paired-Samples T Test。T为负值表示前面一组样本的均值低于后面一组的均值。

    交叉表 - 不同的性别对不同疾病的选择有什么不同用此分析法,即卡方检验,卡方检验

    三组以上比较 - 比较均值 -》单因素anova

    Logist 回归 - 确定两种或两种以上变数间是否相关、相关方向与强度,即相互依赖的定量关系

    SPSS中的单因素方差分析中,各项指标的含义

    1)、Mean: 平均数,均数

    2)、Std.Deviation: 标准差

    3)、Std.Error:标准误

    4)、Confidence Intercal for Mean:均数的可信区间

    5)、Lower Bound:均数的可信区间的下限

    6)、Upper Bound:均数的可信区间的上限

    7)、Minimum:最小值

    8)、Maximum:最大值

    9)、Sum of Squares:平方和,离均差平方和,即SS

    10)、df:degree of freedom,自由度

    11)、Mean Square:圴方,即MS=SS/df

    12)、F:F值,两圴方之比

    展开全文
  • 目录背景调查问卷的目的交叉表的使用展现形式重要指标的细分假设检验的引入利用Python生成交叉表获得原始数据表格生成逻辑图代码示例结果分析小结 背景 现如今,社交媒体已成为各大品牌商公认的重要营销渠道。品牌商...

    背景

    现如今,社交媒体已成为各大品牌商公认的重要营销渠道。品牌商们除了在各类社交平台建立自己的营销账号外,每年还会花费数以亿计的资金与知名的媒体节目,明星,自媒体们合作。虽然相较于传统营销渠道,社交媒体透过流量的红利有着低成本高触达的优点,但高度密集的营销信息也让人们逐渐失去了互动耐心,高成本的广告投资常常仅换来社交用户几秒钟的注意力,所以如何利用好社交媒体海量的数据信息十分重要。

    一般情况下,用户的行为分析主要分为三类:1. 用户数据分析与监控 2.调查问卷 3. 访谈。其中第一类和第二类是了解用户需求比较常见的方式。今天我主要想聊一聊第二类方式的目的以及知名品牌商们比较青睐的结果展现形式。

    调查问卷的目的

    尽管社交媒体本身具备快速获取海量数据的优点,但仅通过用户数据本身并不能百分百反应用户的真实需求。而一份调查面广,靶点清晰的用户调研问卷可以在一定程度上弥补这一缺点。例如,Dropbox在推广早期升级版本时有过一段很长时间的增长瓶颈期,数据分析师们从用户的使用数据中发现,大多数活跃用户都没有使用升级版本。他们不断推出试用版本,不断优化升级版的用户体验,但仍收效甚微。直到Dropbox引进了新的增长团队,做了一次用户调研,才发现大部分的用户根本不知道Dropbox推出了升级版本,新版本的试用引导路线也十分不明确。产品部这才意识到,增长的起点并不是升级版本身,而是升级版本需要有更加直观清晰的引导策略。

    对于社交媒体营销而言,用户调研问卷也行使着相似的功能,品牌商们也可从中了解到营销广告让人过目不忘的程度,用户们的接受程度,验证营销合作对象对用户群体的实际影响价值等等。这种做法可以让产品以及市场人员对需求与业务流程建立更直观的认识并且更容易获得一些常被忽略的细节。

    交叉表的使用

    相较于透视表,交叉表更适合于呈现复杂且多维度的用户调研结果。同一个问题,可以在不同维度下展示。例如,我想知道,在过去的两天中,用户是否能回想起我们公司与某媒体合作的广告。除了了解整体数据,将这个问题放在多个维度下去解析会更加准确且快速地察觉到不同用户画像间的区别 —— 我可以了解到参与了营销博文互动的用户是否对广告的印象更深刻,又或是,参与了互动且能回想起营销内容的25岁以上的用户是否更喜欢我所选择的营销合作对象,等等。

    以下就是一种常见的用户调研结果的展现形式。除了每个维度下的统计数据,我们还可以直接计算出问题中每个选项的横向与纵向占比。
    在这里插入图片描述

    假设检验的引入

    但如何才能验证参与了营销互动的用户比未参与互动的用户对广告的印象更深刻呢?

    假设检验以及卡方分析就是一种比较常见的,用来研究两个定类变量间是否独立即是否存在某种关联性的方法。例如,针对第一个问题,Null Hypothesis可以设定为:是否参与营销博文互动与广告让人过目不忘的程度之间没有关联。而我们可以引入p-value(假设检验为真的概率)来验证假设是否成立。

    在计算P-value之前,我们需要设定significance level, 当P-value小于该significance level时,我们拒绝原假设,证明两者之间有关联。

    利用Python生成交叉表
    获得原始数据

    以下是一个简单的样本数据,每一列都代表一个问题(维度)。
    在这里插入图片描述

    表格生成逻辑图

    ① 简单的二联表
    在这里插入图片描述
    ② 稍复杂的三联表
    在这里插入图片描述

    代码示例

    1. 获得原始数据

    import pandas as pd
    from scipy.stats import chi2_contingency
    from scipy.stats import chi2
    import numpy as np
    import warnings
    warnings.filterwarnings("ignore")
    
    # General Purpose Crosstab Generator (GPCG)
    
    def dataRead(File):
        
        global data,data1,data2    #将变量设为全局变量
        data = pd.read_excel(File)
        
    #    data = data[data.gender == 'Female']
        data1 = data[data.engager == "No"]
        data2 = data[data.engager == "Yes"]
    
        global y
        global z
        y = data['recall']
        z = data['engager']
        
    dataRead("Survey.xlsx")
    

    2. 交叉表的生成 -- ① 简单二联表
    根据以上的示例图,我们将年龄表格左侧的第一个维度,是否记得营销广告作为分组的第二个维度。

    ## ① ## 
    ## 建立一个简单的交叉表,且横向维度只有Yes和No
    def type1(question,fix,Index):
        a = pd.crosstab(question, fix, margins=True)
        a['Non'] = a['No']
        a['Yep'] = a['Yes']
        a = a.drop('No',axis=1)
        a = a.drop('Yes',axis=1)
        a = a.drop('All', axis = 1)
        a = a.fillna(0)
        a = a.reindex(Index)  #按照想要的方式排序
        a.to_clipboard(excel=True)
        return a
    

    在这里插入图片描述

    ## ② ## 
    ## 在简单的交叉表下方添加假设检验的结果
    def p_val(val):
        if val < 0.05:
            return "<0.05"
        elif val < 0.1:
            return "<0.1"
        elif val < 0.15:
            return "<0.15"
        else:
            return ">0.15"
        
    def chsq_test(question,c,Index):
        chsq_rlt=[]
        C=type1(question,c,Index)
        C1=C.iloc[1:,[0,1]]
        # remove all zeroes
        try:
            C1=C1[(C1.T != 0).any()]
            chsq_rlt.append(p_val(chi2_contingency(C1)[1]))
            # rename the column of the dataframe in order to merge p-vlue with crosstab
            b = pd.DataFrame(chsq_rlt).transpose()
            b["Non"] = b[0]
            b["Yep"] = ""            
            b = b.drop([0], axis = 1)
            b = b.rename({0:"p-value"})
            C = C.append(b)
        except:
            pass   
        return C
    

    在这里插入图片描述

    ## ③ ## 
    ## 按照交叉表模板添加每个选项所对应的百分比
    ## convert numbers into percentage
    def percent(X):
        A=X
        L=[[]]
        for i in range(0,len(A[0])):
            L[0].append("{:.1%}".format(A[0][i]))
        return np.array(L)
        
    def percentage1(question1,question2,Index_list,order):
        all_data=pd.DataFrame()
        p=chsq_test(question1,question2,Index_list)
        p=p.reset_index()
        List=p['index'].to_list()[:-1]
        if Text in Text_List:
            for i in range(1,len(p)-1):
                all_data=all_data.append(p[i:i+1])
                all_data=all_data.append(pd.DataFrame(percent(p[i:i+1].iloc[:,1:3].values / p[0:1].iloc[:,1:3].values), columns=p.iloc[:,1:3].columns))
                all_data=all_data.fillna('vert'+'%'+List[i])
                all_data=all_data.append(pd.DataFrame(percent(p[i:i+1].iloc[:,1:3].values / p[i:i+1].iloc[:,1:3].values.sum()), columns=p.iloc[:,1:3].columns))
                all_data=all_data.fillna('hori'+'%'+List[i])
            all_data=all_data.append(p[len(p)-1:len(p)])
            return  all_data[order]
    

    在这里插入图片描述
    在计算每一个问题所对应的的百分比时,有两点需要注意。1. DataFrame在做行与行之间的计算时,需要将数据格式改为Series。 2. 将结果转化为百分比时,可以采用"{:.1%}".format(A)。

    2. 交叉表的生成 -- ② 简单三联表
    其实三联表与二联表不用的地方在于我们需要将数据事先分为两组,生成两组索引相同的交叉表,然后再拼接起来。

    ## ① ## 
    ## 建立稍复杂的交叉表,且横向有两种维度(选项为两种维度的排列组合)
    # 1. 只需要将数据集按照是否参与营销互动分成两个数据集,分别利用type1()生成各自的交叉表
    # 2. 将两个交叉表拼接起来
    data1=data[data.engager=='No'] #根据是否参与营销互动,将数据分为的两部分
    data1=data[data.engager=='Yes']
    def combination1(question_str,Index_list):
        group = []
        groupings = [(data1, y), (data2, y)]
        keyGroup = ['Non-Engagers / Recall', 'Engagers / Recall']
        for element in groupings:
            group.append(chsq_test(element[0][question_str], element[1],Index_list))    
        result = pd.concat(group, keys = keyGroup, axis = 1)
        
        result = result.fillna(0)
        result.to_clipboard(excel=True)
        return(result)
    

    在这里插入图片描述

    ## ② ## 
    ## 计算行、列百分比
    def percentage3(question,Text,Index_list):
        all_data=pd.DataFrame()
        p=combination1(question,Index_list)
        p=p[Text].reset_index()
        List=p['index'].to_list()[:-1]
        for i in range(1,len(p)-1):
            all_data=all_data.append(p[i:i+1])
            all_data=all_data.append(pd.DataFrame(percent(p[i:i+1].iloc[:,1:5].values / p[0:1].iloc[:,1:5].values), columns=p.iloc[:,1:5].columns))
            all_data=all_data.fillna('vert'+'%'+List[i])
            all_data=all_data.append(pd.DataFrame(percent(p[i:i+1].iloc[:,1:5].values / p[i:i+1].iloc[:,1:5].values.sum()), columns=p.iloc[:,1:5].columns))
            all_data=all_data.fillna('hori'+'%'+List[i])
        all_data=all_data.append(p[len(p)-1:len(p)])
        return  all_data[['index','Non-Engagers / Recall','Engagers / Recall']]
    

    在这里插入图片描述
    2. 交叉表的生成 -- ③ 复杂二联表
    当二联表中每个维度所涉及的分组越多时,越有可能会出现某些选项的统计结果为零的情况,但我们仍然要将这些结果展现在表格里。但这就意味着我们的交叉表中会有至少一列的数据全为0,那么这种情况我们是无法计算P-value的。所以以下的例子中不含P-value的结果。

    ## ① ## 
    ## 建立有分组的简单的交叉表,且横向一种维度(几个选项)
    
    def type2(question,fix,Index_list,col_name,options):
        a = pd.crosstab(question, fix, margins=True)
        for i in options:
            if i in a.columns: 
                pass
            else: #如果某个选项没有数据,那就将其结果设为0
                a[i]=0 
        a['Total positives'] = a['Much more positive']+a['Somewhat more positive']+a['No Change, was already positive']
        a['Somewhat/ much more positive'] = a['Much more positive']+a['Somewhat more positive']
        a['Total Negatives'] = a['Much more negative']+a['Somewhat more negative']+a['No change, was already negative']
        a['Somewhat/ much more negative'] = a['Much more negative']+a['Somewhat more negative']
        ## 将列名依照要求排列
    
        a = a[col_name]
        a = a.fillna(0)
        a = a.reindex(Index_list)
        a.to_clipboard(excel=True)
        return a
    

    在这里插入图片描述

    ## ② ## 计算P-value
    
    def chsq_test2(question,c,Index_list,col_name,options):
        chsq_rlt=[]
        C=type2(question,c,Index_list,col_name,options)
        C1=C.iloc[1:,:]
        # remove all zeroes
        try:
            C1=C1[(C1.T != 0).any()]
            chsq_rlt.append(p_val(chi2_contingency(C1)[1]))
            # rename the column of the dataframe in order to merge p-vlue with crosstab
            b = pd.DataFrame(chsq_rlt).transpose()
            b[col_name[0]] = b[0]
            b = b.fillna(" ")
            b = b.rename({0:"p-value"})
            C = C.append(b)
        except:
            pass   
        return C[col_name]
    
    def percentage2(question,c,Index_list,col_name,options):
        all_data=pd.DataFrame()
        p=chsq_test2(question,c,Index_list,col_name,options)
        p=p.reset_index()
        if 'p-value' in p.iloc[:,0].to_list():
            List=p.iloc[:,0].to_list()[:-1]
            for i in range(1,len(p)-1):
                all_data=all_data.append(p[i:i+1])
                all_data=all_data.append(pd.DataFrame(percent(p[i:i+1].iloc[:,1:len(col_name)+1].values / p[0:1].iloc[:,1:len(col_name)+1].values), columns=p.iloc[:,1:len(col_name)+1].columns))
                all_data=all_data.fillna('vert'+'%'+List[i])
                all_data=all_data.append(pd.DataFrame(percent(p[i:i+1].iloc[:,1:len(col_name)+1].values / p[i:i+1].iloc[:,[1,3]].values.sum()), columns=p.iloc[:,1:len(col_name)+1].columns))
                all_data=all_data.fillna('hori'+'%'+List[i])
            all_data=all_data.append(p[len(p)-1:len(p)])
        else:
            List=p.iloc[:,0].to_list()
            for i in range(1,len(p)):
                all_data=all_data.append(p[i:i+1])
                all_data=all_data.append(pd.DataFrame(percent(p[i:i+1].iloc[:,1:len(col_name)+1].values / p[0:1].iloc[:,1:len(col_name)+1].values), columns=p.iloc[:,1:len(col_name)+1].columns))
                all_data=all_data.fillna('vert'+'%'+List[i])
                all_data=all_data.append(pd.DataFrame(percent(p[i:i+1].iloc[:,1:len(col_name)+1].values / p[i:i+1].iloc[:,[1,3]].values.sum()), columns=p.iloc[:,1:len(col_name)+1].columns))
                all_data=all_data.fillna('hori'+'%'+List[i])
            b=pd.DataFrame(columns=p.columns)
            b.loc[5] = 0
            b[p.columns[0]] = "p-value"
            b = b.replace(0," ")
            all_data = all_data.append(b)
        col_list=[p.columns[0]]
     
        for j in col_name:
            col_list.append(j)
        return  all_data[col_list]
    
    展开全文
  • join分组聚合透视表与交叉表项目:分析影响学生成绩的因素 apply函数 pandas提供了apply函数方便的处理Series与DataFrame;apply函数支持逐一处理数据集中的每个元素都会执行一次目标函数,把返回值存入结果集中。...
  • 交叉表查询

    千次阅读 2012-06-27 00:29:07
    简单交叉表查询  如果对于统计的项数是已知的,或着说个数不多,容易枚举的,举例如下:     ...如果对于统计的项数是未知的,或者项数... 2) 使用存储过程,动态生成交叉表查询语句,并借助临时表来存储统计结果
  • pandas数据规整dataframe转array数组df.values # 直接将dataframe转换为array数组pd.DataFrame(arr) # 直接将数组转为DataFrame,还可以有...结果类型都是object,object就是字符串的意思查询非空元素的个数s.cou...
  • 提出用一种等效模场匹配法分析空间交叉波导耦合特性, 将矩形波导的场分布看成是对圆对称光纤场分布的微扰, 解决了对角区场分布的表达, 从而计算空间交叉波导的耦合长度, 并用三维全矢量光束传输法验证了分析结果。...
  • 问题与数据1为A、B两种闪烁液测定血浆中3H-cGMP的交叉试验结果。第1阶段1、3、4、7、9号用A测定,2、5、6、8、10号用B测定;第2阶段1、3、4、7、9号用B测定,2、5、6、8、10号用A测定,试对交叉试验结果进行分析。...
  • Python交叉分析学习笔记 本文将介绍两种方法来进行交叉分析:1.T检验 2.数据透视,数据源:百度网盘,课程来源:慕课网 方法1:独立T检验 任意取两个属性,根据独立T检验结果,判断两者之间的关系 1.导入数据 df=...
  • 在调查问卷中,总会设计一部分多项选择题,对于多选题,一般是统计其各选项的频数和百分比结果。SPSS提供了专门的多选题频数分析统计分析功能——多重响应。01先看案例您拥有以下哪些品牌的贵宾卡? (1)班尼路(2)...
  • 百分比同质性检验案例:某高中校长想要调查该校学生对食堂的满意程度...Step 2:选择【分析】——【描述统计】——【交叉表】,将“年级”选到右边【行】中,将“满意度”选到右边【列】中,点击【单元格】。Step 3...
  • 之前的学习多为在一张上的操作,本篇主要通过以行方向(竖)为单位的集合运算符和以列方向(横)为单位的联结,将多张表中的数据进行组合。什么是集合运算?...联结可以分为交叉联结、内联结、左联结、右...
  • Mysql 多联合查询效率分析及优化

    万次阅读 多人点赞 2010-07-13 15:23:00
    1. 多连接类型 1. 笛卡尔积(交叉连接) 在MySQL中可以为CROSS JOIN或者省略CROSS即JOIN,或者使用',' 如: SELECT * FROM table1 CROSS JOIN table2 SELECT * FROM table1 JOIN table2 SELECT * FROM table1,...
  • 实际分析应用中经常遇到需要交叉表的情况,它能够从不同维度组合分析业务。关系型数据库一般通过 group by 或 Pivot实现,很幸运,Elasticsearch也有类似功能。本文带你了解强大的组合分析,其中示例大多数来自官网...
  • 用SPSS分析甲乙丙三名推销员的对ABC三类产品的销售数据有无显著差异 数据如下: 导入数据 将销量进行加权 点击分析-描述统计–交叉表结果 当表格是2X2的时候得到结果如下:
  • 3.5列联表分析

    2018-02-22 12:44:00
    一 .计算频率 proc freq data=data-set-name; tables var1; run;.../* 输出结果:frequency,percent,cumulative frequency,...制交叉表cross tabulation proc freq data=data-set-name; tables x*y; r...
  • 该工具将监视,评估和报告(MER)叙述与指标结果进行三角划分。 叙事三角剖分工具采用了MER叙事和MER结构化数据集(MSD),可在两个数据源之间进行交叉过滤。 导入所需的数据源后,可以使用MER指示器使用数据透视...
  • 运用光束传播法对硅交叉波导全内反射光开关中的光学效应进行了详细分析结果表明:1)光学表面衰减波和泄漏波所引发的光遂道效应对开关特性有重要影响;2)反射端光功率的相对大小与反射区界面位置密切相关,其起因是...
  • 笛卡尔积(交叉连接) 在MySQL中可以为CROSS JOIN或者省略CROSS即JOIN,或者使用',' 如:1.SELECT * FROM table1 CROSS JOIN table22.SELECT * FROM table1 JOIN table23.SELECT * FROM table1,table2由于其返回的结果...
  • 笛卡尔积(交叉连接) 在MySQL中可以为CROSS JOIN或者省略CROSS即JOIN,或者使用','如: SELECT * FROM table1 CROSS JOIN table2 SELECT * FROM table1 JOIN table2 SELECT * FROM table1,table2由于其返回的结果为被...
  • 本章内容涵盖交叉分析和篮子分析9.1 交叉分析商业场景:图9.1.1所示的为本节案例(调查问卷交叉分析)的分析结果,通过交义分析有助于找出问卷问题1(您的工作属于哪一类?)的答案与问题2(您愿意购买多少元的SSBI教材?)的...
  • 笛卡尔积(交叉连接)在MySQL中可以为CROSS JOIN或者省略CROSS即JOIN,或者使用',' 如:SELECT*FROMtable1CROSSJOINtable2SELECT*FROMtable1JOINtable2SELECT*FROMtable1,table2由于其返回的结果为被连接的两个数据...
  •  由于其返回的结果为被连接的两个数据的乘积,因此当有WHERE, ON或USING条件的时候一般不建议使用,因为当数据项目太多的时候,会非常慢。一般使用LEFT [OUTER] JOIN或者RIGHT [OUTER] JOIN  2. 
  • 笛卡尔积(交叉连接)在MySQL中可以为CROSS JOIN或者省略CROSS即JOIN,或者使用',' 如:SELECT * FROM table1 CROSS JOIN table2 SELECT * FROM table1 JOIN table2 SELECT * FROM table1,table2由于其返回的结果为被...
  • 七、分析结果共享

    2018-08-10 09:46:05
    一、导出和发布数据: 1.通过将数据复制到剪贴板导出数据 在视图上右击并在弹出菜单上单击“全选”,或者在视图上右击并在弹出菜单上... 还可以在视图上右击,并在弹出菜单上选择“复制”➤“交叉表”,从而把...
  • 笛卡尔积(交叉连接) 在MySQL中可以为CROSS JOIN或者省略CROSS即JOIN,或者使用',' 如:SELECT * FROM table1 CROSS JOIN table2SELECT * FROM table1 JOIN table2SELECT * FROM table1,table2由于其返回的结果为被...
  • 笛卡尔积(交叉连接) 在MySQL中可以为CROSS JOIN或者省略CROSS即JOIN,或者使用',' 如:SELECT * FROM table1 CROSS JOIN table2SELECT * FROM table1 JOIN table2SELECT * FROM table1,table2由于其返回的结果为被...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 415
精华内容 166
关键字:

交叉表结果分析