精华内容
下载资源
问答
  • 交叉表: 作用: 交叉表是一种用于计算分组频率的特殊透视图,对数据进行汇总 考察预测数据和正式数据的对比情况,一个作为行,一个作为列 案例: 医院预测病人病情: 真实病情如下数组(B:有病,M:没病) ...

    一.交叉表:

    作用:

    交叉表是一种用于计算分组频率的特殊透视图,对数据进行汇总

    考察预测数据和正式数据的对比情况,一个作为行,一个作为列

    案例:

    医院预测病人病情:

    真实病情如下数组(B:有病,M:没病)

    true = np.load("./cancer_true.npy")     #load()加载数据
    true

    算法预测病情数据如下:

    predict = np.load("./cancer_predict.npy")
    predict

    现在要知道预测结果有多少预测正确,多少预测失败

    使用交叉表:

    #使用交叉表,调用crosstab()函数。

    参数如下:

    ['index', 'columns', 'values=None', 'rownames=None', 'colnames=None', 'aggfunc=None', 'margins=False', "margins_name='All'", 'dropna=True', 'normalize=False'],

    预测结果:

    pd.crosstab(index = true,columns=predict,rownames = ["确诊"],colnames = ["预测"],margins=True)

    可以看到预测正确的结果有36+17个,2个漏诊,2个误诊

     

    二.透视表:

    它根据一个或多个键对数据进行聚合,并根据行和列上的分组键将数据分配到各个矩形区域中

    分组查看数据,和数据库中的group by是相同的功能。

     

    案例:

    分析人的使用左右手跟情商(eq)、智商(iq)的关系

     添加数据(伪造)

    df =DataFrame({"HAND":np.random.randint(0,10,size = 200),"sex":np.random.randint(0,2,size = 200),"iq":np.random.randint(0,100,size =200),"eq":np.random.randint(0,100,size = 200)})
    df

    (部分数据)

     

     对数据进行处理:

    使用透视表:

    调用pivot_table()函数

    参数有:

    ['data', 'values=None', 'index=None', 'columns=None', "aggfunc='mean'", 'fill_value=None',
    'margins=False', 'dropna=True', "margins_name='All'"],

    pd.set_option("display.float_format",lambda x:"%0.1f"%(x))

    pd.pivot_table(data = df,values = ["iq","eq"],index = ["HAND","sex"],aggfunc= "mean",margins = True)

     

    通过表分析字段之间的关系。

     

    转载于:https://www.cnblogs.com/kuangkuangduangduang/p/10273857.html

    展开全文
  • 机器学习特征工程案例。 知识点:合并表:merge,交叉表:crosstab,主成分分析:from sklearn.decomposition import PCA

    目标:特征降维处理主成分分析APA

    方法:

    关联表:user_id---->aisle
    
    交叉表:构造每个用户购买了哪些物品细分类别的商品及数量
    
    降维处理:主成分分析APA
    

    数据来源:https://www.kaggle.com/c/instacart-market-basket-analysis/data

    ·order_products_prior.csv:订单与商品信息
        。字段:order_id,product_id,add_to_cart_order,reordered
        。解释:订单id,产品id,加入购物车订单,再次订购(不止一次订购)
    ·products.csv:商品信息
        。字段:product_id,product_name,aisle_id,department_id
        。解释:产品id,产品名称,物品类别id,产品大分类id
    ·orders.csv:用户的订单信息
        。字段:order_id,user_id,eval_set,order_number,order_dow,order_hour_of_day,days_since_prior_order
        。解释:订单编号,用户编号,评价等级,订单数量,星期几,当天的购买时段h,距离预定日期的天数
    ·aisles.csv:商品所属具体物品类别
        。字段:aisle_id,aisle 
        。解释:物品细分类别id,物品细分类别名称
    
    import numpy as np
    import pandas as pd
    #获取数据
    aisles = pd.read_csv(r"E:\instacart-market-basket-analysis\aisles.csv",sep=",",encoding="utf-8")
    orders = pd.read_csv(r"E:\instacart-market-basket-analysis\orders.csv",sep=",",encoding="utf-8")
    products = pd.read_csv(r"E:\instacart-market-basket-analysis\products.csv",sep=",",encoding="utf-8")
    order_products_prior = pd.read_csv(r"E:\instacart-market-basket-analysis\order_products__prior.csv",sep=",",encoding="utf-8")
    
    #查验数据
    display(aisles.head(3))
    display(orders.head(3))
    display(products.head(3))
    display(order_products_prior.head(3))
    
    aisle_id aisle
    0 1 prepared soups salads
    1 2 specialty cheeses
    2 3 energy granola bars
    order_id user_id eval_set order_number order_dow order_hour_of_day days_since_prior_order
    0 2539329 1 prior 1 2 8 NaN
    1 2398795 1 prior 2 3 7 15.0
    2 473747 1 prior 3 3 12 21.0
    product_id product_name aisle_id department_id
    0 1 Chocolate Sandwich Cookies 61 19
    1 2 All-Seasons Salt 104 13
    2 3 Robust Golden Unsweetened Oolong Tea 94 7
    order_id product_id add_to_cart_order reordered
    0 2 33120 1 1
    1 2 28985 2 1
    2 2 9327 3 0
    import time
    #关联表:user_id---->aisle
    data01 = pd.merge(orders,order_products_prior,how='inner',on=["order_id","order_id"])
    time.sleep(15)
    data02 = pd.merge(data01,products,on=["product_id","product_id"])
    
    data03 = pd.merge(data02,aisles,on=["aisle_id","aisle_id"])
    time.sleep(3)
    
    display(data03.shape,data03.tail(10000))
    
    (32434489, 14)
    
    order_id user_id eval_set order_number order_dow order_hour_of_day days_since_prior_order product_id add_to_cart_order reordered product_name aisle_id department_id aisle
    32424489 2542240 75675 prior 12 5 12 5.0 44471 7 1 Free & Clear Unscented Baby Wipes 82 18 baby accessories
    32424490 3260483 75675 prior 16 0 9 14.0 44471 21 1 Free & Clear Unscented Baby Wipes 82 18 baby accessories
    32424491 2196407 75675 prior 30 0 11 12.0 44471 9 1 Free & Clear Unscented Baby Wipes 82 18 baby accessories
    32424492 532672 75675 prior 38 5 13 7.0 44471 20 1 Free & Clear Unscented Baby Wipes 82 18 baby accessories
    32424493 1705047 75675 prior 39 5 13 0.0 44471 20 1 Free & Clear Unscented Baby Wipes 82 18 baby accessories
    32424494 998672 75675 prior 48 5 14 11.0 44471 13 1 Free & Clear Unscented Baby Wipes 82 18 baby accessories
    32424495 2149746 75675 prior 49 6 9 8.0 44471 6 1 Free & Clear Unscented Baby Wipes 82 18 baby accessories
    32424496 483804 75804 prior 12 6 15 4.0 44471 19 0 Free & Clear Unscented Baby Wipes 82 18 baby accessories
    32424497 1783191 76027 prior 6 4 16 13.0 44471 13 0 Free & Clear Unscented Baby Wipes 82 18 baby accessories
    32424498 3074202 76027 prior 7 2 15 5.0 44471 8 1 Free & Clear Unscented Baby Wipes 82 18 baby accessories
    32424499 431155 76081 prior 8 0 14 16.0 44471 8 0 Free & Clear Unscented Baby Wipes 82 18 baby accessories
    32424500 2879529 76238 prior 36 6 10 6.0 44471 25 0 Free & Clear Unscented Baby Wipes 82 18 baby accessories
    32424501 1652877 76238 prior 39 5 10 6.0 44471 10 1 Free & Clear Unscented Baby Wipes 82 18 baby accessories
    32424502 737972 76466 prior 20 0 10 7.0 44471 7 0 Free & Clear Unscented Baby Wipes 82 18 baby accessories
    32424503 3154632 76556 prior 80 3 18 2.0 44471 7 0 Free & Clear Unscented Baby Wipes 82 18 baby accessories
    32424504 1776861 76576 prior 7 0 15 7.0 44471 2 0 Free & Clear Unscented Baby Wipes 82 18 baby accessories
    32424505 2695824 76726 prior 4 0 11 28.0 44471 26 0 Free & Clear Unscented Baby Wipes 82 18 baby accessories
    32424506 3176388 76823 prior 1 6 12 NaN 44471 19 0 Free & Clear Unscented Baby Wipes 82 18 baby accessories
    32424507 1441764 76866 prior 13 0 16 25.0 44471 7 0 Free & Clear Unscented Baby Wipes 82 18 baby accessories
    32424508 2888446 76868 prior 17 5 10 16.0 44471 19 0 Free & Clear Unscented Baby Wipes 82 18 baby accessories
    32424509 2670733 77148 prior 19 1 9 12.0 44471 24 0 Free & Clear Unscented Baby Wipes 82 18 baby accessories
    32424510 2328300 77187 prior 1 1 9 NaN 44471 1 0 Free & Clear Unscented Baby Wipes 82 18 baby accessories
    32424511 1923581 77229 prior 21 3 11 17.0 44471 2 0 Free & Clear Unscented Baby Wipes 82 18 baby accessories
    32424512 2042750 77229 prior 24 0 14 12.0 44471 6 1 Free & Clear Unscented Baby Wipes 82 18 baby accessories
    32424513 2685754 77238 prior 2 0 9 6.0 44471 5 0 Free & Clear Unscented Baby Wipes 82 18 baby accessories
    32424514 1401197 77265 prior 6 1 5 9.0 44471 8 0 Free & Clear Unscented Baby Wipes 82 18 baby accessories
    32424515 2917195 77265 prior 10 4 20 5.0 44471 4 1 Free & Clear Unscented Baby Wipes 82 18 baby accessories
    32424516 1321674 77265 prior 31 0 10 11.0 44471 2 1 Free & Clear Unscented Baby Wipes 82 18 baby accessories
    32424517 1268589 77265 prior 37 1 18 29.0 44471 7 1 Free & Clear Unscented Baby Wipes 82 18 baby accessories
    32424518 3044303 77280 prior 23 4 23 1.0 44471 3 0 Free & Clear Unscented Baby Wipes 82 18 baby accessories
    ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
    32434459 814403 161964 prior 10 6 12 5.0 26478 20 0 Frozen Apple Juice 113 1 frozen juice
    32434460 503516 175436 prior 4 5 16 13.0 26478 18 0 Frozen Apple Juice 113 1 frozen juice
    32434461 385156 183189 prior 4 1 23 22.0 26478 2 0 Frozen Apple Juice 113 1 frozen juice
    32434462 471382 85005 prior 7 5 0 13.0 24344 1 0 Frozen Concentrate Non-Alcoholic Pina Colada 113 1 frozen juice
    32434463 1833016 92263 prior 5 2 13 8.0 24344 2 0 Frozen Concentrate Non-Alcoholic Pina Colada 113 1 frozen juice
    32434464 2624885 136840 prior 2 6 10 4.0 24344 11 0 Frozen Concentrate Non-Alcoholic Pina Colada 113 1 frozen juice
    32434465 1604793 136840 prior 6 5 10 3.0 24344 17 1 Frozen Concentrate Non-Alcoholic Pina Colada 113 1 frozen juice
    32434466 3154099 136840 prior 16 2 16 3.0 24344 4 1 Frozen Concentrate Non-Alcoholic Pina Colada 113 1 frozen juice
    32434467 3135581 151840 prior 70 0 9 1.0 24344 6 0 Frozen Concentrate Non-Alcoholic Pina Colada 113 1 frozen juice
    32434468 3297537 181495 prior 2 1 14 15.0 24344 9 0 Frozen Concentrate Non-Alcoholic Pina Colada 113 1 frozen juice
    32434469 823196 181495 prior 3 1 14 0.0 24344 1 1 Frozen Concentrate Non-Alcoholic Pina Colada 113 1 frozen juice
    32434470 2471510 107801 prior 8 6 15 4.0 5500 19 0 Blended Juice Beverage, Mango Orange 113 1 frozen juice
    32434471 2181814 135090 prior 5 3 14 10.0 5500 3 0 Blended Juice Beverage, Mango Orange 113 1 frozen juice
    32434472 962734 167413 prior 1 1 12 NaN 5500 9 0 Blended Juice Beverage, Mango Orange 113 1 frozen juice
    32434473 2928960 167413 prior 4 0 12 10.0 5500 3 1 Blended Juice Beverage, Mango Orange 113 1 frozen juice
    32434474 1393242 167413 prior 5 0 12 7.0 5500 21 1 Blended Juice Beverage, Mango Orange 113 1 frozen juice
    32434475 2601337 181750 prior 13 0 20 30.0 5500 2 0 Blended Juice Beverage, Mango Orange 113 1 frozen juice
    32434476 2125702 109046 prior 3 3 16 8.0 2642 3 0 Frozen Concentrated Orange Juice With Added Ca... 113 1 frozen juice
    32434477 2849065 138824 prior 1 6 13 NaN 2642 20 0 Frozen Concentrated Orange Juice With Added Ca... 113 1 frozen juice
    32434478 2634996 138824 prior 6 0 16 28.0 2642 15 1 Frozen Concentrated Orange Juice With Added Ca... 113 1 frozen juice
    32434479 1857751 181888 prior 2 0 7 10.0 2642 5 0 Frozen Concentrated Orange Juice With Added Ca... 113 1 frozen juice
    32434480 2131276 181888 prior 7 1 11 8.0 2642 6 1 Frozen Concentrated Orange Juice With Added Ca... 113 1 frozen juice
    32434481 1466142 181888 prior 9 3 14 16.0 2642 4 1 Frozen Concentrated Orange Juice With Added Ca... 113 1 frozen juice
    32434482 1022794 204495 prior 48 0 9 5.0 2642 9 0 Frozen Concentrated Orange Juice With Added Ca... 113 1 frozen juice
    32434483 3249444 204495 prior 50 6 14 4.0 2642 8 1 Frozen Concentrated Orange Juice With Added Ca... 113 1 frozen juice
    32434484 2231925 204495 prior 51 1 15 9.0 2642 8 1 Frozen Concentrated Orange Juice With Added Ca... 113 1 frozen juice
    32434485 327001 204495 prior 53 2 8 7.0 2642 1 1 Frozen Concentrated Orange Juice With Added Ca... 113 1 frozen juice
    32434486 1997103 110030 prior 4 2 16 5.0 24189 8 0 Tropical Fruit Smoothie Tasty American Favorites 113 1 frozen juice
    32434487 1362143 113181 prior 33 3 17 5.0 24189 12 0 Tropical Fruit Smoothie Tasty American Favorites 113 1 frozen juice
    32434488 777464 179210 prior 7 5 15 20.0 24189 16 0 Tropical Fruit Smoothie Tasty American Favorites 113 1 frozen juice

    10000 rows × 14 columns

    #构造交叉表user_id---->aisle
    data04 = pd.crosstab(data03["user_id"],data03["aisle"])
    display(data04.shape,data04.head(10))
    
    (206209, 134)
    
    aisle air fresheners candles asian foods baby accessories baby bath body care baby food formula bakery desserts baking ingredients baking supplies decor beauty beers coolers ... spreads tea tofu meat alternatives tortillas flat bread trail mix snack mix trash bags liners vitamins supplements water seltzer sparkling water white wines yogurt
    user_id
    1 0 0 0 0 0 0 0 0 0 0 ... 1 0 0 0 0 0 0 0 0 1
    2 0 3 0 0 0 0 2 0 0 0 ... 3 1 1 0 0 0 0 2 0 42
    3 0 0 0 0 0 0 0 0 0 0 ... 4 1 0 0 0 0 0 2 0 0
    4 0 0 0 0 0 0 0 0 0 0 ... 0 0 0 1 0 0 0 1 0 0
    5 0 2 0 0 0 0 0 0 0 0 ... 0 0 0 0 0 0 0 0 0 3
    6 0 0 0 0 0 0 0 0 0 0 ... 0 0 0 0 0 0 0 0 0 0
    7 0 0 0 0 0 0 2 0 0 0 ... 0 0 0 0 0 0 0 0 0 5
    8 0 1 0 0 0 0 1 0 0 0 ... 0 0 0 0 0 0 0 0 0 0
    9 0 0 0 0 6 0 2 0 0 0 ... 0 0 0 0 0 0 0 2 0 19
    10 0 1 0 0 0 0 0 0 0 0 ... 0 0 0 0 0 0 0 0 0 2

    10 rows × 134 columns

    # 主成分分析,保留n.n% 的信息
    from sklearn.decomposition import PCA
    import pandas as pd
    import numpy as np
     
    # 1、数据:使用上面代码生成的data04
    data = data04
    
    #2.实例化一个转换器类
    transfer = PCA(n_components=0.9) #实例化一个转换器类
        # n_components: ·小数:表示保留百分之多少的信息 ·整数:减少到多少特征
    #3.#调用fit_transform()
    xi = transfer.fit_transform(data) #调用fit_transform()
    #查看构成新的几个变量,查看单个变量的方差贡献率
    print(xi.shape,transfer.explained_variance_ratio_)  
    #4.输出新构造出来的主成分变量
    Fi=[ ]
    for i in range(1,xi.shape[1]+1):
        F="F" + str(i)
        Fi.append(F)
    data02 = pd.DataFrame(xi,columns=Fi)
    display(data02.head(3))
    
    (206209, 27) [0.48237998 0.09585824 0.05185877 0.03590181 0.0293466  0.02393094
     0.01899492 0.0183208  0.01487788 0.0134451  0.01121877 0.01102918
     0.01052171 0.00980307 0.00832174 0.00726185 0.00712991 0.00683061
     0.00640343 0.00580483 0.00534075 0.00487297 0.00477908 0.00462158
     0.00444346 0.00413755 0.00408034]
    
    F1 F2 F3 F4 F5 F6 F7 F8 F9 F10 ... F18 F19 F20 F21 F22 F23 F24 F25 F26 F27
    0 -24.215659 2.429427 -2.466370 -0.145686 0.269042 -1.432932 2.140677 -2.738031 -2.714316 -1.743135 ... -3.225987 -4.580076 0.777403 -3.699129 1.907214 2.995386 0.772923 0.686800 1.694394 -2.343230
    1 6.463208 36.751116 8.382553 15.097530 -6.920938 -0.978375 6.011567 3.787725 -8.180749 -9.040861 ... -0.737606 -0.737402 0.740042 -0.091338 5.151285 -4.584815 -3.237894 4.121213 2.446897 -4.283485
    2 -7.990302 2.404383 -11.030064 0.672230 -0.442368 -2.823272 -6.284140 6.512509 -2.148634 -1.585257 ... 5.434733 -3.604842 4.282794 -0.445834 3.039337 -1.469566 -2.946656 1.775345 -0.444194 0.786666

    3 rows × 27 columns

    展开全文
  • SPSS-多重响应--频率和交叉表分析,希望大家能够多提点提点 在云南电信网上营业厅做了一个关于“客户不使用电信3g业务的原因有哪些的问卷调查,问题所示: 这份问卷调查总更有35人参与,样本容量偏少,其中 1:...

    SPSS-多重响应--频率和交叉表分析,希望大家能够多提点提点

    在云南电信网上营业厅做了一个关于“客户不使用电信3g业务的原因有哪些的问卷调查,问题所示:

    这份问卷调查总更有35人参与,样本容量偏少,其中

    1:选择 A :3G资费过高的有 14人

    2:选择 B:  网络覆盖率低,信号不稳定的  15人

    3:选择 C:买手机太麻烦的  15人

    4:选择 D: 换手机号麻烦  15人

    5:选择 E: 3G功能用处不大 9人

    6:选择F: 朋友使用后,觉得不好  10人

    第一步:我们将 A , B, C , D , E ,F,六个答案选项分别做为一个单独的变量,分别赋值为“0”和“1”,0代表没有被选中,“1”代表被选中,这个就是所谓的“二分法”

    在SPSS中进行数据编码后,如下所示:

    点击“分析-多重响应---定义变量集---进入如下所示页面:

    根据如上图所示,填写变量集名称,标签,以及在”二分法” 计算值选项中填入“1”  再点击”添加“ 添加成后,点击”关闭“按钮

    再点击”分析-多重响应--频率分析----分析结果如下所示:

    上图结果很直观,结果,我就不分析了

    百分比=N/总计  =14/78=17.9%

    个案百分比=N/参与人数(有效人数)=14/33=42.4%

     

    下面来进行“交叉表”分析,如下所示:



    从上图可知:多重响应交叉表 中有“行,列,层”三个选框

    1:我们将“变量集" 移入”行“列表框内, 将”客户类型“移入”列框内,   层选框可以不选,有需要时再选,层选项框是用来分层进行统计分析的(我进行了分层,如上图所示)

    比如:我想计算每一个答案有多少被选中,有多少没有选中,可以采用分层,分为“选中”和“未选中”两个层次

    “客户类型”是指来进行“问卷调查”人的分类,分为“3g老客户”“3g一般客户” "很少用3g客户“”不用3g客户“等类型,

    点击“选项”进入如下所示页面:

    点击确定,可以得到如下结果:



    因为我们上图选中的“列”所以,计算的是列单元格百分比, 也进行了分层处理,分为“没有选中”和“选中”两个层次

    转载于:https://www.cnblogs.com/AnswerXin/p/3243691.html

    展开全文
  • 在10.1休假前,希望跟大家讨论一下SPSS-多重响应--频率和交叉表分析,希望大家能够多提点提点 在云南电信网上营业厅做了一个关于“客户不使用电信3g业务的原因有哪些的问卷调查,问题所示: 这份问卷调查总更有...

    在10.1休假前,希望跟大家讨论一下SPSS-多重响应--频率和交叉表分析,希望大家能够多提点提点

    在云南电信网上营业厅做了一个关于“客户不使用电信3g业务的原因有哪些的问卷调查,问题所示:

    这份问卷调查总更有35人参与,样本容量偏少,其中

    1:选择 A :3G资费过高的有 14人

    2:选择 B:  网络覆盖率低,信号不稳定的  15人

    3:选择 C:买手机太麻烦的  15人

    4:选择 D: 换手机号麻烦  15人

    5:选择 E: 3G功能用处不大 9人

    6:选择F: 朋友使用后,觉得不好  10人

    第一步:我们将 A , B, C , D , E ,F,六个答案选项分别做为一个单独的变量,分别赋值为“0”和“1”,0代表没有被选中,“1”代表被选中,这个就是所谓的“二分法”

    在SPSS中进行数据编码后,如下所示:

    点击“分析-多重响应---定义变量集---进入如下所示页面:

    根据如上图所示,填写变量集名称,标签,以及在”二分法” 计算值选项中填入“1”  再点击”添加“ 添加成后,点击”关闭“按钮

    再点击”分析-多重响应--频率分析----分析结果如下所示:

    上图结果很直观,结果,我就不分析了

    百分比=N/总计  =14/78=17.9%

    个案百分比=N/参与人数(有效人数)=14/33=42.4%

     

    下面来进行“交叉表”分析,如下所示:



    从上图可知:多重响应交叉表 中有“行,列,层”三个选框

    1:我们将“变量集" 移入”行“列表框内, 将”客户类型“移入”列框内,   层选框可以不选,有需要时再选,层选项框是用来分层进行统计分析的(我进行了分层,如上图所示)

    比如:我想计算每一个答案有多少被选中,有多少没有选中,可以采用分层,分为“选中”和“未选中”两个层次

    “客户类型”是指来进行“问卷调查”人的分类,分为“3g老客户”“3g一般客户” "很少用3g客户“”不用3g客户“等类型,

    点击“选项”进入如下所示页面:

    点击确定,可以得到如下结果:



    因为我们上图选中的“列”所以,计算的是列单元格百分比, 也进行了分层处理,分为“没有选中”和“选中”两个层次

    转载于:https://www.cnblogs.com/qiernonstop/p/3720492.html

    展开全文
  • 在运行交叉表查询之前,您需要:为人员,地点或其他实体创建案例,这些案例是您分析的重点。定义案例的人口统计属性。在案例和主题节点处编码您的源材料。NVivo质性分析软件中文最新版试用下载、官方教程和系列视频...
  • 分析基础篇(二):什么样的用户会选择离开 - 交叉列表统计案例背景:《黑猫拼图》的用户数本月比上月少了很多。通过确认,商业推广、游戏活动(版本)均没有大的改动。提出猜测,是某个用户群体出现了问题。通过...
  • 在运行交叉表查询之前,您需要:为人员,地点或其他实体创建案例,这些案例是您分析的重点。定义案例的人口统计属性。在案例和主题节点处编码您的源材料。NVivo质性分析软件中文最新版试用下载、官方教程和系列视频...
  • 主要是想分析出用户的ARPU掉档情况。 数据样式: jyputer代码如下: ​#第一题 import pandas as pd data=pd.read_excel('homework_1.xlsx',hearer=0,index_col=0) bins=list(range(0,5001,500)) data['7月AR....
  • 交叉表与透视表1 交叉表与透视表什么作用2 案例分析2.1 数据准备2.2 查看效果2.3 使用pivot_table(透视表)实现 1 交叉表与透视表什么作用 探究股票的涨跌与星期几有关? 以下图当中表示,week代表星期几,1,0代表这...
  • 在进行数据分析时遇到分类型数据,并且要研究两个分类变量之间的相关关系,基于均值、方差的分析方法不能够使用,所以通常从编制两变量的交叉表入手,使用卡方检验和逻辑回归等方法;但是当变量的类别或者变量数量两...
  • 交叉表交叉表用于计算一列数据对于另外一列数据的分组个数(用于统计分组频率的特殊透视表) pd.crosstab(value1, value2) 透视表:透视表是将原有的DataFrame的列分别作为行索引和列索引,然后对指定的列应用...
  • 需求分析案例

    千次阅读 2015-12-31 10:23:51
    1通过数据类型找到线索(数据的关键点)-2数据进行维度划分-3问问自己用户为什么需要这些数据-4数据表现形式(图还是)、数据维度交叉、不具体数据具体化 实践案例 最近有这样一个需求。某产品负责人向我们...
  • 版权声明:本套技术专栏是作者(秦凯新)平时工作的总结和升华,通过从真实商业环境抽取案例进行总结和分享,并给出商业应用的调优建议和集群环境容量规划等内容,请持续关注本套博客。QQ邮箱地址:1120746959@qq....
  • 这次分析的数据是销售的最低价格,分别从周日期、天日期和promotions三个维度进行分析,要实现的效果是,如果选择了WEEK,那坐标轴就是周的名称,展示周的最低销售价格,如果选择了DAY,那坐标轴则是天的维度,展示...
  • SPSS软件的交叉表分析功能,大家更喜欢输出的是卡方检验的结果。殊不知,还有另外一个应用较为广泛而且实用的统计量。它就是kappa系数。在问卷信度、测绘、医疗等行业领域使用的比较多,主要用于衡量同一对象两种...
  • 百分比同质性检验案例:某高中校长想要调查该校学生对食堂的满意程度...Step 2:选择【分析】——【描述统计】——【交叉表】,将“年级”选到右边【行】中,将“满意度”选到右边【列】中,点击【单元格】。Step 3...
  • 01先看案例您拥有以下哪些品牌的贵宾卡? (1)班尼路(2)真维斯(3)佐丹奴(4)堡师龙(5)苹果 (6)U2这是一个典型的多选题,每个受访者可以勾选多个选项。以下采用SPSS多重响应多选题频数分析功能。02数据录入多选题数据在...
  • 在进行数据分析时遇到分类型数据,并且要研究两个分类变量之间的相关关系,基于均值、方差的分析方法不能够使用,所以通常从编制两变量的交叉表入手,使用卡方检验和逻辑回归等方法;但是当变量的类别或者变量数量两...
  • 卡方检验-考察分类变量相关性-“交叉表”或“设定表”中进行; t检验-考察连续变量与分类变量相关性-“设定表”中进行; 线性logsitic回归-研究分类因变量与一组自变量(可连续可分类)的关系; 树结构模型-研究...
  • 案例:把下面的Excel格式的数据转变为SPSS格式。1.部分数据数据基本规范:每一行为一个样本的数据,每一列为一个变量。注意工作中的数据范围为:A2:F594(包括变量名称所在行)。2.SPSS操作步骤(1)分析→打开→数据...

空空如也

空空如也

1 2 3 4 5 ... 8
收藏数 151
精华内容 60
关键字:

交叉表分析案例