精华内容
下载资源
问答
  • 多个率的比较用什么统计方法
    千次阅读
    2020-10-29 23:14:56

    为什么越来越多的非程序员白领都开始学习 Python ?他们可能并不是想要学习 Python 去爬取一些网站从而获得酷酷的成就感,而是工作中遇到好多数据分析处理的问题,用 Python 就可以简单高效地解决。本文就通过一个实际的例子来给大家展示一下 Python 是如何应用于实际工作中高效解决复杂问题的。

    背景

    小明就职于一家户外运动专营公司,他们公司旗下有好多个品牌,并且涉及到很多细分的行业。小明在这家公司任数据分析师,平时都是通过 Excel 来做数据分析的。今天老板丢给他一个任务:下班前筛选出集团公司旗下最近一年销售额前五名的品牌以及销售额。

    对于 Excel 大佬来说,这不就是分分钟的事吗?小明并没有放在眼里,直到市场部的同事将原始的数据文件发给他,他才意识到事情并没有那么简单:

    202092293554829.jpg?202082293610

    这并不是想象中的排序取前五就行了。这总共有90个文件,按常规的思路来看,他要么将所有文件的内容复制到一张表中进行分类汇总,要么将每张表格进行分类汇总,然后再最最终结果进行分类汇总。

    想想这工作量,再想想截止时间,小明挠了挠头,感觉到要渐渐头秃。

    思路分析

    这种体力活,写程序解决是最轻松的啦。小明这时候想到了他的程序员好朋友小段,于是他把这个问题抛给了小段。

    小段缕了下他那所剩无几的头发,说:so easy,只需要找潘大师即可。

    小明说:你搞不定吗?还要找其他人!

    小段苦笑说:不不不,潘大师是 Python 里面一个处理数据的库,叫 Pandas ,俗称 潘大师。

    小明说:我不管什么大师不大师,就说需要多久搞定。

    小段说:给我几分钟写程序,再跑几秒钟就好了!

    小明发过去了膜拜大佬的表情。

    小段略微思考了下,整理了一下程序思路:

    计算每张表每一行的销售额,用"访客数 * 转化率 * 客单价”就行。

    将每张表格根据品牌汇总销售额。

    将所有表格的结果汇总成一张总表

    在总表中根据品牌汇总销售额并排序

    编码

    第零步,读取 Excel :

    import pandas as pd

    df = pd.read_excel("./tables/" + name)

    第一步,计算每张表格内的销售额:

    df['销售额'] = df['访客数'] * df['转化率'] * df['客单价']

    第二步,将每张表格根据品牌汇总销售额:

    df_sum = df.groupby('品牌')['销售额'].sum().reset_index()

    第三步,将所有表格的结果汇总成一张总表:

    result = pd.DataFrame()

    result = pd.concat([result, df_sum])

    第四步,在总表中根据品牌汇总销售额并排序:

    final = result.groupby('品牌')['销售额'].sum().reset_index().sort_values('销售额', ascending=False)

    最后,我们来看看完整的程序:

    import pandas as pd

    import os

    result = pd.DataFrame()

    for name in os.listdir("./tables"):

    try:

    df = pd.read_excel("./tables/" + name)

    df['销售额'] = df['访客数'] * df['转化率'] * df['客单价']

    df_sum = df.groupby('品牌')['销售额'].sum().reset_index()

    result = pd.concat([result, df_sum])

    except:

    print(name)

    pass

    final = result.groupby('品牌')['销售额'].sum().reset_index().sort_values('销售额', ascending=False)

    pd.set_option('display.float_format', lambda x: '%.2f' % x)

    print(final.head())

    最后的结果是这样的:

    品牌 销售额

    15 品牌-5 1078060923.62

    8 品牌-17 1064495314.96

    4 品牌-13 1038560274.21

    3 品牌-12 1026115153.00

    13 品牌-3 1006908609.07

    可以看到最终的前五已经出来了,整个程序运行起来还是很快的。

    几分钟之后,小段就把结果给小明发过去了,小明感动得内牛满面,直呼改天请吃饭,拜师学艺!

    总结

    本文主要是想通过一个实际的案例来向大家展示潘大师(Pandas)的魅力,特别是应用于这种表格处理,可以说是太方便了。写过程序的可能都有点熟悉的感觉,这种处理方式有点类似于 SQL 查询语句。潘大师不仅能使我们的程序处理起来变得更简单高效,对于需要经常处理表格的非程序员也是非常友好的,上手起来也比较简单。

    以上就是利用python汇总统计多张Excel的详细内容,更多关于python汇总统计多张Excel的资料请关注脚本之家其它相关文章!

    更多相关内容
  • 医学中最常设计的试验就是病例对照研究,以探究某一干预措施是否有改善性。需要根据基线的情况,选择相应的...因为基线齐,说明两组干预前组间差异不明显,直接T检验对比干预后的结果。 long_after <- filter(dat

    医学中最常设计的试验就是病例对照研究,以探究某一干预措施是否有改善性。需要根据基线的情况,选择相应的方法。

    试验数据如下:
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    (声明:该数据是随机自动生成的,虚拟的,该计算结果不代表任何真实的事情,该数据不适用于现实世界。)
    数据由试验组长病程10名,试验组短病程10名,对照组10名组成,干预手段为减肥。

    一、两组病例对照研究常用的三种方法
    (1)T检验法,将结果进行T检验。
    因为基线齐,说明两组干预前组间差异不明显,直接用T检验对比干预后的结果。

    long_after <- filter(data, 病程=='长病程' & 干预=='减肥后')
    short_after <- filter(data, 病程=='短病程' & 干预=='减肥后')
    t.test(short_after$血清蛋白含量, long_after$血清蛋白含量, var=T,paired=F)
    

    独立样本T检验得出P=0.5106
    (2)倍差法,将干预前后差值进行T检验。
    先用 干预后 减去 干预前, 得出差值d,然后用差值进行T检验。
    倍差值法独立样本T检验得出P=0.3641
    (3)协方差法,线性回归分析的一种。
    协方差分析法,是把方差分析和回归分析结合起来的一种方法。一般的T检验只考虑了干预方式的影响,但是没有把其他的影响变量纳入进去。而协方差法可以把多个影响变量的效应给处理掉。
    这里运用协方差法计算两组差异的思路,就是将干预前的血清蛋白含量作为影响变量X之一。
    ****协方差分析法是参数统计的一种,所以其运用条件同方差分析。要求是连续型数值,且影响变量之间无交互效应。
    ****协方差分析中,变量必须是连续型数值,所以性别这种分类变量不能用于协方差分析。可以尝试下多因素Logic回归。

    fit <- aov(data$干预后含量 ~  data$干预前含量  + data$病程 )
    summary(fit)
    

    算出如下:
    在这里插入图片描述
    说明长病程和短病程在干预后的差异P值=0.9132 (貌似这个值最大)

    #把年龄因素的影响去掉
    fit <- aov(data$干预后含量 ~  data$干预前含量 + data$年龄 + data$病程 )
    summary(fit)
    

    在这里插入图片描述
    可以看出,年龄对Y无显著影响,校正了年龄、初始血清蛋白含量以后,得出P值=0.7097
    有意思的来了,将年龄和干预前含量交换位置:
    在这里插入图片描述
    干预前的含量对血清含量有显著影响(p=0.0425),校正干预前含量、年龄等因素后,该干预手段对长短病程的患者无显著影响(p=0.7097)。
    (4)Welch Ttest
    Welch Ttest算出P=0.5115

    小彩蛋:其实一开始没有把干预前的基线给算出来,因为主要是想对比这三种常用的方法(可能有的同学常用的只有第一种)。现在来揭晓答案:干预前的长病程组p=0.1162,短病程组p=0.3109,两组无显著差异(shapiro),符合正太分布。两组方差检验(Ftest)P=0.8348,默认方差齐。因此,在这个实验数据中,答案其实就是基线齐。

    二:总结
    可以看出,三种方法对比,独立样本T检验(P=0.5106),倍差值法(P=0.3041),协方差法(P=0.9132)。
    因此,在基线齐的时候,选择倍差法要比独立T检验会好点,因为值更小,容易出结果。student T test 和Welch T test 的值均比倍差值法要大。
    但是协方差法适用范围更大点,因为它排除了年龄等干扰因素,相对而言应用更广泛,其结果更加可信。

    因此,我推荐:
    在基线齐的时候,运用倍差值法进行两组差异检验;在基线不齐的时候,运用协方差法进行两组差异检验(把基线的差异给校正掉)。
    如果想校正年龄、血压等其他可能存在的影响因素,直接用协方差法。

    如果基线不齐,可以用倍差法吗?如果用倍差法,就会引出一个问题,即该干预手段对基线不同的两组的影响作用是一样的吗?
    举例:中风偏瘫患者,在急性期用神经保护剂,效果更高,而在恢复期,效果就一般般。那么对于基线不齐的两组(一组是急性期,一组是恢复期),那么神经保护剂的治疗效果是不同的,因此这个时候用倍差法去计算两组的干预效应,是不对的。
    因此,如果你能根据现有文献,证明该干预手段对两组影响作用一样,那么可以在基线不齐的时候使用倍差法,但是基线不齐最好的还是协方差分析法。但是协方差分析法又有个问题,就是两组数据要符合正态分布,因为协方差分析法是参数检验。

    展开全文
  • 可视化不是单纯的数据展示,其真正价值是设计出可以被读者轻松理解的数据展示。数据与合适的图形结合,不仅能够让复杂的统计数字...1、 柱状图适用场景:以柱子的高度用来比较或以上数值之间的差异。优点:人...

    可视化不是单纯的数据展示,其真正价值是设计出可以被读者轻松理解的数据展示。数据与合适的图形结合,不仅能够让复杂的统计数字简单化、形象化,还能给读者一种视觉的享受。

    今天,就让我们根据数据分析软件亿信ABI来解读一下各类统计图的使用场景以及优缺点。希望掌握这11种可视化图表,能够快速提升和巩固你的数据可视化展示,一起来看看吧!

    1、 柱状图

    17d756018f59a009906e844a6ceb5ee9.png

    适用场景:以柱子的高度用来比较两个或以上数值之间的差异。

    优点:人眼对高度较敏感,直观各组数据差异性,强调个体与个体之间的比较。

    局限:分类过多则无法展示数据特点。

    相似图表:

    系列堆积图:系列堆积起来可以更直观看到总数和各系列分布情况。

    多系列柱状图:将一个维度多个指标进行比较。

    百分比堆积柱状图:适合展示同类别的每个变量占比和分布情况。

    2、 饼图

    a4f4b5724f93c7aa65b1d454c73bdd4f.png

    适用场景:展示数据分布情况,比如:某一时期各个行业的销售占比。

    优点: 直观显示各项占总体的占比,分布情况,强调整体与个体间的比较。

    局限:分类过多,则扇形越小,无法展现图表。

    相似图表:

    · 嵌套圈饼图:用于一个指标在不同维度的占比。

    · 跑道图:看到占比的同时,可以直观看到指标在当前维度下的排名情况。

    · 而圈饼图和南丁格尔图,只是普通饼图的不同表现形式。

    3、 条形图

    a443365d54a24e0e4e861984aebe7127.png

    适用场景:根据数量的多少绘成不同的直条,通过直条中清楚的看出各省的生产值差异。

    局限:分类过多则无法展示数据特点。

    相似图表:

    · 堆积条形图:比较同类别各变量和不同类别变量总和差异。

    · 交错正负轴标签:数据有正有负,将坐标轴标签分别放在坐标轴两边。比如盈亏情况、人员增减情况。

    · 双向柱状图:比较同类别的正反向数值差异。比如男女占比。

    4、 线状图

    2bf18aa0cf74cdf2e1dada24ffcdf6cb.png

    适用场景:以线条来动态展示各个时间段的数值,通过折线的趋势变化,反映出销售额变化情况。

    优点: 直观反映数据变化趋势

    局限:无序的类别无法展示数据特点。

    相似图表:

    · 阶梯线图:线在数据点之间形成一系列步骤。

    · 折点曲线和平滑曲线图,只是折线样式不同,用来展示数据趋势。

    5、 面积图

    bc9741b0006e85d188fd8a03248da8be.png

    适用场景:面积图除了可以像折线图一样表达变化趋势,还可以通过层叠的阴影面积反映差距变化。

    优点:颜色的填充可以更好的突出趋势信息。

    相似图表:

    · 数据监控面积图:用于显示每个数值所占大小随时间或类别变化的趋势线,展示的是部分与整体的关系。比如服务器CPU、内存等监控场景。

    · 横向面积图:用横向面积来展示趋势信息。只是与竖向面积图的不同展现样式。

    6、 地图

    d1efaa8f3fecf2c56ec57fd074dbb10b.png

    适用场景:地图是用颜色的深浅来展示区域范围的数值大小。

    局限:数据分布和地理区域大小的不对称。通常大量数据会集中在地理区域范围小的人口密集区,容易造成用户对数据的误解。

    相似图表:

    · 流向图:展现运动轨迹。比如人员迁移、飞机航线等。

    · 渲染图:一个指标在地图上用颜色来展现,比如天气、人口、收入等。

    · 标点图:用描点展现数据在区域的分布情况。与渲染图用途类似。

    · Gis渲染图:集成Gis地图,在地图上着色从而实现预警的一种方式。

    · Gis统计图:地图与其他统计图的组合,表现该指标在另一维度的分布情况。

    7、 雷达图

    352c615bb03fed3a6a4d048cf7365b1e.png

    适用场景:了解同类别的不同属性的综合情况,以及比较不同类别的相同属性差异。

    局限:分类过多或变量过多,会比较混乱。

    相似图形:

    圆形雷达图和多边形雷达图只是表现形式不一样。

    8、 气泡图

    d33d21889a83eac47a8b80b506823338.png

    适用场景:通过气泡图,可以清晰的看出各产品在市场占有率的大小。

    优点: 直观反映数据集中情况,对离散数据线性回归等曲线预测性的拟合辅助作用

    局限:数据量小的时候会比较混乱。

    相似图表:

    · 散点气泡图:用于展示一个维度在2个变量之间关系,比如男女身高体重情况。

    · 螺旋气泡图:一个维度按大小排列,比如收入情况。

    9、 仪表图

    901e851017234f939bcfa62b2cd5a33e.png

    适用场景:展现指标并分等级,用于数据预警。应用于经营数据分析、财务指标跟踪和绩效考核等方面。

    局限:只适合展现数据的累计情况,不适用于数据的分布特征等。

    相似图形:

    · html5占比:重点关注一个指标的当前占比情况。

    · flash柱:作用同仪表盘,只是外形上有所区别。

    10、 组合图

    集柱状图和线状图优势于一身,更加清晰展示数据之间的差异与变化趋势。

    3eeb276686538edaf6dc85e03ce8d9a9.png

    11、 高级统计图

    除了基础统计图,亿信ABI中还拥有各种高级统计图,总有一款适合你。

    fc4b6c9da4f9c5b751ed66969d8d7299.png
    e60e8af0bfedbc3f3ef034fc1c802b3e.png

    亿信ABI是一款融合了数据源适配、ETL数据处理、数据建模、数据分析、数据填报、工作流、门户、移动应用等核心功能而打造的全能型数据分析平台。其内置百余种统计图,每种统计图都适用于各种不同的场景,善于选择合适的统计图能够更好的展示数据。而且在ABI中,可以通过设计与搭配,可以衍生出成千上万种炫酷的可视化效果,让数据更加生动!

    展开全文
  • 我们首先看看什么是生存分析?因为无法在短时间内评价慢性病患者的预后,所以通常情况下不会简单地采用治愈、病死等指标,而是对患者进行随访,分析一定的时间之后患者生存或死亡的情况,这种将事件...

    我们首先看看什么是生存分析?

    因为无法在短时间内评价慢性病患者的预后,所以通常情况下不会简单地采用治愈率、病死率等指标,而是对患者进行随访,分析一定的时间之后患者生存或死亡的情况,这种将事件的结果和出现这一结果所经历的时间结合起来分析的方法,称为生存分析 (Survival Analysis)。

    对于生存分析的统计方法,SCI通常描述为

    Survival was estimated by the Kaplan-meier method, and any differences in survival were evaluated with a stratified log-rank test. Multivariable analyses with the Cox proportional-hazards model were used to estimate the simultaneous effects of prognostic factors on survival. Interactions with prognostic factors were also examined with the Cox proportional-hazards model.

    中文版:

    采用Kaplan-Meier法计算生存率和中位生存期,采用log-rank检验生存率差异,Cox回归法进行多因素分析。

    一、Kaplan-Meier法

    Kaplan-Meier法简称K-M法,又称乘积极限法(Product-limit Estimate)是生存分析方法中最常用的一种,主要用于估计患者生存率和绘制生存曲线。Kaplan-Meier曲线(生存曲线),以生存时间为横轴,生存率S (tk)为纵轴,绘制而成的连续型的阶梯形曲线,用以说明生存时间与生存率之间的关系。生存曲线一般是平滑而水平延伸的,当某个时间点一旦有患者发生终点事件(如死亡),曲线就会垂直下降,下降幅度是该时间点上患者发生终点事件例数和上一个时间节点后随访的患者样本量的比。

    一般情况下,不同组生存曲线不交叉,但如果有交叉,则提示可能存在混杂因素,可以用校正方法(如逆概率加权法),获得校正后的K-M曲线。

    二、Log-Rank test

    当两组或多组生存曲线(生存率)进行比较时,常用的假设检验方法是对数秩检验(log-rank test ),又称时序检验,属于非参数检验,用于比较两组或多组生存曲线或生存时间是否相同,检验统计量为卡方。需要注意的是,选用Log-Rank检验对样本生成存率进行比较时,要求各组生存曲线不能交叉,生存曲线交叉提示存在混杂因素,可以使用Two-stage方法。

    对于不同组生存曲线的比较,除了log-rank检验外,还可以选用Breslow检验方法。区别在于,Log Rank检验对远期差异敏感,而Breslow检验对近期差异敏感。

    三、Cox回归 (Cox proportional-hazards model)

    Cox回归是生存分析的重要方法,全称是“Cox比例风险模型”。该模型以生存结局和生存时间为因变量,可同时分析多个因素对生存期的影响,可分析截尾数据,且不要求数据分布类型。Cox回归没有直接利用生存时间数据,不涉及生存率的估计和比较等内容。需要注意的是,Cox回归使用需要满足等比例风险假定,如果不满足,可以选择分层Cox回归或时依Cox回归。

    Log-rank法与单因素Cox回归可能会出现结果不一致的情况,已知Log-rank法属非参数法,cox属于半参数法,在符合条件情况下,参数检验的效能高于非参数检验,可以以Cox为准。

    END -

    原创经典专辑(点击直达)

    实用统计教程 | 临床预测模型 | 统计分析批量完成

    R与Graphpad作图 | Kappa检验与ROC分析

    科研软件与浏览器插件 | 小白变统计高手训练营

    小白学R语言训练营 | 统计咨询

    展开全文
  • 使用 Ansible 统计服务器资源利用

    千次阅读 2019-01-10 23:22:16
    使用 Ansible 统计服务器资源利用率 ...CPU 利用率统计: top -bn1 | grep load | awk '{printf &quot;CPU Load: %.2f\n&quot;, $(NF-2)}' 内存利用率统计: free -m | awk 'NR==2{printf &quot;Mem...
  • 例如,我们要统计下表中的各科成绩计算相应的及格:首先,先在单元格B8中输入COUNTIF公式(统计及格人数的函数),这是对指定区域中符合指定条件的单元格计数的一函数。Countif函数的语法规则是:countif(range,...
  • 发现cobertura对jdk1.8支持不够好,每次遇到lamba表达式时,都会报warn,且cobertura对模块支持不够友好(需要使用ant,没有实际测试过)且年久失修(好久都没人更新),故使用了JaCoCo进行模块代码覆盖率统计;...
  • JUnit测试用例覆盖率统计

    千次阅读 2018-12-30 18:20:24
    单元测试覆盖率统计我们的较的就是JaCoCo,该用具已经集成到jmockit的jar包中,如果我们使用的是maven项目,则在pom.xml中把jacoco对应的属性设置上即可,如果是非maven项目需要如何做呢? 上一篇博客已经知道在...
  • Jacoco服务器增量覆盖率统计(支持模块)

    千次阅读 热门讨论 2019-06-18 09:54:22
    统计后端代码覆盖时,一般都使用的是Jacoco,但是Jacoco本身并不支持增量统计,当有一新需求出现时,经过一轮轮的测试,并不能直观的从全量覆盖中找出我们想要的那部分统计率。 二、增量统计思路 (不想看...
  • 千行代码bug率统计

    千次阅读 2020-06-04 16:58:44
    1、计算公式 千行代码bug=bug数/(代码行数/1000) 2、bug标准 ...3、统计方式 git log master..分支名 --no-merges --pretty=tformat: --numstat | awk '{ add += $1; subs += $2; loc += $1 - $2 }
  • 超简单、超实用的统计方法——因子分析

    千次阅读 热门讨论 2020-04-14 19:11:56
    大家好!今天给大家带来一非常简单、实用的统计方法——因子分析,这个方法适用面非常广,无论商科、工科、理科都能用来研究分析。一起来看看吧!
  • 统计数据收集方式与收集方法

    千次阅读 2020-03-05 23:39:46
    统计数据来源 直接来源(一手数据):观察实验、统计调查 间接来源(二手数据):网络数据、公开出版物 二手数据收集方式 1.公开出版物 (《 中国统计年鉴》、《中国统计摘要》、《中国 人口统计年鉴》、《世界经济...
  • 16种常用的数据统计分析方法汇总

    万次阅读 多人点赞 2019-04-24 16:43:00
    经常会有朋友问到一朋友,数据分析常用的分析方法有哪些,我需要学习哪个等等之类的问题,今天数据分析精选给大家整理了十六种常用的数据分析方法,供大家参考学习。 (注:这些统计分析方法基本都是统计学的方法...
  • 统计 Golang 项目的测试覆盖

    万次阅读 2018-05-12 16:52:49
    我们的项目主要基于 Golang 开发,公司要求统计测试覆盖。所以,我们摸索了一下在 Golang 下如何统计整个项目得测试覆盖: 以下内容均基于 Go SDK 1.10.1 获得,不保证可以向下兼容 先直接上结果: go ...
  • 2、如果事先未计划进行多重比较,在方差分析得到有统计意义的F检验值后,可以利用多重比较进行探索性分析,此时比较方法的选择要根据研究目的和样本的性质。比如,需要进行多个实验组和一个对照组比较时,可采用...
  • 假设检验与常见的统计检验方法

    千次阅读 2019-06-08 01:41:56
    小概率反证法思想,小概率思想认为小概率事件在一次试验中基本上不可能发生,在这个方法下,我们首先对总体作出一假设,这假设大概率会成立,如果在一次试验中,试验结果和原假设相背离,也就是小概率事件竟然...
  • 李航《统计学习方法》AdaBoost算法(课后习题)

    千次阅读 多人点赞 2019-01-07 20:12:15
    AdaBoost:... ... 强可学习的:一概念如果存在一多项式的学习算法能够学习它,并且正确了很高,那么,这概念是强可学习的; 弱可学习的:一概念如果存在一多项式的学习算法能...
  •   计算一分三,即平均分、合格、优秀和高分,是成绩统计中最常见也是最需要的统计数据。 3.1计算一分三 实例3-2 3.2计算离均 3.1计算一分三   计算一分三,即平均分、合格、优秀和高分...
  • 一.聚类分析 聚类的目的 1.间隔尺度:变量连续的量来表示【常用】 2.有序尺度:有次序关系,指标有有序的...4.有序样品的聚类:N样品排序,次序相邻的样品聚成一类 5.模糊聚类法:模糊数学的方法,多用于定性变
  • jacoco统计自动化代码覆盖

    万次阅读 热门讨论 2018-07-10 13:40:07
    jacoco统计自动化代码覆盖 1. 简介 1.1. 什么是Jacoco Jacoco是一开源的代码覆盖工具,可以嵌入到Ant 、Maven中,并提供了EclEmma Eclipse插件,也可以使用JavaAgent技术监控Java程序。很第三方的工具...
  • 分类问题结果统计指标的解释:真正类TPR与假正类FPR、查全与查准、感受性与特异性 预测及结果概念定义:TP、FN、FP、TN 对于一模型接受输入后的预测结果,可由下表表示。表中1代表正样本,0代表负样本。 ...
  • 基本的R包已经实现了传统多元统计的很功能,然而CRNA的许多其它包提供了更深入的多元统计方法,下面要综述的包主要分为以下几部分:  1) 多元数据可视化(Visualising multivariate data):  绘图方法:  ...
  • 什么是网站的统计代码

    千次阅读 2019-08-05 22:04:40
    1、什么统计代码,它包含的种类有哪些?作用是什么? 引言:一般网站做好了站长希望知道一天有多少人访问,通过哪些关键词来自己的网站等等 网站统计:是指通过专业的网站统计分析系统(或软件),对网站访问...
  • 一:使用IDEA自带的代码覆盖工具 1.查看配置(因为都是默认的,所以不用修改) 点击Edit Configurations 点击上方的设置图标以修改整个Junit的配置,或者也可以点击具体的单元测试文件来修改该文件的配置 默认...
  • 这时,一个比较合理的判断依据是比较P-R曲线下面积的大小,它在一定程度上表征了学习器在查准和查全上取得相对“双高”的比例。但这值不太容易估算,因此,人们设计了一些综合考虑查准、查全的性能度量,...
  • 因子权重优化方法比较

    万次阅读 2018-04-30 18:26:39
    https://www.ricequant.com/community/topic/4559在因子量化投资体系中,具有稳定的预期收益,可解释的经济驱动理论,与其他因子的低...为了比较不同的权重优化方法的优劣,本文首先采取不同的方法对各个大类...
  • Python统计标签

    千次阅读 2019-07-08 09:30:44
    深度学习中的图像处理,包含多个标签的数据集,往往存在类别不平衡的问题,这样会导致训练模型准确低的问题,因此有必要统计,各个类别图片标签个数,以及所占的比例。 举例:现有标签文件train.txt,内容如下: /...
  • 统计中几常用术语一

    千次阅读 2018-12-02 22:22:35
    表1-1 是我国上市公司分行业的平均市盈的数据集(部分)。通过对全部制造业上市公司的市盈深度分析,为投资者提供了投资建议和投资依据。http://www.cnindex.com.cn/syl.html 数据来源:国证网,2018.11.30 ...
  • 【测试】什么是代码覆盖

    千次阅读 2022-03-31 15:17:12
    文章目录前言覆盖率定义Go覆盖率统计方法一:直接运行go test 命令统计覆盖率1.1 创建main_test.go 文件1.2 执行go test 命令1.3 执行测试用例1.4 生成代码覆盖率文件1.5 查看覆盖率报告方法二:编译、执行插桩二...
  • 迁移 计算方法及用途 风控建模系列 02 在上一篇博客中,我们讲解了vintage分析的原理及方法(https://blog.csdn.net/weixin_44239904/article/details/99745084)。而迁移经常与vintage分析一同被人提到,不少人...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 414,552
精华内容 165,820
关键字:

多个率的比较用什么统计方法