精华内容
下载资源
问答
  • 很全面的样本量计算软件整理

    千次阅读 2018-10-14 21:23:00
    经常很多人问起样本量计算的问题,实际上,对于样本量,我们很时候,都是呈现给 审稿人/评审人 看看而已。并不是说样本量不重要,非常重要!但是,并不是“计算”一词就可以涵盖的。 样本量最大的限制因素,...

    经常很多人问起样本量计算的问题,实际上,对于样本量,我们很多时候,都是呈现给 审稿人/评审人 看看而已。并不是说样本量不重要,非常重要!但是,并不是“计算”一词就可以涵盖的。

     

    样本量最大的限制因素,其实并不是我们常说的α,β,δ,和SD那些东西。而是经费!

     

    是的,经费足了,你可以把β调到0.90,——意味着,你对这个研究有90%的把握度!经费不足,0.60,也只能凑合用啊!但这一参数的小小改变,在最终样本量上可是翻天覆地的影响。β越接近1,提升单位β所需的样本量,近乎指数级的增加!

     

    所以,样本量计算,往往都是凑!凑成自己所能够接受的样本量而已,牺牲的,还是那些参数罢了。。。

     

    当然,用来凑的软件也相当重要,如下,给大家罗列了好多。但并不是所有都需要掌握,大家着重看一下在线的工具,或者(经费足的话)尝试下几乎万能的PASS~

     

    今天的大礼包~点击 ↑↑ 上方“医学统计分析精粹”,关注本微信号,回复“样本量”,即可得到一个非常得心应手的轻量级样本量计算工具!

     

    另,只需关注本微信号,随时随地可以通过回复“样本量”关键词获得最新工具列表和礼包,一旦关注,万事不愁哦~

     

    一、在线样本量计算工具

     

    1、PowerAndSampleSize

    可计算单样本均数,两样本均数比较,k个样本均数比较,单个率,两个率比较,配对率比较,两样本率比较,k个样本率比较,时间-事件数据(生存数据)比较,OR值比较,以及其它。该软件的一个重要特点是可提供样本量的计算公式和R语言代码,在写标书时不用愁啦。

    http://powerandsamplesize.com/Calculators/

     

    2、其他在线工具

     

    二、样本量计算软件

    1、nQuery Advisor+nTerim

    爱尔兰Statistical Solutions公司开发的商业软件(收费)。FDA、欧洲药品管理局、日本、韩国等官方认可,世界制药企业和生物制药公司50强中49家使用。内容几乎涵盖样本量计算的所有方面。

     

    2、PASS

    美国NCSS公司开发的商业软件,最新版本14.类似于nQuery,覆盖了几乎所有样本量计算方法,其官方网站宣称用到的统计方法超过680种。

     

     

    3、陈青山教授-Excel统计软件

    武汉医学院(原同济医科大学)陈青山教授开发的“Excel统计软件”中的“样本含量计算模块”中就包含了15大类的样本含量计算:抽样调查中估计总体率、样本率与总体率比较、完全随机设计的两总体率比较、完全随机设计多个总体率比较、配对设计总体率比较、抽样调查中估计总体均数、配对设计的单个总体均数假设检验、完全随机设计两总体均数比较、完全随机设计多个总体均数比较、随机区组设计多个总体均数比较、交叉设计、重复测量设计、直线回归与相关分析、生存分析、病例对照与队列研究。该工具也同样提供了样本量的计算公式。

     

    4、DSTPLAN

    免费,Fortran语言编写,安德森癌症中心开发。统计分析方法有:t检验、相关分析、率的比较、2xN的列联表检验,以及生存分析的差异性检验。

     

    5、G*Power

    免费,德国杜塞尔多夫大学开发。统计分析方法有:t检验、One-way ANOVA、回归分析、相关分析以及拟合优度分析。输入关键参数后立即给出效应量。

     

    6、PC-Size

    免费,DOS命令行软件。统计方法有:t检验、方差分析、回归分析、相关分析以及率的比较。可计算效应量。

     

    7、PS

    免费,统计分析方法有:t检验、卡方检验、Fisher确切概率法、McNemar检验、回归分析以及生存分析等。

     

    8、SAS Power and Sample Size application (PSS)

    SAS系列内随同安装。虽由SAS公司开发,但包括的统计分析方法非常有限,只有:t检验、率的比较、相关分析、回归分析、方差分析、以及生存分析。

     

    9、Epi Info

    Epi Info是世界卫生组织 (WHO) 和美国疾病控制中心 (CDC) 共同为公共卫生专业工作人员开发的主要用于流行病学、统计学分析的免费软件。可进行人口调查、队列或横断面研究、非配对病例对照研究的样本量计算

     

    部分资料整理自南方医科大学陈平雁教授幻灯片,在此一并致谢!

    来源:http://www.360doc.com/content/15/1119/10/29299010_514259900.shtml

    转载于:https://www.cnblogs.com/lantingg/p/9788074.html

    展开全文
  • 预测模型的样本量计算一直都是困扰笔者很久的问题 一般临床预测模型常见的有两类:非时间因素/包含时间因素 举例来说,非时间因素建模常见于logistic/lasso等回归模型之后,时间因素相关的结局变量常见于cox等模型...

    预测模型的样本量计算一直都是困扰笔者很久的问题
    一般临床预测模型常见的有两类:非时间因素/包含时间因素
    举例来说,非时间因素建模常见于logistic/lasso等回归模型之后,时间因素相关的结局变量常见于cox等模型建模后。
    如果选用logistic模型,可使用的思路为:
    1、根据自变量数目进行预测,根据自变量(即构建模型的自变量)数量,10-20倍区间的样本量均可。具体理论后续补充或完善。
    2、将预测模型视为临床研究的思路,即A模型比B模型能提高结局的预测能力,即在某一类人群中(高危?or 低危?)模型的预测准确度提高了多少。即ROC提高了多少,通过软件ROC可以计算。计算方法 PASS软件可以实现,需强调的是,需要输入阳性与阴性事件发生的概率比值。
    包含时间因素:例如cox等,本身似乎并不存在相应的计算方式,所以不要有太高的指望。有的话请统计大佬不吝赐教。
    考虑到实际应用的问题,将时间因素降维到时间节点后有退化的方式
    包括
    1、特殊事件点的事件预测能力,将时间退化到时间节点后预测ROC的提高程度。
    eg 患者活到3年的概率为(3年OS率),如果从10%提高到20%,需要的样本量是多少,将预测模型作为一个干预变量进行设计。

    展开全文
  • 快速了解AB实验和样本量计算原理

    千次阅读 2021-02-20 10:56:10
    AB实验简介 什么是AB实验 将测试对象随机分成A,B两组,然后比较两组之间的差异 AB测试是为Web或App界面或流程制作两个...随机性:为了排除实验条件以外的干扰因素,我们需要确保两个组的用户是随机选取,这是为了排除

    AB实验简介

    什么是AB实验

    将测试对象随机分成A,B两组,然后比较两组之间的差异
    AB测试是为Web或App界面或流程制作两个(A/B)版本,在同一时间维度,分别让组成成分相同(相似)的访客群组(目标人群)随机的访问这些版本,收集各群组的用户体验数据和业务数据,最后分析、评估出最好版本,正式采用。

    需要满足的条件:
    对照组:有其他对照组作为对比,就能真正看出来效果。而且不同组间的效果差异要足够明显,才能验证我们的判断
    随机性:为了排除实验条件以外的干扰因素,我们需要确保两个组的用户是随机选取,这是为了排除用户差异对实验结果的影响
    大样本:这里的样本量是指数据量,包括用户、行为和时间跨度,样本量越大,越容易排除个体差异的影响,也更容易验证统计上的显著性

    AB实验的原则

    唯一变量:
    AB实验时需要保证除了要实验的变量之外,实验组和对照组其他的“变量”都是均匀的,包含但不限于:
    时间、环境、样本属性等
    多层实验如何保证唯一变量:
    分流因子通过加入不同的字符串(实验名)作为离散因子,保证每层都是正交分布,防止层与层之间有交集。
    在这里插入图片描述

    AB实验涉及的统计学基础

    抽样

    实验的思想:
    用能近似代表总体的样本推断总体的分布(假设检验),利用样本指标近似代替总体指标,继而进行决策;
    如何保证:
    近似代表总体的样本需满足以下2项条件:
    1、随机抽样:实验中的样本是随机抽取的。而且抽取的算法能够充分保证了抽样的随机性。
    2、样本能近似代表总体:
    样本量越大,通过样本去评估总体的误差就越小。当误差小于我们需要的精度时样本量就足够了。
    E ( X ˉ ) = E ( 1 / n ∑ i = 1 n X i ) = 1 n ∑ i = 1 n E ( X i ) = μ D ( X ˉ ) = D ( 1 / n ∑ i = 1 n X i ) = 1 n 2 ∑ i = 1 n D ( X i ) = 1 n σ 2 E(\bar{X})=E(1/n\sum_{i=1}^{n}X_i)=\frac1n\sum_{i=1}^nE(X_i)=\mu\\ D(\bar{X})=D(1/n\sum_{i=1}^{n}X_i)=\frac1{n^2}\sum_{i=1}^nD(X_i)=\frac1n\sigma^2 E(Xˉ)=E(1/ni=1nXi)=n1i=1nE(Xi)=μD(Xˉ)=D(1/ni=1nXi)=n21i=1nD(Xi)=n1σ2
    所以当n较大时, X ˉ \bar{X} Xˉ近似服从 N ( μ , σ 2 n ) N(\mu,\frac{\sigma^2}{n}) N(μ,nσ2),等价地有 X ˉ − μ σ / n ∼ N ( 0 , 1 ) \frac{\bar{X}−\mu}{\sigma/\sqrt{n}}\sim N(0,1) σ/n XˉμN(0,1)
    中心极限定理(central limit theorem):设均值为 μ \mu μ、方差为 σ 2 \sigma^2 σ2(有限)的任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值 μ \mu μ的抽样分布近似服从均值为 μ \mu μ、方差为 1 n σ 2 \frac1n\sigma^2 n1σ2的正态分布。

    样本量计算

    样本量计算公式:
    均值检验样本量预估: n = ( Z 1 − α / 2 + Z 1 − β ) σ 2 E 2 n=\frac{(Z_{1-\alpha/2}+Z_{1-\beta})\sigma^2}{E^2} n=E2(Z1α/2+Z1β)σ2

    率值检验样本量预估: n = ( Z 1 − α / 2 + Z 1 − β ) π ( 1 − π ) E 2 n=\frac{(Z_{1-\alpha/2}+Z_{1-\beta})\pi(1-\pi)}{E^2} n=E2(Z1α/2+Z1β)π(1π)
    公式中的E代表假设实验能够带来的指标变化值。

    要想知道样本量计算公式具体是怎么来的,首先要了解假设检验中的两类错误:
    在这里插入图片描述

    在这里插入图片描述
    第一类错误代表的是原假设成立,但是却拒绝了原假设的概率,也即上图中阴影面积 α \alpha α;
    第二类错误代表的是备择假设成立,当检验指标落在原假设的接受域时,在备择假设下的概率,也即上图中阴影面积 β \beta β,通俗点说就是,给定第一类错误 α \alpha α下,备择假设中的样本,在原假设下检验时接受原假设的可能性。
    检验功效是指正确拒绝原假设的概率,也即备择假设成立时,检验拒绝原假设的概率,在数值上和第二类错误有以下数量关系:
    P o w e r = 1 − β Power=1-\beta Power=1β
    下面我们来推导样本量的计算公式:
    原假设 H 0 : μ = 0 H_0:\mu=0 H0:μ=0
    备择假设: H 1 : μ < > 0 ( μ = μ 1 ) H_1:\mu<>0(\mu=\mu_1) H1:μ<>0(μ=μ1)

    给定样本均值 X ˉ \bar{X} Xˉ,一类错误 α \alpha α,二类错误 β \beta β,令 Z = X ˉ − μ σ / n Z=\frac{\bar{X}−\mu}{\sigma/\sqrt{n}} Z=σ/n Xˉμ
    则:
    P ( ∣ Z ∣ ≥ Z 1 − α / 2 ) = α ⇒ ∣ Z ∣ = ∣ X ˉ − μ σ / n ∣ ≥ Z 1 − α / 2 ⇒ ∣ X ˉ ∣ ≥ Z 1 − α / 2 σ n P(|Z|\geq Z_{1-\alpha/2})=\alpha \Rightarrow |Z|=|\frac{\bar{X}−\mu}{\sigma/\sqrt{n}}|\geq Z_{1-\alpha/2}\Rightarrow |\bar{X}|\geq Z_{1-\alpha/2}\frac{\sigma}{\sqrt{n}} P(ZZ1α/2)=αZ=σ/n XˉμZ1α/2XˉZ1α/2n σ
    意味着 ∣ X ˉ ∣ ≥ Z 1 − α / 2 σ n |\bar{X}|\geq Z_{1-\alpha/2}\frac{\sigma}{\sqrt{n}} XˉZ1α/2n σ时,可以拒绝原假设。
    但同时需要保证第二类错误,则当 X ˉ ∼ N ( μ 1 , σ 2 n ) \bar{X}\sim N(\mu_1,\frac{\sigma^2}{n}) XˉN(μ1,nσ2)时,假设 μ 1 > 0 \mu_1>0 μ1>0,则要求单边检验
    P ( X ˉ ≥ Z 1 − α / 2 σ n ) X ˉ ∼ N ( μ 1 , σ 2 n ) ≥ 1 − β P(\bar{X}\geq Z_{1-\alpha/2}\frac{\sigma}{\sqrt{n}})_{\bar{X}\sim N(\mu_1,\frac{\sigma^2}{n})}\geq 1-\beta P(XˉZ1α/2n σ)XˉN(μ1,nσ2)1β
    同时对 X ˉ \bar{X} Xˉ进行标准化,可以得到
    P ( X ˉ − μ 1 σ / n ≥ Z 1 − α / 2 σ n − μ 1 σ / n ) ≥ 1 − β P( \frac{\bar{X}-\mu_1}{\sigma/\sqrt{n}}\geq \frac{Z_{1-\alpha/2}\frac{\sigma}{\sqrt{n}}-\mu_1}{\sigma/\sqrt{n}})\geq 1-\beta P(σ/n Xˉμ1σ/n Z1α/2n σμ1)1β
    其中 X ˉ − μ 1 σ / n ∼ N ( 0 , 1 ) \frac{\bar{X}-\mu_1}{\sigma/\sqrt{n}}\sim N(0,1) σ/n Xˉμ1N(0,1),则只需要 Z 1 − α / 2 σ n − μ 1 σ / n ≤ − Z 1 − β \frac{Z_{1-\alpha/2}\frac{\sigma}{\sqrt{n}}-\mu_1}{\sigma/\sqrt{n}}\leq -Z_{1-\beta} σ/n Z1α/2n σμ1Z1β(各位自行画出正态图像判断),求解方程可以得到:
    n ≥ σ 2 μ 1 2 ( Z 1 − α / 2 + Z 1 − β ) 2 n\geq \frac{\sigma^2}{\mu_1^2}(Z_{1-\alpha/2}+Z_{1-\beta})^2 nμ12σ2(Z1α/2+Z1β)2
    这里的 μ 1 \mu_1 μ1的含义就是预计实验带来的指标变化大小,也即E的值;
    在实际应用中可以利用样本方差 S n 2 S_n^2 Sn2代替 σ 2 \sigma^2 σ2来计算所需样本量,率值的 σ 2 = π ( 1 − π ) \sigma^2=\pi(1-\pi) σ2=π(1π),可以得到
    n ≥ π ( 1 − π ) μ 1 2 ( Z 1 − α / 2 + Z 1 − β ) 2 n\geq \frac{\pi(1-\pi)}{\mu_1^2}(Z_{1-\alpha/2}+Z_{1-\beta})^2 nμ12π(1π)(Z1α/2+Z1β)2

    效果评估(最小重要变化-目标提升值)

    在工业运用中,只有当试验版本的结果兼备统计显著效果显著两个特征时,才说明这个试验的结束时机已经成熟,该版本是真正值得发布的,因此,我们需要引入一个“最小重要变化”的概念来辅助我们判断和决策。
    在这里插入图片描述
    在这里插入图片描述
    当置信区间的上下上下界都超过或低于最小重要变化时才说他是效果显著的。

    展开全文
  • 通过测试具有两个因素的几个样本之间的几个变量的平均差异,计算相等或不相等样本量的双向变量方差分析。 它考虑 (H) 之间和 (E) 之间的平方和矩阵及其相互作用,分别计算它们的 Wilks'L (lambda) 并根据它选择的...
  • 样本容量的确定

    万次阅读 2018-03-15 08:46:29
    样本容量:样本中个体的数目或组成抽样总体的单位数。•必要样本容量:亦称必要样本单位数,是指满足调查目的要求的情况下,至少需要选择的样本单位数。一、估计总体均值时样本容量的确定1.重复抽样一旦确定了置信...
    样本容量:

    样本中个体的数目或组成抽样总体的单位数。

    必要样本容量

    亦称必要样本单位数,是指满足调查目的要求的情况下,至少需要选择的样本单位数。

    一、估计总体均值时样本容量的确定

    1.重复抽样

    一旦确定了置信水平(1-α),Zα/2的值就确定了,对于给定的的值和总体标准差σ,就可以确定任一希望的允许误差所需要的样本容量。令E代表所希望达到的允许误差,即:


    由此可以推到出确定样本容量的公式如下:


    2.重复抽样


    样本容量 n 与总体方差成正比
    绝对误差成 反比,
    概率度成正比。

    例:拥有MBA学位的研究生年薪的标准差大约为4000 元,假定想要估计年薪95%的置信区间,希望允许误差为10000 元,应抽取多大的样本容量?


    二、估计总体比例时样本容量的确定

    1.重复抽样

    一旦确定了置信水平(1-α),Zα/2的值就确定了。由于总体比例的值是固定的,所以允许误差由样本容量来确定,样本容量越大允许误差就越小。估计的精度就越好。因此,对于给定的π,就可以确定任一希望的允许误差所需要的样本容量。令E代表所希望达到的允许误差,即:

    由此可以推导出重复抽样和无限总体抽样条件确定样本容量的公式如下:

    2.重复抽样

    d 的取值一般小于 0.1
    π 未知,以样本比例 p 替代
    π p 都未知时,可取 0.5 ,这是一种谨慎估计

    某社区想通过抽样调查了解居民参加体育活动的比率,如果把误差范围设定在5%,问如果以95%的置信水平进行参数估计,需要多大的样本?


    影响样本容量n的因素

    a) 总体个单位之间的差异
    b) 概率保证程度
    c) 允许误差的大小
    d) 抽样方式
    e) 抽样的组织形式


    确定样本容量的注意事项

    一、在实际中采用不重复抽样,但常用重复抽样下的公式代替;

    二、若和p未知,其处理方式是:

            1.用过去近期的数据代替,

            2.用样本数据代替,

            3.p=0.5或最接近0.5的值;

    三、对同一总体,若求出的NxNp不等,这时取较大的作为必要样本容量,

            以同时满足做两种调查的需要;

    四、在实际工作中,常使用重复抽样下的简单随机抽样公式。

    展开全文
  • 在对系统输出进行辨识分类建模时,当实际试验样本量不足时,工程上通常考虑利用各种信息源合理增加补充试验样本,而合理确定补充样本容量,避免过多的样本“淹没”实际系统信息,是补充样本需要考虑的关键因素之一。...
  • 样本量确定(sample size determination),又称样本量估计(sample size estimation),是指为满足统计的准确性和可靠性(I类错误的控制和检验效能...
  • 在只有均值、标准差、样本量的情况下,spss是不能实现方差分析的。因此,这个小小的软件能够帮助你问题。
  • 样本量重要,还是测序深度重要?

    千次阅读 2018-11-02 11:17:00
    我认为是样本量远比测序深度重要。只要有足够的样本,我们甚至可以用很低的测序深度(比如1x)获得这些样本中每个人准确的genotype和群体的遗传频谱。这是为什么? 其中一个核心原因是人类这个物种具有单一祖先...
  • 当然这里默认方差变化不大的情况下,因为一般来说很数据经过平均后方差不会变化很大,相比平均前后的样本量。 p值计算, from google image 下图中的数据,y1和y2的数据量各为1000,y1m和y2m数据量各为...
  • 样本量和测序深度的Alpha多样性稀释曲线本节作者:刘永鑫,文涛版本1.0.1,更新日期:2020年6月22日本项目永久地址:https://github.com/YongxinLiu/...
  • R语言实战笔记–第十章 功效分析&样本量标签(空格分隔): R语言 功效分析 样本量功效及两类错误 功效及样本量在概率论与数理统计的假设检验部分里面有说明,可以返回查看原理,这里以R语言实战的描述简单复习一下...
  • 十六、比较两个样本 原文:Comparing Two Samples 译者:飞龙 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译 最近邻分类方法的动机是这样的,个体可能像最近的邻居。 从另一个角度来看,我们可以说一个...
  • 由于上市股票种类繁多,计算全部上市股票的价格平均数或指数的工作是艰巨而复杂的,因此人们常常从上市股票中选择若干种富有代表性的样本股票,并计算这些样本股票的价格平均数或指数。用以表示整个市...
  • 用R做meta分析(附效应量计算神器)

    千次阅读 多人点赞 2020-08-02 21:13:55
    用R做meta分析(附效应量计算神器) 1 准备2 配置环境和工具包3 导入数据4 计算综合效应量5 绘制森林图6 发表偏倚检验7 亚组分析并绘制森林图8 元回归分析9 敏感性分析 Hello, 这里是行上行下,我是喵君姐姐~ ...
  • Cox比例风险回归模型单因素多因素生存分析

    万次阅读 多人点赞 2020-03-13 12:00:20
    Cox比例风险回归模型单因素多因素生存分析 欢迎使用Markdown编辑器 Cox比例风险回归模型临床应用非常广泛,Cox分析得到的结果是可以直接运用到临床应用的,所以这个分析对癌症临床诊断有非常关键的作用,检测高低...
  • 方差分析是假设数据满足正态分布和方差齐性的前提下,计算总体相等但在当前样本量下由于偶然原因导致均值出现差异的概率,或者说基于当前样本量,结局均值的差异有大的可能性(概率)是由于偶然原因造成的。...
  • 总体与样本的理解

    千次阅读 2016-10-26 19:19:51
    在概率论章节,我们对一个变量的分布模型是已经知道的,带着这个模型再去研究或者说计算相应的性质,数字特征等。但是在数理统计这部分,事情的切入角度是不一样的:研究的随机变量分布是不知道的,但是我们常常需要...
  • 为进一步提高因素空间中因素...因此,在继承原算法优点的基础上,将逐列推进改成逐类推进,这种改进不但降低了算法的计算量,而且提高了样本信息的利用率.测试结果表明,改进效果明显,在测试准确率和运行速度均优于原算法.
  • 是否存在通用的模型weight计算方式? 如果没有,是否存在其他选取模型的方式? 如果权重只能人为设置,增加权重提高拟合度的方法是否可行? 如果权重能自动计算,能否在实际数据训练中增加拟合度? 解决方向 ...
  • 训练样本

    万次阅读 2017-03-08 22:55:01
    此数据库信息非常大,包括了各种姿态、表情、光照、种族等因素影响的图片。 AFLW 人脸数据库大约包括 25000 万已手工标注的人脸图片,其中 59% 为女性, 41% 为男性,大部分的图片都是彩色,只有少部分是灰色图片...
  • 样本学习

    千次阅读 2019-06-20 21:58:36
    最近实验室再研究有关于小样本学习的论文,搜集了大量的文献整理...3D视图 三维单视图& RGBD 人脸&身体 行动和视频 运动和生物识别技术 合成 摄影与制图 低级&优化, 场景和代表性, 语言与推...
  • R之分组计算描述性统计统计

    千次阅读 2017-12-25 16:10:24
    你可以使用第5章中的apply()函数或sapply()函数计算所选择的任意描 # 述性统计。对于sapply()函数,其使用格式为:sapple(x,FUN,options) # 其中的x是你的数据框(或矩阵),FUN为一个任意的函数。如果指定了...
  • 为进一步提高因素空间中...因此,在继承原算法优点的基础上,将逐列推进改成逐类推进,这种改进不但降低了算法的计算量,而且提高了样本信息的利用率.测试结果表明,改进效果明显,在测试准确率和运行速度均优于原算法.
  • 样本分析

    千次阅读 2015-02-07 16:08:48
    我们往往都会采取一定的措施来优化(削弱)样本较小的时候计算的结果,常见的就是分母加上一个常量(样本小时,明显削弱原计算结果,样本大时则几乎不影响)。这是一种非常跛足的处理方法(实际中还是非常有效的),...
  • DSSM算法-计算文本相似度

    万次阅读 多人点赞 2018-03-19 20:38:09
    转载请注明出处: http://blog.csdn.net/u013074302/article/details/76422551导语在NLP领域,语义相似度的计算一直是个难题:搜索场景...本文通过介绍DSSM、CNN-DSSM、LSTM-DSSM等深度学习模型在计算语义相似度上...
  • 样本均值和样本标准差带入t统计量计算公式,得出t=6.573,落入拒绝域内   做出决策 拒绝原假设H0,接受备择假设H1,认为样本均值与总体均值差异显著     每个变量的意思: 上边的: R-...
  • Paper之CVPR&ICCV&ECCV:2009年~2019年CVPR&ICCV&ECCV(国际计算机视觉与模式识别会议&国际计算机视觉大会&欧洲计算机视觉会议)历年最佳论文简介及其...深度分离卷积的计算量相对于传统卷积减少了大约k2(k是卷积核大小...
  • 连锁不平衡(linkage ...D是LD的基本单位,度量观察到的单倍型频率与平衡状态下期望频率的计算方法如下: D=P(AB)-P(A)*P(B) P(AB)表示实际观察到的AB频率,P(A)*P(B)表示AB频率的期望值。(如果发生连锁不平...
  • 只能用于二分类模型的评价,对于二分类模型,还有损失函数(logloss),正确率(accuracy),准确率(precision),但相比之下AUC和logloss要比accuracy和precision用的,原因是因为很的机器学习模型计算结果都...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 38,239
精华内容 15,295
关键字:

多因素样本量的计算