精华内容
下载资源
问答
  • pyhon常用统计学实现

    2015-10-13 21:31:20
    第一种是调用相关的包去调用R软件,可以实现,这种方式在我前面的博客里面提到过,但是这种太过依赖于R,说到底还不是Python自己的实现方式。 第二种是Python自身带统计模块 scipy.stats和 sta
    对于Python,经常被别人调侃不是一门适合做统计分析的语言,说起统计分析,最经常提到的是后SAS or  R,实际在Python中也有相关的模块实现统计方面的功能。
    第一种是调用相关的包去调用R软件,可以实现,这种方式在我前面的博客里面提到过,但是这种太过依赖于R,说到底还不是Python自己的实现方式。




    第二种是Python自身带统计模块 scipy.stats和  statsmodels,statsmodels主要是对scipy.stats模块的补充,其中主要包括统计方法是:
    线性回归模型:广义最小二乘法(Generalized least squares),普通最小二乘法(ordinary least squares)
    glm
    discrete:离散变量的回归,基于最大似然估计
    rlm
    tsa:时间序列分析模型
    nonparametric
    datasets
    stats:常用统计检验
    iolib:读Stata的.dta格式,输出ascii、latex和html
    http://statsmodels.sourceforge.net/0.5.0/examples/index.html  这是官方给的一些例子,通俗易懂,scipy.stats相对来说成熟,网上资料也较多

    展开全文
  • 技术工程师基本技能培训系列 培训目的 了解技术工作常用的数据分析 掌握使用JMP软件进行分析的具体方法 2007-3-12 * 培训内容 常用的分析手法
  • 均值、标准偏差、均方根等是分析非定常流动常用统计学参数。ANSYS CFX在非定常计算模式中提供了这些参数的获取途径。本文将结合个人经验对这一功能的使用进行介绍。1. 统计学参数的前处理设置首先介绍前处理模块...

    均值、标准偏差、均方根等是分析非定常流动常用的统计学参数。ANSYS CFX在非定常计算模式中提供了这些参数的获取途径。本文将结合个人经验对这一功能的使用进行介绍。

    1. 统计学参数的前处理设置

    首先介绍前处理模块CFX-pre中的相关设置。在非定常计算模式下,OutputControl中的Trn Stats选项卡就是为输出统计学参数而准备的,如图1所示。

    67ef12e75b6c7834325c80431cf8cf5a.png

    图1 Trn Stats选项卡

    结合图1对Trn Stats选项卡介绍如下:

    按钮1:单击按钮1可以新建统计结果。

    Option后面的下拉菜单2:用于选择需要输出的统计参数,具体包括ArithmeticAverage(算术平均值)、Minimum(最小值)、Maximum(最大值)、Standard Deviation(标准偏差)、Root MeanSquare(均方根)。当Option选为Full时会输出以上所有参数。注意:手册中指出这里给出的标准偏差为样本标准偏差sample standard deviation而不是总体标准偏差population standard deviation,二者差异如图2所示。

    ffb85b11eb3222909288c16345a5a20c.png

    图2 样本标准偏差和总体标准偏差的定义

    Output Variable List:用于指定需要输出统计参数的变量。单击后面的按键3可以打开变量列表,按住ctrl键可以同时选取多个参数。

    Start Iteration List:用于给定统计参数计算的起始时间步,如果不勾选前面的复选框则默认从模拟的第一步开始。

    Stop Iteration List:用于给定统计参数计算的终止时间步,如果不勾选,则默认统计计算结束于模拟的最后一个时间步。

    Start Iteration List和Stop Iteration List可以对每个变量指定不同的统计计算区间,各变量间的起始、终止时间步用逗号隔开。如图1所示,变量AbsolutePressure的统计计算区间为[28714, 29353],Pressure的统计区间为[27000, 28000]。如果给出的时间步少于变量个数,时间步列表的最后一个时间步将应用于剩余未指定起止时间步的变量。如图1所示,界面中并未对变量Velocity指定起止时间步,则软件将默认其统计区间为[27000(Start Iteration List的最后一个数字), 28000(Stop Iteration List的最后一个数字)]

    2. 统计学参数的后处理

    计算结束后,用CFD-Post打开计算结果,可以在变量列表中找到统计学参数如图3所示。

    352bfa232b021d3304b8dd3ca0dc8895.png

    图3 CFD-Post变量列表中的统计学参数

    均值、最大值、最小值、均方根、标准偏差的变量格式分别为:.、.、.、.、.

    在CFD-post中可以基于这些统计参数进行绘图、定义新变量等操作。

    3. 特殊案例:弱非定常流动中表压标准偏差和绝对压力标准偏差的对比

    算例描述:算例模拟了带叶尖间隙低速平面叶栅的非定常流动,结果表明叶尖区存在非定常流动现象,导致叶尖附近叶片表面出现了较弱的压力脉动。

    338f64139c5f2116c9548c205c4ca17d.png

    图4 叶片压力面的表压和绝对压力的标准偏差

    图4对比了叶片压力面的表压(相对压力)和绝对压力的标准偏差。表压RelativePressure的定义为绝对压力Absolute Pressure与参考压力之差,这里的参考压力设定为一个大气压。我们知道当样本同时加或减去一个常数(也就是参考压力),其标准偏差不会发生变化,即:

    aaa0fb2e022a6ade8407eb0bc6041e87.png

     因此,表压和绝对压力计算出的标准偏差理应完全相同。然而图4中,表压和绝对压力的标准偏差云图却差异巨大。其中,表压的标准偏差正常,而绝对压力的标准偏差云图布满噪点,完全看不出任何规律,明显不合理。造成这一现象的原因究竟是什么呢?以下为个人推断的原因。

    CFX-Pre的用户手册中指出“Whenever thestandard deviation is computed, the arithmetic average and RMS statistics arealso computed”, 即每当计算标准偏差时,平均值和RMS也会被计算。然而,由图2中样本标准偏差的公式可知,计算标准偏差应该只需要均值E(X)即可,并不需要RMS。我推断CFX应该采用的不是图2中的公式,很可能借助了方差与均值之间的关系式(如图5所示),通过RMS和均值来计算出标准偏差。

    cf75c5a65c9fd24b4b761e8740ca662c.png

    图5

    图6对比了用RMS和均值计算的样本标准偏差S。图中可以看出,RMS和均值计算出与图4中求解器得到结果一致。

    2cb8ac737ded08c74b3bb6393075f81f.png

    图6 RMS和均值计算出的S

    在进行图6的计算时,需要对样本和均值进行平方运算。其中绝对压力的数量级为105,其平方和的数量级将达到1010。然而,算例采用了单精度求解器,浮点数仅有23个二进制有效位,换算成10进制最多只有7个有效数字。由图4(a)可以看出,叶片表面静压脉动的量级最大仅为101。在一些区域,压力脉动对绝对压力平方的影响很可能就湮灭在了浮点数存储带来的精度损失中,最终导致标准偏差计算出错。

    为了进一步验证上述猜想,我们在参考压力为0的模式下运行了一次算例,此时相对压力的量级也达到了105,结果如图7所示。可以看出,相对压力标准偏差的计算结果与绝对压力一样不合理,算例没有得到正确的压力脉动标准偏差。因此,在对弱非定常流动进行模拟时,需要合理选择参考压力以尽可能降低表压的数量级、进而获得更精确的统计结果。

    上述仅为个人观点,如果您有更好的分析,欢迎在评论区留言。

    6a5cd38d4462822df9205dcc3b7c02f4.png

                   图7 参考压力为0[Pa]时的相对压力标准偏差  

    4. 高阶矩的计算

    目前ANSYS CFX无法在软件中直接实现Skewness(三阶中心矩,表征概率密度函数分布的非对称性)、Kurtosis(也称flatness,四阶中心矩,表征概率密度函数分布的陡峭程度)等高阶矩的计算,需要采用一些间接的方法。例如:先提取多个流场快照,然后借助其他软件处理。在CFX提取2D流场快照的方法可以参考往期文章【软件使用经验】ANSYS CFX获取多时间步2D流场快照的3种方法。

    参考文献:ANSYS. Ansys CFX-pre user’s guide.

    展开全文
  • 数据分析常用软件及工具

    千次阅读 2019-09-09 12:05:29
    数据分析常用软件及工具 SPSS:是统计产品与服务解决方案(Statistical Product and Service Solutions)的简称,为IBM公司的一系列用于统计学分析运算、数据挖掘、预测分析和决策支持任务的软件产品及相关服务的...

    数据分析常用的软件及工具

    SPSS:是统计产品与服务解决方案(Statistical Product and Service Solutions)的简称,为IBM公司的一系列用于统计学分析运算、数据挖掘、预测分析和决策支持任务的软件产品及相关服务的总称。

    Stata:是Statacorp于1985年开发出来的统计程序,在全球范围内被广泛应用于企业和学术机构中。许多使用者工作在研究领域,特别是在经济学、社会学、政治学及流行病学领域。 Stata的一系列功能包括: 数据管理 统计分析 图表 模拟 自定义编程。

    SAS:统计分析系统(英文:Statistical Analysis System),由北卡罗来纳州立大学两位生物统计学研究生所编写及制定,最早只是一个数学统计软件,于1976年由Jim Goodnight及John Sall博士等人成立统计分析系统公司,并且正式推出相关软件。

    展开全文
  • 统计学P值

    千次阅读 2019-05-06 19:30:02
    P 值是最常用的一个统计学指标,几乎统计软件输出结果都有P值。 统计学的观点,超过一定基准(比如 5%,其实是低于5%),就不能简单地认为这是偶然事件了,而是受到了外在的影响。 数学大佬出来定义了一个称为值...

    P 值是最常用的一个统计学指标,几乎统计软件输出结果都有P值。 
    统计学的观点,超过一定基准(比如 5%,其实是低于5%),就不能简单地认为这是偶然事件了,而是受到了外在的影响。

    数学大佬出来定义了一个称为 P 值(p-value)的概念:

    罗纳德·艾尔默·费希尔爵士(1890-1962)

    得到的就是(单侧P值):

    \text {p-value}=P(8\leq X\leq 10)=0.05\\

    所以(双侧P值):

    \text {p-value}=P(0\leq X\leq 2)+P(8\leq X\leq 10)=0.1\\

    如果扔10次出现出现8次正面:

    \text {p-value}=P(8\leq X\leq 10)=0.05\leq 0.05\\

    一般而言,为了确定从样本(sample)统计结果推论至总体时所犯错的概率,我们会利用统计学家所开发的一些统计方法,进行统计检验

    通过把所得到的统计检定值,与统计学家建立了一些随机变量的概率分布(probability distribution)进行比较,我们可以知道在多少百分比的机会下会得到目前的结果。倘若经比较后发现,出现这结果的机率很少,亦即是说,是在机会很少、很罕有的情况下才出现;那我们便可以有信心的说,这不是巧合,是具有统计学上的意义的(用统计学的话讲,就是能够拒绝虚无假设null hypothesis,Ho)。相反,若比较后发现,出现的机率很高,并不罕见;那我们便不能很有信心的直指这不是巧合,也许是巧合,也许不是,但我们没能确定。

    • 如果 P<0.01,说明是较强的判定结果,拒绝假定的参数取值。
    • 如果 0.01<P值<0.05,说明较弱的判定结果,拒接假定的参数取值。
    • 如果 P值>0.05,说明结果更倾向于接受假定的参数取值。

    比如一枚均质硬币,抛 10 次:

    在比如这样一个问题,某公司声称研制了一种系统,对此地的犯罪事件进行预测成功的概率为 70%,已知某天的 14 起案件预测对了 13 件,那么统计学意义上,公司是否谎报了自己的数据呢?

     

     

     

     

    展开全文
  • 文末扫码领取【Python开源项目包】上篇文章→:数据分析5大软件「优势PK」:Python、Excel、R、SAS、SPSS你最爱哪个?作者 | 求知鸟来源 | 知乎开门见山。这篇文章,教大家用Python实现常用的假设检验!服从什么分布...
  • 现代统计学与SAS应用

    2008-12-01 14:52:34
     第1篇 统计学基础知识与SAS软件应用技巧 第1章 绪论  第1节 统计学的理论基础和研究对象  第2节 统计学的任务和作用  第3节 统计学的主要内容  第4节 学习统计方法的捷径  第5节 统计资料的...
  • 数据分析技能、统计学基础、计算机技能、设计/审美、商业理论、管理学、市场营销、销售、宏观经济学 这里就先推荐一些入门类的书籍吧。 1、统计基础(《深入浅出统计学》、《商务与经济统计(第12版)》) 2、分析...
  • 为什么要学习SPSS统计分析软件是数据分析的主要工具统计设计完成后,完整的分析过程包括数据的搜集数据的整理数据的分析结果的报告统计学为数据分析提供一套完整的科学的方法论,统计软件为数据分析提供了实现手段。...
  • 统计学方法与数据分析(上下册)

    热门讨论 2013-12-29 11:32:47
    3.2计算器、计算机及软件系统 3.3单个变量数据的描述:图表法 3.4单个变量数据的描述:中心趋势的度量 3.5单个变虽数据的描述:变异性度量 3.6盒形图 3.7多变量数据的概括 3.8小结 重要公式 补充练习 第四部分...
  • 3.用于数据整理和统计分析的常用统计软件有等。4. 描述数据集中趋势的常用测度值主要有、和等,其中最重要的是;描述数据离散程度的常用测度值主要有、、、等,其中最重要的是、。(二)选择题1. 各样本观察值均加同一...
  • 2)常用统计学软件:2、变量筛选遵循的基本原则1)足够的统计学效能:2)依据临床研究报告的以往经验筛选:3)结合临床知识筛选:3、变量筛选的基本共识1)结合临床专业知识:2)根据单因素分析结果筛选变量:3)...
  • revman meta分析软件

    2019-01-22 15:55:15
    软件用于医学统计学meta分析,是一个常用的meta分析软件
  • SPSS11.5软件打包

    热门讨论 2009-05-28 09:28:26
    本书共24章,分基础篇和高级篇两部分,基础篇介绍了SPSS的基本知识和常用统计学方法;高级篇囊括了大量现代统计学分析方法,如决策树分析、多项分类logistic回归、Poisson回归、重复测量资料分析、混合效应模型分析...
  • 常用数值计算库

    千次阅读 2013-10-08 22:49:55
    常用数值计算库 Intel Math Kernel Library 1.基本线形代数运算(BLAS) 向量与向量、向量与矩阵、矩阵与矩阵的运算 2.稀疏线形代数运算 3.快速傅立叶变换(单精度/双精度)(fftw) 4.LAPACK(求解线形方程组、最小方差、...
  • 博客要写的内容就是这个学期学的很多门课程,比如算法、统计学原理之类的文章。 一方面也是相当于这个学期的总结,我现在觉得对一门课或者一个学期学到的知识进行总结还是挺有必要的;另一方面也是自己重新学习知识...
  • 当说到一款功能强大但操作简单的统计分析软件时,你首先想到谁!当然是spss!它操作简单编程方便功能强大数据接口针对性强当然,它最强大的还是分析功能!为了让大家更好地利用spss,我们为大家准备了《基于SPSS的...
  • 按系统功能分,不同的数据平台对应着不同的常用软件。在大数据兴盛的今天,欲进军数据界的你,应该对此有更进一步的了解。以下,大圣众包威客平台将为你推介。  1.数据挖掘模块  作为一个跨学科的计算机...
  • 按系统功能分,不同的数据平台对应着不同的常用软件。在大数据兴盛的今天,欲进军数据界的你,应该对此有更进一步的了解。 1.数据挖掘模块 作为一个跨学科的计算机科学分支,数据挖掘是用人工智能、机器学习、统计学...
  • 统计学常用软件 SPSS 进行主成分分析的详细步骤
  • 按系统功能分,不同的数据平台对应着不同的常用软件。在大数据兴盛的今天,欲进军数据界的你,应该对此有更进一步的了解。以下,大圣众包威客平台(www.dashengzb.cn)将为你推介。1.数据挖掘模块作为一个跨学科的...
  • 本书共24章,分基础篇和高级篇两部分,基础篇介绍了SPSS的基本知识和常用统计学方法;高级篇囊括了大量现代统计学分析方法,如决策树分析、多项分类logistic回归、Poisson回归、重复测量资料分析、混合效应模型分析...
  • 欢迎关注小号:医学统计数据分析,今天我们来介绍一下医学统计学中常用统计学方法的R语言基本操作。 R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计...
  • 数据分析师的职业规划

    千次阅读 2014-07-13 15:24:20
    数据挖掘、统计学、数据库相关专业,熟练掌握关系数据库技术,具有数据库系统开发经验,熟练掌握常用的数据挖掘算法,具备数理统计理论基础,并熟悉常用的统计工具软件,具有相关的行业知识,或者能够很快熟悉相关的...
  • 在基因表达矩阵计算过程中,我们需要获得各个样品的基因表达矩阵,以便后续做差异基因/转录本...事实发现,常用统计学软件如Excel在数据处理过程中并不是一个理想的工具,甚至在我们统计基因列表的时候Excel存在...
  • 梁劲(Jim Liang),来自 SAP (全球第一大商业软件公司)。 书籍特点 条理清晰,含图像化表示更加易懂,对公式有详细的注解等。 内容概要 主要分为基本概念、常用算法和其他三部分。 为什么会这样? 首当其冲就是...
  • 1)excel等常用办公软件 2)SQL等数据库 3)python等常用分析语言 二.该怎么学 1.理论: 1)统计学:《商务经济与统计》 @数据分析的核心 @理解书本概念,重要的公式最好自己手工推理 2)概率论:《A ...

空空如也

空空如也

1 2 3 4
收藏数 68
精华内容 27
关键字:

常用统计学软件