-
这是一个关于计算机组成原理的问题
2020-05-31 17:47:30我原本以为按字寻址,是以字为单位寻址,每次寻址都是找的字。假如机器字长4字节,那么每个地址指向4字节。但是看这个图,我发现按字寻址和按字节寻址一样。作用都是找字节,只不过按字寻址更麻烦,要搞个组号,组内... -
在统计学中_统计学中的基本概念
2021-01-14 20:56:17总体(1)总体的概念:总体是指客观存在的、具有某种共同性质的许多个别事物组成的整体;在统计研究过程当中,统计研究的目的和任务居于支配和主导的地位,有什么样的研究目的就应该有什么样的统计总体与之相适应。...- 1 -
1.2
统计学的几个基本概念
1.2.1
总体和总体单位
1.
总体
(
1
)总体的概念:
总体是指客观存在的、具有某种共同性质的
许多个别
事物组成的整体;
在统计研究过程当中,
统计研究的目的和任务居于支配和主导的
地位,有
什么样的研究目的就应该有什么样的统计总体与之相适应。
例如:要研究我们学
院教师的工资情况,
那么全体教师就是研究的总
体,其中的每一位教师就是总
体单位;如果要了解某班
50
个学生的
学习情况,则总体就是该班的
50
名学
生,每一名学生是总体单位。
根据我们研究目的的不同,
我们要选取的研究对
象也就是研究总体相
应地要发生变化。
(
2
)总体的分类:
总体根据总体单位是否可以计量分为有限总体和无限
总体:
★有限总体:指所包含的单位数是有限的总体。
如一个企业的全体职
工、一个国家的全部人口等都是有限总体;
★无限总体:指所包含的单位数目是
无限的,或准确度量它的单
位数是不经济或没有必要的,这样的总体称为无限总
体。
如企业生产中连续生产的大量产品,
江河湖海中生长的鱼的尾数
等等。
划分有限总体和无限总体对于统计工作的意义就在于可以帮助
我们设计统计
调查方法。
很显然,对于有限总体,
可以进行全面调查,
也可以进行非全面调
查,
但对于无限总体不能进行全面调查,
只能抽
取一部分单位进行非全面调
查,据以推断总体。
(
3
)总体的特征:
★大量性:是指构成总体的单位数要足够的多,总体应
由大量的
单位所构成。大量性是对统计总体的基本要求。
个别单位的现象或表现有很大的偶然性,
而大量单位的现象综合
则相对稳
定。因此,现象的规律性
只能在大量个别单位的汇总综合中
才能表现出来。
只
有数量足够的多,
才能准确地反应我们要研究的总
体的特征,达到我们的研究
目的。
★同质性:指总体中各单位至少在某一个方面性质相同,使它们
可以结合起
来构成总体。同质性是构成统计总体的
前提条件
。
-
IT规划:三个层面_架构是核心
2014-02-17 13:45:15有些单位的IT规划仅是对总体IT架构蓝图的设计。那么IT规划内涵究竟是指什么? 通常而言,IT规划是指信息技术战略规划(IT Strategic Planning),它包括两个部分:信息技术战略(IT Strategy)的制定和信息技术行动... -
AB实验你真的了解嘛
2020-11-06 19:56:05在实际实验时会从总体抽取部分个体组成样本单位,并从个体实验结果推断总体结果。 1-1、实验原因 由于对照实验遵循单一变量原则,能通过对比发现因果性,并根据实验结果量化正向和负向的影响程度。 当实现了...1 为什么要做A/B实验?
A/B实验,是一种验证假设的方法,其核心方法及原理分别是对照实验及假设检验。
在实际实验时会从总体抽取部分个体组成样本单位,并从个体实验结果推断总体结果。
1-1、实验原因
由于对照实验遵循单一变量原则,能通过对比发现因果性,并根据实验结果量化正向和负向的影响程度。
当实现了某个新的特性,我们无法准确预估上线后是增益还是减益,从风险和成本的角度考量,会切分小流量进行验证。
小型实验也意味着大部分能在单研发团队自助完成,时间和效率也能得到保障。
1-2、适用场景
A/B实验,解决的是策略优化问题,它能帮助我们从可选策略中选择最优策略。
它可以让我们在已达到的山上越来越高,却不能用它来发现一座新的山脉。
2 明确目的
数据分析的过程中一般的次序为:相关性>>因果性>>效果。
先通过数据分析洞察相关性,再通过实验提出假设,模糊预估其因果性。在证明成功后根据首次实验效果,持续优化时再进行清晰预估。
3 确认指标
1)正负指标
正向指标,一般依据实验路径制定,是策略好坏的直接评价,如:留存人数->点击人数->浏览人数->成交人数。
负向指标,适用于结果指标相近的场景,如实验策略是下发公众号模板,其中两组的成交人数相近,但实验组却致使用户取关人数激增。
如正向收益小于负向收益,则应分析问题考虑优化实验或停止实验。
2)结果、过程、观察指标
结果指标是实验目的,过程指标体现如何完成。观察指标则指的相关性指标,多用于预估上升空间,如成交人数上升,但件均金额较低或购买对象仅覆盖本人。
依据观察指标,可以预估上升空间,并设计下一个实验。这3个指标在此前《数据分析的逻辑思维及分析方法》已有较全面的描述,在这里也不再赘述了,有兴趣的朋友可以查阅该文章。
4 制定策略
4-1、实验类型
1)互斥实验
遵循单一变量原则的代表是互斥实验,即用户同时间仅可进行一个实验,通过流量的互斥保障实验结果不受干扰。
但当实验越来越多,同时间可进行实验的用户量减少。流量不足,样本的代表性差。如果要等待前述实验结束再进行下一实验,验证周期增长、效率降低。
2)正交实验
为了解决互斥实验的流量问题,使用的方法是正交实验,也称分层实验。在此,分层的依据是不同的实验。
正交实验能使流量共享,同时进行多个实验,但我们需保障各层的划分参数相互独立且互不影响。
如:上一层的绿色字体不能与绿色背景正交。但绿色字体可以与蓝色背景正交实验,绿色字体也可以与只能推荐正交。
最后还有一个小的细节是,实验流量的来源不仅是上一层实验。这里涉及的内容可以参考谷歌的论文《Overlapping Experiment Infrastructure》。
4-2、实验设计
实验设计须注意的点是,尽量先粗后细,尽量先追求深度再追求广度。当产品有明显不佳的体验,其实更应该迅速迭代优化,并不是每件事都要有数据、有实验证明。
5 选择样本
5-1、抽样的原则
1)唯一性原则
唯一性指在用户进行实验时,从始至终仅命中相同的策略。帮助我们更准确的归因并让用户维持相同的体验。
2)均匀性原则
均匀性原则有两层定义,数量的均匀和特征的均匀。
前者是为了保证组间样本数量,减少因数量小导致实验波动过大,后者则能使样本代表性更强。假设分组中的女性占比过高,则实验的结论无法推断男性在这一实验中是否有类似的行为。
特征的均匀也应与实验目的相结合,如实验指标为某按钮点击率,实验组样本的点击率已在较高的基准线上,则可能无法分析策略优劣。
5-2、抽样方法
1)完全随机分组
完全随机分组,也称CR(Complete Randomization),是最常见的随机分组方式之一。常见的实现形式为对某ID字段哈希后对10取模,根据结果值进入不同的组。
如果随机选取ID进行哈希取模,那么是简单随机抽样。如果先将ID排序,逢6取1(6、16、26...)后再进行哈希取模,我们也称之为等距抽样。
2)重新随机分组
完全随机分组,由于不考虑样本的特征是否均匀,可能会导致某组样本的结果指标偏高或者偏低。为了解决此问题,我们可以AA实验观察样本差异或使用重新随机分组(ReRandomization)。
其原理为,每次随机分组后,通过验证组间差异是否小于设定的阈值。如果差异大于阈值,则重新分组,否则则停止分组。
此方法相比完全随机分组更准确,由于缺乏重跑的依据,得到合适的样本是概率性的,也可能造成很大的耗时。一般而言样本量越大,重分的次数越少。
3)自适应分组
Adaptive自适应分组,是滴滴AI Lab团队自研的分组方法,其能够在只分组一次的情况下,让选定的观测指标在分组后每组分布基本一致。
它在每次分组的时,记录当前分配的样本数以及样本分布,并计算当前对象分配至该组后该组的特征均匀情况,从而决定应分至哪个组。
6 实验分析
6-1、放量/全量
A/B实验,是小流量验证的实验方式,那我们应如何放量呢?
其前提如下:
1)结果显著,至少保证95%的可信度。
2)正向指标价值>负向指标价值
3)效果稳定,不因时间周期等元素变化剧烈波动
常见的放量方式有两种,流量开放以及实验推广。流量开放包含了实验内对照组和实验组流量的切分,也可在源头再增加样本。
实验推广,则是将此实验在其他特征、行为的群体中推广。
6-2、再实验&终止
再实验的原因,从效果的次序来看是:无法肯定是否有效果->无效果->效果不明显->负反馈。负反馈如果影响了核心流程,则应考虑终止实验。
关于这2者的分析方法和需求分析是相近的,可以参考逻辑树“自下而上”的方法,先将每1环节可能出现的问题,再依次向上聚合。
7 几个理论
1)辛普森悖论
在分组中占优势的一方,在整体中有时反而是劣势的一方。
2)幸存者偏差
只看结果,却忽略了呈现结果的用户是谁。
3)新奇效应
一开始对实验策略有较好的回应,但一段时间迅速消失。
前2者,主要用于探究样本的代表性和均匀性。新奇效应则应在单一变量下,重复、长时地进行实验,保障实验结果不受实验影响。
写在最后
这篇文章始终感觉难度很大,从双盲实验到A/B实验,这两个词已经被成千上万的文章解读过很多遍,让我甚至写不出前言。最终选择的切入点是,逻辑梳理和知识再提炼。
也因为再提炼,会根据自身的理解省略了前期建设、上线监控等环节,其中监控更适合开单章,而数学、算法原理已经有朋友总结了很全面了,有兴趣的朋友可以阅读下方的参考资料。
感谢你看到这里,谢谢。
参考资料
1、腾讯PCG-E计划:实验设计及决策基础篇
2、ABtest 和假设检验、流量分配
https://www.6aiq.com/article/1555861276270?p=1&m=0
3、假设检验的运用
https://www.cnblogs.com/wobujiaonaoxin/articles/11910326.html
4、abtest-数据分析-假设检验基础
https://cloud.tencent.com/developer/article/1427845
5、哈希表是什么
http://www.woshipm.com/pmd/805326.html
6、区块链节点间的数据验证:哈希值与非对称加密
http://www.woshipm.com/blockchain/1019704.html
7、Overlapping Experiment Infrastructure重叠的实验基础设施
https://max.book118.com/html/2018/0131/151334020.shtm
8、AB实验在滴滴数据驱动中的应用
-
【HarmonyOS学习笔记】第一节:Ability与AbilitySlice讲解
2020-09-23 22:05:08Ability是应用所具备能力的抽象,也是应用程序的重要组成部分。一个应用可以具备多种能力(即可以包含多个Ability),HarmonyOS支持应用以Ability为单位进行部署。 Ability分为两种: FA (Feature Ability): ...1.什么是Ability?
Ability是应用所具备能力的抽象,也是应用程序的重要组成部分。一个应用可以具备多种能力(即可以包含多个Ability),HarmonyOS支持应用以Ability为单位进行部署。
Ability分为两种:
FA (Feature Ability):
Page模板是FA唯一支持的模板,用于提供与用户交互的能力。一个Page实例可以包含一组相关页面,每个页面用一个。
PA (Particle Ability):
PA支持Service模板和Data模板:
Service模板:用于提供后台运行任务的能力;
Data模板:用于对外提供统一的数据访问抽象。
1.1 总体概述:
Ability 是一个窗口;
AbilitySlice 是窗口里面的一个页面。
1.2 举个例子:
如果使用Ability切换,它会新弹出一个窗口
如果使用AbilitySlice切换,相当于是同一个窗口,不断的切换新的页面
2 MyApplication
2.1 概述:
MyApplication.java相当于是一个总的入口,然后去启动MAinAbility
2.2 鸿蒙工程怎么知道要启动谁?
根据工程中config.json文件中abilities的配置,找到abilities,在找到abilities中的name属性,可以知道首先启动的是MainAbility。
3 注意:
自己开发的xxxAbility必须要继承Ability
自己开发的xxxAbilitySlice必须要继承AbilitySlice -
excel的使用
2012-11-25 17:06:01$#,##0.00_)” 使用条件运算符也可以作为缩放数值的强有力的辅助方式,例如,如果所在单位生产几种产品,每个产品中只要几克某化合物,而一天生产几千个此产品,那么在编制使用预算时,需要从克转为千克、吨,这时... -
基于AT89S52 单片的频率计
2010-01-04 08:47:37单片机的起振电路是有晶振和两个小电容组成的。 晶振的作用:它结合单片机内部的电路,产生单片机所必须的时钟频率,单 片机的一切指令的执行都是建立在这个基础上的,晶振的提供的时钟频率越 高,那单片机的运行... -
陕西省公共体育场馆开放利用现状影响因素的调查与分析
2010-12-03 00:11:01公共体育场馆是大众健身活动和竞技体育比赛、训练的重要场所,是体现国家实力和开展体育事业的重要组成部分。在目前公共体育场馆总量还发展很不平衡的状况下,为了适应社会市场经济发展的需要、拓宽体育事业的经费... -
国资委20XX年上半年工作情况汇报.doc
2021-01-15 14:29:41国资委20XX年上半年工作情况汇报 xx年,xx市国资委在市委、市政府的正确领导下,紧紧围绕“提速、增效、进位”的总要求,在没有出资人企业的情况下,顺应单位性质的转变(从政府特设部门转变为政府组成部门),以... -
软件资料文档标准规格
2009-04-02 09:34:59◇ 概要设计说明书:该说明书是概要实际阶段的工作成果,它应说明功能分配、模块划分、程序的总体结构、输入输出以及接口设计、运行设计、数据结构设计和出错处理设计等,为详细设计提供基础。 ◇ 详细设计说明... -
让你的网页更丝滑(全)
2021-01-08 14:41:34这个60HZ是什么意思?就是指屏幕每秒钟刷新60次。所以我们可以通过屏幕作为参考,如果我们的网页也可以每秒钟往屏幕传输60个画面,用户就会觉得这个网页是流畅的,有一个单位叫做FPS,... -
软件工程教程
2012-07-06 23:10:29问:开发这个软件目标是什么? 答: 提高用户对音乐的学习和娱乐 参与创作音乐 项目背景--钢琴练奏师 问:为什么传统音乐程序不好? 答: 传统音乐程序功能单一,容易令人感到枯燥无味,没有吸引力; 传统音乐... -
《编译原理》课后习题答案
2011-10-24 18:16:21各部分的主要功能是什么?并画出编译程 序的总体结构图。 答案: 一个典型的编译程序通常包含 8 个组成部分,它们是词法分析程序、语法分析程序、语 义分析程序、中间代码生成程序、中间代码优化程序、目标代码... -
软件测试规范
2018-04-23 09:16:121.什么是软件测试 .................................................................................................................................. 2 2.软件测试的目标 .................................... -
软件工程-理论与实践(许家珆)习题答案
2011-01-12 00:49:42C) 解决系统是“做什么的问题” D) 解决系统是“如何做的问题” 2. 需求分析的主要方法有(C D)。 A) 形式化分析方法 B) PAD图描述 C) 结构化分析(SA)方法 D) OOA法 3. 面向对象的分析方法主要是... -
计算机二级C语言考试题预测
2010-06-08 18:29:34(67) 数据处理的最小单位是(C) 注:数据项不可再分割 A. 数据 B. 数据元素 C. 数据项 D. 数据结构 (68) 下列有关数据库的描述,正确的是(C) 注:P102 A. 数据库是一个DBF文件 B. 数据库是一个关系 C. 数据库是一个... -
二级C语言公共基础知识
2009-11-20 11:26:03(15) 在软件生命周期中,能准确地确定软件系统必须做什么和必须具备哪些功能的阶段是______。(D) A. 概要设计 B. 详细设计 C. 可行性分析 D. 需求分析 (16) 数据流图用于抽象描述一个软件的逻辑模型,数据流图由一些... -
ASP.NET精品课程+源代码
2009-01-05 20:15:51目前ASP.NET已成为微软推出的新一代MicroSoft.Net的一个重要的组成部分。 ASP.NET是Microsoft可用于创建和运行动态的交互式 Web 服务器应用程序。使用可合并的 HTML 页、脚本命令以及 COM 组件,可以创建交互式 Web ... -
Excel公式与函数大辞典.宋翔(带书签高清文字版).pdf
2019-03-02 08:33:511.1.1 公式的组成部分 1 1.1.2 数据类型及其相互转换 2 1.1.3 运算符及其优先级 3 1.1.4 普通公式与数组公式 5 1.1.5 单个单元格公式与多个单元格公式 5 1.1.6 Excel对数字精度、公式与函数等方面的限制 5 ... -
UML和模式应用 面向对象分析与设计导论
2010-02-07 15:04:491.5.3 组织中的角色是什么 1.5.4 谁该干什么?他们之间如何协作 1.6 面向对象的分析与设计的例子 1.6.l 定义用况 1.6.2 定义概念模型 1.6.3 定义协作图 1.6.4 定义设计类图 1.6.5 掷骰子游戏... -
由于蚂蚁的行为轨迹是随机分布的,因此在单位时间内,短路径上的蚂蚁数量比长路径上的蚂蚁数量要多,从而蚂蚁留下的信息素浓度也就越高。这为后面的蚂蚁们提供了强有力的方向指引,越来越多的蚂蚁聚集到最短的路径...
-
门禁系统设计 论文 完整版
2009-03-24 10:09:394.进出通道的时段:就是设置进出该通道的人在什么时间范 围内可以进出。 2.实时监控功能 系统管理人员可以微机实时察看每个门区人员的进出情况(同时有照片显示),每个门区的状态(包括门的开关,各种非正常状态... -
软件工程知识点
2012-12-02 21:34:25软件定义是软件项目的早期阶段,主要由软件系统分析人员和用户合作,针对有待开发的软件系统进行分析、规划和规格描述,确定软件是什么,为今后的软件开发做准备。这个时期往往需要分阶段地进行以下几项工作。 1.... -
《数学要项定理公式证明辞典》作者: [日]笹部贞市郎 译者: 高隆昌 / 王世璠 / 田景黄 / 罗朝杰 出版年: ...
2019-05-25 16:34:421·1 虚数单位 1·2 复数的定义 1·3 复数的四则运算 1·4 共轭复数 1·5 复数的模 1·6 复数的极坐标形式(复数的三角表示式) 1·7 复数的旋转 2.复数与图形 2·1 复数的四则运算的图示 2·2 复数的性质 2·3 映射 2... -
国家标准是什么?公摊多少才合理? 2.8.4 户型 什么是好的户型? 也推荐大家看一些装修的书和装修案例,看看不同的户型如何来设计和改造可以更好满足自己的居住需求,目前我了解下来,很多同学都面临1改2,2改3的...
-
《数学要项定理公式证明辞典》 作者: [日]笹部贞市郎 译者: 高隆昌 / 王世璠 / 田景黄 / 罗朝杰 出版年: ...
2019-05-25 16:46:491·1 虚数单位 1·2 复数的定义 1·3 复数的四则运算 1·4 共轭复数 1·5 复数的模 1·6 复数的极坐标形式(复数的三角表示式) 1·7 复数的旋转 2.复数与图形 2·1 复数的四则运算的图示 2·2 复数的性质 2·3 映射 2... -
oracle学习文档 笔记 全面 深刻 详细 通俗易懂 doc word格式 清晰 连接字符串
2017-05-06 20:26:52组成:表空间、段、区、块的组成层次 六、 oracle安装、卸载和启动 硬件要求 物理内存:1GB 可用物理内存:50M 交换空间大小:3.25GB 硬盘空间:10GB 安装 1. 安装程序成功下载,将会得到如下2个文件: ... -
1.三改一拆是什么 2.2018拆迁大幕-主城要拆4万户、萧山8000户、临安1500户 3.2018年棚户区改造计划(第三批) 4.主城区城中村改造五年(2016-2020)攻坚行动计划 5.2017年主城区拆迁表 6.余杭区2017-2019年城中村改造...
-
《数据结构 1800题》
2012-12-27 16:52:03二者有何相同和不同之处,抽象数据类型的主要特点是什么? 使用抽象数据类型的主要好处是什么?【北京邮电大学 1994 一(8分)】 4. 回答问题(每题 2分)【山东工业大学 1997 一 (8分)】 (1)在数据结构课程中...