精华内容
下载资源
问答
  • 重新引入了带有状态反馈的重复控制(RC),其中包括过去的误差前馈和当前误差反馈方案,用于线性时不变系统。 周期扰动在重复系统中很常见,可以用时延模型表示。 拟议的设计着重于隔离干扰模型并找到围绕延迟模型...
  • 级别内变化包括单个级别的测量误差方差,这通常将级别内变化的影响扩展到类内相关。 因此,多级CFA生成的结果与通过完全可靠的措施生成的结果相对应。 如果跨级别指定了相同的度量模型,则通过将每个项目的负载定义...
  • 抽样类型详细说明

    2016-03-24 10:41:11
    概率抽样是依据概率论的基本原理,按照随机原则进行的抽样,因而它能够避免抽样过程中的人为误差,保证样本的代表性;而非概率抽样则主要是依据研究者的主观意愿、判断或是否方便等因素来抽取对象,它不考虑抽样中的...

    抽样的类型
      根据抽取对象的具体方式,人们把抽样分为许多不同的类型。总的来说,各种抽样都可以归为概率抽样与非概率抽样两大类。这是两种有着本质区别的抽样类型。概率抽样是依据概率论的基本原理,按照随机原则进行的抽样,因而它能够避免抽样过程中的人为误差,保证样本的代表性;而非概率抽样则主要是依据研究者的主观意愿、判断或是否方便等因素来抽取对象,它不考虑抽样中的等概率原则,因而往往产生较大的误差,难以保证样本的代表性。
      概率抽样与非概率抽样又各自包括了许多具体类型。分别适用于不同调查对象。联系实际认识概率抽样的不同类型及其适用性是掌握抽样方法的关键。
      (一)概率抽样
      概率抽样又称随机抽样,是指总体中每一个成员都有同等的进入样本的可能性,即每一个成员的被抽概率相等,而且任何个体之间彼此被抽取的机会是独立的。概率抽样以概率理论为依据,通过随机化的机械操作程序取得样本,所以能避免抽样过程中的人为因素的影响,保证样本的客观性。虽然随机样本一般不会与总体完全一致,但它所依据的是大数定律,而且能计算和控制抽样误差,因此可以正确地说明样本的统计值在多大程度上适合于总体,根据样本调查的结果可以从数量上推断总体,也可在一定程度上说明总体的性质、特征。正是因为如此,现实生活中绝大多数抽样调查都采用概率抽样方法来抽取样本。
      概率抽样依照具体抽样方法的不同,分为以下类型:
      1.简单随机抽样
      简单随机抽样又称纯随机抽样,是指在特定总体的所有单位中直接抽取n个组成样本。它是一种等概率抽样和元素抽样方法,最直观地体现了抽样的基本原理。简单随机抽样是最基本的概率抽样,其它概率抽样都以它为基础,可以说是由它派生而来的。
      简单随机抽样分为重复抽样和不重复抽样两类。
      常用的简单随机抽样方法有直接抽样法、抽签法和随机数表法。
      其中直接抽样法、抽签法适用于总体规模稍小的抽样;随机数表法是用随机数表来抽样的方法,适用于总体规模稍大的抽样。 
      简单随机抽样没有人为因素的干扰,简单易行,是概率抽样的理想类型。但是它也有很大局限性。
      第一,这种抽样方法,在总体同质性较高时,用来比较准确有效,但在总体异质性较高时,则不一定效果好。这是因为当构成总体的个体差异较大时,用简单随机抽样方法抽出的样本由于在总体中的分布不一定均匀,所以很可能误差较大,不能很好地说明总体的性质和特征。
      第二,当总体所含个体数目太多时,采用这种抽样方式不仅费时、费力、费钱,而且很难操作。
      2.系统抽样
      系统抽样也称等距抽样或机械抽样,是按一定的间隔距离抽取样本的方法。其做法是先编制抽样框,将总体的所有单位都按一定标志排列编号;再用总体的单位数除以样本的单位数,求得抽样间距;然后,在第一个抽样间距内随机抽出第一个样本单位,作为抽样的起点;接着,按照抽样间距依次抽取样本单位,直到抽足样本的单位数为止。
      同简单随机抽样相比,系统抽样有明显的优点。
      第一,当总体规模较大时,系统抽样比简单随机抽样中的随机数表法易于实施,工作量较少。它不需要反复使用随机数字表抽取个体,而只需按照间隔等距抽取即可。
      第二,系统抽样的样本不是任意抽取,而是按照间隔等距抽取,所以在总体中的分布更均匀,抽样误差一般也要小于简单随机抽样,也就是说精确度更高,代表性更强。
      系统抽样的局限性与简单随机抽样一样,也是仅适用于同质性较高的总体。当总体内不同类别个体的数量相差过于悬殊时,采用此法所抽出的样本代表性可能较差。另外,总体单位的排列不能呈有规律分布的状态,否则会使系统抽样产生很大误差,降低样本的代表性。
      3.分类抽样
      所谓分类抽样也叫类型抽样或分层抽样,就是先将总体的所有单位依照一种或几种特征分为若干个子总体,每一个子总体即为一类,然后从每一类中按简单随机抽样或系统随机抽样的办法抽取一个子样本,称为分类样本,再把它们集合起来即为总体样本。
      按照确定分层样本数量的不同方式,分类抽样分为比例分类抽样和非比例分类抽样两种。比例分类抽样是指分类样本在总体样本中所占比例与该类所有单位在总体中所占比例相同;非比例分类抽样则比例不同。
      分类抽样有着突出的优点:
      第一,分类抽样能够克服简单随机抽样的缺点,适用于总体内个体数目较多,结构较复杂,内部差异较大的情况。
      第二,精确度较高。
      第三,便于对不同层面的问题进行探索。
      第四,便于分工,使工作效率提高。
      分类抽样的缺点是,如何分类通常由人们主观判定,因此要求调查者具备较高的素质与能力,并且必须事先对总体各单位的情况有较多的了解,而它们在实际工作中有时难以完全实现,这就会影响分类的科学性和精确性。
      4.整群抽样
      整群抽样又称聚类抽样或集体抽样,是将总体按照某种标准划分为一些群体,每一个群体为一个抽样单位,再用随机的方法从这些群体中抽取若干群体,并将所抽出群体中的所有个体集合为总体的样本。整群抽样分为等规模整群抽样和不等规模整群抽样,前者总体内所有群体的规模都大致相同,后者总体内各群体规模则不等,在社会调查研究中以后一种情况居多。这种差异如果较大,就会对抽样成本预算与精确度测算以及实地调查工作造成不利影响,同时还容易产生抽样偏差。为了解决这一问题,人们往往采用概率与元素的规模大小成比例的抽样方法,简称PPS抽样(Probability Proportionate to Size),就是根据每个群体所包含的最终抽样单位(如家庭)的规模来决定各自抽取样本的比例大小,规模大则抽取样本比例相对小,规模小则抽取样本比例相对大,从而保证每个群体中的最终抽样单位都具有被抽中的同等机会。
      整群抽样与分类抽样都是将总体分为一些子群,但它和分类抽样的区别在于不是按性质和特征而是按集群性划分抽样对象。而且分类抽样中所有子群均要抽取一个样本,总体样本是各分类样本的集合,即总体样本在各类中均有分布。整群抽样则不然,它是抽取若干子群,并将这些子群的全部个体集合为总体样本,因此,总体样本只分布在部分子群之中。整群抽样对于个体单位之间界限不清的总体,能够充分发挥其作用,却并不适用于总体单位界限分明的情况。对于后者,一般还是以采用分类抽样等方法为宜。
      另外,整群抽样对于所含子群总数较少的总体也不大适用。
      5.多阶段抽样
      多阶段抽样又称多级抽样或分段抽样,就是把从总体中抽取样本的过程分成两个或多个阶段进行的抽样方法。它是在总体内个体单位数量较大,而彼此间的差异不太大时,先将总体各单位按一定标志分成若干群体,作为抽样的第1阶段单位,并依照随机原则,从中抽出若干群体作为第1阶段样本;然后将第1阶段样本又分成若干小群体,作为抽样的第2阶段单位,从中抽出若干群体作为第2阶段样本,依此类推,可以有第3阶段、第4阶段。。。直到满足需要为止。最末阶段抽出的样本单位的集合,就是最终形成的总体样本。
      在进行大规模社会调查时,如果抽样单位只有一级,而且样本的分布极其分散,所需调查费用与人力物力就巨大。多阶段抽样采用从高级抽样单位到低级抽样单位逐段抽样的方法,能够较好地解决这些问题。因此,多阶段抽样的最大优点就是可以达到以最小的人财物消耗和最短的时间获得最佳调查效果的目的,特别适用于调查范围大、单位多、情况复杂的调查对象。此外,多阶段抽样由于在各阶段抽样时可根据具体情况灵活选用不同的抽样方法,所以能够综合各种抽样方法的优点,有利于提高样本质量。
      多阶段抽样的不足之处是抽样误差较大。由于每次抽样都必然产生误差,所以抽样阶段越多抽样误差就越大。因此,为了降低抽样误差的程度,必须避免不必要的分段。
      (二)非概率抽样
      非概率抽样又称为不等概率抽样、非随机抽样或主观抽样,就是调查者根据自己的方便或主观判断抽取样本的方法。它不是严格按随机抽样原则来抽取样本,所以失去了大数定律的存在基础,也就无法确定抽样误差,无法正确地说明样本的统计值在多大程度上适合于总体。虽然根据样本调查的结果也可在一定程度上说明总体的性质、特征,但不能从数量上推断总体。
      非随机抽样的具体方法很多,其中常用的有以下几种:
      1.偶遇抽样
      偶遇抽样又叫自然抽样、方便抽样或便利抽样,是调查者将在一定时间、一定环境里所能遇见到或接触到的人作为样本的方法。具体说就是调查者根据自己的方便,任意抽取偶然遇到的人或者选择那些离自己最近的、最容易找到的人作为样本。
      2.判断抽样
      判断抽样又叫目标抽样、或立意抽样,是调查者根据研究的目标和自己主观的分析,来选择和确定样本的方法。它又可分为印象判断抽样和经验判断抽样两种。
      3.定额抽样
      定额抽样又叫配额抽样,是先根据总体各个组成部分所包含的抽样单位的比例分配样本数额,然后由调查者在各个组成部分内根据配额的多少采用主观的抽样方法抽取样本。
      定额抽样与概率抽样中的分类抽样、整群抽样都是依据某些特征对总体进行分类,但定额抽样注重的是样本与总体在结构比例上的表面一致性而不是本质特征上的内部一致性。所以往往照顾不到总体单位之间的差异性。对于那些单位众多、错综复杂、情况不断更新的调查总体而言,定额抽样的样本很可能出现较大的误差,因此,根据定额抽样样本调查的结果是不能推论较大总体的,即使在较小的调查研究中,要用定额抽样调查的结果推论总体,也应谨慎从事。它一般不是用于说明总体状况,而是用于检验理论、说明关系、比较不同等。
      4.滚雪球抽样
      滚雪球是一种形象比喻的说法,它是指先找少量的、甚至个别的调查对象进行访问,然后通过他们再去寻找新的调查对象,依次类推,就像滚雪球一样越来越大,直至达到调查目的为止。
      滚雪球抽样适用于总体的个体信息不充分或难以获得,不能使用其它抽样方法抽取样本的调查研究。
      滚雪球抽样用于某一特殊群体的调查往往可以收到奇效。但是,当总体规模较大时,有许多个体就无法找到;有时调查对象会出于某种考虑故意漏掉一些重要个体,这都可能导致抽样样本产生误差,无法正确反映总体状况。
      总之,非概率抽样不是按照概率均等的原则,而是根据人们的主观经验和便利条件来抽取样本,每个个体进入样本的概率是未知的,无法说明样本是否重现了总体的结构,所以,其样本的代表性往往较小,误差有时相当大并且无法估计,用这样的样本推论总体是不可靠的。
      但是非概率抽样也有其优势:一是在很多情况下,严格的随机抽样无法进行或没有必要,例如,在人流涌动的车站、商店、广场、街道等许多场合,不允许调查者从容地随机抽样;对诸如吸毒者之类的特殊社会群体无法确定调查总体,也就无法随机抽取样本;有时调查的目的只是要对总体作最一般的了解和接触或做某些片面的研究,没必要采用随机抽样;由于调查者的时间,人力,物力不足,无力进行随机抽样,等等。在这些情况下,就只能采用非概率抽样。二是随机抽样为了保证概率原则,对抽样的操作过程要求严格,实施起来比较麻烦,费时费财费力,而非概率抽样操作便捷,省钱省时省力,统计上也远较概率抽样简单,因此如果调查的目的允许,而且调查者对调查总体有较好的了解,那么采用非概率抽样就不失为一种更好的选择。

     

    本文转自:http://202.107.209.242/media_file/rm/ip3/wangzz/2007_03_01/shdcy/shdcy04/htm/04.htm

    展开全文
  • 该研究论文代表了非线性耦合一维反应扩散系统的数值近似,包括时间相关解的存在和唯一以及解的上下界。 此外,通过有限差分方案可以获得数值近似值,以达到合理的精度水平,并通过L2,L∞和相对误差范数进行放大...
  • 新颖之处在于,它使用高精度和可观测误差的本地时钟来判断分布式系统中事件的先后顺序。Spanner代表了分布式数据库领域的新趋势——NewSQL。Spanner是Google最近公开的新一代分布式数据库,它既具有NoSQL系统的可...
  • 包括贷款,招聘,刑事司法和广告在内的各种应用领域,机器学习因其损害历史上代表性不足或弱势群体的可能性而受到批评。 在这篇文章中,我们来讨论将机器学习的决策与长期社会福利目标结合起来的工作。通常,机器...

    内容来源:ATYUN AI平台 

    Berkeley研究:机器学习决策的偏见及对弱势群体的潜在影响

    经过训练以减少预测误差的机器学习系统通常会根据敏感特征(如种族和性别)呈现歧视行为。一个原因可能是由于数据中的历史偏见。在包括贷款,招聘,刑事司法和广告在内的各种应用领域,机器学习因其损害历史上代表性不足或弱势群体的可能性而受到批评。

    在这篇文章中,我们来讨论将机器学习的决策与长期社会福利目标结合起来的工作。通常,机器学习模型会产生一个总结个人信息的分数,以便为他们做出决定。例如,信用评分以通知银行信誉度的方式总结个人的信用记录和金融活动。让我们继续使用贷款设置作为例子。

    如下图所示,任何一组人都有特定的信用分数分布。

    1.信用评分和还款分配

    Berkeley研究:机器学习决策的偏见及对弱势群体的潜在影响

    通过定义一个阈值,分数可以做决定。例如,超过阈值分数的个人可以贷款,而拒绝低于阈值分数的个人的贷款请求。这种决策规则被称为阈值策略。

    分数可以被解释为对贷款违约的概率进行编码。例如,信用评分为650的人中有90%可能会被要求偿还授予他们的贷款。这使得银行可以通过向信用评分为650的个人提供相同的贷款来预测他们期望获得的利润。以同样的方式,银行可以通过向所有信用额度高于650的个人贷款来预测他们期望的利润。

    2.贷款阈值和成果

    向左或向右拖动黑色阈值栏以更改贷款的阈值。此图及下文图中的参数皆可变,请到原网站bair.berkeley.edu/blog/2018/05/17/delayed-impact/进行操作并观察。

    Berkeley研究:机器学习决策的偏见及对弱势群体的潜在影响

    银行总是试图最大化其总利润。利润取决于银行从偿还贷款中获得的金额与银行从违约贷款中损失的金额之比。在上面的交互式图表中,这个增益与损失的比率是1到-4。由于损失相对于收益成本更高,银行会更保守地发放贷款,并提高贷款阈值。我们将在这个阈值以上的人口比例称为选择率。

    结果曲线

    贷款决定不仅影响机构,而且影响个人。违约事件(借款人未能偿还贷款)不仅会削弱银行的利润,也降低了借款人的信用评分。成功的贷款结果会为银行带来利润,同时也会增加借款人的信用评分。在我们的运行示例中,借款人信贷评分变化的比例为1(已偿还)为-2(默认值)。

    对于阈值政策,定义为人口分数预期变化的结果可以作为选择率的函数进行参数化,我们称这个函数为结果曲线。由于一组的选择率不同,该组的结果也不尽相同。这些人口水平的结果既取决于还款的可能性(由分数编码),也取决于个人贷款决策的成本和收益。

    Berkeley研究:机器学习决策的偏见及对弱势群体的潜在影响

    上图显示了代表性人群的结果曲线。当一组中有足够人员获得贷款并成功偿还时,该组的平均信用评分可能会增加。在这种情况下,不受约束的利润最大化导致人口平均分数变化。由于我们偏离利润最大化而向更多人发放贷款,所以平均分数变化增加到最大化的某个点。我们可以称之为利他最佳(altruistic optimum)。我们还可以将选择率提高到平均得分变化低于无限制的利润最大化,但仍然为正的点,如黄色虚线区域所示。我们说在黄色虚线区域的选择率会造成危害。但是,如果有太多的人无法偿还贷款,那么该组的平均信用评分将下降,这与红色区域的情况一样。

    4.贷款阈值和结果曲线

    向左或向右拖动黑色阈值栏以更改贷款的阈值。

    Berkeley研究:机器学习决策的偏见及对弱势群体的潜在影响

    多个组

    给定的阈值政策如何影响不同群体中的个人?信用评分分布不同的两组人将会有不同的结果。

    假设第二组的信用分数分布与第一组不同,并且人数也较少。我们可以认为这个群体是一个历史上处于弱势地位的少数群体。让我们把这个小组标作蓝色小组,我们想要确保银行的贷款政策不会过度损害他们的利益。

    我们认为银行可以为每个组选择不同的阈值。尽管依赖于群体的阈值可能面临法律挑战,但它们避免了固定阈值决策可能引起的差异结果。

    5.不同群体的贷款决策

    向左或向右拖动黑色阈值栏以更改贷款的阈值。

    Berkeley研究:机器学习决策的偏见及对弱势群体的潜在影响

    什么样的阈值选择导致了蓝色组内分数分布的改进,这样的问题很有意义。正如我们之前提到的,一个无约束的银行政策将最大化利润,选择达到盈亏平衡点的阈值,超过这个限度就可以发放贷款。事实上,两组的利润最大化阈值(信用评分580)是相同的。

    公平标准

    具有不同分布的分组会得到不同形状的结果曲线(参见图6的上半部分,由实际信用评分数据和简单结果模型得出的结果曲线)。作为不受限制的利润最大化的替代方案,可以考虑公平性约束,这些公平性约束可以使团体之间的决策相对于某个目标函数相等。目前已经提出了各种公平标准来保护弱势群体。通过结果模型,我们现在可以具体回答公平限制是否在实际上鼓励更积极的结果。

    一个经常提出的公平标准——人口平等(demographic parity),要求银行以同样的速度向两个组提供贷款。根据这一要求,银行将尽可能地继续实现利润最大化。另一个标准,即机会均等,使两组之间的真实利率相等,要求银行在偿还贷款的个人中以平等的利率贷款。

    尽管这些公平标准是考虑均衡静态决策的一种自然方式,但他们经常忽略这些政策对人口结果的未来影响。图6通过对比最大利润,人口平等和机会均等带来的政策来说明这一点。尝试选择每个贷款策略来查看他们导致的银行利润和信用评分变化。与最大利润相比,人口均等和平等机会都会降低银行的利润。但是,他们是否改善了蓝色人口超过最大利润的结果?尽管相对于利他最优而言,最大利润策略偏向于蓝色区域的人群,但相对于利他最优化而言,机会均等相对过度,而人口均等则超过了对蓝色人群造成相对危害的程度。

    6.用约束模拟贷款决策

    向左或向右拖动黑色阈值栏以更改贷款的阈值。点击预设的贷款策略,查看公平性约束条件。

    Berkeley研究:机器学习决策的偏见及对弱势群体的潜在影响

    如果采用公平标准的目标是增加或平衡所有人群的长期福祉,我们刚才已经表明,有些情况下公平标准实际上违背了这一目标。换句话说,公平性限制也会减少已经处于不利地位的人群的福利。构建一个准确的模型来预测决策对人口结果的影响可能有助于缓解应用公平约束的潜在危害。

    考虑“公平”机器学习的结果

    我们主张在讨论“公平”的机器学习时寻求长期成果。如果没有谨慎的延迟结果模型,人们无法预见强制执行公平标准作为分类系统的约束条件产生的影响。然而,如果一个准确的结果模型可用,那么有比现有的公平标准更直接的方法来优化正性结果。具体而言,结果曲线为我们提供了一种以最直接改善结果的方式偏离最大利润策略的方式。

    结果模型是将领域知识纳入分类过程的具体方法。这与许多学者指出机器学习中上下文敏感本质的公平性相一致。结果曲线提供了一个可解释的视觉设备来突出对特定应用程序的折衷。

    我们的工作只是初步探索结果模型如何减轻机器学习算法的不良社会影响。为了确保机器学习的长期公平性,还有很多工作要做,因为算法会影响更多人的生活。

    展开全文
  • 常用的深度学习框架

    2019-12-26 23:23:48
    在深度学习中,一般通过误差反向传播算法来进行参数学习。采用手工方式来计算梯度再写代码实现的方式会非常低效,并且容易出错。...**比较有代表性的框架包括:Theano、Caffe、 TensorFlow、Pytorch...

    在深度学习中,一般通过误差反向传播算法来进行参数学习。采用手工方式来计算梯度再写代码实现的方式会非常低效,并且容易出错。此外,深度学习模型需要的计算机资源比较多,一般需要在CPU和GPU之间不断进行切换, 开发难度也比较大。因此,**一些支持自动梯度计算、无缝CPU和GPU切换等功能的深度学习框架就应运而生。**比较有代表性的框架包括:Theano、Caffe、 TensorFlow、Pytorch、Keras等。
    (1)Theano
    蒙特利尔大学的Python工具包,用来高效地定义、优化和执行
    。多维数组数据对应数学表达式。 Theano可以透明的使用GPUs和高效的符号 微分。
    (2)caffe
    全称为Convolutional Architecture for Fast Feature Embedding, 是一个卷积网络模型的计算框架,所要实现的网络结构可以在配置文件中指定, 不需要编码。Caffe是用C++和Python实现,主要用于计算机视觉。
    (3)TensorFlow
    Google公司开发的Python工具包,可以在任意具备CPU或 者GPU的设备上运行。TensorFlow的计算过程使用数据流图来表示。TensorFlow的名字来源于其计算过程中的操作对象为多维数组,即张量(tensor)。
    (4)Pytorch
    由Facebook、NVIDIA、Twitter等公司开发维护的深度学习框 架,其前身为Lua语言的Torch6。PyTorch也是基于动态计算图的框架,在需 要动态改变神经网络结构的任务中有着明显的优势。
    (5)chainer
    一个最早采用动态计算图的神经网络框架,其核心开发团队为来 自日本的一家机器学习创业公司Preferred Networks。和 Tensorflow、Theano、 Caffe等框架使用的静态计算图相比,动态计算图可以在运行时动态地构建计算图,因此非常很适合进行一些复杂的决策或推理任务。
    (6)PaddlePaddle(百度)
    Paddle 是 Parallel Distributed Deep Learning 的缩写,中文名字是并行分布式深度学习。paddle 的原意是“用浆划动”,所以 logo 也是两个划船的小人,也就是等待众人划桨的中国 AI 大船。
    从2016年9月27日发布至今,PaddlePaddle 大概有三年左右的时间了,而其前身是百度于2013年自主研发的易用、高效、灵活、可扩展的深度学习平台,且一直为百度内部工程师研发使用,可以认为是一个类似Facebook支持的PyTorch、Google的TensorFlow等工业优而开源的又一个典范。
    此外,还有一些深度学习框架,包括微软的CNTK7,由亚马逊、华盛顿大学和卡内基梅隆大学等开发维护的MXNet1和百度开发的PaddlePaddle2等。
    在这些基础框架之上,还有一些建立在这些框架之上的高度模块化的神经网络库,使得构建一个神经网络模型就像搭积木一样容易。其中比较有名的模 块化神经网络框架有:(1)基于TensorFlow和Theano的Keras3和(2)基于 Theano的Lasagne4。

    展开全文
  • 中科院机器学习算法的网络大数据级应用实践,...了协同过滤推荐并设计了整套实验流程,实验选择了一个具有代表性开放数据源作为处理对象,最后地实验结果给出了预测 的均方根误差以及实验的耗时和数据量等指标。 关键词:
  • Python最小距离法

    2018-04-06 20:10:29
    2、使用前期作业里面的程序、对6种组合分别使用不同方法进行基于120个训练样本30个测试样本的学习误差和测试计算,方法包括:最小距离法(均值为代表点)、最近邻法、k近邻法(k取3、5...)等;
  • Recommended-system-源码

    2021-04-12 15:21:15
    数据包括DVD和Video数据,矩阵每一行代表一个用户,每一列代表一件商品,用户对商品的打分范围为1-5,数据中0分的位置即为当前该用户对该数据没有评价,需要推测出来。 评价指标 由于没有评价的数据没有真实值,无法...
  •     在深度学习中,一般通过误差反向传播算法来进行参数学习.采用手工方式来计算梯度再写代码...比较有代表性的框架包括:Theano、Caffe、TensorFlow、Pytorch、飞桨(PaddlePaddle)、Chainer和MXNet等. ...

        在深度学习中,一般通过误差反向传播算法来进行参数学习.采用手工方式来计算梯度再写代码实现的方式会非常低效,并且容易出错.此外,深度学习模
    型需要的计算机资源比较多,一般需要在 CPU 和 GPU 之间不断进行切换,开发
    难度也比较大.
        因此,一些支持自动梯度计算、无缝CPU和GPU切换等功能的深度学习框架就应运而生.比较有代表性的框架包括:Theano、Caffe、TensorFlow、Pytorch、飞桨(PaddlePaddle)、Chainer和MXNet等.

    在这里插入图片描述在这里插入图片描述
    在这里插入图片描述

    展开全文
  • 为了研究将这些重型柴油机转换为天然气-柴油双燃料运行的可能,必须有一个代表实际发动机工作条件的瞬态发动机占空比。 在本文中,提出了一种方法,并根据从11辆公路运砂卡车和水运卡车上收集的公路数据得出了...
  • 2.4 阻抗控制实现中的关键问题确定了协作机器人系统阻抗控制结构、控制策略和方法后,阻抗控制技术在实施过程中仍需要以下几...一些学者对系统动力学建模进行了研究,其中具有代表性的工作有:黎柏春等提出了由外关...
  • 模型简化

    千次阅读 2016-03-18 16:29:59
    顶点聚类的思想很简单:对于给定的多边形表面,把模型所在空间分成很多个小格(小格尺寸小于用户指定的近似误差阈值),为每个小格计算一个代表顶点,把原始模型落在这个小格内的顶点都合并到代表顶点上。...
  • 预测房屋售价 技术与技能 技术技能:回归,数据清理,探索数据分析(EDA),数据可视化,机器学习,偏差方差折衷,插补... 我将用来评估模型准确的主要指标包括均方根误差(RMSE)和确定系数(R平方)。 RMSE代表
  • 但是,在不同空气质量条件下MODIS AOD产品的代表性仍不清楚。 在这项研究中,我们获得了北京地区2001年至2015年的三种MODIS Terra AOD和2003年至2015年的Aqua AOD的信息,以研究北京在不同空气质量情况下不同AOD...
  • Pérez-Delgado在包括 , 各种论文中描述了一种蚂蚁树颜色量化(ATCQ)的实现。 产生的16种调色板,按大小排序和加权: 通过对数据进行后处理,我们可以进一步减少到6种不同的颜色: 注意:此库尚未完全记录或...
  • realplayer

    2010-08-18 10:57:02
    此软件可含任何下列 RealNetworks 产品,其中包括此类产品与 Alpha、Beta、试验、预发行、免费、有偿和高级版本产品(统称为“RN 产品”)的任何组合:RealPlayer、RealPlayer Plus、RealJukebox 和 Pocket PC 的...
  • 全书译成中文约合100万字(也包括图片、绘图、表格、公式等)。本书可作为已具有初步图像技术知识的相关专业高年级本科生和低年级研究生的专业基础课教材,也可供从事图像应用相关领域的科研技术人员参考。 译者...
  •  曲线可以是精确通过点阵的、也可以是很光顺的(捕捉点阵代表的曲线主要形状),或介于两者之间。  创建曲线。  根据需要创建曲线,可以改变控制点的数目来调整曲线。控制点增多则形状吻合度好,控制点减少则曲线...
  • PID算法的运用

    2015-06-14 20:23:54
    一下程序包括PID计算和输出两部分。当偏差>10度时全速加热,偏差在10度以内时为PID计算输出。 程序说明:下面的程序,先看main函数。可知在对定时器0初始化后就一直在执行PID_Output()函数。在PID_Output()函数...
  • 代表性的如美国机械动力学公司的动力学仿真分析软件。本文采用的虚拟样机仿真...
  • 全书分为12章,包括绪论,数字图像基础,灰度变换与空间滤波,频域滤波,图像复原与重建,彩色图像处理,小波及多分辨率处理,图像压缩,形态学图像处理,图像分割,表现与描述,目标识别。 目录编辑 前言15 致谢19 ...
  • 本文对门限法去噪中涉及到的门限值、门限函数以及小波的选取进行了广泛的研究,对众多的小波门限去噪方法进行了归纳和全面仿真,给出了具有代表性的门限法的性能评估.对实际应用具有一定的指导意义。 2.小波域...

空空如也

空空如也

1 2 3
收藏数 60
精华内容 24
关键字:

代表性误差包括