精华内容
下载资源
问答
  • 我的机器学习教程「美团」算法工程师带你入门机器学习 已经开始更新了,欢迎大家订阅~ 任何关于算法、编程、AI行业知识或博客内容的问题,可以随时扫码关注公众号「图灵的猫」,加入”学习小组“,沙雕博...什么是...

    任何关于算法、编程、AI行业知识或博客内容的问题,可以随时扫码关注公众号「图灵的猫」,加入”学习小组“,沙雕博主在线答疑~此外,公众号内还有更多AI、算法、编程和大数据知识分享,以及免费的SSR节点和学习资料。其他平台(知乎/B站)也是同名「图灵的猫」,不要迷路哦~

     

     

    什么是移动平均法?

      移动平均法是用一组最近的实际数据值来预测未来一期或几期内公司产品的需求量、公司产能等的一种常用方法。移动平均法适用于即期预测。当产品需求既不快速增长也不快速下降,且不存在季节性因素时,移动平均法能有效地消除预测中的随机波动,是非常有用的。移动平均法根据预测时使用的各元素的权重不同

      移动平均法是一种简单平滑预测技术,它的基本思想是:根据时间序列资料、逐项推移,依次计算包含一定项数的序时平均值,以反映长期趋势的方法。因此,当时间序列的数值由于受周期变动和随机波动的影响,起伏较大,不易显示出事件的发展趋势时,使用移动平均法可以消除这些因素的影响,显示出事件的发展方向与趋势(即趋势线),然后依趋势线分析预测序列的长期趋势。

      移动平均法的种类

      移动平均法可以分为:简单移动平均和加权移动平均。

      一、简单移动平均法

      简单移动平均的各元素的权重都相等。简单的移动平均的计算公式如下: Ft=(At-1+At-2+At-3+…+At-n)/n式中,

      ·Ft–对下一期的预测值;

      ·n–移动平均的时期个数;

      ·At-1–前期实际值;

      ·At-2,At-3和At-n分别表示前两期、前三期直至前n期的实际值。 
      

      二、加权移动平均法

      加权移动平均给固定跨越期限内的每个变量值以不同的权重。其原理是:历史各期产品需求的数据信息对预测未来期内的需求量的作用是不一样的。除了以n为周期的周期性变化外,远离目标期的变量值的影响力相对较低,故应给予较低的权重。加权移动平均法的计算公式如下:

      Ft=w1At-1+w2At-2+w3At-3+…+wnAt-n式中,

      ·w1–第t-1期实际销售额的权重;

      ·w2–第t-2期实际销售额的权重;

      ·wn–第t-n期实际销售额的权

      ·n–预测的时期数;w1+ w2+…+ wn=1

      在运用加权平均法时,权重的选择是一个应该注意的问题。经验法和试算法是选择权重的最简单的方法。一般而言,最近期的数据最能预示未来的情况,因而权重应大些。例如,根据前一个月的利润和生产能力比起根据前几个月能更好的估测下个月的利润和生产能力。但是,如果数据是季节性的,则权重也应是季节性的。

      移动平均法的优缺点

      使用移动平均法进行预测能平滑掉需求的突然波动对预测结果的影响。但移动平均法运用时也存在着如下问题:

      1、加大移动平均法的期数(即加大n值)会使平滑波动效果更好,但会使预测值对数据实际变动更不敏感;

      2、移动平均值并不能总是很好地反映出趋势。由于是平均值,预测值总是停留在过去的水平上而无法预计会导致将来更高或更低的波动;

      3、移动平均法要由大量的过去数据的记录。

      移动平均法案例分析 
       
      简单移动平均法在房地产中的运用 
    某类房地产2001年各月的价格如下表中第二列所示。由于各月的价格受某些不确定因素的影响,时高时低,变动较大。如果不予分析,不易显现其发展趋势。如果把每几个月的价格加起来计算其移动平均数,建立一个移动平均数时间序列,就可以从平滑的发展趋势中明显地看出其发展变动的方向和程度,进而可以预测未来的价格。

      在计算移动平均数时,每次应采用几个月来计算,需要根据时间序列的序数和变动周期来决定。如果序数多,变动周期长,则可以采用每6个月甚至每12个月来计算;反之,可以采用每2个月或每5个月来计算。对本例房地产2001年的价格,采用每5个月的实际值计算其移动平均数。计算方法是:把1~5月的价格加起来除以5得684元/平方米,把2~6月的价格加起来除以5得694元/平方米,把3~7月的价格加起来除以5得704元/平方米,依此类推,见表中第三列。再根据每5个月的移动平均数计算其逐月的上涨额,见表中第四列。 
      这里写图片描述

    假如需要预测该类房地产2002年1月的价格,则计算方法如下:由于最后一个移动平均数762与2002年1月相差3个月,所以预测该类房地产2002年1月的价格为:762 + 12 × 3 =798(元/平方米)

     

    ARMA

    自回归滑动平均模型(ARMA 模型,Auto-Regressive and Moving Average Model)是研究时间序列的重要方法,由自回归模型(简称AR模型)与滑动平均模型(简称MA模型)为基础“混合”构成。在市场研究中常用于长期追踪资料的研究,如:Panel研究中,用于消费行为模式变迁研究;在零售研究中,用于具有季节变动特征的销售量、市场规模的预测等。
    ARMA模型(auto regressive moving average model)自回归滑动平均模型,模型参量法高分辨率谱分析方法之一。这种方法是研究平稳随机过程有理谱的典型方法,适用于很大一类实际问题。它比AR模型法与MA模型法有较精确的谱估计及较优良的谱分辨率性能,但其参数估算比较繁琐。ARMA模型参数估计的方法很多:
    如果模型的输入序列{u(n)}与输出序列{a(n)}均能被测量时,则可以用最小二乘法估计其模型参数,这种估计是线性估计,模型参数能以足够的精度估计出来;
    许多谱估计中,仅能得到模型的输出序列{x(n)},这时,参数估计是非线性的,难以求得ARMA模型参数的准确估值。从理论上推出了一些ARMA模型参数的最佳估计方法,但它们存在计算量大和不能保证收敛的缺点。因此工程上提出次最佳方法,即分别估计AR和MA参数,而不像最佳参数估计中那样同时估计AR和MA参数,从而使计算量大大减少。

     

     

    ARMA模型分为以下三种:

    自回归模型(AR:Auto-regressive)
    如果时间序列
      
    满足
    其中
     
    是独立同分布的随机变量序列,且满足
    以及 E(
      
    ) = 0
    则称时间序列
    为服从p阶的自回归模型。
    自回归模型的平稳条件:
    滞后算子多项式
    的根均在单位圆外,即φ(B) = 0的根大于1。
    移动平均模型(MA:Moving-Average)
    如果时间序列
      
    满足
    ,则称时间序列
      
    为服从q阶移动平均模型;
    移动平均模型平稳条件:任何条件下都平稳。
    自回归滑动平均模型(ARMA)
    如果时间序列
      
    满足:
    则称时间序列
     
    为服从(p,q)阶自回归滑动平均混合模型。或者记为φ(B)
    = θ(B)

     

    >>>关于作者

    CSDN 博客专家,2019-CSDN百大博主,计算机(机器学习方向)博士在读,业余Kaggle选手,有过美团、腾讯算法工程师经历,目前就职于Amazon AI lab。喜爱分享和知识整合。

    关注微信公众号,点击“学习资料”菜单即可获取算法、编程资源以及教学视频,还有免费SSR节点相送哦。其他平台(微信/知乎/B站),欢迎关注同名公众号「图灵的猫」~

     

    展开全文
  • 解答:通过阅读博文,发现交叉验证法是用来评估模型性能的,并不参与最后预测模型的生成。 知识点总结: 一、交叉验证法是用于小数据集的。大数据集可直接使用train-validation-test。 在研究对比不同算法的泛化...

    疑问:对于交叉验证法,如5折交叉验证,那么将会生成5个模型,到底应该选择哪个模型作为最终的模型呢?

    解答:通过阅读博文,发现交叉验证法是用来评估模型性能的,并不参与最后预测模型的生成。

    知识点总结:

    一、交叉验证法是用于小数据集的。大数据集可直接使用train-validation-test。

    在研究对比不同算法的泛化性能时,使用测试集来评估,而把训练数据划分为训练集和验证集,基于验证集上的性能来进行模型选择和调参。

    使用train-validation-test的过程:

    1. 将数据集划分为training set,validation set,testing set;
    2. 对不同的3个算法svm,random forest,logistic regression,分别执行以下三步,得到其最优模型。
    • 对于一个算法,如svm,针对不同的核参数,在training set上训练模型;
    • 在validation set上评估不同核参数对应模型的结果,选择出最优的核参数;
    • 对该最优核参数,重新使用training set+validation set进行训练,得到最终的模型;

         3. 在testing set上对这三个不同算法的性能进行评估,用来估计模型在实际使用时的泛化能力。

    二、交叉验证法是用于选择超参数的。如svm中核函数的参数选择,tuning parameter时,使用交叉验证法的平均评估结果来验证哪个参数最好。 

    机器学习训练时主要需要学两样东西。

    一样是模型weights,比如coefficients and biases.

    另外一样是模型的超参数,比如学习率,regularisation strength什么的。

    cross validation 主要是为了找到最好的超参数。然后用最好的超参数训练模型,得到最终的模型weights.

    作者:Softmax
    链接:https://www.zhihu.com/question/39259296/answer/460169275
    来源:知乎
    著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

    使用交叉验证进行tuning parameter的过程总结:

    1. 将全部数据集划分为training set和 testing set;
    2. 对不同算法,进行tuning parameter:
    • 对不同超参数,使用training set,进行5折交叉验证,得到评估结果;
    • 选择评估结果最好的那个超参数作为最优超参数;
    • 对最优超参数,重新使用training set训练模型;

         3.使用testing set评估不同算法的泛化能力。

     

     

     

    三、若非要纠结使用交叉验证的哪个模型比较好,一般选择使用误差最小的那个模型作为最终模型。(不常用)(这点不确定理解的是不是正确)

     

    声明:

    本博文通过参考以下博文而得出:

    https://www.zhihu.com/question/39259296

    https://www.cnblogs.com/WayneZeng/p/7802759.html

     

     

    展开全文
  • 根据 使用最大似然来求解线性模型(1),待求解的线性模型如下式: tn=wT*xn+ξn 第xn年的百米赛跑的时间tn,与两个参数有关:一个w,另一个则该年对应的一个误差值(noise) 在求解w和ξ 之前,先观察一下误差...

    根据 使用最大似然法来求解线性模型(1),待求解的线性模型如下式:

    • tn=wT*xnn

    第xn年的百米赛跑的时间tn,与两个参数有关:一个是w,另一个则是该年对应的一个误差值(noise)

    在求解w和 ξ 之前,先观察一下误差值的特点:

     

    1. 误差有正有负,是一个随机变量。
    2. 误差与年份无关,每一个年份对应的误差之间相互独立

     

    因此,关于errors(noise)的假设如下:

     

    更进一步,假设errors(noise)服从高斯分布,模型表示如下:显然这个模型由两个参数来决定:w 和 σ2,只要确定这两个参数,就确定了这个模型。

     

    这N个误差的联合概率密度为:p(ξ1,ξ2,...,ξN),由于它们相互独立,故有:

     

     

    现在,tn 表示成了一个常数(w0+w1*xn) 加上 一个服从高斯分布的随机变量ξn故tn 也相当于一个服从正态分布的随机变量了。根据正态分布性质:

    得出:

     

    那tn为什么是个条件概率呢?

    根据上面tn的表达式,在给定的w和ξn之后,我们就知道了tn。而ξn服从正态分布,由σ2来确定。故tn可表示成如上的条件概率形式。

     

    现在不妨假设已经求得了w=[36.416,-0.0133]T和σ2=0.05,在xn=1980年时,上面的条件概率公式表示如下:

     

    随机变量的均值由wT*xn计算得到,均值u=10.02,而方差是0.05

     

    故它的概率密度函数如下:

     

    在概率密度函数中有三个点A,B,C。其中B点对应的时间t约是tB=10.1,C点对应的时间t是tC=10.25

    从图中可以看出:在A,B,C三个点中,B点对应的概率密度最大(y轴的值最高),根据正态分布的概率密度性质,说明随机变量取B点处的值的概率最大,也即:随机变量tn最可能的取值是10.1秒

    但是,我们实际观察到的1980年奥林匹克竞赛男子100m赛跑的时间是:10.25秒,这是实际的样本值,也即上面概率密度函数中C点对应的值

    因此,问题就来了:

    我们需要修改(重新求解)w和的σ2值(原来的值为:w=[36.416,-0.0133]T  σ2=0.05),使得:根据w和σ2画出的概率密度函数在t=10.25处最高,也即在t=10.25处取值的概率最大。

    换句话说:我们需要寻找合适的w和σ2,让模型的概率密度函数在 实际值10.25秒 时,对应的概率密度最大。

    我们把实际的样本值t=10.25 称为样本点xn=1980 所对应的 似然值(likelihood of data point 1980)。

    目标是:寻找合适的w和σ让概率密度函数在真实值10.25秒 时对应的概率密度最大。而这就是最大化似然函数的思想。

     

    参考:《A First Course of Machine Learning》第二章

    本文转自hapjin博客园博客,原文链接:http://www.cnblogs.com/hapjin/,如需转载请自行联系原作者

    展开全文
  • 层次分析法模型算法步骤,需要明晰哪些必要的问题 ,以及解决的是什么类型的问题

    目录:

    • 层次分析法用于解决哪一种类型的问题
    • 建立模型前需要分析清楚哪些问题
    • 层次分析法的模型算法步骤

    层次分析法数学模型用于解决评价类问题,而评价类问题可以通过打分解决,比如所决定哪一个旅游地更好。关键是要通过建模完成下面这张表格(同一颜色累加结果为1):
    在这里插入图片描述
    解决评价类问题需要明晰的三个问题:

    • 评价目标是什么
    • 为达到这个目标有几种可选方案
    • 评价的准则是什么或者评价的指标是什么,更简单的来说就是根据什么东西来评价一个地方的好坏

    层析分析法模型的算法步骤:

    第一步:分析系统中个因素之间的关系,建立系统的递进层次结构
    在这里插入图片描述
    第二步:对于同一层次的各个元素关于上一层次中某一准则的重要性进行两两比较,构造两两判断举证

    1.构造准则层判断矩阵,算出各指标所占的权重,可以填好指标权重列
    在这里插入图片描述
    2.构造方案层判断矩阵,给各个可选方案关于某一指标进行打分,可以填好每一个同颜色横,有几种评价指标,就需要构建几个C-P判断矩阵
    在这里插入图片描述
    第三步:由判断矩阵计算被比较的元素对于该准则的相对权重,并进行一致性检验(检验通过后权重才能用),

    在后续更新将会介绍如何计算权重,以及如何进行一致性检验
    第四步:计算各个方案的最终得分,得分最高的即为待选的最佳方案
    在这里插入图片描述


    更多有关与层次分析法的经典获奖论文,以及建模论文模板等资料关注公众号,回复,“层次分析法”,即可免费领取!!!
    在这里插入图片描述

    展开全文
  • 我们都知道,神经网络先将模型参数的调整问题转换为一个求某个损失函数的极小值问题,然后通过梯度下降算法让参数选择合适的值使得该损失函数取得极小值。那么为什么梯度下降算法可以完成这个任务呢? 假设一个...
  • mAP(mean Average Precision 平均精度),一个经常被用来衡量目标检测模型是否具有较好性能的指标。 相关概念 GT:Ground Truth,也就是标签,对应了真实框的大小位置以及分类。 IOU:两个框的交并比。 score、...
  • 模型法创建表视图

    2015-10-10 20:44:00
    在以前的学习中,掌握的对于做一个页面框架的开发方式无非有以下几种: (1)纯代码 + StoryBoard混合 开发 (故事板开发苹果...在今天看别人的博客的时候,知道纯代码创建页面框架还包括:纯代码 + 模型 思想 ...
  • 移动平均法是用一组最近的实际数据值来预测未来一期或几期内产品的需求量的一种常用方法。移动平均法适用于即期预测。当产品需求既不快速增长也不快速下降,且不存在季节性因素时,移动平均法能有效地消除预测中的...
  • 在需求分析阶段,进行MVP(核心)功能选择的时候,产品经理往往...一、什么是KANO模型分析? KANO模型分析方法狩野纪昭(东京理工大学教授)基于KANO模型对用户需求的细分原理,开发的一套结构型问卷和分析方...
  •  移动平均法是用一组最近的实际数据值来预测未来一期或几期内公司产品的需求量、公司产能等的一种常用方法。移动平均法适用于即期预测。当产品需求既不快速增长也不快速下降,且不存在季节性因素时,移动平均法能...
  • 在格式化模型中,实体用记录表示,实体的属性对应...在层次模型中,每个结点表示一个记录类型,每个记录类型可包含若干个字段,记录类型描述的实体,字段描述的实体的属性。 层次数据模型的存储结构 邻接: ...
  • 原型, 瀑布模型, V-模型, 螺旋模型

    千次阅读 2017-11-10 22:20:46
    在开发一个系统时,如果用户对系统的目标不很清楚,难以定义需求,这时最好使用原型的系统开发方法。...通过逐步调整原型使其满足客户的要求,开发人员可以确定客户的真正需求是什么。第二步则在第一步的基础...
  • 什么是状态空间

    千次阅读 2020-06-08 22:33:55
    在经典控制理论中,在建立数学模型通过传递函数进行的,在这个过程中,只考虑输入和输出之间的关系,所以会将系统变成一个黑盒子,里面的内容被浓缩了。 而在现代控制理论中,会首先从系统中抽取出一些状态变量...
  • 一致性组织模型法什么是一致性组织模型法? 管理者在企业管理过程中经常会遇到许多问题,有时候问题的原因不查自明,但在许多情况下,种种复杂因素给查找企业问题的原因带来不便。一致性模型一种能够迅速而准确地...
  • 模型,在整个HTML里面都一个非常重要的关键点,那么,如何正确快速有效的学习好盒模型呢?这就可以用到我们的快递比喻! 首先,让我们来看一张图。 这张图我们可以看**出什么呢!当然,一个快递,里面放了一...
  • 什么是移动平均法?    移动平均法是用一组最近的实际数据值来预测未来一期或几期内公司产品的需求量、公司产能等的一种常用方法。移动平均法适用于即期预测。当产品需求既不快速增长也不快速下降,且不存在...
  • 思维模型 5Why分析

    2020-03-30 15:45:19
    本系列文章 主要 分享思维模型,涉及各个领域,重在提升认知 1 模型故事 丰田汽车公司前副社长野耐一先生见到生产线上的机器总是停转,虽然修过多次但仍不见好转,便上前询问现场的工作人员。 (1-Why)问:...
  • 是什么原因使变量间有关联呢?是否存在不能直接观测到的、但影响可观测变量变化的公共因子?因子分析(Factor Analysis)就是寻找这些公共因子的模型分析方法,它是在主成分的基础上构筑若干意义较为明确的公因子...
  • 万事万物都相互联系的万物即“模型”,联系即“关系”。比能力重要一万倍的,你的底层思维逻辑。...而选择什么样的模型、选择一个还是几个模型,则智慧。模型给我们带来了什么?Models help us to better orga...
  • 什么是梯度下降

    千次阅读 2021-01-10 18:13:50
    在很多模型中,比如对率回归或者SVM,优化标准凸形的。凸形函数只有一个极小值,即全局最小值。相比之下,神经网络中的优化标准是非凸形的。不过,即使只找到局部最小值,在很多实际问题中也足够了。 让我们来了解一下...
  • 模型评价(一) AUC大 混淆矩阵

    千次阅读 2018-07-13 10:06:26
    问题:AUC是什么AUC能拿来干什么AUC如何求解(深入理解AUC)AUC是什么混淆矩阵(Confusion matrix)混淆矩阵是理解大多数评价指标的基础,毫无疑问也是理解AUC的基础。丰富的资料介绍着混淆矩阵的概念,这里用一个经典...
  • 有监督学习,就是有训练集,有label,我们是可以知道模型输出是什么样子的。而无监督学习,没有训练集,没有label,提前无法知道输出的样子。 有监督学习分为两种:回归和分类。模型输出若为连续变量,就是回归;...
  • 思维模型 5W2H分析

    2020-04-08 18:05:36
    WHY:用户购买的目的是什么?(市场调查获取数据,比如售出的笔记本显卡配置均较高说明有可能主要用于娱乐) WHAT:用户主要购买的产品?(各产品的销量分布,是否有某几款产品 卖的特别多) WHEN:用户何时购买?...
  • delta法则使用梯度下降来找到最佳权向量。拿数字识别这个案例为例,训练模型的过程通常这样的。输入为1万张图片,也就是1万个样本,我们定义为D,训练样例集合,输出为相对应的1万个数字。这就是1万个目标...
  • 决策模型和表示(DMN)规范OMG(对象管理小组)提出的相对较新的标准,旨在为业务规则和业务决策做些什么。 BPMN(它的兄弟规范)用于业务流程:标准化表示和执行语义,以使业务用户可以使用它,并且可以在...
  • 机器学习虽然那么多事实上都是一个规律。我在文章末尾进行了总结。逻辑回归和线性回归最大区别两个 一 是线性回归它认为模型是一条直线,逻辑回归它认为...逻辑回归到底是什么?要优化什么参数?为何要优化这些参数...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 1,966
精华内容 786
关键字:

模型法是什么