精华内容
下载资源
问答
  • import numpy as np b = [1.1, 2, 3, 4, 5, 6, 7, 8, 9, 10] y1 = [np.log2(i) for i in b] #log2函数 y2 = [np.log10(i) for...# 我们从高中学的 对数函数的换底公式 其实有一个很重要的意义 任意两个对数函数 存在...
    import numpy as np
    b = [1.1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
    y1 = [np.log2(i) for i in b]            #log2函数
    y2 = [np.log10(i) for i in b]
    print(y1)
    print(y2)
    
    # 我们从高中学的 对数函数的换底公式 其实有一个很重要的意义 任意两个对数函数 存在确定的线性关系
    # y1 = w * y2
    
    w = 1 / np.array(y2) * np.array(y1)
    print(w)
    展开全文
  • 更多CFA官方教材详解,请关注“边际实验室”。“边际实验室”是一家专注于金融科技...■在估计回归之前,可能需要转换一个或多个回归变量(例如,通过对变量取自然对数)。■回归模型汇集了来自不同样本中不应该被汇集...

    更多CFA官方教材详解,请关注“边际实验室”。

    “边际实验室”是一家专注于金融科技、金融大数据领域的工作室,同时提供CFA、FRM等金融考试内容的免费讲解。

    每当我们估计回归模型时,都必须假定回归具有正确的函数形式。该假设可能会有以下几种错误:

    ■可以从回归中忽略一个或多个重要变量。

    ■在估计回归之前,可能需要转换一个或多个回归变量(例如,通过对变量取自然对数)。

    ■回归模型汇集了来自不同样本中不应该被汇集的数据。

    首先,考虑从回归中忽略一个重要的自变量的影响(遗漏变量偏差)。如果真正的回归模型是:

    Yi= b0 + b1X1i + b2X2i +εi

    但是我们估计的模型是:

    Yi= a0 + a1X1i +εi

    那么我们的回归模型将被错误指定。该模型有什么问题?如果省略的变量(X2)与其余变量(X1)相关,则模型中的误差项将与(X1)相关,并且回归系数a0和a1的估计值将有偏差且不一致。另外,这些系数的标准误估计值也将不一致,因此我们既不能使用系数估计值也不能使用估计的标准误差来进行统计检验。 案例遗漏变量偏差和买卖价差

    在本例中,我们扩展了对买卖价差的研究,以显示从回归中省略重要变量的影响。在此前的案例中,我们证明了[(买卖价差)/价格]的自然对数与做市商数量的自然对数和公司市值的自然对数存在显著相关。

    下表显示了结果:

    46a8462efc41ab79435659d2ae69936c.png

    如果我们去除市值的自然对数,只对[(买卖价差)/价格]的自然对数与做市商数量的自然对数进行一个自变量的回归,结果如下表所示。

    dd1107f4e4064e34c779611a22e371df.png
    e5a2efab14153675c52c7f38e83ce0c8.png

    请注意,ln(纳斯达克做市商数量)的系数从原始回归(正确结果)的-1.5186变为错误的-3.1027。同样,截距从原始回归中的1.5949变为5.0707。这些结果说明,遗漏回归中应包含的自变量会导致其余回归系数的不一致。

    回归模型发生错误指定的第二个常见原因是,对于需要转换的数据,在回归中没有进行转换,或使用了错误的数据形式。例如,有时分析人员无法判断因变量和自变量之间的非线性关系,进而指定了变量之间的线性关系。在指定回归模型时,应考虑经济理论是否暗示了非线性关系。我们通常可以通过绘制数据图表来确认非线性关系,如下面的案例所示。如果当一个或多个变量的比例变化表现出线性关系时,我们可以通过取自然对数来对错误指定进行纠正。在其他时候,分析师更倾向于使用无单位的数据进行回归分析(例如将净收入或现金流量除以销售额)。在此前的案例中,我们用股票价格对买卖差价进行了除法计算,因为对于投资者而言,买卖差价在交易成本方面的意义取决于股票价格;如果我们没有调整买卖差价,那么回归模型就会发生错误指定。

    案例 非线性与买卖价差

    在此前的案例中,我们的结果表明[(买入-卖出价差)/价格]的自然对数与做市商数量的自然对数和公司市值的自然对数均显著相关。但是,为什么我们在回归中使用的是变量的自然对数呢?

    关于[(买入-卖出点差)/价格]及其决定因素(自变量)之间的关系的性质,有什么理论基础吗?Stoll(1978)建立了市场中买卖差价百分比决定因素的理论模型。他的模型如下:

    b822bf94cdf3da140805454bcf9d800c.png

    其中,c是常数。在初始变量中,买卖差价百分比与做市商数量与市值的关系不是线性的。但是,如果对上述模型等式两边取自然对数,转换后的变量是线性的(对数-对数回归):

    Yi= b0 + b1X1i + b2X2i +εi

    其中

    Yi= 股票i(买入-卖出价差)/价格的自然对数

    b0= 常数,ln(c)

    X1i= 股票i的做市商数量的自然对数

    X2i= 公司i市值的自然对数

    εi= 残差

    如此前案例所述,对数-对数模型的斜率系数被解释为弹性,准确地说,因变量相对于自变量存在部分弹性(“部分”是指保持其他自变量不变)。

    我们可以绘制数据以评估对数转换后变量是否线性相关。例如,下图展示了一个股票的做市商数量自然对数的散点图(X轴)、(买卖价差)/价格的自然对数(Y轴)及回归线。这两个经过转换后的变量之间的关系显然是线性的。

    035e3076766a236daccf2f553e3db718.png
    8ce4a9c40bd93e34b2e7d949774b8004.png

    如果我们不取[(买卖价差)/价格]的对数,回归线就不是线性的。上面第二张图显示了做市商数量自然对数(X轴)和[(买卖价差)/价格](Y轴)之间的关系。我们看到这两个变量之间的非线性关系非常明显的。因此,我们不应该以[(买卖价差)/价格]为因变量来估计回归。另外,考虑到需要确保预测的买卖价差是正的,因此我们不能直接使用[(买卖价差)/价格]作为因变量。如果我们直接使用[(买卖价差)/价格]作为因变量,模型也可以将买卖价差预测为负值。这个结果是荒谬的——在现实中,没有买卖价差是负的(交易员不可能同时在高位买入和低位卖出),因此能够预测买卖价差为负的模型肯定是错误的。我们下面将讨论预测买卖价差为负值的问题。

    下表显示了以[(买卖价差)/价格]为因变量,做市商数量的自然对数和公司市值的自然对数为自变量的回归结果。

    57541f78e1b6143f34fac6a7430185d9.png

    1、假设对于在纳斯达克上市的特定股票,做市商的数量为50,市值为60亿美元。根据上述模型,该股票的预期买卖差价与价格的比率是多少?

    做市商数量的自然对数等于ln50 = 3.9120,股票市值(百万美元)的自然对数等于ln6000 = 8.6995。

    在这种情况下,预期买卖差价与价格的比率为0.0674+(-0.0142×3.9120)+(-0.0016×8.6995)=-0.0021。因此,该模型预测买卖价差与股票价格之比为-0.0021。

    2、上述股票的预期买卖价差是否有意义?如果没有,如何避免这个问题?

    预测的买卖差价为负,这在经济上没有意义。

    通过使用[(买卖价差)/价格]的对数作为因变量,可以避免此问题。

    通常,分析师在比较公司之间的数据之前必须决定是否对变量进行加工。例如,在财务报表分析中,分析师通常会使用百分比财务报表。在百分比利润表中,所有金额都除以了公司的收入。

    百分比财务报表使公司之间的可比性更加容易。对于想要使用回归分析来比较一组公司业绩的分析师来说,可能会出现可比性问题。如以下案例所示。

    案例 经营现金流和自由现金流之间的关系

    假设有一位分析师想解释美国11家服装公司2001年自由现金流与经营现金流量的关系。

    为了调查此问题,分析师可能在线性回归中将自由现金流作为因变量,将经营现金流作为自变量。下图显示了回归的结果。请注意,经营活动现金流的斜率系数的t统计量非常高(6.5288),回归的F统计量的显著性水平很低(0.0001),R方值非常高。我们可能会倾向于认为这种回归是准确的。如果经营活动现金流增加1.00美元,我们可以有把握地预测公司的自由现金流量将增加0.3579美元。

    d1d41e030fcf7f8df32905bc012c7806.png
    de3280f07b6b9ca0ab019c5a0f9151c4.png

    但是这个估计是正确吗?该回归没有考虑样本中公司之间的规模差异。

    我们可以通过使用常见的现金流百分比结果来解决规模差异。在使用回归分析之前,我们将经营活动现金流和公司的自由现金流除以公司的销售额。我们将(自由现金流/销售额)作为因变量,并使用(经营活动现金流/销售额)作为自变量。下图显示了回归结果。请注意,(经营活动现金流/销售额)斜率系数的t统计量为1.6262,在0.05水平上不显著。另外,F统计量的显著性水平为0.1383,因此我们不能在0.05水平上拒绝“回归不能解释服装公司(自由现金流/销售额)的差异”该假设。

    最后,我们也应该注意到,此回归中的R方比以前的回归低得多。

    16d2cebcad5f18ea9781122659c5be80.png

    哪种回归更有意义?通常,等比例的回归更有意义。我们想知道如果来自经营活动的现金流量(与销售额的比率)发生变化,自由现金流(与销售额的比率)会发生什么。如果不进行缩除法,则回归结果可以仅基于公司之间的规模差异,而不是基于公司的基本经济状况。

    回归模型中错误指定的第三种常见形式是合并不应合并的来自不同样本的数据。我们用图形方式说明这种类型的错误指定。下图显示了变量X和Y的两个数据集,并带有拟合的回归线。数据可以表示两个不同时间段的两个金融变量之间的关系。

    67aae09bc9e1fba70a3e5b4342fd8146.png

    在X和Y的每个数据集中,两个变量之间的相关性几乎为0。由于组合样本中两个数据集的X和Y的均值不同,所以X和Y高度相关。然而,这种相关性是假的,因为它反映了X和Y在两个不同时期的关系的差异。

    本文由边际实验室自媒体原创,如需转载请务必注明出处!

    be86df410fb4d999e353ee3c398fceee.png
    展开全文
  • Glauber的相干态理论的基础上,合理假设这组解在非线性介质中呈泊松分布,进而得到了在对数饱和非线性介质中存在高斯孤子的结论,并获得高斯孤子解、非线性系数与泊松参量三者之间的关系。该关系说明,若在介质中存在...
  • 对数线性回归; y的衍生物 3.1 基本形式 假设样本x有d个属性,线性模型(linear model)试图学得一个通过属性的线性组合来进行预测的函数,即f(x)=w1x1+w2x2+⋅⋯+wdxd+bf(x)=w1x1+w2x2+⋅⋯+wdxd+bf(x)=w_{1}x_...

    墙裂推荐阅读:y的衍生物

    关键词:最小二乘法;正则化;对数线性回归; y的衍生物

    3.1 基本形式

    假设样本x有d个属性,线性模型(linear model)试图学得一个通过属性的线性组合来进行预测的函数,即 f(x)=w1x1+w2x2++wdxd+b f ( x ) = w 1 x 1 + w 2 x 2 + ⋅ ⋯ + w d x d + b ,向量形式 f(x)=wTx+b f ( x ) = w T x + b

    3.2 线性回归

    关键词:无序属性连续化。
    对离散属性,若属性值之间存在“序”(order)关系,可通过连续化将其转化为连续值,例如二值属性身高的取值,“高”“矮”可和转化为{1.0 , 0}。 若属性值之间不存在序的关系,例如属性“瓜类”的取值为西瓜,南瓜,冬瓜,则可转化为(0,0,1),(0,1,0),(1,0,0)。

    关键词:最小二乘法(least square method)。
    基于均方误差最小化来进行模型求解的方法称为“最小二乘法”。在线性回归中,最小二乘法就是试图找到一条直线,使所有样本到直线上的欧氏距离之和最小。

    关键词: 正则化(regularization)项。
    假设解一个线性方程组,当方程数大于自由变量数时,是没有解的。反过来,当方程数小于自由变量数的时候,解就有很多个了。往往,我们会碰到这种情况,参数多,“方程”少的情况,那么有很多个w(权值向量)都能使均方误差最小,那么该选哪一个呢? 这就涉及到 归纳偏好问题了,常见的做法是引入正则化项。

    关键词:对数线性回归(log-linear regression);y的衍生物
    把线性回归模型简写为: f(x)=wTx+b f ( x ) = w T x + b ,当我们希望线性模型的预测值逼近真实标记y,这样就是线性模型。那可否令模型的预测值毕竟y的衍生物呢? 作者的这一描述实在太妙了!y的衍生物,通俗易懂! 假设y的衍生物是 y的对数即lny,那么就可以得到对数线性回归模型: lny=wTx+b l n y = w T x + b , 也就是让模型 去逼近 lny,而不是y。也可以对 lny=wTx+b l n y = w T x + b 做一下变换就变成了 y=ewTx+b y = e w T x + b ,也可以理解为让 ewTx+b e w T x + b 去逼近y。形式上还是线性回归的,但实质上已是在求取输入空间到输出空间的非线性函数映射。如图:
    这里写图片描述

    来思考一个问题
    想从线性模型出发,去扩展线性模型,就是让线性模型 f(x)=wTx+b f ( x ) = w T x + b 去拟合y的衍生物,那么我们常说的逻辑回归(对数几率回归)是怎么从线性模型演变而来的呢?是让 wTx+b w T x + b 去拟合哪一种“y的衍生物” 什么呢?这个可以思考思考后,请看下篇:逻辑回归

    展开全文
  • 简要介绍对数正态分布线性矩与分布参数的关系,提出两种可考虑历史洪水的样本线性矩估计公式.统计试验结果表明,估计公式均具有较高精度.从两种估算公式中推荐一种效果更好的供实际频率计算使用,从而解决了具有历史...
  • 很多非线性模型是在线性模型的基础上通过引入层级结构或高维映射得到的。 权重矩阵直观表达了各个属性的重要性,因此具有良好解释性。 线性回归 1、线性回归介绍与离散属性转换为实数值 线性回归(linear ...

    基本形式

    优点:线性模型形式简单、易于建模。

               很多非线性模型是在线性模型的基础上通过引入层级结构或高维映射得到的。

               权重矩阵直观表达了各个属性的重要性,因此具有良好解释性。

    线性回归

     1、线性回归介绍与离散属性转换为实数值

    线性回归(linear regeression)试图学习一个线性模型以尽可能准确预测实值输出标记。

    对于预测值本来就是实数值的数据还好说,对于离散属性,其离散值转化为实数值有两种方法:第一种,若属性存在“序”的关系,可通过连续化进行转换(例如身高取值“高”“矮”,就可以转化为“1.0”“0.0”);第二种,若属性没有序的关系,可以转化为k维向量(例如“西瓜”“南瓜”,可以转化为{1,0}{0,1})。

    2、线性模型学习策略

    3、线性模型学习算法

    先举一个单属性的例子:

    再举更为一般的例子,也就是多元线性回归:

    4、广义线性模型

    注意(以下是个人理解):广义线性模型和后续介绍的广义线性判别分析(函数)殊途同归,都是利用线性判别分析进行扩展,解决非线性问题,但从形式上老说,不像是一回事。

     

    对数几率回归

    1、引言

    上述讨论的都是回归问题,如果用线性判别模型进行分类学习,就需要将实数值转化为离散值。

    利用广义线性模型,我们易知最理想的函数是“单位阶跃函数”,但是它不连续,无法适用于g-1(·)。因此我们找了个替代品,即对数几率函数(logistic function)(是一种sigmoid函数,还是其最重要的代表):

    因此虽然对应模型名称“对数几率回归”,但是其实是一种分类方法。

    2、学习策略与学习方法

    移步我的另一篇博客:https://www.cnblogs.com/CJT-blog/p/10135077.html

     

    线性判别分析

    1、引言

    线性判别分析(Linear Discriminant Analysis,LDA)是一种经典的线性学习方法,亦称“Fisher判别分析”。

    2、模型、学习策略与学习方法

    请移步我的另一篇博客:https://www.cnblogs.com/CJT-blog/p/10187720.html 

     

    广义线性判别分析

    1、引言

    2、广义线性判别函数

    3、特例——线性判别函数的齐次简化

    转载于:https://www.cnblogs.com/CJT-blog/p/10187905.html

    展开全文
  • 概述  数字电位器具有可靠性高、尺寸小、易使用等优点,被广泛用来替代机械式电位器,尤其是在音量控制方面,应用非常普遍。考虑到人耳对音量衰减的... 利用数学关系式简单、易懂的线性抽头数字电位器,可以完成对
  • 对数几率回归(logistic regression),有时候会译为逻辑回归(音译),其实是我们把回归模型应用到分类问题时,线性回归的一种变形,主要是针对二分类提出的。既然是线性回归的一种变形,那么在理解对数几率回归时,...
  • 煤矿事故死亡率与人力的增产或减资有关,成比例关系。 因此,我们将死亡率映射到对数尺度,转换为加性递减,并使用线性模型预测未来五年的死亡人数,然后将其映射并四舍五入到现实煤矿工人生命风险的预测。
  • 韦伯-费希纳定律与对数关系的深意

    万次阅读 2018-01-20 01:43:44
    我喜欢在秋冬的时候把头发留得很长,一直留到盛夏,然后选这么一天,这天非常炎热干燥,最好再尘土飞扬(可惜上海深圳都没有这样的夏日),然后确认前一天没有洗头,在这天午后最热的时候,跑去一个理发店,直接剃成...
  • 1 线性回归 线性回归其实就是高中讲过的那种回归,但是不同的是线性回归在神经网络这个学科里大多使用梯度下降来计算参数w,bw,bw,b,而高中讲的是使用最小二乘法。 线性回归想解决的问题也是回归问题,公式: y=wx+b...
  • 文章目录对数线性回归(波士顿房价预测)导入模块获取数据训练模型可视化 对数线性回归(波士顿房价预测) 导入模块 import pandas as pd import numpy as np import matplotlib.pyplot as plt from matplotlib.font_...
  • 经典线性模型自变量的线性预测就是因变量的估计值。 广义线性模型:自变量的线性预测的函数是因变量...本篇是对逻辑回归理论应用的学习总结、以及广义线性模型导出逻辑回归的过程,下一篇将对最大熵模型的学习总结。
  • 线性模型有三种任务,分别为回归任务、二分类任务多分类任务。 1.线性回归 试图学得fx=wTx+b ≈ y y即实际值。在输出的所有(w,b)中,采用均方误差最小的原则来选取最好的性能度量。 更一般的情形是如本节开头的...
  • #Lab报告3个图表。 Main.py用于I vsV。Main2.Py用于ln(v)vs I显示电压随时间的衰减运行时,它在Y轴上显示电压,在X轴上显示时间。 不确定性是main.py main2.py中误差线的时间差,不确定性是电压
  • logfit(X,Y,graphType),其中 X 是向量,Y 是向量或矩阵将绘制具有确定的轴缩放比例的数据通过 graphType 如下:graphType-> xscale, yscale 日志日志-> 日志,日志logx -> log,线性逻辑 -> 线性对数线性 -> 线性...
  • 结果表明,在选定变量之间的原始二十八种可能的双向相互关系中,有十七种被识别为保留在分层对数线性模型中。 本文扩展了影响企业绩效的因素的研究,并可以更好地了解欧洲多个制造规模的复杂相互作用关联。
  • 数据结构的线性关系

    千次阅读 2018-10-21 22:11:40
    线性关系:里面的每一个元素都是平等的,每个节点至多有一个前驱一个后继。头部没有前驱,尾部没有后继。其结构类似于一维数组的结构。 如下图所示: 顺序存储结构 删除操作:对某一元素进行删除,其后面的...
  • 人工智能学习离不开实践的验证,推荐大家可以多在FlyAI-AI竞赛服务平台多参加训练竞赛,以此来提升自己的能力。FlyAI是为AI开发者提供数据竞赛并支持GPU离线训练的一站式服务平台。每周免费提供项目开源算法样例,...
  • 多元线性回归 stata

    万次阅读 多人点赞 2019-09-16 09:43:18
    回归的思想,任务,使命 可以看到0-1回归的因变量自变量都是0-1变量 因变量y可以分为 解释y的形成机制就是通过建立x,y的数学关系式 感觉相关分析就是回归分析的前两步, 数据的分类 ...
  • 线性回归 高斯曲线 对数正态分布

    千次阅读 2013-12-28 23:14:44
    如果回归分析中包括两个或两个以上的自变量,且因变量自变量之间是线性关系,则称为多元线性回归分析。  在线性回归中,数据使用线性预测函数来建模,并且未知的模型参数也是通过数据来估计。这些模型被叫做...
  • 对数线性模型》是最好的对数线性模型教学材料之一,不仅讨论了一般对数线性模型,还讨论了logit模型,这一模型通过分析作为自变量函数的因变量的期望发生比来检验自变量与因变量之间的关系。作者从处理二分变量的...
  • 基于sklearn的线性分类器logistics(对数几率回归)Python实现 声明:本人小白,文章作为自己的学习参考资料,供大家学习交流 本文章 refer to 作者:月见樽 链接:https://www.jianshu.com/p/f9cb59dc99ec 来源:...
  • 线性回归的模型是求出特征向量Y输入样本矩阵X之间的线性关系系数θ,满足Y = Xθ。此时Y是连续的,所以是回归模型。 对应n维样本数据,对应的模型是这样的: 其中θ为模型参数。 一般用均方误差作为损失函数,...
  • 该函数可以根据测试的频段该频段的测试数据在对数坐标系的对应位置绘制测试曲线。 DrawFrameCurve() 函数绘制曲线的流程图如图 1 所示: 图1 测试流程图   <!-- /* Font...
  • 线性模型转换为线性模型&&平滑数据处理
  • 同时考虑线性和线性结果时会遇到困难,这就是为什么Roodman [1]为多维模型实现Stata模块cmp的原因。 在本文中,我们进一步开发了该技术,以使研究人员能够在面板尺寸设置中实现联立方程模型。 在Stata下实现的...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 36,739
精华内容 14,695
关键字:

对数关系和线性关系