精华内容
下载资源
问答
  • 2019-12-04 17:30:23

    在多元线性回归部分,西瓜书的省略实在是太多了,有时候会让读者很无奈。这篇博客便针对这些问题进行详细的解答,希望对大家理解西瓜书有帮助。
    在多元线性回归这一章节中,或许是囿于篇幅,西瓜书中(1)没有解释清楚 w w w b b b怎么组合成 w ^ 的 \hat{w}的 w^(注:此处的 w w w w ^ \hat{w} w^都是向量,因为这是多元线性回归了)(2)没有解释损失函数 E w ^ E_{\hat{w}} Ew^怎么来的。(3)没有解释为什么 ∂ E w ^ ∂ w ^ = 0 \frac{\partial E_{\hat{w}}}{\partial{\hat{w}}}=0 w^Ew^=0时,就有最小值。

    1、 w w w向量和 b b b组合成 w ^ \hat{w} w^向量

    对于多元的情况,我们可以的到一个回归公式,
    f ( x i ) = w T x i + b f(x_i)=w^Tx_i+b f(xi)=wTxi+b,因为 w w w x x x都是列向量,所以我们可以将其展开,得到如下的式子。 f ( x i ) = w 1 x i 1 + w 2 x i 2 + ⋯ + w d x i d + b f(x_i)=w_1x_{i1}+w_2x_{i2}+\cdots+w_dx_{id}+b f(xi)=w1xi1+w2xi2++wdxid+b i代表第几个样本,d代表样本的维度。
    b = w d + 1 ⋅ 1 b=w_{d+1} \cdot1 b=wd+11,所以 f ( x i ) f(x_i) f(xi)又可以变成如下的式子:
    f ( x i ^ ) = ( w 1 w 2 ⋯ w d w d + 1 ) ⏟ w ^ T ( x i 1 x i 2 ⋮ x i d 1 ) ⏟ x i ^ = w ^ T ⋅ x i ^ f(\hat{x_i})=\underbrace{ \begin{pmatrix}w_1&w_2\cdots&w_d&w_{d+1}\end{pmatrix}}_{\rm \hat{w}^T} \underbrace{ \begin{pmatrix} x_{i1}\\x_{i2}\\\vdots \\ x_{id}\\1\\ \end{pmatrix}} _{\rm \hat{x_i}}=\hat{w}^T\cdot \hat{x_i} f(xi^)=w^T (w1w2wdwd+1)xi^ xi1xi2xid1=w^Txi^
    所以我们这样就表示出了 w ^ \hat{w} w^ x ^ \hat{x} x^

    2、损失函数 E w ^ E_{\hat{w}} Ew^的“前世今生”

    损失函数 E w ^ = ∑ i = 1 m ( y i − f ( x i ^ ) ) 2 = ∑ i = 1 m ( y i − w ^ T x i ^ ) 2 E_{\hat{w}}=\sum_{i=1}^{m}(y_i-f(\hat{x_i}))^2=\sum_{i=1}^{m}(y_i-\hat{w}^T\hat{x_i})^2 Ew^=i=1m(yif(xi^))2=i=1m(yiw^Txi^)2但这和西瓜书上的损失函数表达式不同,所以还应该进行恒等变形。所以我们现在求得的就是损失函数的“前世”了。由上一篇博客可知,一个求和符号就代表了两个向量相乘。所以我们接下来进行向量化。

    2.1、向量化

    首先我们先来定义一个矩阵X和向量 y y y:
    X = ( x 11 x 12 x 13 ⋯ x 1 d 1 x 21 x 22 x 23 ⋯ x 2 d 1 ⋮ ⋮ ⋮ ⋱ ⋮ ⋮ x m 1 x m 2 x m 3 ⋯ x m d 1 ) = ( x 1 T 1 x 2 T 1 ⋮ x m T 1 ) = ( x 1 ^ T x 2 ^ T ⋮ x m ^ T ) X= \begin{pmatrix} x_{11} & x_{12} & x_{13} & \cdots & x_{1d} & 1 \\ x_{21} & x_{22} & x_{23} & \cdots & x_{2d}&1 \\ \vdots & \vdots & \vdots & \ddots & \vdots & \vdots \\ x_{m1} & x_{m2} & x_{m3} & \cdots & x_{md} &1 \\\\ \end{pmatrix} = \begin{pmatrix} x_1^T&1\\ x_2^T&1\\ \vdots\\ x_m^T&1\\ \end{pmatrix} = \begin{pmatrix} \hat{x_1}^T\\ \hat{x_2}^T\\ \vdots\\ \hat{x_m}^T\\ \end{pmatrix} X=x11x21xm1x12x22xm2x13x23xm3x1dx2dxmd111=x1Tx2TxmT111=x1^Tx2^Txm^T
    y = ( y 1 y 2 y 3 ⋮ y m ) y=\begin{pmatrix} y_1\\y_2\\y_3\\\vdots\\y_m \end{pmatrix} y=y1y2y3ym
    准备工作结束了,我们先将 E w ^ E_{\hat{w}} Ew^的求和项展开成矩阵相乘的形式。

    E w ^ = ( y 1 − w ^ T x 1 ^ ) 2 + ( y 2 − w ^ T x 2 ^ ) 2 + ⋯ + ( y m − w ^ T x m ^ ) 2 E_{\hat{w}}=(y_1-\hat{w}^T\hat{x_1})^2+(y_2-\hat{w}^T\hat{x_2})^2+\cdots+(y_m-\hat{w}^T\hat{x_m})^2 Ew^=(y1w^Tx1^)2+(y2w^Tx2^)2++(ymw^Txm^)2
    E w ^ = [ ( y 1 − w ^ T x 1 ^ ) ( y 1 − w ^ T x 1 ^ ) ⋯ ( y m − w ^ T x m ^ ) ] [ ( y 1 − w ^ T x 1 ^ ) ( y 2 − w ^ T x 2 ^ ) ⋮ ( y m − w ^ T x m ^ ) ] E_{\hat{w}}= \begin{bmatrix} (y_1-\hat{w}^T\hat{x_1})&(y_1-\hat{w}^T\hat{x_1})\cdots(y_m-\hat{w}^T\hat{x_m}) \end{bmatrix} \begin{bmatrix} (y_1-\hat{w}^T\hat{x_1})\\ (y_2-\hat{w}^T\hat{x_2})\\ \vdots\\ (y_m-\hat{w}^T\hat{x_m}) \end{bmatrix} Ew^=[(y1w^Tx1^)(y1w^Tx1^)(ymw^Txm^)](y1w^Tx1^)(y2w^Tx2^)(ymw^Txm^)
    再对里面的小项进行恒等变形,
    [ ( y 1 − w ^ T x 1 ^ ) ( y 2 − w ^ T x 2 ^ ) ⋮ ( y m − w ^ T x m ^ ) ] = [ y 1 y 2 y 3 ⋮ y m ] − [ w ^ T x 1 ^ w ^ T x 2 ^ ⋮ w ^ T x m ^ ] = y − [ w ^ T x 1 ^ w ^ T x 2 ^ ⋮ w ^ T x m ^ ] \begin{bmatrix} (y_1-\hat{w}^T\hat{x_1})\\ (y_2-\hat{w}^T\hat{x_2})\\ \vdots\\ (y_m-\hat{w}^T\hat{x_m}) \end{bmatrix} =\begin{bmatrix} y_1\\y_2\\y_3\\\vdots\\y_m \end{bmatrix} - \begin{bmatrix} \hat{w}^T\hat{x_1}\\ \hat{w}^T\hat{x_2}\\ \vdots\\ \hat{w}^T\hat{x_m} \end{bmatrix} =y- \begin{bmatrix} \hat{w}^T\hat{x_1}\\ \hat{w}^T\hat{x_2}\\ \vdots\\ \hat{w}^T\hat{x_m} \end{bmatrix} (y1w^Tx1^)(y2w^Tx2^)(ymw^Txm^)=y1y2y3ymw^Tx1^w^Tx2^w^Txm^=yw^Tx1^w^Tx2^w^Txm^
    发现 w ^ T x i ^ \hat{w}^T\hat{x_i} w^Txi^是一个标量而非向量,根据矩阵转置的法则,标量转置还是等于原先的标量。所以我们就把 w ^ T x i ^ \hat{w}^T\hat{x_i} w^Txi^转置成 x i ^ T w ^ \hat{x_i}^T\hat{w} xi^Tw^再进行恒等变形。
    [ w ^ T x 1 ^ w ^ T x 2 ^ ⋮ w ^ T x m ^ ] = [ x 1 ^ T w ^ x 2 ^ T w ^ ⋮ x m ^ T w ^ ] = [ x 1 ^ T x 2 ^ T ⋮ x m ^ T ] w ^ = X ⋅ w ^ \begin{bmatrix} \hat{w}^T\hat{x_1}\\ \hat{w}^T\hat{x_2}\\ \vdots\\ \hat{w}^T\hat{x_m} \end{bmatrix} =\begin{bmatrix} \hat{x_1}^T\hat{w}\\ \hat{x_2}^T\hat{w}\\ \vdots\\ \hat{x_m}^T\hat{w} \end{bmatrix} =\begin{bmatrix} \hat{x_1}^T\\ \hat{x_2}^T\\ \vdots\\ \hat{x_m}^T \end{bmatrix} \hat{w} =X\cdot \hat{w} w^Tx1^w^Tx2^w^Txm^=x1^Tw^x2^Tw^xm^Tw^=x1^Tx2^Txm^Tw^=Xw^
    所以损失函数 E w ^ E_{\hat{w}} Ew^的“今生”就得到了,
    E w ^ = ( y − X w ^ ) T ( y − X w ^ ) E_{\hat{w}}=(y-X\hat{w})^T(y-X\hat{w}) Ew^=(yXw^)T(yXw^)

    3、证明损失函数为凸函数

    证明多元函数为凸函数的方法与证明一元函数(详情请见一元线性回归(一))有所不同,又有点相似之处。
    最大的不同之处就是一元函数求偏导,是对标量求偏导;而多元则是对向量求偏导,所以这里要补充一些概念(只是图有点多而已概念不难只需了解就好)。在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述 在这里插入图片描述
    下面的这个公式将用来恒等变形(公式里的 x , a , B x,a,B x,a,B都是矩阵或者向量)在这里插入图片描述
    现在可以开始着手证明 E w ^ E_{\hat{w}} Ew^是个凸函数了。
    ∂ E w ^ ∂ w ^ = ∂ ( y − X w ^ ) T ( y − X w ^ ) ∂ w ^ \frac{\partial{E_{\hat{w}}}} {\partial{\hat{w}}}=\frac{\partial{(y-X\hat{w})^T(y-X\hat{w})}}{\partial{\hat{w}}} w^Ew^=w^(yXw^)T(yXw^)
    恒等变形,得
    ∂ E w ^ ∂ w ^ = ∂ ( − y T X w ^ − w ^ T X T y + w ^ T X T X w ^ ) ∂ w ^ \frac{\partial{E_{\hat{w}}}} {\partial{\hat{w}}}=\frac{\partial{( -y^TX\hat{w}-\hat{w}^TX^Ty+\hat{w}^TX^TX\hat{w} ) }}{\partial{\hat{w}}} w^Ew^=w^(yTXw^w^TXTy+w^TXTXw^)
    再用上面给出的公式对每一项进行化简,最后得,
    ∂ E w ^ ∂ w ^ = 2 X T ( X w ^ − y ) \frac{\partial{E_{\hat{w}}}} {\partial{\hat{w}}}=2X^T(X\hat{w}-y) w^Ew^=2XT(Xw^y)
    一阶导数已经求出来了,但是根据多元函数凹凸性的定理,我们需要求出二阶导数,所以继续求偏导。
    ∂ ( ∂ E w ^ ∂ w ^ ) ∂ w ^ = ∂ [ 2 X T ( X w ^ − y ) ] ∂ w ^ = ∂ ( 2 X T X w ^ ) ∂ w ^ \frac{\partial( \frac{\partial{E_{\hat{w}}}} {\partial{\hat{w}}} )}{\partial\hat{w}}=\frac{\partial{[2X^T(X\hat{w}-y)]}} {\partial{\hat{w}}}=\frac{\partial{(2X^TX\hat{w})}} {\partial{\hat{w}}} w^(w^Ew^)=w^[2XT(Xw^y)]=w^(2XTXw^)
    再次利用公式,所以
    ∂ ( ∂ E w ^ ∂ w ^ ) ∂ w ^ = 2 X T X (Hession矩阵) \frac{\partial( \frac{\partial{E_{\hat{w}}}} {\partial{\hat{w}}} )}{\partial\hat{w}}= 2X^TX \tag{Hession矩阵} w^(w^Ew^)=2XTX(Hession)
    根据多元函数凹凸性判定定理,Hession矩阵需要是正定矩阵,这样才能证明是凸函数,事实上Hession矩阵不一定是正定矩阵,因为 X X X代表的是我们的样本数据,如果没有经过处理的话,是很难符合条件的。所以西瓜书为了简便起见,直接假设Hession矩阵是正定的。
    我们同样也假设Hession矩阵是正定的,那么根据判定定理,损失函数应该为凸函数。
    再由凸充分性定理可知当一阶导数=0时, w ^ \hat{w} w^为全局解。
    ∂ E w ^ ∂ w ^ = 2 X T ( X w ^ − y ) = 0 \frac{\partial{E_{\hat{w}}}}{\partial{\hat{w}}} =2X^T(X\hat{w}-y)=0 w^Ew^=2XT(Xw^y)=0
    X T X w ^ = X T y X^TX\hat{w}=X^Ty XTXw^=XTy
    w ^ = ( X T X ) − 1 X T y \hat{w}=(X^TX)^{-1}X^Ty w^=(XTX)1XTy
    花了一下午写这篇博客,深感疲惫,得抱着我的吉他弹弹“5323”了

                                                                   在这里插入图片描述

    更多相关内容
  • 梯度下降法 梯度下降法的基本思想可以类比为一个下山的过程。 假设这样一个场景:一个人被困在山上,需要从山上下来(找到山的最低点,也就是山谷)。但此时山上的浓雾很大,导致...首先,我们有一个可微分的函数。这个
  • 线性变换是最基本的多元函数。因此要学习多元函数,首先需要对线性变换做一个彻底的了解。本文依然从代数学的角度去阐述线性变换的性质。自从泛函分析这门学科提出以来,代数学与分析学的联系越来越紧密。因此,多...

    线性变换是最基本的多元函数。因此要学习多元函数,首先需要对线性变换做一个彻底的了解。本文依然从代数学的角度去阐述线性变换的性质。自从泛函分析这门学科提出以来,代数学与分析学的联系越来越紧密。因此,多学习一些代数学的知识,很有必要。代数学其实并不难学,任何的代数学系统,都不是凭空捏造的。它只是我们熟知的数学运算的一个概括总结而已。例如,对我们的实数运算法则进行抽象,便有了域的概念。对我们n维实数空间进行抽象,便有了线性空间的概念。为什么线性空间的向量没有乘法运算的概念?因为我们的n维实数向量,没有乘法。虽然两个实数向量有点积,叉积运算,但是这两个运算都不满足封闭性,更找不到幺元。点积,叉积运算当然很重要,但是那与域上的乘法有本质区别。所以要研究它们,需要新的代数系统。这是后话。因此,学习代数学需要结合我们熟知的具体的代数系统,对比参照,方不至于迷失。

    线性变换的定义如下。

    定义. 设V和W都是域F上的有限维线性空间。那么我们称L:V\mapsto W是线性的,如果对于任意的\alpha,\beta\in F

    L(\alpha \cdot v_1 + \beta \cdot v_2)=\alpha \cdot L(v_1) + \beta \cdot L(v_2)

    对所有的v_1,v_2\in V成立.

     

    例.  当V=R^n, W=R^m且F取实数域R,对那么任意的实矩阵M_{m\times n},有

    L(x)=Mx

    是一个线性映射。

     

    上面的例子说明,一个矩阵可以诱导出一个线性变换。事实上,对任意的线性变换L:R^n\mapsto R^m都可以由一个实矩阵唯一确定。这是一个非常重要的性质,它告诉我们,线性变换的性质可以从矩阵的性质推导而来。这也是矩阵论的最大意义所在。

    定理. 设L: R^n\mapsto R^m是一个线性变换,那么存在唯一的矩阵M_{m\times n}使得

    L(x)=Mx对任意的x\in R^n成立。

    证明. 存在性. 设e_1,e_2,...,e_n是线性空间R^n上的单位基向量。换句话说向量e_i的第i个元素为1,其他元素为0。对任意的i,记

    L_i = L(e_i)

    那么矩阵M=[L_1,L_2,...,L_n]即满足条件。为了验证这点。对任意的x\in R^n,都有

    x=\sum_{i=1}^n x_i e_i

    这里的x_i是x的第i个分量。因此

    L(x)=\sum_{i=1}^n x_i \cdot L(e_i)= \sum_{i=1}^n x_i \cdot Li = Mx

    唯一性。设M' 也是满足题设条件的矩阵。分别记M_{i,j}M'_{i,j}是矩阵M和M'的第i行j列的元素。那么

    M'_{i,j}=e_i^TM'e_j=e_i^{T} L_j=e_i^T M e_j=M_{i,j}

    故M=M'。定理证毕。

     

    展开全文
  • 在上一篇博文中,我们介绍了线性变换的一个最基本的性质,即任何一个线性变换L,都存在唯一的矩阵M,满足L(x)=Mx。由此,建立了线性变换与矩阵的紧密联系。这样,我们也理解了,为什么在线性代数这门学科里,我们...

    在上一篇博文中,我们介绍了线性变换的一个最基本的性质,即任何一个线性变换L,都存在唯一的矩阵M,满足L(x)=Mx。由此,建立了线性变换与矩阵的紧密联系。这样,我们也理解了,为什么在线性代数这门学科里,我们需要花费那么多的篇幅去研究矩阵。其实,研究矩阵的性质,就是在研究线性变换的性质。本文将列举一些事例,来说明这一点。

    为了简化起见,我们假设后文中的所有线性变换都是R^n \mapsto R^n,这样线性变换矩阵是一个n \times n的方阵。

    线性变换的加法与矩阵加法

    设线性L_1L_2的矩阵分别为M_1M_2。那么L=L_1+L_2也是一个线性变换,这里的L满足

    L(x)=L_1(x)+L_2(x).

    L的线性变换矩阵为M=M_1 + M_2.

    线性变换的复合与矩阵乘法

    设线性L_1L_2的矩阵分别为M_1M_2。那么L=L_1\circ L_2也是一个线性变换,这里的L满足

    L(x)=L_1(L_2(x)).

    L的线性变换矩阵为M=M_1 M_2.

    为了证明这一点,利用线性变换矩阵的性质,我们有

    L(x)=L_1(L_2(x))=L_1(M_2x)=M_1(M_2x)=(M_1M_2)x.

    恒等变换与单位阵

    如果线性变换L满足L(x)=x,那么我们称L是一个恒等变换。此时L的线性变换矩阵是一个单位阵。

    为了说明这点,我们假设线性变换矩阵M=[v_1,v_2,...,v_n],那么我们有

    v_i=L(e_i)=e_i

    这里的e_i是第i个分量为1,其他分量为0的单位基向量。于是

    M=[e_1,e_2,...,e_n]

    是一个单位阵。

    象空间维数与矩阵的秩

    我们假设线性变换L的矩阵为M=[v_1,v_2,...,v_n],那么很显然L的象空间是span(v_1,v_2,...,v_n)。这进一步说明,线性变换象空间的维数就是矩阵M的秩。

    满秩矩阵与一一变换

    我们说线性变换L是一一变换,如果它满足:

    1)对任意的y\in R^n都存在x\in R^n使得L(x)=y;

    2)L(x_1)=L(x_2)当且仅当x_1=x_2

    接下来,我们证明L是一一变换当且仅当M满秩。

    “当”。若M满秩,则span(v_1,v_2,...,v_n)维数为n,也即span(v_1,v_2,...,v_n)=R^n。这样,对任意的y\in R^n,都存在\alpha_1,\alpha_2,...,\alpha_n使得

    y=\alpha_1 v_1 + \alpha_2 v_2 + ... \alpha_n v_n

    x=(\alpha_1,...,\alpha_n)^T=\alpha_1 e_1+...+\alpha_n e_n,便有L(x)=y。这证明了性质1)。

    为证明性质2。设x_1=(\alpha_1,...,\alpha_n),y_1=(\beta_1,...,\beta_n)L(x_1)=L(x_2)。那么

    L(x_1-x_2)=L(x_1)-L(x_2)=\mathbf{0}

    这说明

    (*)                 (\alpha_1-\beta_1)v_1+...+(\alpha_n-\beta_n)v_n=\mathbf{0}

    但是span(v_1,v_2,...,v_n)维数为n,因此v_1,v_2,...,v_n线性独立。这样,要使(*)式成立,必须有\alpha_1-\beta_1=...=\alpha_n-\beta_n=0,也即x_1=x_2。性质2)成立。

    这样L是一个一一映射。

    “仅当”。我们用反证法。假设M不是满秩,那么span(v_1,v_2,...,v_n)维数小于n。因此存在n长向量y满足y\notin span(v_1,v_2,...,v_n),也即y不属于L的象空间。故L不是一一映射。

    结论证毕。

     

    逆变换与逆矩阵

    若L是一一变换,那么对于任意的y存在唯一的x满足L(x)=y。此时,我们可以定义L的逆变换L^{-1},它满足

    L^{-1}(y)=x当且仅当L(x)=y。

    可以很容易证明,L^{-1}也是一个线性变换。为了求出L^{-1}的线性变换矩阵N,我们令K=L\circ L^{-1},那么很显然K是一个恒等变换。所以,K的线性变换矩阵MN是一个单位阵,这里的M是线性变换L的矩阵。于是我们有N=M^{-1}

     

    展开全文
  • 多元函数第三:线性变换(4)旋转

    千次阅读 2019-02-03 13:33:21
    上一篇博文介绍了一般的等距变换。本文介绍一个特殊的等距变换,即旋转变换。这里介绍旋转,指的是二...为了证明旋转变换是线性变换,我们需要验证如下命题。 命题1. 设是二维平面上的一个旋转变换。对任意的都有a...

    上一篇博文介绍了一般的等距变换。本文介绍一个特殊的等距变换,即旋转变换。这里介绍旋转,指的是二维平面上的旋转。对于n维平面,结论完全类似,只是多了几个自由度而已。

    在二维平面上,对一个向量a进行旋转变换,是指将它逆时针旋转一个角度\alpha,从而得到一个新的向量a'。见图1。

    图1

     

    为了证明旋转变换是线性变换,我们需要验证如下命题。

    命题1.  设L_{\alpha}是二维平面上的一个旋转变换。对任意的a\in R^2都有a到a'=L_{\alpha}(a)的夹角为\alpha,如图1所示。那么,L_{\alpha}是一个线性变换。更确切地说,对任意的a,b\in R^2,p,q\in R

    L_{\alpha}(pa+qb)=pL_{\alpha}(a)+qL_{\alpha}(b).

    证明. 我们分两步来完成,这两步都是用几何的方法证明。

    首先,我们证明L_{\alpha}(pa)=pL_{\alpha}(a)。我们记向量a'=L_{\alpha}(a),那么向量pL_{\alpha}(a)=pa'。这样问题就转化为证明L_{\alpha}(pa)=pa'。要证明两个向量相等,只需证明它们的大小和方法相等。

    由于旋转变换不改变向量的大小,故有|L_{\alpha}(pa)|=|pa|=|p||a|=|p||L_\alpha(a)|=|p||a'|=|pa'|.

    为证明L_{\alpha}(pa)与pa‘方向相同,我们不妨假设p>0(对于p\leq 0的情形,证明完全类似)。此时有pa与a同向。因为a到a'的夹角是\alpha,pa到L_{\alpha}(pa)的夹角是\alpha,故而a'与L_{\alpha}(pa)同向。又a'与pa'同向,故而有L_{\alpha}(pa)与pa‘同向。既然L_{\alpha}(pa)与pa‘大小方向均相同,故而有L_{\alpha}(pa)=pa'=pL_{\alpha}(a). 见图2。

    图2

     

    接下来,我们证明L_{\alpha}(a+b)=L_{\alpha}(a)+L_{\alpha}(b)。记a'=L_{\alpha}(a),b'=L_{\alpha}(b), c=a+b, c'=a'+b'.设向量a,b,c,a',b',c'在坐标轴上的终点分别为A,B,C,A',B',C',它们的起点都是坐标原点O,见图3。那么三角形OAC与三角形OA'C'全等。因此,c与c'的大小相等。同时,由于a到a'的夹角为\alpha,而a到c的夹角等于a'到c'的夹角,所以c到c'的夹角为\alpha。这样我们有c'=L_{\alpha}(c),也即是说L_{\alpha}(a+b)=L_{\alpha}(a)+L_{\alpha}(b).

    命题证毕。

    图3

     

    注意,上面的命题用代数的方法也可以证明,只是略显繁琐,因为涉及到很多的坐标变换的运算。但是,在我们知道旋转是线性变换以后,构造旋转的线性变换矩阵却非常容易。

     

    命题2. 二维平面上旋转变换L_\alpha的线性变换矩阵为

    L_{\alpha} = \Big[ \begin{matrix} cos(\alpha) & -sin(\alpha)\\ sin(\alpha)& cos(\alpha) \end{matrix} \Big].

    证明. 由线性变换(1) 中的定理我们可以知道L_{\alpha}=[L_1, L_2]。这里的L_1=L_\alpha(e_1),L_2=L_\alpha(e_2),而e_1=(1,0)^T, e_2=(0,1)^T是二维平面上的标准正交基。通过数形结合的方法,我们可以很容易验证L_1=(cos(\alpha), sin(\alpha))^T,L_2=(-sin(\alpha), cos(\alpha))^T。命题证毕。

     

    通过命题2,我们可以推导出三角函数的和角公式。

    首先,我们知道

    L_{\alpha+\beta} = \Big[ \begin{matrix} cos(\alpha+\beta) & -sin(\alpha+\beta)\\ sin(\alpha+\beta)& cos(\alpha+\beta) \end{matrix} \Big]

    另一方面

    L_{\alpha+\beta} =L{\alpha}L_{\beta} =\Big[ \begin{matrix} cos(\alpha) & -sin(\alpha)\\ sin(\alpha)& cos(\alpha) \end{matrix} \Big] \Big[ \begin{matrix} cos(\beta) & -sin(\beta)\\ sin(\beta)& cos(\beta) \end{matrix} \Big]= \Big[ \begin{matrix} cos(\alpha)cos(\beta) -sin(\alpha)sin(\beta)& -sin(\alpha)cos(\beta) -cos(\alpha)sin(\beta) \\ sin(\alpha)cos(\beta) +cos(\alpha)sin(\beta) & cos(\alpha)cos(\beta) -sin(\alpha)sin(\beta) \end{matrix} \Big]

    于是我们便有

    cos(\alpha+\beta)=cos(\alpha)cos(\beta)-sin(\alpha)sin(\beta)\\ cos(\alpha+\beta)=cos(\alpha)sin(\beta)+sin(\alpha)cos(\beta).

    事实上这种证明并不是什么新鲜玩意儿。我们高中关于和角公式的证明,也是完全类似的思路。只是因为当时没有引入矩阵的符号,所以证明显得繁琐。

     

     

     

     

     

    展开全文
  • 上一篇文章讲述了梯度下降法的数学思想,趁热打铁,这篇博客笔者将使用梯度下降法完成多元线性回归,话不多说,直接开始。 我们假设我们的目标函数是长这样的: import numpy as np import pandas as pd # 读入...
  • 机器学习 回归篇(1)——多元线性回归摘要线性回归简介python实现运行结果及可视 摘要 本文介绍了最基础的回归问题——多元线性回归,并通过python进行实现及可视展示运行结果。 线性回归简介 线性回归问题的...
  • 在分析了传统萨道夫斯基公式存在不足的基础上,引入了考虑质点与爆心高程差的萨道夫斯基修正公式,并将其非线性函数关系式线性化,建立了爆破振动衰减规律多元线性数学模型;运用最小二乘法理论推导得到模型中K、α...
  • 现在给定的要求是,使用一个多元线性模型去拟合这些数据,然后用于预测。 模型 price=f(x1,x2,…,xn)=∑i=1nwixi+b price = f(x_1, x_2, …, x_n) = \sum\limits_{i=1}^{n} w_i x_i + bprice=f(x1​,x2​,…,xn​)=i...
  • Matlab(多元)线性回归、非线性回归、多项式拟合、(自定义函数)曲线拟合-代码示例
  • 原文:Matlab随笔之分段线性函数化为线性规划eg:  10x, 0<=x<=500 c(x)=1000+8x, 500<=x<=1000  3000+6x, 1000<=x<=1500   解法一: 可引入0-1变量,令z1=1...
  • 现以一个多元函数求最值的问题举例说明: 例如求以下函数的最大值: Y=sin(4*pi*X(1))*X(1)+sin(20*pi*X(2))*X(2),该函数有两个未知数 X(1),X(2),变量求解范围分别为[-3.0 12.1] ,[ 4.1 5.8]。 1、编码 初始...
  • 1.1 什么是多元函数 设D为一个非空的n 元有序数组的集合, f为某一确定的对应规则。 若对于每一个有序数组( x1,x2,…,xn)∈D,通过对应规则f,都有唯一确定的实数y与之对应,则称对应规则f为定义在D上的n元函数。 ...
  • 多元线性回归

    千次阅读 2022-04-24 16:20:22
    多元线性回归的概念 多元回归:回归分析中包含 两个或两个以上的自变量。 多元线性回归:因变量和自变量之间是 线性 关系。 多元线性回归模型的几何意义 一元线性回归模型的几何意义 在平面直角坐标系中, 一元线性...
  • regress用于一元及多元线性回归,本质上是最小二乘法,可以通过help命令查看更具体内容 b = regress(Y,X) //确定回归系数的点估计值 b 为回归系数向量 [b,BINT] = regress(Y,X) [b,BINT,R] = regress(Y,X)...
  • 定义损失函数 with tf.name_scope("LossFunction"): loss_function=tf.reduce_mean(tf.pow(y-pred,2)) # 均方误差 ### 创建优化器 optimizer=tf.train.GradientDescentOptimizer(learning_rate).minimize(loss_...
  • 第1章 什么是函数逼近? 1.1 抛出问题1:函数插值 利用有限的样本数据,发现其内在的规律,并用这个规律预测未来新的数据。 (1)单个数据点 0次函数通过样本点:唯一确定一个点 y = f(x) = a0 1次直线函数通过...
  • Bootstrapreg 是一个 MATLAB 程序,用于引导多元线性回归模型 y = beta0 + beta1*x1 + ... + betan*xn + error。 重采样残差方法用于生成随机数以反复更新预测。 这种通过重新采样学生残差的方法比引导对象方法更...
  • 多元线性回归的基础理解

    万次阅读 多人点赞 2018-11-19 01:09:28
    多元线性回归  Multivarate Linear Regression Multiple Feature 前面我们学习了一元线性回归,也动手亲自从底层编写了梯度下降算法来实现一元线性回归。相信大家已经对梯度下降和线性回归有了很清晰的理解了。 ...
  • 多元线性回归分析

    千次阅读 2021-08-07 20:34:33
    多元线性回归分析 回归分析是数据分析中最基础也是最重要的分析工具,绝大多数的数据分析问题,都可以使用回归的思想来解决。回归分析的任务就是,通过研究自变量X和因变量Y的相关关系,尝试去解释Y的形成机制,进而...
  • 梯度下降法求解多元线性回归问题 使用梯度下降法求解一元线性回归的方法也可以被推广到求解多元线性回归问题。 这是多元线性回归的模型: 其中的 X 和 W 都是 m+1 维的向量。 下图为它的损失函数: 它也是一个...
  • 人工智能实验————利用Python编程,求解多元函数极值和回归问题的几种方法 一、牛顿法 1.原理详解 高次方程没有通解,可以依靠牛顿迭代法来求解。没有根式解不意味着方程解不出来,数学家也提供了很多方法,牛顿...
  • 最小二乘法—多项式拟合非线性函数

    万次阅读 多人点赞 2019-07-10 15:02:57
    目录 一、函数的近似表示—高次多项式 二、误差函数—最小二乘法 ...七、优化目标函数—求解线性方程组 八、python编程实现拟合曲线函数 九、结果分析 一、函数的近似表示—高次多项式 为了研究一些复杂...
  • 线性回归模型属于经典的统计学模型,该模型的应用场景是根据已知的变量(自变量)来预测某个连续的数值变量(因变量)。...在开始多元线性模型前介绍下一元线性模型。数学公式可以表示为:一个因变量,一个自变量。...
  • 神经网络拟合二次曲面,涉及到神经网络结构定义、前向传播、后向传播等,代码实现完整,一键运行,供大家学习使用,有问题可以联系博主。
  • 主要介绍了Python利用神经网络解决非线性回归问题,结合实例形式详细分析了Python使用神经网络解决非线性回归问题的相关原理与实现技巧,需要的朋友可以参考下
  • 线性回归Python代码

    2018-07-23 21:49:33
    线性回归是回归函数关于未知回归系数具有非线性结构的回归。常用的处理方法有回归函数线性迭代法、分段回归法、迭代最小二乘法等。非线性回归分析的主要内容与线性回归分析相似。
  • 从头开始学习为Python中任意数量的变量开发多元线性回归。线性回归可能是最简单的机器学习算法。对于初学者来说非常好,因为它使用简单的公式。因此,这对学习机器学习概念很有帮助。在本文中,我将尝试逐步解释多元...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 23,030
精华内容 9,212
关键字:

多元函数的线性化

友情链接: Python.rar