精华内容
下载资源
问答
  • 对范数求偏导

    千次阅读 2017-09-24 21:14:08
    AHA^H表示Hermitian矩阵(A的共轭转置矩阵A∗==A)基础(1)迹(Trace)eig(A)表示A的特征值(2)行列式(Determinant)(3)特例2*2矩阵以上是摘自:The Matrix Cookbook 也可参考维基百科:Matrix calculusL1范数的...

    首先介绍点基础知识,另一方面也算是巩固下:
    A1表示A的逆矩阵;
    AT表示A的转置;
    AH表示Hermitian矩阵(A的共轭转置矩阵A∗==A)

    基础

    这里写图片描述

    (1)迹(Trace)

    eig(A)表示A的特征值

    这里写图片描述

    (2)行列式(Determinant)

    这里写图片描述

    (3)特例2*2矩阵

    这里写图片描述

    以上是摘自:The Matrix Cookbook
    也可参考维基百科:Matrix calculus

    L1范数的次微分

    L1范数不可微。但是存在次梯度,即是次微分的
    L1范数的次梯度如下:

    x||x||1=sign(x)

    其中sign(x) 表示如下:
    sign(x)=+11[1,1]xi>0xi<0xi=0

    L1范数:
    ||X||1=|x1|+|x2|++|xn|

    例如:x=(3,2,5)T
    故其梯度为:sign(x)=(1,1,-1)

    L2范数的微分

    这里写图片描述

    例如:求解下面函数的偏导数:

    f(W)=12i,jϵSγi,j||wTiXwTjX||22

    得:
    f(W)wi=i,jϵsγi,j(wTiXwTjX)(wTiXwTjX)wi=i,jϵsγi,j(wTiXwTjX)XT=i,jϵsγi,j(wTiwTj)(XXT)

    注意这里得到的是行向量的形式,因此还需要对其进行转置

    以上的推倒是基于上图公式得到。。。

    展开全文
  • 如果这个多元函数的二阶偏导数的行列式是半正定的则需要条件极值在极值时有一个条件等式,条件极值通常可以构造一个函数.如原函数是f(x,y),条件等式是z(x,y),可构造F(x,y,a)=f(x,y)+az(x,y...

    条件极值的求法(函数极值的求法例题)

    2020-05-07 21:51:24

    共10个回答

    各个分量的偏导数为0,这是一个必要条件.充分条件是这个多元函数的二阶偏导数的行列式为正定或负定的.如果这个多元函数的二阶偏导数的行列式是半正定的则需要

    88d67cd2ec9afd23448a1b19f494dcc8.png

    条件极值在求极值时有一个条件等式,求条件极值通常可以构造一个函数.如原函数是f(x,y),条件等式是z(x,y),可构造F(x,y,a)=f(x,y)+az(x,y),在分别对x,y,a求偏导令为0,求

    a6a6fa9c4354a04fa6bb18f2da6ab5c2.png

    (1)令f(x,y)=$(2x+4)dx+g(y)=x^2+4x+g(y)f'y=dg(y)/dy=-2y则g(y)=-y^2+cf(1,1)=2则c=-2f(x,y)=x^2+4x-y^2-2(2)令f'x=2x+4=0f'y=-2y=0得驻点(-2,0)f''xx=2f''xy=0f''yy=-20^2-2•(-2)>0f(x,y)无极值边界x^2+y^2=4代入f(x,y)=2x^2+4x-6(-2

    1480bdcfd141a75f9853cc3a6e70d0c0.png

    解:构造拉格朗日函数L(x,y,z,m)=x-2y+2z+m(x^2+y^2+z^2-1)联立Lx(x,y,m)=1+2mx=0Ly(x,y,m)=-2+2my=0Lz(x,y,m)=2+2mz=0Lm(x,y,m)=x^2+y^2+z^2-1=0解得x=±1/3y=±2/3z=±2/3所以f(x,y,z)min=f(-1/3,2/3,-2/3)=-3

    ccb448a00082aec7924a9ef497a0ef53.png

    一、因为z=(1/A-1/y-1/x)^(-1),代入到U=xyz中消去z,再求二阶偏导数Uxx,Uxy,Uyy,若计算得UxxUyy-(Uxy)^2>0,而且Uxx>0,则极小值存在,这样求得符合要求的x、y、z的取值烦围仅是所求点;二、令F(x,y,z)=xyy-入(1/x加1/y加1/z-1/A),则偏导数Fx=Fy=Fz=0,又1/x加1/y加1/z-1/A=0,这样四个方程联立可以求出最值!

    12dcbc60d98d033991f35d8714624ce7.png

    最后三行,可以删除了!前面已经求出两组解:(1)x=-1/3,y=2/3,z=-2/3(2)x=1/3,y=-2/3,z=2/3分别代入目标函数f,第一组得到,f=-3第二组得到,f=3所以,条件极大值为-3,条件极小值为3

    ce3ad831f307d14b298cdfcab7c7485a.png

    这并非条件极值问题,而是需要进行坐标的旋转变换问题,将坐标变换为标准形式,这才能得到长半轴a和短半轴b,从而得到椭圆的面积.

    9dc09355ae41497711b649ab3426e3ca.png

    设F(x,y,z)=x-2y+2z+λ(x²+y²+z²-9)求出偏导数,得到如下方程组:1+2λx=0-2+2λy=02+2λz=0x²+y²+z²=9(这是约束条件)由前三个方程得到,y=-2x,z=2x代入第四个方程得到9x²=9∴x=±1,x=1时,y=-2,z=2∴u=9x=-1时,y=2,z=-2∴u=-9∴条件极大值为9,条件极小值为-9

    d7353736145d6e9aca84ccc9d3a0ceff.png

    你对一阶导数的理解完全正确,二阶导数跟凹凸性有关,也是对的.一阶导为0,且两阶导大于0,比如:y=x^2,在x=0处.怎么理解呢?锅啊.从上往下看,整个都是凹的,最底下那个点就是极小值点.一阶导为0,且两阶导小于0,比如:y=-x^2,在x=0处.倒扣的锅啊,凸的,最上面的点为极大值点.好学善思的精神值得称道,祝进步!

    e04e7b900665d781eb57541fe582e508.png

    用拉格朗日乘数法,距离d的平方为f(x,y,z),然后构造拉格朗日函数,求解.(对于你给的,只需要空间几何中的d就行,lagrange可用于曲线与平面的距离)

    e4c4dd6dc56a59ba372a66dd168abb4a.png

    展开全文
  • 解列出关于在 上的方程组出系数行列式的结果判断是否为特征方程、特征曲线由定解问题的初始条件,可得得到关于在 上的方程得到系数行列式对于系数行列式 曲线 为非特征曲线: 时, 上的只有唯一解曲线 为特征曲线....

    59c7c80dbbff02edb50dd50779ca65b6.png

    2个自变量+拟线性

    先考虑只有两个自变量的二阶拟线性方程的定解问题

    4922fbc7c91461e2de5811508899f185.png

    a,b,c和F都是

    equation?tex=x%2Cy%2Cu%2Cu_%7Bxx%7D%2C+u_%7Byy%7D%2Cu_%7Bxy%7D 的已知函数,T是xOy平面上的一条曲线

    特征理论

    问题

    能否唯一确定函数u的各二阶偏导

    equation?tex=u_%7Bxx%7D%2C+u_%7Byy%7D%2Cu_%7Bxy%7D
    equation?tex=%5CGamma
    的值?

    1. 列出关于
      equation?tex=u_%7Bxx%7D%2C+u_%7Byy%7D%2Cu_%7Bxy%7D
      equation?tex=%5CGamma 上的方程组
    2. 求出系数行列式的结果
    3. 判断是否为特征方程、特征曲线
    • 由定解问题的初始条件,可得

    ae3466a5938c79418b19bf12b3ba7b05.png
    • 得到关于
      equation?tex=u_%7Bxx%7D%2C+u_%7Byy%7D%2Cu_%7Bxy%7D
      equation?tex=%5CGamma 上的方程

    78d3555129ece6b952cd967ddffd8bed.png
    • 得到系数行列式

    f4c0e5bf0680cf237997a750669abd86.png
    • 对于系数行列式
      equation?tex=%5CDelta

    曲线

    equation?tex=%5CGamma
    非特征曲线
    equation?tex=%5CDelta+%5Cne+0 时,
    equation?tex=%5CGamma 上的
    equation?tex=u_%7Bxx%7D%2C+u_%7Byy%7D%2Cu_%7Bxy%7D只有唯一解

    曲线

    equation?tex=%5CGamma
    特征曲线
    equation?tex=%5CDelta+%3D+0 时,
    equation?tex=%5CGamma 上的
    equation?tex=u_%7Bxx%7D%2C+u_%7Byy%7D%2Cu_%7Bxy%7D无解或有无穷解

    equation?tex=%5CDelta+%3D+0
    特征方程

    特征方程的其他写法

    (1)dy dx写法

    • 因为

    cc5bd4bab0769396e63b32d5620d77af.png
    • 所以特征方程又写作
      equation?tex=%5CDelta+%3D+a%28dy%29%5E2+-2bdxdy%2Bc%28dx%29%5E2+%3D+0%5C%5C
    • 解得

    a6ed8d8a06d57ad126807f3e5eb1703d.png

    (2) 用曲线隐函数表达式写法

    • equation?tex=%5CGamma 不用参数表达式,用隐函数表达式
      equation?tex=%5CGamma+%3A+%5CPhi%28x%2Cy%29+%3D+0

    67fff577c69e57c7753dbe7c21b832ac.png
    • 因为
      equation?tex=%5CPhi%28x%2Cy%29%3D0 也可写成参数表达式形式,所以上述式可相等
    • 所以,在隐函数表达式下,特征方程写作

    97206116b6f1c640b9f4063f58660446.png

    二阶方程的分类

    二次曲线分类

    • equation?tex=ax%5E2%2B2bxy%2Bcy%5E2%2Bdx%2Bey%2Bf+%3D+0 判别式
      equation?tex=%5CDelta+%3D+b%5E2-ac
    • equation?tex=%5CDelta+%3E0+ 双曲线
    • equation?tex=%5CDelta+%3D0+ 抛物线
    • equation?tex=%5CDelta+%3C0++ 椭圆线

    二阶方程分类:这里的

    equation?tex=%5CDelta
    是判别式,前面的是特征方程

    equation?tex=au_%7Bxx%7D%2B2bu_%7Bxy%7D%2Bcu_%7Byy%7D%2Bdu_x%2Beu_y%2Bgu+%3D+f%28x%2Cy%29

    equation?tex=%5COmega+%5Csubset+R%5E2 是一个区域,
    equation?tex=%28x_0%2Cy_0%29%5Cin%5COmega

    abcdegf都是关于xy的已知函数

    方程在某点

    equation?tex=%28x_0%2Cy_0%29 处为:
    • 双曲型偏微分方程:
      equation?tex=%5CDelta+%28x_0%2Cy_0%29+%3E+0
    • 抛物型偏微分方程:
      equation?tex=%5CDelta+%28x_0%2Cy_0%29+%3D+0
    • 椭圆型偏微分方程:
      equation?tex=%5CDelta+%28x_0%2Cy_0%29+%3C+0

    对于某区域:

    • 方程在某点领域:双曲、椭圆形偏微分方程在某点的领域类型,与在该点的类型相同。但抛物型则不知。
    • 方程在区域
      equation?tex=%5COmega 的类型:
      • 混合型方程:方程在
        equation?tex=%5COmega的一个子区域为双曲型,另一个子区域为椭圆形
      • 退化双曲型方程:方程在
        equation?tex=%5COmega的一个子区域为双曲型,在其余点(不一定构成子区域)为抛物型
      • 退化椭圆形方程:放在在
        equation?tex=%5COmega的一个子区域为椭圆型,在其余点(不一定构成子区域)我抛物型

    方程标准型

    equation?tex=au_%7Bxx%7D%2B2bu_%7Bxy%7D%2Bcu_%7Byy%7D%2Bdu_x%2Beu_y%2Bgu+%3D+f%28x%2Cy%29

    abcdeg均为常数,a不等于0

    分析

    • 换元得到新方程+求解特征方程:
      • equation?tex=%5Cbegin%7Bcases%7D+%5Cxi+%3D+%5Cvarphi%28x%2Cy%29%5C%5C+%5Ceta+%3D+%5Cpsi%28x%2Cy%29+%5Cend%7Bcases%7D

    dd205cf5d5c1ca3652ff70ea395d5f38.png
      • 代回原泛定方程,得

    equation?tex=Au_%7B%5Cxi%5Cxi%7D%2B2Bu_%7B%5Cxi%5Ceta%7D%2BCu_%7B%5Ceta%5Ceta%7D%2BDu_%5Cxi%2BEu_%5Ceta%2BGu+%3D+F%5C%5C

    其中

    8bc139379d52a4fc10341af0125b58d7.png
    • 发现A、C均为特征方程形式
    • 由特征方程
      equation?tex=a%28dy%29%5E2-2bdxdy%2Bc%28dx%29%5E2++%3D+0 可得
      equation?tex=%5Cfrac%7Bdy%7D%7Bdx%7D+%3D+%5Cfrac%7Bb%5Cpm%5Csqrt%7Bb%5E2-ac%7D%7D%7Ba%7D

    双曲型方程

    可从特征方程的解求得两族特征线,

    equation?tex=%5Cbegin%7Bcases%7D+y-%5Cfrac%7Bb%2B%5Csqrt%7Bb%5E2-ac%7D%7D%7Ba%7Dx+%3D+c_1%5C%5C+y-%5Cfrac%7Bb-%5Csqrt%7Bb%5E2-ac%7D%7D%7Ba%7Dx+%3D+c_2+%5Cend%7Bcases%7D%5C%5C

    equation?tex=%5Cbegin%7Bcases%7D+%5Cvarphi%28x%2Cy%29%3Dy-%5Cfrac%7Bb%2B%5Csqrt%7Bb%5E2-ac%7D%7D%7Ba%7Dx+%5C%5C+%5Cpsi%28x%2Cy%29+%3D+y-%5Cfrac%7Bb-%5Csqrt%7Bb%5E2-ac%7D%7D%7Ba%7Dx++%5Cend%7Bcases%7D%5C%5C

    则这个变换满足特征方程,从而使得A、C均等于0

    由此得到双曲型方程的第一标准型

    equation?tex=u_%7B%5Cxi%5Ceta%7D+%3D+Du_%5Cxi%2BEu_%5Ceta%2BGu+%2B+F%28%5Cxi%2C%5Ceta%29%5C%5C

    equation?tex=%5Coverline+x+%3D+%5Cxi%2B%5Ceta%2C+%5Coverline+y+%3D+%5Cxi+-%5Ceta ,用求解第一标准型相同的方法

    可得第二标准型

    equation?tex=u_%7B%5Coverline+x%5Coverline+x%7D-u_%7B%5Coverline+y%5Coverline+y%7D+%3D+D_1u_%5Coverline+x%2BE_1u_%5Coverline+y%2BG_1u%2BF_1%28%5Coverline+x%2C%5Coverline+y%29%5C%5C

    抛物型

    因为

    equation?tex=%5CDelta+%3D+b%5E2-ac+%3D+0 所以只能从特征方程求得一族双曲线
    equation?tex=y+-+%5Cfrac%7Bb%7D%7Ba%7Dx+%3D+c

    所以令

    equation?tex=%5Cbegin%7Bcases%7D+%5Cxi+%3D%5Cvarphi+%28x%2Cy%29+%3D++y+-+%5Cfrac%7Bb%7D%7Ba%7Dx+%5C%5C+%5Ceta+%3D+%5Cpsi%28x%2Cy%29+%3D+y+%5Cend%7Bcases%7D%5C%5C

    此时

    equation?tex=%5Cxi 可以令A = 0,
    equation?tex=%5Cxi%E3%80%81%5Ceta 可以令B = 0

    同求双曲线第一标准型的方法,得到抛物型方程的标准型

    equation?tex=u_%7B%5Ceta%5Ceta%7D+%3D+D_2+u_%5Cxi%2BE_2u_%5Ceta+%2BG_2u%2BF_2%28%5Cxi%2C%5Ceta%29%5C%5C

    椭圆形

    此时特征方程没有实解,但有虚解

    equation?tex=%5Cfrac%7Bdy%7D%7Bdx%7D+%3D+%5Cfrac%7Bb%5Cpm+i%5Csqrt%7B-%5CDelta%7D%7D%7Ba%7D

    可以求得两族虚特征线

    equation?tex=%5Cbegin%7Bcases%7D+y+-+%5Cfrac%7Bb%2B+i%5Csqrt%7B-%5CDelta%7D%7D%7Ba%7Dx+%3D+c_1+%5Ccdots+%281%29%5C%5C+y-+%5Cfrac%7Bb-i%5Csqrt%7B-%5CDelta%7D%7D%7Ba%7Dx+%3D+c_2+%5Ccdots%282%29+%5Cend%7Bcases%7D%5C%5C+

    为了消除复数,做如下变换

    equation?tex=%5Cbegin%7Bcases%7D+%5Cxi+%3D+%5Cfrac%7B1%7D%7B2%7D%28%281%29%2B%282%29%29+%3D+y-%5Cfrac%7Bb%7D%7Ba%7Dx%5C%5C+%5Ceta+%3D+%5Cfrac%7B1%7D%7B2i%7D%28%281%29-%282%29%29+%3D+-%5Cfrac%7B%5Csqrt%7B-%5CDelta%7D%7D%7Ba%7Dx++%5Cend%7Bcases%7D%5C%5C

    按照求双曲型第一标准型的方法,可得椭圆型方程的标准型:

    equation?tex=u_%7B%5Cxi%5Cxi%7D%2Bu_%7B%5Ceta%5Ceta%7D+%3D+D_3u_%5Cxi%2BE_3u_%5Ceta%2BG_3u%2BF%28%5Cxi%2C%5Ceta%29%5C%5C

    多个自变量+线性

    有如下定解问题

    56531fd95745e1d3fe1c2f376622c3d6.png

    S为曲面:

    equation?tex=G%28x_1%2Cx_2%2C%5Ccdots%2Cx_n%29+%3D+0

    a、b、c、f均是已知的关于

    equation?tex=x_1%2Cx_2%2C%5Ccdots%2Cx_n 的函数

    特征理论

    问题

    唯一确定u的各二阶导数

    equation?tex=u_%7Bx_ix_j%7D
    在S上的值

    (1)当S为超平面时,设该超平面为

    equation?tex=x_n+%3D+x_n%5E0

    (超平面:一个n维中n-1维的子空间,可以把n维空间分成不相交的两部分)

    1. 写出定解问题
    2. 从初值条件可以得出
      equation?tex=u_%7Bx_ix_j%7D++%28i%2Cj%5Cne+n%29 ,
      equation?tex=u_%7Bx_ix_n%7D++%28i%5Cne+n%29
    3. 从泛定方程求得
      equation?tex=u_%7Bx_nx_n%7D
    4. equation?tex=a_%7Bnn%7D 讨论S是否为特征曲面
    • 定解问题如下

    1b0bb91cca81ac37820d733a046c5fd3.png
      • 由边界条件 1 可以求出
        equation?tex=u_%7Bx_ix_j%7D++%28i%2Cj%5Cne+n%29 ,边界条件 2 可以求出
        equation?tex=u_%7Bx_ix_n%7D++%28i%5Cne+n%29
      • 剩下
        equation?tex=u_%7Bx_nx_n%7D++ 未知
    • equation?tex=u_%7Bx_nx_n%7D++,由泛定方程

    1f29c217b8c732c2ec5b01ef826bbc2b.png
      • S为非特征曲面:当
        equation?tex=a_%7Bnn%7D+%5Cne+0 时,
        equation?tex=u_%7Bx_nx_n%7D 有唯一解
      • S为特征曲面:当
        equation?tex=a_%7Bnn%7D+%3D+0 时,
        equation?tex=u_%7Bx_nx_n%7D 无解或有解,有解需满足如下相容性条件

    f639e66799fe6f2703f6f7db2629a066.png

    (2)当S为一般曲面时(这里让S为正规曲面

    1. 将一般曲面变换为超平面:换+验证
    2. 写出新空间下的定解问题
    3. 同上述超平面解法

    1

    • 将S进行拓扑变换,将S由空间
      equation?tex=%28x_1%2Cx_2%2C%5Ccdots%2Cx_n%29 转移到空间
      equation?tex=%28%5Cxi_1%2C%5Cxi_2%2C%5Ccdots%2C%5Cxi_n%29 ,该新空间要满足:
      • S在新空间里是超平面
        equation?tex=%5Cxi_n+%3D+%5Cxi_n%5E0
      • 已知
        equation?tex=%28x_1%2Cx_2%2C%5Ccdots%2Cx_n%29 可得
        equation?tex=%28%5Cxi_1%2C%5Cxi_2%2C%5Ccdots%2C%5Cxi_n%29
      • 已知
        equation?tex=%28%5Cxi_1%2C%5Cxi_2%2C%5Ccdots%2C%5Cxi_n%29 可得
        equation?tex=%28x_1%2Cx_2%2C%5Ccdots%2Cx_n%29
    • 作如下变换:

    equation?tex=%5Cbegin+%7Bcases%7D+%5Cxi_1+%3D+x_1%5C%5C+%5Cxi_2+%3D+x_2%5C%5C+%5Ccdots%5C%5C+%5Cxi_%7Bn-1%7D+%3D+x_%7Bn-2%7D%5C%5C+%5Cxi_n+%3D+G%28x_1%2Cx_2%2C%5Ccdots%2Cx_n%29+%3D+0+%5Cend+%7Bcases%7D%5C%5C
    • 证明该平面符合要求:
      • 因为S是正规曲面,所以对任意点
        equation?tex=P%28x_1%2Cx_2%2C%5Ccdots%2Cx_n%29
        equation?tex=%5Csum_%7Bi%3D1%7D%5E%7Bn%7D%7BG_%7Bx_i%7D%7D%5E2%28x_1%2Cx_2%2C%5Ccdots%2Cx_n%29+%5Cne+0%5C%5C
        equation?tex=%5Cfrac%7B%5Cpartial+G%7D%7B%5Cpartial+x_i%7D+%5Cne+0
      • 由反函数定理,可得已知
        equation?tex=%5Cxi_n 时可求得
        equation?tex=x_n

    23

    在可逆变化下,仍变为一个二阶线性方程

    • 在新空间中的定解问题如下:

    e69cc31ee0671e3825b7f13dc24af992.png
    • 可求出
      equation?tex=u_%7B%5Cxi_i%5Cxi_j%7D+%28i%2Cj%5Cne+n%29
      equation?tex=u_%7B%5Cxi_i%5Cxi_n%7D+%28i%5Cne+n%29 ,剩下
      equation?tex=u_%7B%5Cxi_n%5Cxi_n%7D 未知
    • 因为

    cb64cb83de8d00c5ea5ca76e12ad0f50.png
      • 其中,
        equation?tex=A_%7Bnn%7D%3Da_%7Bij%7D%5Cfrac%7B%5Cpartial+G%7D%7B%5Cpartial+x_i%7D%5Cfrac%7B%5Cpartial+G%7D%7B%5Cpartial+x_j%7D%5C%5C
      • S为非特征曲面:当
        equation?tex=A_%7Bnn%7D+%5Cne+0 唯一解
      • S为特征曲面:当
        equation?tex=A_%7Bnn%7D%3D0 无解或满足相容性条件时无穷解
      • equation?tex=A_%7Bnn%7D%3D0 为特征方程、

    特征方程的其他形式

    (?)曲面S法线方向余弦:

    55e4b979da54d452346d09c0ab1be419.png
    • 所以特征方程又写作
      equation?tex=%5Csum_%7Bi+%3D+1%7D%5E%7Bn%7D%7Ba_%7Bij%7D%5Calpha_i%5Calpha_j%7D+%3D+0%5C%5C

    分类与标准型

    仅考虑主部具有常系数的多个自变量的二阶线性偏微分方程

    37dbbc12970680419499d58231fc3ca4.png

    a均为常数,

    equation?tex=a_%7Bij%7D+%3D+a_%7Bji%7D

    方程标准型

    概念解释:

    • 特征方程:
      equation?tex=%5Csum_%7Bi%2Cj%3D1%7D%5E%7Bn%7D%7Ba_%7Bij%7D%5Calpha_i%5Calpha_j%7D+%3D+0
    • 特征二次型:
      equation?tex=D+%3D+%5Csum_%7Bi%2Cj%3D1%7D%5E%7Bn%7D%7Ba_%7Bij%7D%5Calpha_i%5Calpha_j%7D
    • 二次型:n个变量的二次多项式。
    • 二次型的标准型:二次型自变量经过
      equation?tex=%5Coverrightarrow+x+%3D+C%5Coverrightarrow+y 变化后,变成二次项里只有平方项的形式
    • 例子

    73132a301591bdd81b4b3fef54b15e4b.png

    求解方程标准型:

    • 令特征二次型
      equation?tex=D+%3D+%5Csum_%7Bi%2Cj%3D1%7D%5E%7Bn%7D%7Ba_%7Bij%7D%5Calpha_i%5Calpha_j%7D%3D%5Calpha%5ETA%5Calpha (因为a是常数所以矩阵A全是常数)
    • 将特征二次型化为标准型:

    equation?tex=%5Coverrightarrow+%5Calpha+%3D+C%5Coverrightarrow+%5Cbeta%5C%5C

    equation?tex=D+%3D+%5Csum_%7Bi%3D1%7D%5E%7Bn%7D%7B%5Clambda_i%5Cbeta_i%5E2%7D%5C%5C

    其中

    equation?tex=C%5ETAC 是关于λ的对角矩阵,其中λ取值为0、1、-1
    • equation?tex=+%5Coverrightarrow+y+%3DC%5ET+%5Coverrightarrow+x+ ,从而将原泛定方程转化为

    8799226709901af300c879d2f0bc207f.png

    得到多个自变量的二阶线性方程的标准型(主部是常系数)

    根据标准型分类

    • 椭圆、双曲型:λ全不为0
      • 椭圆型偏微分方程:λ全是1或全是-1
      • 双曲型偏微分方程:
        • λ其中一个为1,另外n-1个为-1
        • λ其中一个为-1,另外n-1个位1
      • 超双曲型偏微分方程:λ取1和-1的个数都超过一个(说明自变量个数大于等于4个)
    • 抛物型偏微分方程:λ中有一个为0,其余全为1或-1
    展开全文
  • 在向量分析中,雅可比矩阵(也称作Jacobi矩阵)是函数的一阶偏导数以一定方式排列成的矩阵,当其为方阵(square matrix)时,其行列式称为Jacobi行列式。要注意的是,如果雅可比矩阵为方阵,那在英文中雅可比矩阵跟...

    导航

    1 导航与滤波

    1.1 雅可比矩阵示例

    • 雅可比矩阵:用来预测模型?还是求取导数?
      在向量分析中,雅可比矩阵(也称作Jacobi矩阵)是函数的一阶偏导数以一定方式排列成的矩阵,当其为方阵(square matrix)时,其行列式称为Jacobi行列式。要注意的是,如果雅可比矩阵为方阵,那在英文中雅可比矩阵跟Jacobi行列式两者都称作 Jacobian。在卡尔曼滤波设计的过程中往往需要对观测函数进行求取偏导,这里就可以使用雅可比矩阵表示偏导矩阵。
      对于下列函数
      x=rsinθcosφx=r \sin \theta \cos \varphi
      y=rsinθsinφy=r \sin \theta \sin \varphi
      z=rcosθz=r \cos \theta
      求雅可比矩阵如下:
      JF(r,θ,φ)=[xrxθxφyryθyφzrzθzφ]=[sinθcosφrcosθcosφrsinθsinφsinθsinφrcosθsinφrsinθsinφsinθsinφrcosθsinφrsinθcosφcosθrsinθ0]\mathbf{J}_{\mathbf{F}}(r, \theta, \varphi)=\left[\begin{array}{ccc}{\frac{\partial x}{\partial r}} & {\frac{\partial x}{\partial \theta}} & {\frac{\partial x}{\partial \varphi}} \\ {\frac{\partial y}{\partial r}} & {\frac{\partial y}{\partial \theta}} & {\frac{\partial y}{\partial \varphi}} \\ {\frac{\partial z}{\partial r}} & {\frac{\partial z}{\partial \theta}} & {\frac{\partial z}{\partial \varphi}}\end{array}\right]=\left[\begin{array}{ccc}{\sin \theta \cos \varphi} & {r \cos \theta \cos \varphi} & {-r \sin \theta \sin \varphi} \\ {\sin \theta \sin \varphi} & {r \cos \theta \sin \varphi} & {-r \sin \theta \sin \varphi} \\ {\sin \theta \sin \varphi} & {r \cos \theta \sin \varphi} & {r \sin \theta \cos \varphi} \\ {\cos \theta} & {-r \sin \theta} & {0}\end{array}\right]
    • 为作动力学参考,我们假设飞行器,在月球着陆时的动力学方程如下:
      dx˙dt=μr3x+32(μC20r5)x(15(zr)2)+Ωe2x+2Ωey˙+x¨resdy˙dt=μr3y+32(μC20r5)y(15(zr)2)+Ωe2y2Ωex˙+y¨resdz˙dt=μr3z+32(μC20r5)z(35(zr)2)+z¨res\begin{aligned} \frac{d \dot{x}}{d t} &=-\frac{\mu}{r^{3}} x+\frac{3}{2}\left(\frac{\mu C_{20}}{r^{5}}\right) x\left(1-5\left(\frac{z}{r}\right)^{2}\right)+\Omega_{e}^{2} x+2 \Omega_{e} \dot{y}+\ddot{x}_{r e s} \\ \frac{d \dot{y}}{d t} &=-\frac{\mu}{r^{3}} y+\frac{3}{2}\left(\frac{\mu C_{20}}{r^{5}}\right) y\left(1-5\left(\frac{z}{r}\right)^{2}\right)+\Omega_{e}^{2} y-2 \Omega_{e} \dot{x}+\ddot{y}_{r e s} \\ \frac{d \dot{z}}{d t} &=-\frac{\mu}{r^{3}} z+\frac{3}{2}\left(\frac{\mu C_{20}}{r^{5}}\right) z\left(3-5\left(\frac{z}{r}\right)^{2}\right)+\ddot{z}_{r e s} \end{aligned}
      关于雅可比矩阵的计算可以参考:
    1. 直接法
      J(ξ)=J0J1J2J3=I2(p)p[fx00fy][10X2!01YZ][1000ZY010Z0X001YX0]1Z\begin{aligned} \mathbf{J}(\boldsymbol{\xi}) &=\mathbf{J}_{0} \cdot \mathbf{J}_{1} \cdot \mathbf{J}_{2} \cdot \mathbf{J}_{3} \\ &=\frac{\partial \mathbf{I}_{2}\left(\mathbf{p}^{\prime}\right)}{\partial \mathbf{p}^{\prime}} \cdot\left[\begin{array}{ll}{f_{x}} & {0} \\ {0} & {f_{y}}\end{array}\right] \cdot\left[\begin{array}{ccc}{1} & {0} & {-\frac{X^{\prime}}{2 !}} \\ {0} & {1} & {-\frac{Y^{\prime}}{Z^{\prime}}}\end{array}\right] \cdot\left[\begin{array}{cccccc}{1} & {0} & {0} & {0} & {Z^{\prime}} & {-Y^{\prime}} \\ {0} & {1} & {0} & {-Z^{\prime}} & {0} & {X^{\prime}} \\ {0} & {0} & {1} & {Y^{\prime}} & {-X^{\prime}} & {0}\end{array}\right] \cdot \frac{1}{Z^{\prime}} \end{aligned}
    2. 特征点法
      =[fxZ0XfxZ2XYfxZ2fx+X2fxZ2YfxZ0fyZYfyZ2fyY2fyZ2XYfyZ2XfyZ]=\left[\begin{array}{ccccc}{\frac{f_{x}}{Z^{\prime}}} & {0} & {-\frac{X^{\prime} f_{x}}{Z^{\prime 2}}} & {-\frac{X^{\prime} Y^{\prime} f_{x}}{Z^{\prime 2}}} & {f_{x}+\frac{X^{\prime 2} f_{x}}{Z^{\prime 2}}} & {-\frac{Y^{\prime} f_{x}}{Z^{\prime}}} \\ {0} & {\frac{f_{y}}{Z^{\prime}}} & {-\frac{Y^{\prime} f_{y}}{Z^{\prime 2}}} & {-f_{y}-\frac{Y^{\prime 2} f_{y}}{Z^{\prime 2}}} & {\frac{X^{\prime} Y^{\prime} f_{y}}{Z^{\prime 2}}} & {\frac{X^{\prime} f_{y}}{Z^{\prime}}}\end{array}\right]

    1.2 卡尔曼滤波与扩展卡尔曼滤波

    • 卡尔曼滤波在「slam十四讲」中有对应内容,由此可以推导出“kalman filter”
      现在的问题是如何求解这个最大化问题。对于高斯分布,最大化问题可以变成最小化它的负对数。这一点在「概率统计」中经常用到。
      JxT=HTW1(zHx)=0(HTW1H)x=HTW1z\frac{\partial J}{\partial x^{T}}=-H^{T} W^{-1}(z-H x)=0 \Rightarrow\left(H^{T} W^{-1} H\right) x=H^{T} W^{-1} z
      实际上我们可以看出,卡尔曼滤波只用到目前时刻向前的先验信息(或者说是观测数据),但是优化问题中往往需要以后时刻的观测数据进行优化计算。并且更新每个时刻的均值(就是估计值)与方差(就是模型的输入误差方差P)。
      关于几种状态估计的方式,这里给出了公式与对比,可以借鉴参考。概括如下:
      P~k=Fk1P^k1Fk1T+Qk\tilde{P}_{k}=F_{k-1} \hat{P}_{k-1} F_{k-1}^{T}+Q_{k}^{\prime}
      x~k=f(x^k1,vk,0)\tilde{x}_{k}=f\left(\hat{x}_{k-1}, v_{k}, 0\right)
      Kk=P~kGkT(GkP~kGkT+Rk)1K_{k}=\tilde{P}_{k} G_{k}^{T}\left(G_{k} \tilde{P}_{k} G_{k}^{T}+R_{k}^{\prime}\right)^{-1}
      P^k=(IKkGk)P~k\hat{P}_{k}=\left(I-K_{k} G_{k}\right) \tilde{P}_{k}
      x^k=x~k+Kk(ykg(x~k,0))\hat{x}_{k}=\tilde{x}_{k}+K_{k}\left(y_{k}-g\left(\tilde{x}_{k}, 0\right)\right)
      其中,
      Fk1=fxk1x^k1,Gk=hxkx~kF_{k-1}=\left.\frac{\partial f}{\partial x_{k-1}}\right|_{\hat{x}_{k-1}}, G_{k}=\left.\frac{\partial h}{\partial x_{k}}\right|_{\tilde{x}_{k}}
    • 几个注意的地方:
      1. 即使是高斯分布,经过一个非线性变换后也不是高斯分布。EKF只计算均值与协方差,是在用高斯近似这个非线性变换后的结果。(实际中这个近似可能很差)。
      2. 系统本身线性化过程中,丢掉了高阶项。
      3. 线性化的工作点往往不是输入状态真实的均值,而是一个估计的均值。于是,在这个工作点下计算的F,G,也不是最好的。
      4. 在估计非线性输出的均值时,EKF算的是μy=f(μx)\mu_y=f(\mu_x)的形式。这个结果几乎不会是输出分布的真正期望值。协方差也是同理。
        那么,怎么克服以上的缺点呢?途径很多,主要看我们想不想维持EKF的假设。如果我们比较乖,希望维持高斯分布假设,可以这样子改:
    • 为了克服第3条工作点的问题,我们以EKF估计的结果为工作点,重新计算一遍EKF,直到这个工作点变化够小。是为迭代EKF(Iterated EKF, IEKF)。
      • 为了克服第4条,我们除了计算μy=f(μx)\mu_y=f(\mu_x),再计算其他几个精心挑选的采样点,然后用这几个点估计输出的高斯分布。是为Sigma Point KF(SPKF,或UKF)。
      • 如果不那么乖,可以说:我们不要高斯分布假设,凭什么要用高斯去近似一个长得根本不高斯的分布呢?于是问题变为,丢掉高斯假设后,怎么描述输出函数的分布就成了一个问题。一种比较暴力的方式是:用足够多的采样点,来表达输出的分布。这种蒙特卡洛的方式,也就是粒子滤波的思路。
      • 如果再进一步,可以丢弃滤波器思路,说:为什么要用前一个时刻的值来估计下一个时刻呢?我们可以把所有状态看成变量,把运动方程和观测方程看成变量间的约束,构造误差函数,然后最小化这个误差的二次型。这样就会得到非线性优化的方法,在SLAM里就走向图优化那条路上去了。不过,非线性优化也需要对误差函数不断地求梯度,并根据梯度方向迭代,因而局部线性化是不可避免的。
      • 可以看到,在这个过程中,我们逐渐放宽了假设。
        相关信息,可以参见这个人的博客
    • github上对卡尔曼滤波总结的比较好。

    1.3 卡尔曼滤波仿真代码

    下面给出框架代码(matlab)

    %% fusion.m
    % Parameters ============================================================
    
    % Biases
    BIAS1 = +1;
    BIAS2 = -1;
    
    % Measurement noise covariances
    R1 = 0.64;
    R2 = 0.64;
    
    % Process noise covariance
    Q = .005;
    
    % State transition model
    A = 1;
    
    % Observation model
    C1 = 1;
    C2 = 1;
    
    % Duration
    N = 1000;
    
    % Run ====================================================================
    
    % Generate the signal x as a sine wave
    x = 20 + sin(5*linspace(0,1,N)*pi);
    
    % Add some process noise with covariance Q
    w = sqrt(Q) * randn(size(x));
    x = x + w;
    
    % Compute noisy sensor values
    z1 = BIAS1 + x + sqrt(R1) * randn(size(x));
    z2 = BIAS2 + x + sqrt(R2) * randn(size(x));
    
    % Run a single-sensor example and plot it
    xhat = kalman(z1, A, C1, R1, Q);
    
    % Plot sensed and estimated values
    clf
    plotsigs(1, z1, xhat, 'Sensor 1')
    title('One sensor: signal cleanup')
    
    % Plot estimate and actual values
    plotsigsrms('One sensor', 2, x, xhat)
    
    % Run the Kalman filter on fused sensors
    xhat = kalman([z1; z2], A, [C1; C2], [R1 0; 0 R2], Q);
    
    % Plot fusion example
    plotsigsrms('Two sensors', 3, x, xhat)
    
    %%kalman.m
    function xhat = kalman(z, A, C, R, Q)
    
    % Initializtion =====================================================
    
    % Number of sensors
    m = size(C, 1);
    
    % Number of state values
    n = size(C, 2);
    
    % Number of observations
    numobs = size(z, 2);
    
    % Use linear least squares to estimate initial state from initial
    % observation
    xhat = zeros(n, numobs);
    xhat(:,1) = C \ z(:,1);
    
    % Initialize P, I
    P = ones(size(A));
    I = eye(size(A));
    
    % Kalman Filter =====================================================
    
    for k = 2:numobs
        
        % Predict
        xhat(:,k) = A * xhat(:,k-1);
        P         = A * P * A' + Q;
        
        % Update
        G         = P  * C' / (C * P * C' + R);
        P         = (I - G * C) * P;
        xhat(:,k) = xhat(:,k) + G * (z(:,k) - C * xhat(:,k));
        
    end
    end
    

    1.4 为角度设计卡尔曼滤波器

    若用C++完成卡尔曼滤波的设计,针对陀螺仪的单项的纠正如下:
    博客中给出了相应的解释。
    xk=Fxk1+Buk+wk\boldsymbol{x}_{k}=\boldsymbol{F} x_{k-1}+\boldsymbol{B} u_{k}+w_{k}
    其中:
    xk=[θθ˙b]k\boldsymbol{x}_{k}=\left[\begin{array}{c}{\theta} \\ {\dot{\theta}_{b}}\end{array}\right]_{k}
    预测方程最终可以写成为:
    =\left[\begin{array}{c}\theta+\Delta t\left(\dot{\theta}-\dot{\theta}{b}\right) \ \dot{\theta}{b}\end{array}\right]

    问题是这里的bias到底是什么?不是特别确定(偏差量直接作为要估计的项?)

    另外,我们计算wk的协方差,过程噪声协方差矩阵,在这种情况下是加速度计和偏差状态估计的协方差矩阵。在这种情况下,我们将认为偏置和加速度计的估计值是独立的,因此它实际上等于加速度计和偏置的估计值的方差。最终定义为:
    Qk=[Qθ00Qθ˙b]Δt\boldsymbol{Q}_{k}=\left[\begin{array}{cc}{Q_{\theta}} & {0} \\ {0} & {Q_{\dot{\theta}_{b}}}\end{array}\right] \Delta t
    调试过程如下:
    请注意,如果设置较大的值,则状态估计中的噪声会更多。因此,例如,如果估计的角度开始漂移,则必须增加的值$Q _ {\dot{\theta}b} $ 。否则,如果估计趋于缓慢,则说明您对角度的估计过于信任,应尝试减小的值 $ Q\theta $ 以使其更具响应性。
    DraggedImage.png

    float Kalman::getAngle(float newAngle, float newRate, float dt) {
        // KasBot V2  -  Kalman filter module - http://www.x-firm.com/?page_id=145
        // Modified by Kristian Lauszus
        // See my blog post for more information: http://blog.tkjelectronics.dk/2012/09/a-practical-approach-to-kalman-filter-and-how-to-implement-it
    
        // Discrete Kalman filter time update equations - Time Update ("Predict")
        // Update xhat - Project the state ahead
        /* Step 1 */
        rate = newRate - bias;
        angle += dt * rate;
    
        // Update estimation error covariance - Project the error covariance ahead
        /* Step 2 */
        P[0][0] += dt * (dt*P[1][1] - P[0][1] - P[1][0] + Q_angle);
        P[0][1] -= dt * P[1][1];
        P[1][0] -= dt * P[1][1];
        P[1][1] += Q_bias * dt;
    
        // Discrete Kalman filter measurement update equations - Measurement Update ("Correct")
        // Calculate Kalman gain - Compute the Kalman gain
        /* Step 4 */
        float S = P[0][0] + R_measure; // Estimate error
        /* Step 5 */
        float K[2]; // Kalman gain - This is a 2x1 vector
        K[0] = P[0][0] / S;
        K[1] = P[1][0] / S;
    
        // Calculate angle and bias - Update estimate with measurement zk (newAngle)
        /* Step 3 */
        float y = newAngle - angle; // Angle difference
        /* Step 6 */
        angle += K[0] * y;
        bias += K[1] * y;//这里为什么用bias,我也不太明白。
    
        // Calculate estimation error covariance - Update the error covariance
        /* Step 7 */
        float P00_temp = P[0][0];
        float P01_temp = P[0][1];
    
        P[0][0] -= K[0] * P00_temp;
        P[0][1] -= K[0] * P01_temp;
        P[1][0] -= K[1] * P00_temp;
        P[1][1] -= K[1] * P01_temp;
    
        return angle;
    };
    

    1.5 多传感器融合

    激光雷达与IMU融合

    2 导航其他相关内容

    展开全文
  • 1,采用目标函数对多项式系数求偏导,得到最优值条件,组成一个方程组; 2,方程组的解法采用行列式变换(两次变换:普通行列式——三角行列式——对角行列式——求解),行列式的求解算法上优化过一次了,目前还...
  • 最小二乘C

    2015-10-30 21:52:14
    1,采用目标函数对多项式系数求偏导,得到最优值条件,组成一个方程组; 2,方程组的解法采用行列式变换(两次变换:普通行列式——三角行列式——对角行列式——求解),行列式的求解算法上优化过一次了,目前还...
  • 最小二乘法曲线拟合 C语言实现

    万次阅读 2014-04-26 11:55:00
    1,采用目标函数对多项式系数求偏导,得到最优值条件,组成一个方程组; 2,方程组的解法采用行列式变换(两次变换:普通行列式——三角行列式——对角行列式——求解),行列式的求解算法上优化过一次了,目前还...
  • 1.计算行列式 2.计算特征根 3.补充知识点:顺序主子式、主子式是相应矩阵行列式的值。 4.判断矩阵是否正定(特征根法,顺序主子式法) 5.判断凸函数:黑塞矩阵(二阶偏导)正定or半正定。 ...
  • 近日在学习cs231n的向量化梯度求法时候,无法理解利用雅克比行列式求梯度,于是补充大学关于各种数据类型微积分的知识。 目的 学习深度学习需要的矩阵微积分知识,达到能理解Tensorflow中对于向量化梯度具体代码...
  • 2017.05.18回顾

    2017-05-18 17:43:55
    1、上午小结写得很快,写完了上午就是继续研究为什么相关系数是线性关系的度量,还是有所进展的,推导了一元线性回归的最小二乘方法,对参数求偏导,令其等于0,解一个二元一次方程组,可以用行列式求解方法,先检验...
  • 正规方程组

    2017-01-17 12:19:13
    首先,前提知识A是一个输入矩阵,,也就是对A中的每个元素求偏导,举例, 然后引入了矩阵的迹,,这是在线性代数中的知识,下面给出一系列公式, 有兴趣的可以自己证明一下。 |A|代表的是A的行列式。 下面讲述...
  • 这里,对a,b求偏导= 0,取误差时最小时的a,b 1.3、Python实现 2、多元线性回归 2.1、核心理解: 类似一元线性,这里写一下推导,也挺简单的: 这里需要注意的是我们在做多元线性回归的时候一般要求xa 与xb的...
  • 多元正态分布的概率密度函数 N维随机向量 如果服从多变量正态分布,必须满足下面的...我们对均值求偏导 针对上面的矩阵求导,给出如下证明: 下面两个是常用的两个公式: 第一个公式证明,和上面的类似。 第二个小编
  • 2. 复合函数求偏导数 3. 隐函数求偏导数 4. 高阶偏导数 4.二元函数的极值 1. 极值的基本概念 2. 无限制条件求极值 3. 有限制条件求极值 练习题七 8.二重积分 1.二重积分的基本概念 1. 二重积分的引入 2. 二重积分的...
  • Mathmetica 日常应用

    2020-08-17 13:12:11
    高数计算解方程极限偏导数积分幂级数展开微分方程傅里叶变换3.线代计算建立矩阵行列式秩逆矩阵特征值与特征向量线性方程组施密特正交化 Mathmetica日常应用 1.画图 1.1 二维图 单变量 可以单个图像画图 Plot[Sin...
  • 图像区分平坦、边缘、角点区域

    千次阅读 2017-08-15 15:20:44
    此处所说的张量不是相对论或黎曼几何里的张量,黎曼几何的张量好多论文都叫张量场了。也不是数学界还没研究明白的对矩阵进行扩展的高阶张量,主要是张量分解。...然后矩阵E的行列式K和迹H。然后根据K和H的关系就能区
  • 图像区分平坦区域、边缘、角点区域:像素组织而成的矩阵如下:,其中Ix和Iy为原图像在x和y方向求得的偏导,然后矩阵E的行列式K和迹H,后根据K和H的关系就能区分图像的区域模式了。平坦区域:H=0边缘区域:H&gt...
  • 8·12 偏导数 第十二章 积分学 1.不定积分 1·1 原函数和不定积分 1·2 不定积分的法则与公式 1·3 常用初等函数的不定积分公式 1·4 有理函数的积分法 1·5 无理函数的积分法 1·6 超越函数的积分法 1·7 各种函数...
  • 8·12 偏导数 第十二章 积分学 1.不定积分 1·1 原函数和不定积分 1·2 不定积分的法则与公式 1·3 常用初等函数的不定积分公式 1·4 有理函数的积分法 1·5 无理函数的积分法 1·6 超越函数的积分法 1·7 各种函数...

空空如也

空空如也

1 2 3 4 5
收藏数 90
精华内容 36
关键字:

行列式求偏导