精华内容
下载资源
问答
  • 通俗易懂,讲解很好,易理解,案例明确,过程清晰,很实用。
  • 最优控制中的变分法

    2021-04-01 17:58:53
    本文总结自胡寿松教授的专著《最优控制理论与系统》第二章 最优控制中的变分法。文章中举的例题均用自己的方法写了一遍,没有依照书上的解法写。

    第2章 最优控制中的变分法

    最优控制问题是在一定的约束条件下,寻求使性能达到极值时的控制函数。

    注:本文总结自胡寿松教授的专著《最优控制理论与系统》第二章 最优控制中的变分法。文章中举的例题均用自己的方法写了一遍,没有依照书上的解法写。

    全文的公式使用LaTex公式编辑器编辑而成

    2.1 欧拉方程

    2.1.1 无约束泛函极值的必要条件

    无约束泛函极值问题为
    min ⁡ x J ( x ) = ∫ t 0 t f L ( x , x ˙ , t ) d t (1) \min_xJ(x)=\int_{t_0}^{t_f} L(x,\dot{x},t)\mathrm{d}t \tag{1} xminJ(x)=t0tfL(x,x˙,t)dt(1)
    【定理】 对于式 ( 1 ) (1) (1),使其取极值的必要条件,是轨线*x(t)*满足下列欧拉方程
    ∂ L ∂ x − d d t ∂ L ∂ x ˙ = 0 \frac{\partial L}{\partial x}-\frac{\mathrm{d}}{\mathrm{d}t} \frac{\partial L}{\partial \dot{x}}=0 xLdtdx˙L=0

    2.1.2 有约束泛函极值的必要条件

    有等式约束的泛函极值问题为
    min ⁡ x J ( x ) = ∫ t 0 t f L ( x , x ˙ , t ) d t s . t . f ( x , x ˙ , t ) = 0 (2) \begin{matrix} \min_xJ(x)=\int_{t_0}^{t_f} L(x,\dot{x},t)\mathrm{d}t\\ \mathrm{s. t. }\quad f(x,\dot{x},t )=0 \end{matrix} \tag{2} minxJ(x)=t0tfL(x,x˙,t)dts.t.f(x,x˙,t)=0(2)
    【定理】 对于式 ( 2 ) (2) (2),使其取极值的必要条件,是轨线 x(t) 满足下列欧拉方程
    ∂ L ∂ x − d d t ∂ L ∂ x ˙ = 0 \frac{\partial L}{\partial x}-\frac{\mathrm{d}}{\mathrm{d}t} \frac{\partial L}{\partial \dot{x}}=0 xLdtdx˙L=0
    式中
    L ( x , x ˙ , λ , t ) = g ( x , x ˙ , λ ) + λ T ( t ) f ( x , x ˙ , λ ) L(x,\dot{x},\lambda,t)=g(x,\dot{x},\lambda)+\lambda^\mathrm{T}(t)f(x,\dot{x},\lambda) L(x,x˙,λ,t)=g(x,x˙,λ)+λT(t)f(x,x˙,λ)
    λ ∈ R n \lambda \in R^n λRn 为待定拉格朗日乘子向量。

    2.1.3 无约束泛函极值的充分条件

    使式 ( 1 ) (1) (1) 成立的充分条件是:除了欧拉方程应成立之外,下列等价勒让德条件之一应成立:
    [ ∂ 2 L ∂ x 2 ∂ 2 L ∂ x ∂ x ˙ ( ∂ 2 L ∂ x ∂ x ˙ ) T ∂ 2 L ∂ x ˙ 2 ] (3) \begin{bmatrix} \frac{\partial^2 L}{\partial x^2} & \frac{\partial^2 L}{\partial x \partial \dot{x} } \\ (\frac{\partial^2 L}{\partial x \partial \dot{x} })^\mathrm{T} & \frac{\partial^2 L}{\partial \dot{x}^2} \end{bmatrix} \tag{3} [x22L(xx˙2L)Txx˙2Lx˙22L](3)

    ∂ 2 L ∂ x 2 − d d t ∂ 2 L ∂ x ∂ x ˙ ≥ 0 , ∂ 2 L ∂ x ˙ 2 > 0 (4) \frac{\partial^2 L}{\partial x^2}- \frac{\mathrm{d}}{\mathrm{d}t} \frac{\partial^2 L}{\partial x \partial \dot{x} }\geq 0, \quad \frac{\partial^2 L}{\partial \dot{x}^2}>0 \tag{4} x22Ldtdxx˙2L0,x˙22L>0(4)

    ∂ 2 L ∂ x 2 − d d t ∂ 2 L ∂ x ∂ x ˙ > 0 , ∂ 2 L ∂ x ˙ 2 ≥ 0 (5) \frac{\partial^2 L}{\partial x^2}- \frac{\mathrm{d}}{\mathrm{d}t} \frac{\partial^2 L}{\partial x \partial \dot{x} } > 0, \quad \frac{\partial^2 L}{\partial \dot{x}^2} \geq 0 \tag{5} x22Ldtdxx˙2L>0,x˙22L0(5)

    2.1.4 有约束泛函极值的充分条件

    使式 ( 2 ) (2) (2) 成立的充分条件是:除了欧拉方程应成立和约束条件满足之外,下列等价勒让德条件之一应成立:
    [ ∂ 2 L ∂ x 2 ∂ 2 L ∂ x ∂ x ˙ ( ∂ 2 L ∂ x ∂ x ˙ ) T ∂ 2 L ∂ x ˙ 2 ] (6) \begin{bmatrix} \frac{\partial^2 L}{\partial x^2} & \frac{\partial^2 L}{\partial x \partial \dot{x} } \\ (\frac{\partial^2 L}{\partial x \partial \dot{x} })^\mathrm{T} & \frac{\partial^2 L}{\partial \dot{x}^2} \end{bmatrix} \tag{6} [x22L(xx˙2L)Txx˙2Lx˙22L](6)

    ∂ 2 L ∂ x 2 − d d t ∂ 2 L ∂ x ∂ x ˙ ≥ 0 , ∂ 2 L ∂ x ˙ 2 > 0 (7) \frac{\partial^2 L}{\partial x^2}- \frac{\mathrm{d}}{\mathrm{d}t} \frac{\partial^2 L}{\partial x \partial \dot{x} }\geq 0, \quad \frac{\partial^2 L}{\partial \dot{x}^2}>0 \tag{7} x22Ldtdxx˙2L0,x˙22L>0(7)

    ∂ 2 L ∂ x 2 − d d t ∂ 2 L ∂ x ∂ x ˙ > 0 , ∂ 2 L ∂ x ˙ 2 ≥ 0 (8) \frac{\partial^2 L}{\partial x^2}- \frac{\mathrm{d}}{\mathrm{d}t} \frac{\partial^2 L}{\partial x \partial \dot{x} } > 0, \quad \frac{\partial^2 L}{\partial \dot{x}^2} \geq 0 \tag{8} x22Ldtdxx˙2L>0,x˙22L0(8)

    式中
    L ( x , x ˙ , λ , t ) = g ( x , x ˙ , λ ) + λ T ( t ) f ( x , x ˙ , λ ) L(x,\dot{x},\lambda,t)=g(x,\dot{x},\lambda)+\lambda^\mathrm{T}(t)f(x,\dot{x},\lambda) L(x,x˙,λ,t)=g(x,x˙,λ)+λT(t)f(x,x˙,λ)
    λ ∈ R n \lambda \in R^n λRn 为待定拉格朗日乘子向量。

    2.2 横截条件

    求解欧拉方程,需要由横截条件提供两点边界值1

    在实际工程中,会出现很多种情况:

    • 初始时刻 t 0 t_0 t0 和末端时刻 t f t_f tf 自由;
    • 初始时刻 t 0 t_0 t0 和末端时刻 t f t_f tf 固定;
    • 初始时刻 t 0 t_0 t0 固定、末端时刻 t f t_f tf 自由;
    • 初始时刻 t 0 t_0 t0 自由、末端时刻 t f t_f tf 固定。

    2.2.1 末端时刻固定时的横截条件

    当末端时刻固定时,由泛函极值的必要条件可知,横截条件的一般表达式为
    ( ∂ L ∂ x ˙ ) T δ x ∣ t 0 t f = ( ∂ L ∂ x ˙ ) T ∣ t = t f δ x ( t f ) − ( ∂ L ∂ x ˙ ) T ∣ t = t 0 δ x ( t 0 ) = 0 (9) (\frac{\partial L}{\partial \dot{x}})^\mathrm{T}\delta x\bigg |^{t_f}_{t_0} =(\frac{\partial L}{\partial \dot{x}})^\mathrm{T}\bigg |_{t=t_f}\delta x(t_f) -(\frac{\partial L}{\partial \dot{x}})^\mathrm{T}\bigg |_{t=t_0}\delta x(t_0) =0 \tag{9} (x˙L)Tδxt0tf=(x˙L)Tt=tfδx(tf)(x˙L)Tt=t0δx(t0)=0(9)
    只要不是两端固定问题,宗量变分 δ x ( t f ) \delta x(t_f) δx(tf) δ x ( t 0 ) \delta x(t_0) δx(t0) 不能同时为零,使泛函一次变分 δ J = 0 \delta J=0 δJ=0 缺少条件,就应当由极值的基本必要条件来补足:或是 ( ∂ L ∂ x ˙ ) T ∣ t f = 0 (\frac{\partial L}{\partial \dot{x}})^\mathrm{T}\bigg |_{t_f}=0 (x˙L)Ttf=0,或是 ( ∂ L ∂ x ˙ ) T ∣ t 0 = 0 (\frac{\partial L}{\partial \dot{x}})^\mathrm{T}\bigg |_{t_0}=0 (x˙L)Tt0=0.

    如果把初始状态 x ( t 0 ) x(t_0) x(t0) 称为起点,把末端状态 x ( t f ) x(t_f) x(tf) 称为终点,有如下几个性质:

    • 起点固定时, x ( t 0 ) = x 0 , δ x ( t 0 ) = 0 x(t_0)=x_0,\quad \delta x(t_0)=0 x(t0)=x0,δx(t0)=0
    • 起点自由时, x ( t 0 ) ≠ 0 x(t_0) \ne 0 x(t0)=0
    • 终点固定时, x ( t f ) = x f , δ x ( t f ) = 0 x(t_f)=x_f,\quad \delta x(t_f)=0 x(tf)=xf,δx(tf)=0
    • 终点自由时, x ( t f ) ≠ x f x(t_f) \ne x_f x(tf)=xf

    则得到末端时刻 t f t_f tf 固定时的各种横截条件表格。

    在这里插入图片描述

    2.2.2 末端时刻自由时的横截条件

    末端时刻自由问题的实质是,末端时间 t f t_f tf 不固定,末端状态或自由、或受约束,属于变动端点问题。

    经过一系列运算后,得到末端变动、 t f t_f tf 自由时泛函极值的必要条件
    ∂ L ∂ x − d d t ∂ L ∂ x ˙ = 0 \frac{\partial L}{\partial x}-\frac{\mathrm{d}}{\mathrm{d}t} \frac{\partial L}{\partial \dot{x}}=0 xLdtdx˙L=0
    以及
    ( ∂ L ∂ x ˙ ) T ∣ t f δ x ( t f ) − ( ∂ L ∂ x ˙ ) T ∣ t 0 δ x ( t 0 ) + L ( x ∗ , x ˙ ∗ , t ) ∣ t f δ t f = 0 (10) (\frac{\partial L}{\partial \dot{x}})^\mathrm{T}\bigg |_{t_f}\delta x(t_f) -(\frac{\partial L}{\partial \dot{x}})^\mathrm{T}\bigg |_{t_0}\delta x(t_0)+L(x^*,\dot{x}^*,t)\bigg |_{t_f}\delta t_f =0 \tag{10} (x˙L)Ttfδx(tf)(x˙L)Tt0δx(t0)+L(x,x˙,t)tfδtf=0(10)
    ( 10 ) (10) (10) 称为横截条件,除提供求解欧拉方程所需的两点边界值外,还提供了一个确定最优末端时间 t f ∗ t_f^* tf 所需边界条件。

    (1)起点固定、末端自由

    x ( t 0 ) = x 0 , δ x ( t 0 ) = 0 x(t_0)=x_0,\quad \delta x(t_0)=0 x(t0)=x0,δx(t0)=0

    整理得公式为
    ( L − x ˙ T ( t ) ∂ L ∂ x ˙ ) ∣ t f δ t f + ( ∂ L ∂ x ˙ ) T ∣ t f δ x f = 0 (11) \left(L-\dot{x}^\mathrm{T}(t)\frac{\partial L}{\partial \dot{x}}\right)\bigg |_{t_f}\delta t_f+ \left(\frac{\partial L}{\partial \dot{x}}\right)^\mathrm{T}\bigg |_{t_f}\delta x_f =0 \tag{11} (Lx˙T(t)x˙L)tfδtf+(x˙L)Ttfδxf=0(11)
    δ t f \delta t_f δtf δ x f \delta x_f δxf 任意,即 δ t f ≠ 0 \delta t_f \ne 0 δtf=0 δ x f ≠ 0 \delta x_f \ne 0 δxf=0 ,故横截条件为
    { ( L − x ˙ T ( t ) ∂ L ∂ x ˙ ) ∣ t f δ t f = 0 ( ∂ L ∂ x ˙ ) = 0 x ( t 0 ) = x 0 \left\{\begin{matrix} \left(L-\dot{x}^\mathrm{T}(t)\frac{\partial L}{\partial \dot{x}}\right)\bigg |_{t_f}\delta t_f =0\\ \left(\frac{\partial L}{\partial \dot{x}}\right) = 0\\ x(t_0)=x_0 \end{matrix}\right. (Lx˙T(t)x˙L)tfδtf=0(x˙L)=0x(t0)=x0
    (2)起点固定、末端受约束

    设末端约束方程为
    x ( t f ) = c ( t f ) x(t_f)=c(t_f) x(tf)=c(tf)
    因为末端受约束,则 δ x f \delta x_f δxf 不能任意。那么横截条件在式 ( 11 ) (11) (11) 的基础上进一步演化为
    ( L − x ˙ T ( t ) ∂ L ∂ x ˙ ) ∣ t f δ t f + ( ∂ L ∂ x ˙ ) T ∣ t f c ˙ ( t f ) δ t f = [ L + ( c ˙ − x ˙ T ) ] ∣ t f δ t f = 0 \left(L-\dot{x}^\mathrm{T}(t)\frac{\partial L}{\partial \dot{x}}\right)\bigg |_{t_f}\delta t_f+ \left(\frac{\partial L}{\partial \dot{x}}\right)^\mathrm{T}\bigg |_{t_f}\dot{c}(t_f)\delta t_f =\left[L+(\dot{c}-\dot{x}^\mathrm{T})\right]\bigg |_{t_f}\delta t_f=0 (Lx˙T(t)x˙L)tfδtf+(x˙L)Ttfc˙(tf)δtf=[L+(c˙x˙T)]tfδtf=0
    δ t f \delta t_f δtf 任意,即 δ t f ≠ 0 \delta t_f \ne 0 δtf=0,故横截条件为
    { [ L + ( c ˙ − x ˙ T ) ] ∣ t f = 0 x ( t f ) = c ( t f ) x ( t 0 ) = x 0 \left\{\begin{matrix} \left[L+(\dot{c}-\dot{x}^\mathrm{T})\right]\bigg |_{t_f} =0\\ x(t_f)=c(t_f)\\ x(t_0)=x_0 \end{matrix}\right. [L+(c˙x˙T)]tf=0x(tf)=c(tf)x(t0)=x0

    2.2.3 初始时刻自由时的横截条件

    初始时刻自由问题的实质时:末端固定 x ( t f ) = x f x(t_f)=x_f x(tf)=xf,初始时刻 t 0 t_0 t0 不固定,初始状态 x ( t 0 ) x(t_0) x(t0) 或自由、或受约束。例如,空对地导弹的攻击。

    如果把初始状态 x ( t 0 ) x(t_0) x(t0) 称为起点,把末端状态 x ( t f ) x(t_f) x(tf) 称为终点,有如下几个性质:

    • 起点固定时, x ( t 0 ) = x 0 , δ x ( t 0 ) = 0 x(t_0)=x_0,\quad \delta x(t_0)=0 x(t0)=x0,δx(t0)=0
    • 起点自由时, x ( t 0 ) ≠ 0 x(t_0) \ne 0 x(t0)=0
    • 终点固定时, x ( t f ) = x f , δ x ( t f ) = 0 x(t_f)=x_f,\quad \delta x(t_f)=0 x(tf)=xf,δx(tf)=0
    • 终点自由时, x ( t f ) ≠ x f x(t_f) \ne x_f x(tf)=xf

    则得到末端时刻 t f t_f tf 固定时的各种横截条件表格。

    在这里插入图片描述

    2.3 用变分法解最优控制问题

    对于一般的最优控制问题,应广泛采用拉格朗日乘子法,引入哈密顿函数概念,将泛函条件极值问题转化为无约束泛函极值问题,以获得最优解的必要条件和充分条件。

    2.3.1 末端时刻固定时的最优解

    当末端时刻 t f t_f tf 固定时,最优控制问题可以归结为如下一般形式:
    min ⁡ u ( t ) J = φ [ x ( t f ) ] + ∫ t 0 t f L ( x , u , t ) d t s .   t . f ( x , u , t ) − x ˙ ( t ) = 0 , x ( t 0 ) = x 0 Ψ [ x ( t f ) ] = 0 \min_{u(t)}J=\varphi[x(t_f)]+ \int_{t_0}^{t_f} L(x,u,t)\mathrm{d}t \\ \mathrm{s.\ t.} \quad f(x,u,t)-\dot{x}(t)=0, \quad x(t_0) =x_0 \\ \Psi [x(t_f)]=0 u(t)minJ=φ[x(tf)]+t0tfL(x,u,t)dts. t.f(x,u,t)x˙(t)=0,x(t0)=x0Ψ[x(tf)]=0
    假设各向量维数同前。末端状态 x ( t f ) x(t_f) x(tf) 存在如下状态:

    • 末端状态受约束
    • 末端状态自由
    • 末端状态固定

    若末端自由,则 Ψ [ x ( t f ) ] = 0 \Psi [x(t_f)]=0 Ψ[x(tf)]=0 不会出现;若末端固定,则因 δ x ( t f ) = 0 \delta x(t_f)=0 δx(tf)=0,那么横截条件 λ ( t f ) = ∂ φ ∂ x ( t f ) + ∂ Ψ T ∂ x ( t f ) γ \lambda(t_f)=\frac{\partial \varphi}{\partial x(t_f)} +\frac{\partial \Psi^\mathrm{T}}{\partial x(t_f)}\gamma λ(tf)=x(tf)φ+x(tf)ΨTγ 将不存在。

    下面给出了末端时刻固定时最优解的必要条件

    【定理】 对于如下最优控制问题
    min ⁡ u ( t ) J = φ [ x ( t f ) ] + ∫ t 0 t f L ( x , u , t ) d t , t f 固 定 s .   t . f ( x , u , t ) − x ˙ ( t ) = 0 , x ( t 0 ) = x 0 Ψ [ x ( t f ) ] = 0 , ( 末 端 受 约 束 情 况 有 此 项 、 末 端 自 由 和 末 端 固 定 没 有 此 项 ) (12) \min_{u(t)}J=\varphi[x(t_f)]+ \int_{t_0}^{t_f} L(x,u,t)\mathrm{d}t,\quad t_f固定 \\ \mathrm{s.\ t.} \quad f(x,u,t)-\dot{x}(t)=0, \quad x(t_0) =x_0 \\ \Psi [x(t_f)]=0,\quad (末端受约束情况有此项、末端自由和末端固定没有此项) \tag{12} u(t)minJ=φ[x(tf)]+t0tfL(x,u,t)dttfs. t.f(x,u,t)x˙(t)=0,x(t0)=x0Ψ[x(tf)]=0(12)
    x ( t ) x(t) x(t) λ ( t ) \lambda (t) λ(t) 满足下列正则方程
    x ˙ ( t ) = ∂ H ∂ λ λ ˙ ( t ) = − ∂ H ∂ x \dot x(t)=\frac{\partial H}{\partial \lambda} \\ \dot \lambda(t)=- \frac{\partial H}{\partial x} x˙(t)=λHλ˙(t)=xH
    式中
    H ( x , u , λ , t ) = L ( x , u , t ) + λ T f ( x , u , t ) H(x,u,\lambda,t)=L(x,u,t)+\lambda^{\mathrm{T}}f(x,u,t) H(x,u,λ,t)=L(x,u,t)+λTf(x,u,t)
    ② 边界条件

    a)若末端受约束,则有
    x ( t 0 ) = x 0 λ ( t f ) = ∂ φ ∂ x ( t f ) + ∂ Ψ T ∂ x ( t f ) γ Ψ [ x ( t f ) ] = 0 x(t_0) = x_0 \\ \lambda(t_f)=\frac{\partial \varphi}{\partial x(t_f)} +\frac{\partial \Psi^\mathrm{T}}{\partial x(t_f)}\gamma \\ \Psi[x(t_f)]=0 x(t0)=x0λ(tf)=x(tf)φ+x(tf)ΨTγΨ[x(tf)]=0
    按我理解,上式应写为
    x i ( t 0 ) = x i 0 λ i ( t f ) = ∂ φ ∂ x i ( t f ) + ∂ Ψ T ∂ x i ( t f ) γ Ψ [ x ( t f ) ] = 0 x_i(t_0) = x_{i0} \\ \lambda_i(t_f)=\frac{\partial \varphi}{\partial x_i(t_f)} +\frac{\partial \Psi^\mathrm{T}}{\partial x_i(t_f)}\gamma \\ \Psi[x(t_f)]=0 xi(t0)=xi0λi(tf)=xi(tf)φ+xi(tf)ΨTγΨ[x(tf)]=0
    式中, i i i 代表第 i i i 个微分方程(或动态系统方程)。

    b)若末端自由,则有
    x ( t 0 ) = x 0 λ ( t f ) = ∂ φ ∂ x ( t f ) x(t_0) = x_0 \\ \lambda(t_f)=\frac{\partial \varphi}{\partial x(t_f)} x(t0)=x0λ(tf)=x(tf)φ
    c)若末端固定,则有
    x ( t 0 ) = x 0 x ( t f ) = x f x(t_0) = x_0 \\ x(t_f) = x_f x(t0)=x0x(tf)=xf
    ③ 极值条件

    ∂ H ∂ u = 0 \frac{\partial H}{\partial u}=0 uH=0

    总结

    • 先找对应的模型,或是末端受约束,或是末端自由,或是末端固定

    • 按照“ ① 求解正则方程 —> ② 边界条件 —> ③ 极值条件”的顺序解题。解到 “③ 极值条件”一般可以求出 u ( t ) u(t) u(t) ,再把 u ( t ) u(t) u(t) 代回求解 λ ( t ) \lambda(t) λ(t) x ( t ) x(t) x(t) ,将末端时刻 t f t_f tf 代入方程中,可求出最优轨线 x ∗ ( t ) x^*(t) x(t) 和最优控制解 u ∗ ( t ) u^*(t) u(t)


    例题

    (最优控制理论与系统【胡寿松】, 第三版, pp35-36)试求被控系统
    { x ˙ 1 ( t ) = x 2 ( t ) x ˙ 2 ( t ) = u ( t ) \left\{\begin{matrix} \dot x_1(t) = x_2(t)\\ \dot x_2(t) = u(t) \end{matrix}\right. {x˙1(t)=x2(t)x˙2(t)=u(t)
    由已知初态 x 1 ( 0 ) = 0 x_1(0)=0 x1(0)=0 x 2 ( 0 ) = 0 x_2(0)=0 x2(0)=0 出发,在 t f = 1 t_f=1 tf=1 时转移到目标集合
    x 1 ( 1 ) + x 2 ( 1 ) = 1 x_1(1)+x_2(1)=1 x1(1)+x2(1)=1
    且使性能指标
    J = 1 2 ∫ 0 1 u 2 ( t ) d t J=\frac{1}{2}\int_{0}^{1}u^2(t)\mathrm{d}t J=2101u2(t)dt
    为最小的最优控制 u ∗ ( t ) u^*(t) u(t) 及相应的最优轨迹 x ∗ ( t ) x^*(t) x(t)


    【解】 本题是积分型性能指标、 t f t_f tf固定、末端受约束的最优化问题。按照总结中提到的解题步骤来解题。

    ① 求正则方程 x ( t ) x(t) x(t) λ ( t ) \lambda (t) λ(t)

    构建哈密顿函数
    H = 1 2 u 2 ( t ) + λ 1 x 2 ( t ) + λ 2 u ( t ) H = \frac{1}{2}u^2(t) + \lambda_1 x_2(t) + \lambda_2 u(t) H=21u2(t)+λ1x2(t)+λ2u(t)
    求解正则方程
    x ˙ 1 = ∂ H ∂ λ 1 = x 2 ( t ) , x ˙ 2 = ∂ H ∂ λ 2 = u ( t ) λ ˙ 1 = − ∂ H ∂ x 1 = 0 , λ ˙ 2 = − ∂ H ∂ x 2 = − λ 1 ( t ) \dot x_1 = \frac{\partial H}{\partial \lambda_1}=x_2(t), \quad \dot x_2 = \frac{\partial H}{\partial \lambda_2}=u(t) \\ \dot \lambda_1 = -\frac{\partial H}{\partial x_1}=0, \quad \dot \lambda_2 = -\frac{\partial H}{\partial x_2}=-\lambda_1(t) x˙1=λ1H=x2(t),x˙2=λ2H=u(t)λ˙1=x1H=0,λ˙2=x2H=λ1(t)
    ② 边界条件
    x 1 ( 0 ) = 0 , x 2 ( 0 ) = 0 λ 1 ( 1 ) = ∂ φ ∂ x 1 ( 1 ) + ∂ Ψ T ∂ x 1 ( 1 ) γ = γ , λ 2 ( 1 ) = ∂ φ ∂ x 2 ( 1 ) + ∂ Ψ T ∂ x 2 ( 1 ) γ = γ x 1 ( 1 ) + x 2 ( 1 ) = 1 x_1(0)=0,\quad x_2(0)=0 \\ \lambda_1(1)=\frac{\partial \varphi}{\partial x_1(1)} +\frac{\partial \Psi^\mathrm{T}}{\partial x_1(1)}\gamma=\gamma,\quad \lambda_2(1)=\frac{\partial \varphi}{\partial x_2(1)} +\frac{\partial \Psi^\mathrm{T}}{\partial x_2(1)}\gamma=\gamma \\ x_1(1)+x_2(1)=1 x1(0)=0,x2(0)=0λ1(1)=x1(1)φ+x1(1)ΨTγ=γ,λ2(1)=x2(1)φ+x2(1)ΨTγ=γx1(1)+x2(1)=1
    ③ 极值条件
    ∂ H ∂ u = u ( t ) + λ ( t ) = 0 ⇒ u ( t ) = − λ ( t ) \frac{\partial H}{\partial u}=u(t)+\lambda(t)=0\Rightarrow u(t)=-\lambda(t) uH=u(t)+λ(t)=0u(t)=λ(t)
    又因为
    λ ˙ 1 ( t ) = 0 ⇒ λ 1 ( t ) = c 1 λ ˙ 2 ( t ) = − λ 1 ( t ) = − c 1 ⇒ λ 2 ( t ) = − c 1 t + c 1 \dot \lambda_1(t) = 0 \Rightarrow \lambda_1(t) = c_1 \\ \dot \lambda_2(t) = -\lambda_1(t) =-c_1 \Rightarrow \lambda_2(t) = -c_1 t + c_1 λ˙1(t)=0λ1(t)=c1λ˙2(t)=λ1(t)=c1λ2(t)=c1t+c1
    得到
    u ( t ) = − λ 2 ( t ) = − c 1 t + c 1 u(t) = -\lambda_2(t) = -c_1 t + c_1 u(t)=λ2(t)=c1t+c1
    那么
    x ˙ 2 ( t ) = u ( t ) = − c 1 t + c 1 ⇒ x 2 ( t ) = 1 2 c 1 t 2 − c 2 t + c 3 x ˙ 1 ( t ) = x 2 ( t ) = 1 2 c 1 t 2 − c 2 t + c 3 ⇒ x 1 ( t ) = 1 6 c 1 t 3 − 1 2 c 2 t 2 + c 3 t + c 4 \dot x_2(t)=u(t)=-c_1 t+c_1 \Rightarrow x_2(t)=\frac{1}{2}c_1t^2-c_2t+c_3 \\ \dot x_1(t)=x_2(t)=\frac{1}{2}c_1t^2-c_2t+c_3\Rightarrow x_1(t)=\frac{1}{6}c_1t^3-\frac{1}{2}c_2t^2+c_3t+c_4 x˙2(t)=u(t)=c1t+c1x2(t)=21c1t2c2t+c3x˙1(t)=x2(t)=21c1t2c2t+c3x1(t)=61c1t321c2t2+c3t+c4
    ④ 解方程

    代入初值 x 1 ( 0 ) = 0 x_1(0)=0 x1(0)=0 x 2 ( 0 ) = 0 x_2(0)=0 x2(0)=0 以及末端状态 x 1 ( 1 ) + x 2 ( 1 ) = 1 x_1(1)+x_2(1)=1 x1(1)+x2(1)=1,得到
    { x 1 ( 0 ) = c 4 = 0 x 2 ( 0 ) = c 3 = 0 x 1 ( 1 ) + x 2 ( 1 ) = 1 6 c 1 − 1 2 c 2 + 1 2 c 1 − c 2 = 2 3 c 1 − 3 2 c 2 = 1 \left\{\begin{matrix} x_1(0)=c_4=0 \\ x_2(0)=c_3=0 \\ x_1(1)+x_2(1)=\frac{1}{6}c_1-\frac{1}{2}c_2+\frac{1}{2}c_1-c_2=\frac{2}{3}c_1-\frac{3}{2}c_2=1 \end{matrix}\right. x1(0)=c4=0x2(0)=c3=0x1(1)+x2(1)=61c121c2+21c1c2=32c123c2=1
    又因为
    λ 1 ( 1 ) = λ 2 ( 1 ) = γ \lambda_1(1)=\lambda_2(1)=\gamma λ1(1)=λ2(1)=γ
    得到
    c 1 = − c 1 × 1 + c 2 c_1=-c_1 \times1 + c_2 c1=c1×1+c2
    解得
    c 1 = 1 2 c 2 c_1=\frac{1}{2}c_2 c1=21c2
    代回上式,得到 c 1 c_1 c1 c 2 c_2 c2 c 3 c_3 c3 c 4 c_4 c4的值为
    { c 1 = − 3 7 c 2 = − 6 7 c 3 = 0 c 4 = 0 \left\{\begin{matrix} c_1 = -\frac{3}{7} \\ c_2 = -\frac{6}{7} \\ c_3 = 0 \\ c_4 = 0 \end{matrix}\right. c1=73c2=76c3=0c4=0
    ⑤ 求解结果

    最优轨线
    { x 1 ∗ ( t ) = − 1 14 t 3 + 3 7 t 2 x 2 ∗ ( t ) = − 3 14 t 2 + 6 7 t \left\{\begin{matrix} x_1^*(t)=-\frac{1}{14}t^3+\frac{3}{7}t^2 \\ x_2^*(t)=-\frac{3}{14}t^2+\frac{6}{7}t \end{matrix}\right. {x1(t)=141t3+73t2x2(t)=143t2+76t
    最优控制
    u ∗ ( t ) = − 3 7 t + 6 7 u^*(t)=-\frac{3}{7}t+\frac{6}{7} u(t)=73t+76

    代码为

    clear;clc;close all;
    syms x1 x2 u
    % 系统方程
    Dx1 = x2;
    Dx2 = u;
    % 代价函数
    syms g
    g = 0.5*u^2;
    
    % Step 1:构造Hamilton函数,求正则方程
    syms lambda1 lambda2
    H = g + lambda1*Dx1 + lambda1*Dx2;
    % 求解正则方程
    Dlambda1 = -diff(H,x1);
    % Dlambda2 = -diff(H,x2);
    
    % Step 2:边界条件
    syms Psi gamma
    Psi = x1 + x2 - 1;
    lambda1(1) = diff(Psi,'x1')*gamma;
    % lambda2(1) = diff(Psi,'x2')*gamma;
    
    % Step 3:极值条件
    dU = diff(H,'u');
    % sol_u = solve(dU,u);
    
    % Step 4:解方程
    syms t c1 c2 c3 c4 gamma
    Flambda1 = int(Dlambda1);
    if Flambda1 == '0'
        Flambda1 = c1;
    end
    Int_lambda1 = Flambda1;
    Dlambda2 = Int_lambda1;
    Flambda2 = -int(Dlambda2,t) + c2;
    Int_lambda2 = Flambda2;
    sol_u = -Int_lambda2;
    
    Dx2 = subs(Dx2,u,sol_u);
    x2 = int(Dx2) + c3;
    Dx1 = x2;
    % x1 = int(Dx1) + c4;
    
    eq1 = c1 == gamma;
    eq2 = -c1 + c2 == gamma;
    eq3 = (1/6)*c1 - (1/2)*c2 + (1/2)*c1 - c2 == 1;
    s = solve(eq1,eq2,eq3,c1,c2,gamma);
    
    c1 = s.c1;
    c2 = s.c2;
    c3 = 0;
    c4 = 0;
    x1 = (c1*t^3)/6 - (c2*t^2)/2 + c3*t + c4
    x2 = (c1*t^2)/2 - c2*t + c3
    lambda2 = -c1*t + c2;
    u = -lambda2
    

    仿真结果为

    在这里插入图片描述

    下面给出了末端时刻固定时最优解的充分条件

    【定理】

    对于如下最优控制问题
    min ⁡ u ( t ) J = φ [ x ( t f ) ] + ∫ t 0 t f L ( x , u , t ) d t , t f 固 定 s .   t . f ( x , u , t ) − x ˙ ( t ) = 0 , x ( t 0 ) = x 0 Ψ [ x ( t f ) ] = 0 \min_{u(t)}J=\varphi[x(t_f)]+ \int_{t_0}^{t_f} L(x,u,t)\mathrm{d}t,\quad t_f固定 \\ \mathrm{s.\ t.} \quad f(x,u,t)-\dot{x}(t)=0, \quad x(t_0) =x_0 \\ \Psi [x(t_f)]=0 u(t)minJ=φ[x(tf)]+t0tfL(x,u,t)dttfs. t.f(x,u,t)x˙(t)=0,x(t0)=x0Ψ[x(tf)]=0
    式中 t f t_f tf 固定。是性能泛函 J J J 取极小值的最优解的充分条件是下列等价勒让德条件之一成立:
    [ ∂ 2 H ∂ x 2 ∂ 2 H ∂ u ∂ x ( ∂ 2 H ∂ x ∂ u ) T ∂ 2 H ∂ u 2 ] > 0 , ∂ 2 Θ [ x ( t f ) , γ ] ∂ x 2 ( t f ) ≥ 0 \begin{bmatrix} \frac{\partial^2 H}{\partial x^2} & \frac{\partial^2 H}{\partial u \partial x } \\ (\frac{\partial^2 H}{\partial x \partial u })^\mathrm{T} & \frac{\partial^2 H}{\partial u^2} \end{bmatrix}>0, \quad \frac{\partial^2 \Theta[x(t_f),\gamma]}{\partial x^2(t_f)} \geq 0 [x22H(xu2H)Tux2Hu22H]>0,x2(tf)2Θ[x(tf),γ]0

    [ ∂ 2 H ∂ x 2 ∂ 2 H ∂ u ∂ x ( ∂ 2 H ∂ x ∂ u ) T ∂ 2 H ∂ u 2 ] ≥ 0 , ∂ 2 Θ [ x ( t f ) , γ ] ∂ x 2 ( t f ) > 0 \begin{bmatrix} \frac{\partial^2 H}{\partial x^2} & \frac{\partial^2 H}{\partial u \partial x } \\ (\frac{\partial^2 H}{\partial x \partial u })^\mathrm{T} & \frac{\partial^2 H}{\partial u^2} \end{bmatrix}\geq 0, \quad \frac{\partial^2 \Theta[x(t_f),\gamma]}{\partial x^2(t_f)} > 0 [x22H(xu2H)Tux2Hu22H]0,x2(tf)2Θ[x(tf),γ]>0

    式中
    H ( x , u , λ , t ) = L ( x , u , t ) + λ T ( t ) f ( x , u , t ) Θ [ x ( t f ) , γ ] = φ [ x ( t f ) ] + γ T Ψ [ x ( t f ) ] H(x,u,\lambda,t)=L(x,u,t)+\lambda^{\mathrm{T}}(t)f(x,u,t) \\ \Theta[x(t_f),\gamma]=\varphi[x(t_f)]+\gamma^{\mathrm{T}}\mathit{\Psi}[x(t_f)] H(x,u,λ,t)=L(x,u,t)+λT(t)f(x,u,t)Θ[x(tf),γ]=φ[x(tf)]+γTΨ[x(tf)]

    2.3.2 末端时刻自由时的最优解

    当末端时刻 t f t_f tf 自由时,末端状态又可区分为受约束自由固定三种情况。

    当末端时刻 t f t_f tf 固定时,最优控制问题可以归结为如下一般形式:
    min ⁡ u ( t ) J = φ [ x ( t f ) ] + ∫ t 0 t f L ( x , u , t ) d t s .   t . f ( x , u , t ) − x ˙ ( t ) = 0 , x ( t 0 ) = x 0 Ψ [ x ( t f ) ] = 0 \min_{u(t)}J=\varphi[x(t_f)]+ \int_{t_0}^{t_f} L(x,u,t)\mathrm{d}t \\ \mathrm{s.\ t.} \quad f(x,u,t)-\dot{x}(t)=0, \quad x(t_0) =x_0 \\ \Psi [x(t_f)]=0 u(t)minJ=φ[x(tf)]+t0tfL(x,u,t)dts. t.f(x,u,t)x˙(t)=0,x(t0)=x0Ψ[x(tf)]=0
    假设各向量维数同前。末端状态 x ( t f ) x(t_f) x(tf) 存在如下状态:

    • 末端状态受约束
    • 末端状态自由
    • 末端状态固定

    若末端自由,则 Ψ [ x ( t f ) ] = 0 \Psi [x(t_f)]=0 Ψ[x(tf)]=0 不会出现;若末端固定,则因 δ x ( t f ) = 0 \delta x(t_f)=0 δx(tf)=0,那么横截条件 λ ( t f ) = ∂ φ ∂ x ( t f ) + ∂ Ψ T ∂ x ( t f ) γ \lambda(t_f)=\frac{\partial \varphi}{\partial x(t_f)} +\frac{\partial \Psi^\mathrm{T}}{\partial x(t_f)}\gamma λ(tf)=x(tf)φ+x(tf)ΨTγ 将不存在。

    下面给出了末端时刻自由时最优解的必要条件

    【定理】 对于如下最优控制问题
    min ⁡ u ( t ) J = φ [ x ( t f ) ] + ∫ t 0 t f L ( x , u , t ) d t , t f 固 定 s .   t . f ( x , u , t ) − x ˙ ( t ) = 0 , x ( t 0 ) = x 0 Ψ [ x ( t f ) ] = 0 , ( 末 端 受 约 束 情 况 有 此 项 、 末 端 自 由 和 末 端 固 定 没 有 此 项 ) (12) \min_{u(t)}J=\varphi[x(t_f)]+ \int_{t_0}^{t_f} L(x,u,t)\mathrm{d}t,\quad t_f固定 \\ \mathrm{s.\ t.} \quad f(x,u,t)-\dot{x}(t)=0, \quad x(t_0) =x_0 \\ \Psi [x(t_f)]=0,\quad (末端受约束情况有此项、末端自由和末端固定没有此项) \tag{12} u(t)minJ=φ[x(tf)]+t0tfL(x,u,t)dttfs. t.f(x,u,t)x˙(t)=0,x(t0)=x0Ψ[x(tf)]=0(12)
    x ( t ) x(t) x(t) λ ( t ) \lambda (t) λ(t) 满足下列正则方程
    x ˙ ( t ) = ∂ H ∂ λ λ ˙ ( t ) = − ∂ H ∂ x \dot x(t)=\frac{\partial H}{\partial \lambda} \\ \dot \lambda(t)=- \frac{\partial H}{\partial x} x˙(t)=λHλ˙(t)=xH
    式中
    H ( x , u , λ , t ) = L ( x , u , t ) + λ T f ( x , u , t ) H(x,u,\lambda,t)=L(x,u,t)+\lambda^{\mathrm{T}}f(x,u,t) H(x,u,λ,t)=L(x,u,t)+λTf(x,u,t)
    ② 边界条件

    a)若末端受约束,则有
    x ( t 0 ) = x 0 λ ( t f ) = ∂ φ ∂ x ( t f ) + ∂ Ψ T ∂ x ( t f ) γ Ψ [ x ( t f ) ] = 0 x(t_0) = x_0 \\ \lambda(t_f)=\frac{\partial \varphi}{\partial x(t_f)} +\frac{\partial \Psi^\mathrm{T}}{\partial x(t_f)}\gamma \\ \Psi[x(t_f)]=0 x(t0)=x0λ(tf)=x(tf)φ+x(tf)ΨTγΨ[x(tf)]=0
    按我理解,上式应写为
    x i ( t 0 ) = x i 0 λ i ( t f ) = ∂ φ ∂ x i ( t f ) + ∂ Ψ T ∂ x i ( t f ) γ Ψ [ x ( t f ) ] = 0 x_i(t_0) = x_{i0} \\ \lambda_i(t_f)=\frac{\partial \varphi}{\partial x_i(t_f)} +\frac{\partial \Psi^\mathrm{T}}{\partial x_i(t_f)}\gamma \\ \Psi[x(t_f)]=0 xi(t0)=xi0λi(tf)=xi(tf)φ+xi(tf)ΨTγΨ[x(tf)]=0
    式中, i i i 代表第 i i i 个微分方程(或动态系统方程)。

    b)若末端自由,则有
    x ( t 0 ) = x 0 λ ( t f ) = ∂ φ ∂ x ( t f ) x(t_0) = x_0 \\ \lambda(t_f)=\frac{\partial \varphi}{\partial x(t_f)} x(t0)=x0λ(tf)=x(tf)φ
    c)若末端固定,则有
    x ( t 0 ) = x 0 x ( t f ) = x f x(t_0) = x_0 \\ x(t_f) = x_f x(t0)=x0x(tf)=xf
    ③ 极值条件

    ∂ H ∂ u = 0 \frac{\partial H}{\partial u}=0 uH=0
    ④ 哈密顿函数在最优轨线末端满足

    a)若末端受约束,则有
    H ( t f ) = − ∂ φ ∂ t f − γ T ( t f ) ∂ Ψ ∂ t f H(t_f)=-\frac{\partial \varphi}{\partial t_f}-\gamma^{\mathrm{T}}(t_f)\frac{\partial \Psi}{\partial t_f} H(tf)=tfφγT(tf)tfΨ
    b)若末端自由,则有
    H ( t f ) = − ∂ φ ∂ t f H(t_f)=-\frac{\partial \varphi}{\partial t_f} H(tf)=tfφ
    c)若末端固定,则有
    H ( t f ) = − ∂ φ ∂ t f H(t_f)=-\frac{\partial \varphi}{\partial t_f} H(tf)=tfφ

    总结

    • 先找对应的模型,或是末端受约束,或是末端自由,或是末端固定

    • 按照“ ① 求解正则方程 —> ② 边界条件 —> ③ 极值条件 —> ④ 哈密顿函数在最优轨线末端满足条件”的顺序解题。解到 “③ 极值条件”一般可以求出 u ( t ) u(t) u(t) ,解到 “④ 哈密顿函数在最优轨线末端满足条件”可以求出 u ( t ) u(t) u(t) 的真正表达式,再把 u ( t ) u(t) u(t) 代回求解 λ ( t ) \lambda(t) λ(t) x ( t ) x(t) x(t) ,将末端时刻 t f t_f tf 代入方程中,可求出最优轨线 x ∗ ( t ) x^*(t) x(t) 和最优控制解 u ∗ ( t ) u^*(t) u(t)


    例题

    (最优控制理论与系统【胡寿松】, 第三版, pp40-41)设一阶系统方程为
    x ˙ ( t ) = u ( t ) \dot x(t)=u(t) x˙(t)=u(t)
    性能指标取为
    J = t f + 1 2 ∫ 0 t f u 2 ( t ) d t J=t_f+\frac{1}{2}\int_0^{t_f}u^2(t)\mathrm{d}t J=tf+210tfu2(t)dt
    式中 t f t_f tf 自由。试确定最优控制 u ∗ ( t ) u^*(t) u(t),使系统由 x ( 0 ) = 1 x(0)=1 x(0)=1 转移到 x ( t f ) = 0 x(t_f)=0 x(tf)=0 ,并使性能指标为极小值。


    【解】 本题是复合型性能指标、 t f t_f tf 自由、末端固定、控制变量取值无约束的最优化问题。按照总结中提到的解题步骤来解题。

    ① 求正则方程 x ( t ) x(t) x(t) λ ( t ) \lambda (t) λ(t)

    构建哈密顿函数
    H = 1 2 u 2 ( t ) + λ u ( t ) H = \frac{1}{2}u^2(t)+\lambda u(t) H=21u2(t)+λu(t)
    求解正则方程
    x ˙ = ∂ H ∂ λ 1 = u ( t ) λ ˙ = − ∂ H ∂ x = 0 ⇒ λ ( t ) = c 1 \dot x = \frac{\partial H}{\partial \lambda_1}=u(t) \\ \dot \lambda = -\frac{\partial H}{\partial x}=0 \Rightarrow \lambda(t)=c_1 x˙=λ1H=u(t)λ˙=xH=0λ(t)=c1
    ② 边界条件
    x ( 0 ) = 0 , x ( t f ) = 0 x(0)=0,\quad x(t_f)=0 \\ x(0)=0,x(tf)=0
    ③ 极值条件
    ∂ H ∂ u = u ( t ) + λ ( t ) = 0 ⇒ u ( t ) = − λ ( t ) = − c 1 \frac{\partial H}{\partial u}=u(t)+\lambda(t)=0\Rightarrow u(t)=-\lambda(t)=-c_1 uH=u(t)+λ(t)=0u(t)=λ(t)=c1
    ④ 哈密顿函数在最优轨线末端满足

    因为末端固定,所以
    H ( t f ) = − ∂ φ ∂ t f = − 1 ⇒ 1 2 u 2 ( 1 ) + c 1 u ( 1 ) = − 1 ⇒ 1 2 c 1 2 + c 1 2 = − 1 ⇒ c 1 2 = 1 2 ⇒ c 1 = 2 H(t_f)=-\frac{\partial \varphi}{\partial t_f}=-1 \\ \Rightarrow \frac{1}{2}u^2(1)+c_1u(1)=-1 \\ \Rightarrow \frac{1}{2}c_1^2+c_1^2=-1 \\ \Rightarrow c_1^2=\frac{1}{2} \\ \Rightarrow c_1=\sqrt{2} H(tf)=tfφ=121u2(1)+c1u(1)=121c12+c12=1c12=21c1=2
    那么

    x ˙ ( t ) = − c 1 = − 2 ⇒ x ( t ) = − 2 t + c 2 \dot x(t)=-c_1=-\sqrt{2} \\ \Rightarrow x(t)=-\sqrt{2}t+c_2 x˙(t)=c1=2 x(t)=2 t+c2
    因为
    x ( 0 ) = c 2 = 1 x(0)=c_2=1 x(0)=c2=1
    所以
    x ( t ) = − 2 t + 1 x(t)=-\sqrt{2}t+1 x(t)=2 t+1

    x ( t f ) = − 2 t f + 1 = 0 ⇒ t f = 1 2 x(t_f)=-\sqrt{2}t_f+1=0 \\ \Rightarrow t_f=\frac{1}{\sqrt{2}} x(tf)=2 tf+1=0tf=2 1
    ⑤ 求解结果

    最优轨线
    x ∗ ( t ) = − 2 t + 1 x^*(t)=-\sqrt{2}t+1 x(t)=2 t+1
    最优控制
    u ∗ ( t ) = − 2 u^*(t)=-\sqrt{2} u(t)=2
    思考:按照步骤一步一步解即可,书上的解法反而让人感觉眼花缭乱,摸不着重点。

    至此,使用变分法解最优控制问题便已全部介绍完毕。


    1. 初始时刻和末端时刻的值 ↩︎

    展开全文
  • 是《最优控制理论与应用(邵克勇,王婷婷,宋金波)》的读书笔记,相比于其他的书,选择这本书的理由是页数少,能读完。解学书的《最优控制理论与应用》看目录感觉很全,但是太厚了,感觉看不完。 虽然用过h2和h无穷...

    是《最优控制理论与应用(邵克勇,王婷婷,宋金波)》的读书笔记,相比于其他的书,选择这本书的理由是页数少,能读完。解学书的《最优控制理论与应用》看目录感觉很全,但是太厚了,感觉看不完。

    虽然用过h2和h无穷的方法,但是对原理不是了解的很透彻,就是会用。

    本章的逻辑线大概是:什么是泛函?(函数的对应值)——>变量的变分——>微小变化——>连续(k阶连续)——>线性泛函——>泛函的变分——>泛函的极值——>泛函的极值定理

     

     


    2.1 泛函与变分

    • 泛函
      • 定义
        • 泛函可简单理解为“函数的函数”
        • 对应于定义域中的每一个值x,y都有一个(或一组)值与之对应,则称y是x的函数,记为y=f(x)。这里x是自变量,y是因变量。
        • 对应于某一类函数中的每一个确定的函数y(x)(注意,不是函数值),因变量J都有一个确定的值(注意,不是函数)与之对应,则称因变量J为函数y(x)的泛函数,简称泛函。记为J=J【y(x)】或简单记为J。也就是说,泛函可简单理解为“函数的函数”,
        • 它经常以定积分的形式出现。
      • 例子
        • 1

        • 可见,x(t)表示一类函数,一旦函数的表达式确定,则J的值是确定的.J的值随函数x(t)的确定而确定,是一个泛函。
      • (2)泛函的变量y(x)的变分
        • 泛函J【y(x)】的变量y(x)的增量

        • 也称变量y(x)的变分,记为

        • 其中y(x)假定是在某一类函数中任意改变的,有时简记8y(x)为8y。
      • (3)泛函的连续性
        • 若对于变量y(x)的微小改变,存在与之对应的泛函J【y(x)】的微小改变,则称泛函J【y(x)】为连续的。
        • 其中,变量y(x)的微小改变的含义是,对于y(x)与y0(x)有定义的所有x值,|y(x)-y0(x)|很小,表示成下式

        • 其中ε是一个任意给定的很小的正数,则称y(x)与y0(x)有零阶接近度。如图2-2所示,但是它们具有零阶接近度
          • 1

        • 一阶接近度
          • 如果不仅|y(x)-y0(x)|很小,而且|y(x)-y0(x)|也很小,这也意味着y(x)与y0(x)有微小改变,称这种微小改变具有一阶接近度,如图2-3所示。

        • k阶接近度

        • k阶连续

      • (4)线性泛函

      • (5)泛函的变分(或增量)*
        • 当宗量函数y(x)有变分δy(x)时,连续泛函J【y(x)】的增量可以表示为

        • 式中
          • 宗量y(x)的变分

          • 泛函的变分

            • 泛函增量的线性主部,它是δy(x)的线性连续泛函
            • 由此可知,泛函的变分是泛函增量的线性主部,所以泛函的变分也可以称为泛函的微分。
            • 当泛函的变分存在,即其增量△J可用式(2-7)表达时,则称泛函是可微的
          • 高阶无穷小量
            • 1

          • 例子
            • 1

            • 常用定理
              • 1

              • 例子

        • 变分规则
          • 1

      • (6)泛函的极值
        • 极小值
          • 在y0(x)处

        • 极大值
          • 在y0(x)处

        • 强极值
          • 泛函极值是一个相对的比较概念,如果y(x)与y0(x)具有零阶接近度,则泛函达到的极值为强极值;
        • 弱极值
          • 如果y(x)与y0(x)具有一阶(或一阶以上)接近度,则泛函的极值为弱极值
        • *
          • 显然,在y(x)上达到强极值的泛函,必然在y0(x)上达到弱极值,但反之不一定成立。
          • 同时,强极值是范围更大的一类曲线(函数)的泛函中比较出来的,所以强极大值大于或等于弱极大值,而强极小值小于或等于弱极小值
        • 泛函极值定理
          • 1

    展开全文
  • 最优控制——变分法

    2019-07-13 21:47:00
    第一章 最优控制基础 1、一般的最优化问题要最小化的性能指标定义在数域上,而变分问题的性能指标(目标泛函)的定义域是函数的集合。 2、 泛函:从任意定义域到实数域或复数域的映射。泛函的定义域是函数集,值域...

     

    第一章 最优控制基础

    1、一般的最优化问题要最小化的性能指标定义在数域上,而变分问题的性能指标(目标泛函)的定义域是函数的集合。

    2、 泛函:从任意定义域到实数域或复数域的映射。泛函的定义域是函数集,值域是数集,也就是说,泛函是从函数空间到数域的一个映射

    3、最优控制问题的四个基本元素:状态方程、容许控制、目标集、性能指标

    其中状态方程(关于状态变量和控制变量的常微分方程)

     

    是最优控制问题与经典变分问题的重要区别之一

    4、经典变分问题需要连续的控制变量--->之后的极小值原理处理不连续控制变量、状态变量或者控制变量有约束的情况--->更复杂的非线性状态方程、控制变量不可微等      动态规划方法

    5、无确定模型的最优控制方法:强化学习与自适应动态规划、模型预测控制、微分博弈、平行控制

    第二章 最优控制方法

    1、直接变分法 实质:以函数为输入,以实数为输出

    在局部范围内对最优解加以”扰动“,再考察性能指标是否发生变化。利用微积分取极限的思想。

    (链式法则,先对x求,再对x'求,以及分步积分巴拉巴拉复习一下

    2、拉格朗日的delata方法,加以扰动,对比最优曲线和扰动后的曲线,看新的性能指标是不是会<最优的,若是极值点,这个增量应该总是>=0的,在该点足够小的邻域内是几乎为0的

    得出

     

    问题:可能导致扰动后x落在定义域之外,结论不再有效

    3、拉格朗日乘子法和KKT条件

     

    第三章 变分法

    1、函数变分:函数的增量 delta x    

    泛函增量:J(x+delta x)-J(x)    类比计算极值的时候函数值的差

    线性泛函:若满足齐次性条件和可加性条件,则称之为线性泛函

    若泛函增量可以写成函数变分的线性泛函及其高阶无穷小项的两部分加和,则称泛函对函数x可微,且其中的线性泛函就是泛函变分。

    2、泛函极值的必要条件

    驻点条件:泛函变分为0(反证法,前提是定义域是开集) 

    适用场景:控制变量可在全空间中任意取值没有约束,容许控制为连续函数全体。

    不适用场景:控制变量或其分量取值于实数空间中的闭区间

    3、最简变分法:(欧拉-拉格朗日方程)

     

    求变分不止可以用看线性泛函和高阶无穷小,还可以用微积分的方法求解:

     

    4、 欧拉-拉格朗日方程是关于状态x的二阶微分方程

    分为三种情况:

    三种结果:

     

    5、hamilton方程组

    物理学家将欧拉-拉格朗日这个二阶微分方程化成了一阶常微分方程组

    6、等式约束的处理

    拉格朗日乘子法

     

    转载于:https://www.cnblogs.com/lin-kid/p/11168872.html

    展开全文
  • 最优控制理论总结——变分法

    千次阅读 2016-11-23 22:17:04
    此总结为中国科学院大学《最优控制理论》课程的总结。课程未结束,不定期更新。

    此总结为中国科学院大学《最优控制理论》课程的总结,不是很详细,适合有一定基础、梳理思路用。课程未结束,不定期更新。







    展开全文
  • 变分法及其在最优控制中的应用,讲义概述。
  • 变分法如何解决最优控制问题

    千次阅读 2020-06-10 19:52:37
    之前文章主要讲述最优控制问题的一个描述,在此不过多叙述。文章链接为:https://blog.csdn.net/qq_40241332/article/details/95941248 主要分为以下几个部分: 具有等式约束下的条件问题 末态时刻固定,末态无...
  • 变分法最优控制

    2011-11-28 11:08:15
    泛函分析与变分法,变分法最优控制,变分法及其应用(加藤敏夫),高清.
  • Daniel Liberzon 的关于变分法最优控制的英文书,Calculus of Variations and Optimal Control Theory,适合入门和打基础。
  • 1987_11变分法最优控制_10654423[General Information]书名=1987.11变分法最优控制作者=孙振绮页数=283SS号出版日期=1987年11月第1版封面页书名页版权页前言页目录页第一篇 变分法绪论第一章 最简单泛函的极值1....
  • 最优控制
  • 老版《最优控制理论与系统》的习题解答,答案很详细,和新版的大部分题型很像,或者题目相同,题目不会做,可以借鉴一下这本答案。
  • 最优控制理论与应用,吴受章著,适合学习最优控制,里面讲述变分法以及由其发展而来的最优控制
  • 最优控制课后习题答案,有详细的解答(注意:只有部分习题答案,非全部内容:2-11、3-8、4-4、5-5、5-8、5-9、5-10)。
  • 优化理论课件变分法最优控制理论.doc
  • 最优控制理论 一、变分法和泛函极值问题

    千次阅读 多人点赞 2020-07-23 22:30:57
    最优控制理论的基础内容——变分法。本文是对一些重要内容作了笔记,包括泛函极值必要条件Euler方程、不同边界条件的处理方式、以及等式约束条件的处理等。
  • 最优控制理论与系统》-胡寿松老师-第2章-最优控制中的变分法第2章 最优控制中的变分法2.1 泛函与变分2.1.1 线性赋范空间2.1.2 泛函及其定义域2.1.3 泛函的变分定义2-132.1.4 泛函极值与变分引理2.2 欧拉方程2.2.1 ...
  • 最优控制理论是研究和解决从一切可能的控制方案中寻找最优解的一门,解决最优控制问题的主要方法有古典变分法、极小值原理和动态规划。最优控制理论已被应用于综合和设计最速控制系统、最省燃料控制系统、最小能耗...
  • 最优控制理论与应用

    2017-12-23 22:32:41
    基本内容有:变分法、连续系统最优控制、线性连续系统的二次型调节器(LQR)、离散系统最优控制、最大值原理、动态规划。为配合上述六个基本内容,列举了两个应用实例,即LQR在电力系统中的应用、最小值原理在登月软...
  • 最优控制ppt

    2019-02-27 22:08:46
    系统讲解泛函,极小值原理,线性二次型原理,变分法,等,与胡寿松的最优控制理论与系统相结合看。
  • 最优控制:理论、方法与应用》系统地介绍了最优控制理论内容,包括变分法、极小值原理、线性二次型最优控制、动态规划方法、最优控制的计算方法、随机最优控制、奇异最优控制、鲁棒最优控制、遗传优化算法在最优...
  • 最优控制理论教程,适合本科生和研究生以及科学工作者
  • 就一个包含终端等式约束、内点约束的最优控制问题,按间接推导了必要条件,将问题参数化并用于求解两点边值问题,给出了MATLAB代码。
  • 最优控制的理解

    万次阅读 2017-09-14 23:02:31
    最优控制在满足一定约束的情况下,寻求最优控制策略,使得性能指标取极大值或极小值 对一个受控的动力学系统,从一类允许的控制方案中寻找一个最优的控制方案,使得系统的运动从由某个初始状态转移到目标状态的同时...
  • 最优控制

    2012-10-29 16:29:23
    最优控制》主要内容: 变分法、极小值原理、动态规划法、线性二次型问题 首先了解什么是最优控制问题。
  • 二次型最优控制(一)

    千次阅读 多人点赞 2019-05-04 22:43:51
    本文来自潘神的知乎笔记什么是二次型最优控制 什么是二次型 说到“最”字,我们自然需要一个标准。比如,我们说到“最高”,可以用长度来丈量;说到“最重”,一般用质量来衡量,这些都是比较容易获得标准的。现在...
  • 最优控制的问题描述

    千次阅读 2019-07-15 11:24:28
    本文适合于控制理论与控制工程的研究生或者本科生,简单介绍最优控制的基本问题。适合有一定现代控制理论基础的人士,本文一些基本的符号不再做过多解释。 一、最优控制的问题描述主要包括以下几个内容 数学模型 ...
  • 对于较简单的时间最优控制问题可以应用古典变分法和 庞特里雅金最大值原理进行分析求解。但在实际问题中,能求得解析解的仅是少数。因此,有必要寻求一种能够有效求解时 间最优控制问题的数值方法。在分析时间最优...
  • 关于最优控制的一些总结1

    千次阅读 2019-12-28 20:45:20
    控制理论发展到现在,可以说成果丰硕,特别是在理论方面每年都有大量的论文发表,相应的控制方法分支也很多(这里主要是指现代控制理论,以频域分析为代表的经典控制理论在控制工程中用得比较多,而且通常在本科阶段...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 17,372
精华内容 6,948
关键字:

最优控制变分法

友情链接: VICTOR2d.rar