精华内容
下载资源
问答
  • 最优控制——变分法

    2019-07-13 21:47:00
    第一章 最优控制基础 1、一般的最优化问题要最小化的性能指标定义在数域上,而变分问题的性能指标(目标泛函)的定义域是函数的集合。 2、 泛函:从任意定义域到实数域或复数域的映射。泛函的定义域是函数集,值域...

     

    第一章 最优控制基础

    1、一般的最优化问题要最小化的性能指标定义在数域上,而变分问题的性能指标(目标泛函)的定义域是函数的集合。

    2、 泛函:从任意定义域到实数域或复数域的映射。泛函的定义域是函数集,值域是数集,也就是说,泛函是从函数空间到数域的一个映射

    3、最优控制问题的四个基本元素:状态方程、容许控制、目标集、性能指标

    其中状态方程(关于状态变量和控制变量的常微分方程)

     

    是最优控制问题与经典变分问题的重要区别之一

    4、经典变分问题需要连续的控制变量--->之后的极小值原理处理不连续控制变量、状态变量或者控制变量有约束的情况--->更复杂的非线性状态方程、控制变量不可微等      动态规划方法

    5、无确定模型的最优控制方法:强化学习与自适应动态规划、模型预测控制、微分博弈、平行控制

    第二章 最优控制方法

    1、直接变分法 实质:以函数为输入,以实数为输出

    在局部范围内对最优解加以”扰动“,再考察性能指标是否发生变化。利用微积分取极限的思想。

    (链式法则,先对x求,再对x'求,以及分步积分巴拉巴拉复习一下

    2、拉格朗日的delata方法,加以扰动,对比最优曲线和扰动后的曲线,看新的性能指标是不是会<最优的,若是极值点,这个增量应该总是>=0的,在该点足够小的邻域内是几乎为0的

    得出

     

    问题:可能导致扰动后x落在定义域之外,结论不再有效

    3、拉格朗日乘子法和KKT条件

     

    第三章 变分法

    1、函数变分:函数的增量 delta x    

    泛函增量:J(x+delta x)-J(x)    类比计算极值的时候函数值的差

    线性泛函:若满足齐次性条件和可加性条件,则称之为线性泛函

    若泛函增量可以写成函数变分的线性泛函及其高阶无穷小项的两部分加和,则称泛函对函数x可微,且其中的线性泛函就是泛函变分。

    2、泛函极值的必要条件

    驻点条件:泛函变分为0(反证法,前提是定义域是开集) 

    适用场景:控制变量可在全空间中任意取值没有约束,容许控制为连续函数全体。

    不适用场景:控制变量或其分量取值于实数空间中的闭区间

    3、最简变分法:(欧拉-拉格朗日方程)

     

    求变分不止可以用看线性泛函和高阶无穷小,还可以用微积分的方法求解:

     

    4、 欧拉-拉格朗日方程是关于状态x的二阶微分方程

    分为三种情况:

    三种结果:

     

    5、hamilton方程组

    物理学家将欧拉-拉格朗日这个二阶微分方程化成了一阶常微分方程组

    6、等式约束的处理

    拉格朗日乘子法

     

    转载于:https://www.cnblogs.com/lin-kid/p/11168872.html

    展开全文
  • 最优控制中的变分法

    2021-04-01 17:58:53
    本文总结自胡寿松教授的专著《最优控制理论与系统》第二章 最优控制中的变分法。文章中举的例题均用自己的方法写了一遍,没有依照书上的解法写。

    第2章 最优控制中的变分法

    最优控制问题是在一定的约束条件下,寻求使性能达到极值时的控制函数。

    注:本文总结自胡寿松教授的专著《最优控制理论与系统》第二章 最优控制中的变分法。文章中举的例题均用自己的方法写了一遍,没有依照书上的解法写。

    全文的公式使用LaTex公式编辑器编辑而成

    2.1 欧拉方程

    2.1.1 无约束泛函极值的必要条件

    无约束泛函极值问题为
    minxJ(x)=t0tfL(x,x˙,t)dt(1) \min_xJ(x)=\int_{t_0}^{t_f} L(x,\dot{x},t)\mathrm{d}t \tag{1}
    【定理】 对于式 (1)(1),使其取极值的必要条件,是轨线*x(t)*满足下列欧拉方程
    LxddtLx˙=0 \frac{\partial L}{\partial x}-\frac{\mathrm{d}}{\mathrm{d}t} \frac{\partial L}{\partial \dot{x}}=0

    2.1.2 有约束泛函极值的必要条件

    有等式约束的泛函极值问题为
    minxJ(x)=t0tfL(x,x˙,t)dts.t.f(x,x˙,t)=0(2) \begin{matrix} \min_xJ(x)=\int_{t_0}^{t_f} L(x,\dot{x},t)\mathrm{d}t\\ \mathrm{s. t. }\quad f(x,\dot{x},t )=0 \end{matrix} \tag{2}
    【定理】 对于式 (2)(2),使其取极值的必要条件,是轨线 x(t) 满足下列欧拉方程
    LxddtLx˙=0 \frac{\partial L}{\partial x}-\frac{\mathrm{d}}{\mathrm{d}t} \frac{\partial L}{\partial \dot{x}}=0
    式中
    L(x,x˙,λ,t)=g(x,x˙,λ)+λT(t)f(x,x˙,λ) L(x,\dot{x},\lambda,t)=g(x,\dot{x},\lambda)+\lambda^\mathrm{T}(t)f(x,\dot{x},\lambda)
    λRn\lambda \in R^n 为待定拉格朗日乘子向量。

    2.1.3 无约束泛函极值的充分条件

    使式 (1)(1) 成立的充分条件是:除了欧拉方程应成立之外,下列等价勒让德条件之一应成立:
    [2Lx22Lxx˙(2Lxx˙)T2Lx˙2](3) \begin{bmatrix} \frac{\partial^2 L}{\partial x^2} & \frac{\partial^2 L}{\partial x \partial \dot{x} } \\ (\frac{\partial^2 L}{\partial x \partial \dot{x} })^\mathrm{T} & \frac{\partial^2 L}{\partial \dot{x}^2} \end{bmatrix} \tag{3}

    2Lx2ddt2Lxx˙0,2Lx˙2>0(4) \frac{\partial^2 L}{\partial x^2}- \frac{\mathrm{d}}{\mathrm{d}t} \frac{\partial^2 L}{\partial x \partial \dot{x} }\geq 0, \quad \frac{\partial^2 L}{\partial \dot{x}^2}>0 \tag{4}

    2Lx2ddt2Lxx˙>0,2Lx˙20(5) \frac{\partial^2 L}{\partial x^2}- \frac{\mathrm{d}}{\mathrm{d}t} \frac{\partial^2 L}{\partial x \partial \dot{x} } > 0, \quad \frac{\partial^2 L}{\partial \dot{x}^2} \geq 0 \tag{5}

    2.1.4 有约束泛函极值的充分条件

    使式 (2)(2) 成立的充分条件是:除了欧拉方程应成立和约束条件满足之外,下列等价勒让德条件之一应成立:
    [2Lx22Lxx˙(2Lxx˙)T2Lx˙2](6) \begin{bmatrix} \frac{\partial^2 L}{\partial x^2} & \frac{\partial^2 L}{\partial x \partial \dot{x} } \\ (\frac{\partial^2 L}{\partial x \partial \dot{x} })^\mathrm{T} & \frac{\partial^2 L}{\partial \dot{x}^2} \end{bmatrix} \tag{6}

    2Lx2ddt2Lxx˙0,2Lx˙2>0(7) \frac{\partial^2 L}{\partial x^2}- \frac{\mathrm{d}}{\mathrm{d}t} \frac{\partial^2 L}{\partial x \partial \dot{x} }\geq 0, \quad \frac{\partial^2 L}{\partial \dot{x}^2}>0 \tag{7}

    2Lx2ddt2Lxx˙>0,2Lx˙20(8) \frac{\partial^2 L}{\partial x^2}- \frac{\mathrm{d}}{\mathrm{d}t} \frac{\partial^2 L}{\partial x \partial \dot{x} } > 0, \quad \frac{\partial^2 L}{\partial \dot{x}^2} \geq 0 \tag{8}

    式中
    L(x,x˙,λ,t)=g(x,x˙,λ)+λT(t)f(x,x˙,λ) L(x,\dot{x},\lambda,t)=g(x,\dot{x},\lambda)+\lambda^\mathrm{T}(t)f(x,\dot{x},\lambda)
    λRn\lambda \in R^n 为待定拉格朗日乘子向量。

    2.2 横截条件

    求解欧拉方程,需要由横截条件提供两点边界值1

    在实际工程中,会出现很多种情况:

    • 初始时刻 t0t_0 和末端时刻 tft_f 自由;
    • 初始时刻 t0t_0 和末端时刻 tft_f 固定;
    • 初始时刻 t0t_0 固定、末端时刻 tft_f 自由;
    • 初始时刻 t0t_0 自由、末端时刻 tft_f 固定。

    2.2.1 末端时刻固定时的横截条件

    当末端时刻固定时,由泛函极值的必要条件可知,横截条件的一般表达式为
    (Lx˙)Tδxt0tf=(Lx˙)Tt=tfδx(tf)(Lx˙)Tt=t0δx(t0)=0(9) (\frac{\partial L}{\partial \dot{x}})^\mathrm{T}\delta x\bigg |^{t_f}_{t_0} =(\frac{\partial L}{\partial \dot{x}})^\mathrm{T}\bigg |_{t=t_f}\delta x(t_f) -(\frac{\partial L}{\partial \dot{x}})^\mathrm{T}\bigg |_{t=t_0}\delta x(t_0) =0 \tag{9}
    只要不是两端固定问题,宗量变分 δx(tf)\delta x(t_f)δx(t0)\delta x(t_0) 不能同时为零,使泛函一次变分 δJ=0\delta J=0 缺少条件,就应当由极值的基本必要条件来补足:或是(Lx˙)Ttf=0(\frac{\partial L}{\partial \dot{x}})^\mathrm{T}\bigg |_{t_f}=0,或是(Lx˙)Tt0=0(\frac{\partial L}{\partial \dot{x}})^\mathrm{T}\bigg |_{t_0}=0.

    如果把初始状态 x(t0)x(t_0) 称为起点,把末端状态 x(tf)x(t_f) 称为终点,有如下几个性质:

    • 起点固定时,x(t0)=x0,δx(t0)=0x(t_0)=x_0,\quad \delta x(t_0)=0
    • 起点自由时,x(t0)0x(t_0) \ne 0
    • 终点固定时,x(tf)=xf,δx(tf)=0x(t_f)=x_f,\quad \delta x(t_f)=0
    • 终点自由时,x(tf)xfx(t_f) \ne x_f

    则得到末端时刻 tft_f 固定时的各种横截条件表格。

    在这里插入图片描述

    2.2.2 末端时刻自由时的横截条件

    末端时刻自由问题的实质是,末端时间 tft_f 不固定,末端状态或自由、或受约束,属于变动端点问题。

    经过一系列运算后,得到末端变动、tft_f 自由时泛函极值的必要条件
    LxddtLx˙=0 \frac{\partial L}{\partial x}-\frac{\mathrm{d}}{\mathrm{d}t} \frac{\partial L}{\partial \dot{x}}=0
    以及
    (Lx˙)Ttfδx(tf)(Lx˙)Tt0δx(t0)+L(x,x˙,t)tfδtf=0(10) (\frac{\partial L}{\partial \dot{x}})^\mathrm{T}\bigg |_{t_f}\delta x(t_f) -(\frac{\partial L}{\partial \dot{x}})^\mathrm{T}\bigg |_{t_0}\delta x(t_0)+L(x^*,\dot{x}^*,t)\bigg |_{t_f}\delta t_f =0 \tag{10}
    (10)(10) 称为横截条件,除提供求解欧拉方程所需的两点边界值外,还提供了一个确定最优末端时间 tft_f^* 所需边界条件。

    (1)起点固定、末端自由

    x(t0)=x0,δx(t0)=0x(t_0)=x_0,\quad \delta x(t_0)=0

    整理得公式为
    (Lx˙T(t)Lx˙)tfδtf+(Lx˙)Ttfδxf=0(11) \left(L-\dot{x}^\mathrm{T}(t)\frac{\partial L}{\partial \dot{x}}\right)\bigg |_{t_f}\delta t_f+ \left(\frac{\partial L}{\partial \dot{x}}\right)^\mathrm{T}\bigg |_{t_f}\delta x_f =0 \tag{11}
    δtf\delta t_fδxf\delta x_f 任意,即δtf0\delta t_f \ne 0δxf0\delta x_f \ne 0 ,故横截条件为
    {(Lx˙T(t)Lx˙)tfδtf=0(Lx˙)=0x(t0)=x0 \left\{\begin{matrix} \left(L-\dot{x}^\mathrm{T}(t)\frac{\partial L}{\partial \dot{x}}\right)\bigg |_{t_f}\delta t_f =0\\ \left(\frac{\partial L}{\partial \dot{x}}\right) = 0\\ x(t_0)=x_0 \end{matrix}\right.
    (2)起点固定、末端受约束

    设末端约束方程为
    x(tf)=c(tf) x(t_f)=c(t_f)
    因为末端受约束,则 δxf\delta x_f 不能任意。那么横截条件在式 (11)(11) 的基础上进一步演化为
    (Lx˙T(t)Lx˙)tfδtf+(Lx˙)Ttfc˙(tf)δtf=[L+(c˙x˙T)]tfδtf=0 \left(L-\dot{x}^\mathrm{T}(t)\frac{\partial L}{\partial \dot{x}}\right)\bigg |_{t_f}\delta t_f+ \left(\frac{\partial L}{\partial \dot{x}}\right)^\mathrm{T}\bigg |_{t_f}\dot{c}(t_f)\delta t_f =\left[L+(\dot{c}-\dot{x}^\mathrm{T})\right]\bigg |_{t_f}\delta t_f=0
    δtf\delta t_f 任意,即δtf0\delta t_f \ne 0,故横截条件为
    {[L+(c˙x˙T)]tf=0x(tf)=c(tf)x(t0)=x0 \left\{\begin{matrix} \left[L+(\dot{c}-\dot{x}^\mathrm{T})\right]\bigg |_{t_f} =0\\ x(t_f)=c(t_f)\\ x(t_0)=x_0 \end{matrix}\right.

    2.2.3 初始时刻自由时的横截条件

    初始时刻自由问题的实质时:末端固定 x(tf)=xfx(t_f)=x_f,初始时刻 t0t_0 不固定,初始状态 x(t0)x(t_0) 或自由、或受约束。例如,空对地导弹的攻击。

    如果把初始状态 x(t0)x(t_0) 称为起点,把末端状态 x(tf)x(t_f) 称为终点,有如下几个性质:

    • 起点固定时,x(t0)=x0,δx(t0)=0x(t_0)=x_0,\quad \delta x(t_0)=0
    • 起点自由时,x(t0)0x(t_0) \ne 0
    • 终点固定时,x(tf)=xf,δx(tf)=0x(t_f)=x_f,\quad \delta x(t_f)=0
    • 终点自由时,x(tf)xfx(t_f) \ne x_f

    则得到末端时刻 tft_f 固定时的各种横截条件表格。

    在这里插入图片描述

    2.3 用变分法解最优控制问题

    对于一般的最优控制问题,应广泛采用拉格朗日乘子法,引入哈密顿函数概念,将泛函条件极值问题转化为无约束泛函极值问题,以获得最优解的必要条件和充分条件。

    2.3.1 末端时刻固定时的最优解

    当末端时刻 tft_f 固定时,最优控制问题可以归结为如下一般形式:
    minu(t)J=φ[x(tf)]+t0tfL(x,u,t)dts. t.f(x,u,t)x˙(t)=0,x(t0)=x0Ψ[x(tf)]=0 \min_{u(t)}J=\varphi[x(t_f)]+ \int_{t_0}^{t_f} L(x,u,t)\mathrm{d}t \\ \mathrm{s.\ t.} \quad f(x,u,t)-\dot{x}(t)=0, \quad x(t_0) =x_0 \\ \Psi [x(t_f)]=0
    假设各向量维数同前。末端状态 x(tf)x(t_f) 存在如下状态:

    • 末端状态受约束
    • 末端状态自由
    • 末端状态固定

    若末端自由,则 Ψ[x(tf)]=0\Psi [x(t_f)]=0 不会出现;若末端固定,则因 δx(tf)=0\delta x(t_f)=0,那么横截条件 λ(tf)=φx(tf)+ΨTx(tf)γ\lambda(t_f)=\frac{\partial \varphi}{\partial x(t_f)} +\frac{\partial \Psi^\mathrm{T}}{\partial x(t_f)}\gamma 将不存在。

    下面给出了末端时刻固定时最优解的必要条件

    【定理】 对于如下最优控制问题
    minu(t)J=φ[x(tf)]+t0tfL(x,u,t)dttfs. t.f(x,u,t)x˙(t)=0,x(t0)=x0Ψ[x(tf)]=0(12) \min_{u(t)}J=\varphi[x(t_f)]+ \int_{t_0}^{t_f} L(x,u,t)\mathrm{d}t,\quad t_f固定 \\ \mathrm{s.\ t.} \quad f(x,u,t)-\dot{x}(t)=0, \quad x(t_0) =x_0 \\ \Psi [x(t_f)]=0,\quad (末端受约束情况有此项、末端自由和末端固定没有此项) \tag{12}
    x(t)x(t)λ(t)\lambda (t) 满足下列正则方程
    x˙(t)=Hλλ˙(t)=Hx \dot x(t)=\frac{\partial H}{\partial \lambda} \\ \dot \lambda(t)=- \frac{\partial H}{\partial x}
    式中
    H(x,u,λ,t)=L(x,u,t)+λTf(x,u,t) H(x,u,\lambda,t)=L(x,u,t)+\lambda^{\mathrm{T}}f(x,u,t)
    ② 边界条件

    a)若末端受约束,则有
    x(t0)=x0λ(tf)=φx(tf)+ΨTx(tf)γΨ[x(tf)]=0 x(t_0) = x_0 \\ \lambda(t_f)=\frac{\partial \varphi}{\partial x(t_f)} +\frac{\partial \Psi^\mathrm{T}}{\partial x(t_f)}\gamma \\ \Psi[x(t_f)]=0
    按我理解,上式应写为
    xi(t0)=xi0λi(tf)=φxi(tf)+ΨTxi(tf)γΨ[x(tf)]=0 x_i(t_0) = x_{i0} \\ \lambda_i(t_f)=\frac{\partial \varphi}{\partial x_i(t_f)} +\frac{\partial \Psi^\mathrm{T}}{\partial x_i(t_f)}\gamma \\ \Psi[x(t_f)]=0
    式中,ii 代表第ii 个微分方程(或动态系统方程)。

    b)若末端自由,则有
    x(t0)=x0λ(tf)=φx(tf) x(t_0) = x_0 \\ \lambda(t_f)=\frac{\partial \varphi}{\partial x(t_f)}
    c)若末端固定,则有
    x(t0)=x0x(tf)=xf x(t_0) = x_0 \\ x(t_f) = x_f
    ③ 极值条件

    Hu=0 \frac{\partial H}{\partial u}=0

    总结

    • 先找对应的模型,或是末端受约束,或是末端自由,或是末端固定

    • 按照“ ① 求解正则方程 —> ② 边界条件 —> ③ 极值条件”的顺序解题。解到 “③ 极值条件”一般可以求出 u(t)u(t) ,再把 u(t)u(t) 代回求解 λ(t)\lambda(t)x(t)x(t) ,将末端时刻 tft_f 代入方程中,可求出最优轨线 x(t)x^*(t) 和最优控制解 u(t)u^*(t)


    例题

    (最优控制理论与系统【胡寿松】, 第三版, pp35-36)试求被控系统
    {x˙1(t)=x2(t)x˙2(t)=u(t) \left\{\begin{matrix} \dot x_1(t) = x_2(t)\\ \dot x_2(t) = u(t) \end{matrix}\right.
    由已知初态 x1(0)=0x_1(0)=0x2(0)=0x_2(0)=0 出发,在 tf=1t_f=1 时转移到目标集合
    x1(1)+x2(1)=1 x_1(1)+x_2(1)=1
    且使性能指标
    J=1201u2(t)dt J=\frac{1}{2}\int_{0}^{1}u^2(t)\mathrm{d}t
    为最小的最优控制 u(t)u^*(t) 及相应的最优轨迹 x(t)x^*(t)


    【解】 本题是积分型性能指标、 tft_f固定、末端受约束的最优化问题。按照总结中提到的解题步骤来解题。

    ① 求正则方程x(t)x(t)λ(t)\lambda (t)

    构建哈密顿函数
    H=12u2(t)+λ1x2(t)+λ2u(t) H = \frac{1}{2}u^2(t) + \lambda_1 x_2(t) + \lambda_2 u(t)
    求解正则方程
    x˙1=Hλ1=x2(t),x˙2=Hλ2=u(t)λ˙1=Hx1=0,λ˙2=Hx2=λ1(t) \dot x_1 = \frac{\partial H}{\partial \lambda_1}=x_2(t), \quad \dot x_2 = \frac{\partial H}{\partial \lambda_2}=u(t) \\ \dot \lambda_1 = -\frac{\partial H}{\partial x_1}=0, \quad \dot \lambda_2 = -\frac{\partial H}{\partial x_2}=-\lambda_1(t)
    ② 边界条件
    x1(0)=0,x2(0)=0λ1(1)=φx1(1)+ΨTx1(1)γ=γ,λ2(1)=φx2(1)+ΨTx2(1)γ=γx1(1)+x2(1)=1 x_1(0)=0,\quad x_2(0)=0 \\ \lambda_1(1)=\frac{\partial \varphi}{\partial x_1(1)} +\frac{\partial \Psi^\mathrm{T}}{\partial x_1(1)}\gamma=\gamma,\quad \lambda_2(1)=\frac{\partial \varphi}{\partial x_2(1)} +\frac{\partial \Psi^\mathrm{T}}{\partial x_2(1)}\gamma=\gamma \\ x_1(1)+x_2(1)=1
    ③ 极值条件
    Hu=u(t)+λ(t)=0u(t)=λ(t) \frac{\partial H}{\partial u}=u(t)+\lambda(t)=0\Rightarrow u(t)=-\lambda(t)
    又因为
    λ˙1(t)=0λ1(t)=c1λ˙2(t)=λ1(t)=c1λ2(t)=c1t+c1 \dot \lambda_1(t) = 0 \Rightarrow \lambda_1(t) = c_1 \\ \dot \lambda_2(t) = -\lambda_1(t) =-c_1 \Rightarrow \lambda_2(t) = -c_1 t + c_1
    得到
    u(t)=λ2(t)=c1t+c1 u(t) = -\lambda_2(t) = -c_1 t + c_1
    那么
    x˙2(t)=u(t)=c1t+c1x2(t)=12c1t2c2t+c3x˙1(t)=x2(t)=12c1t2c2t+c3x1(t)=16c1t312c2t2+c3t+c4 \dot x_2(t)=u(t)=-c_1 t+c_1 \Rightarrow x_2(t)=\frac{1}{2}c_1t^2-c_2t+c_3 \\ \dot x_1(t)=x_2(t)=\frac{1}{2}c_1t^2-c_2t+c_3\Rightarrow x_1(t)=\frac{1}{6}c_1t^3-\frac{1}{2}c_2t^2+c_3t+c_4
    ④ 解方程

    代入初值 x1(0)=0x_1(0)=0x2(0)=0x_2(0)=0 以及末端状态 x1(1)+x2(1)=1x_1(1)+x_2(1)=1,得到
    {x1(0)=c4=0x2(0)=c3=0x1(1)+x2(1)=16c112c2+12c1c2=23c132c2=1 \left\{\begin{matrix} x_1(0)=c_4=0 \\ x_2(0)=c_3=0 \\ x_1(1)+x_2(1)=\frac{1}{6}c_1-\frac{1}{2}c_2+\frac{1}{2}c_1-c_2=\frac{2}{3}c_1-\frac{3}{2}c_2=1 \end{matrix}\right.
    又因为
    λ1(1)=λ2(1)=γ \lambda_1(1)=\lambda_2(1)=\gamma
    得到
    c1=c1×1+c2 c_1=-c_1 \times1 + c_2
    解得
    c1=12c2 c_1=\frac{1}{2}c_2
    代回上式,得到 c1c_1c2c_2c3c_3c4c_4的值为
    {c1=37c2=67c3=0c4=0 \left\{\begin{matrix} c_1 = -\frac{3}{7} \\ c_2 = -\frac{6}{7} \\ c_3 = 0 \\ c_4 = 0 \end{matrix}\right.
    ⑤ 求解结果

    最优轨线
    {x1(t)=114t3+37t2x2(t)=314t2+67t \left\{\begin{matrix} x_1^*(t)=-\frac{1}{14}t^3+\frac{3}{7}t^2 \\ x_2^*(t)=-\frac{3}{14}t^2+\frac{6}{7}t \end{matrix}\right.
    最优控制
    u(t)=37t+67 u^*(t)=-\frac{3}{7}t+\frac{6}{7}

    代码为

    clear;clc;close all;
    syms x1 x2 u
    % 系统方程
    Dx1 = x2;
    Dx2 = u;
    % 代价函数
    syms g
    g = 0.5*u^2;
    
    % Step 1:构造Hamilton函数,求正则方程
    syms lambda1 lambda2
    H = g + lambda1*Dx1 + lambda1*Dx2;
    % 求解正则方程
    Dlambda1 = -diff(H,x1);
    % Dlambda2 = -diff(H,x2);
    
    % Step 2:边界条件
    syms Psi gamma
    Psi = x1 + x2 - 1;
    lambda1(1) = diff(Psi,'x1')*gamma;
    % lambda2(1) = diff(Psi,'x2')*gamma;
    
    % Step 3:极值条件
    dU = diff(H,'u');
    % sol_u = solve(dU,u);
    
    % Step 4:解方程
    syms t c1 c2 c3 c4 gamma
    Flambda1 = int(Dlambda1);
    if Flambda1 == '0'
        Flambda1 = c1;
    end
    Int_lambda1 = Flambda1;
    Dlambda2 = Int_lambda1;
    Flambda2 = -int(Dlambda2,t) + c2;
    Int_lambda2 = Flambda2;
    sol_u = -Int_lambda2;
    
    Dx2 = subs(Dx2,u,sol_u);
    x2 = int(Dx2) + c3;
    Dx1 = x2;
    % x1 = int(Dx1) + c4;
    
    eq1 = c1 == gamma;
    eq2 = -c1 + c2 == gamma;
    eq3 = (1/6)*c1 - (1/2)*c2 + (1/2)*c1 - c2 == 1;
    s = solve(eq1,eq2,eq3,c1,c2,gamma);
    
    c1 = s.c1;
    c2 = s.c2;
    c3 = 0;
    c4 = 0;
    x1 = (c1*t^3)/6 - (c2*t^2)/2 + c3*t + c4
    x2 = (c1*t^2)/2 - c2*t + c3
    lambda2 = -c1*t + c2;
    u = -lambda2
    

    仿真结果为

    在这里插入图片描述

    下面给出了末端时刻固定时最优解的充分条件

    【定理】

    对于如下最优控制问题
    minu(t)J=φ[x(tf)]+t0tfL(x,u,t)dttfs. t.f(x,u,t)x˙(t)=0,x(t0)=x0Ψ[x(tf)]=0 \min_{u(t)}J=\varphi[x(t_f)]+ \int_{t_0}^{t_f} L(x,u,t)\mathrm{d}t,\quad t_f固定 \\ \mathrm{s.\ t.} \quad f(x,u,t)-\dot{x}(t)=0, \quad x(t_0) =x_0 \\ \Psi [x(t_f)]=0
    式中 tft_f 固定。是性能泛函 JJ 取极小值的最优解的充分条件是下列等价勒让德条件之一成立:
    [2Hx22Hux(2Hxu)T2Hu2]>0,2Θ[x(tf),γ]x2(tf)0 \begin{bmatrix} \frac{\partial^2 H}{\partial x^2} & \frac{\partial^2 H}{\partial u \partial x } \\ (\frac{\partial^2 H}{\partial x \partial u })^\mathrm{T} & \frac{\partial^2 H}{\partial u^2} \end{bmatrix}>0, \quad \frac{\partial^2 \Theta[x(t_f),\gamma]}{\partial x^2(t_f)} \geq 0

    [2Hx22Hux(2Hxu)T2Hu2]0,2Θ[x(tf),γ]x2(tf)>0 \begin{bmatrix} \frac{\partial^2 H}{\partial x^2} & \frac{\partial^2 H}{\partial u \partial x } \\ (\frac{\partial^2 H}{\partial x \partial u })^\mathrm{T} & \frac{\partial^2 H}{\partial u^2} \end{bmatrix}\geq 0, \quad \frac{\partial^2 \Theta[x(t_f),\gamma]}{\partial x^2(t_f)} > 0

    式中
    H(x,u,λ,t)=L(x,u,t)+λT(t)f(x,u,t)Θ[x(tf),γ]=φ[x(tf)]+γTΨ[x(tf)] H(x,u,\lambda,t)=L(x,u,t)+\lambda^{\mathrm{T}}(t)f(x,u,t) \\ \Theta[x(t_f),\gamma]=\varphi[x(t_f)]+\gamma^{\mathrm{T}}\mathit{\Psi}[x(t_f)]

    2.3.2 末端时刻自由时的最优解

    当末端时刻 tft_f 自由时,末端状态又可区分为受约束自由固定三种情况。

    当末端时刻 tft_f 固定时,最优控制问题可以归结为如下一般形式:
    minu(t)J=φ[x(tf)]+t0tfL(x,u,t)dts. t.f(x,u,t)x˙(t)=0,x(t0)=x0Ψ[x(tf)]=0 \min_{u(t)}J=\varphi[x(t_f)]+ \int_{t_0}^{t_f} L(x,u,t)\mathrm{d}t \\ \mathrm{s.\ t.} \quad f(x,u,t)-\dot{x}(t)=0, \quad x(t_0) =x_0 \\ \Psi [x(t_f)]=0
    假设各向量维数同前。末端状态 x(tf)x(t_f) 存在如下状态:

    • 末端状态受约束
    • 末端状态自由
    • 末端状态固定

    若末端自由,则 Ψ[x(tf)]=0\Psi [x(t_f)]=0 不会出现;若末端固定,则因 δx(tf)=0\delta x(t_f)=0,那么横截条件 λ(tf)=φx(tf)+ΨTx(tf)γ\lambda(t_f)=\frac{\partial \varphi}{\partial x(t_f)} +\frac{\partial \Psi^\mathrm{T}}{\partial x(t_f)}\gamma 将不存在。

    下面给出了末端时刻自由时最优解的必要条件

    【定理】 对于如下最优控制问题
    minu(t)J=φ[x(tf)]+t0tfL(x,u,t)dttfs. t.f(x,u,t)x˙(t)=0,x(t0)=x0Ψ[x(tf)]=0(12) \min_{u(t)}J=\varphi[x(t_f)]+ \int_{t_0}^{t_f} L(x,u,t)\mathrm{d}t,\quad t_f固定 \\ \mathrm{s.\ t.} \quad f(x,u,t)-\dot{x}(t)=0, \quad x(t_0) =x_0 \\ \Psi [x(t_f)]=0,\quad (末端受约束情况有此项、末端自由和末端固定没有此项) \tag{12}
    x(t)x(t)λ(t)\lambda (t) 满足下列正则方程
    x˙(t)=Hλλ˙(t)=Hx \dot x(t)=\frac{\partial H}{\partial \lambda} \\ \dot \lambda(t)=- \frac{\partial H}{\partial x}
    式中
    H(x,u,λ,t)=L(x,u,t)+λTf(x,u,t) H(x,u,\lambda,t)=L(x,u,t)+\lambda^{\mathrm{T}}f(x,u,t)
    ② 边界条件

    a)若末端受约束,则有
    x(t0)=x0λ(tf)=φx(tf)+ΨTx(tf)γΨ[x(tf)]=0 x(t_0) = x_0 \\ \lambda(t_f)=\frac{\partial \varphi}{\partial x(t_f)} +\frac{\partial \Psi^\mathrm{T}}{\partial x(t_f)}\gamma \\ \Psi[x(t_f)]=0
    按我理解,上式应写为
    xi(t0)=xi0λi(tf)=φxi(tf)+ΨTxi(tf)γΨ[x(tf)]=0 x_i(t_0) = x_{i0} \\ \lambda_i(t_f)=\frac{\partial \varphi}{\partial x_i(t_f)} +\frac{\partial \Psi^\mathrm{T}}{\partial x_i(t_f)}\gamma \\ \Psi[x(t_f)]=0
    式中,ii 代表第ii 个微分方程(或动态系统方程)。

    b)若末端自由,则有
    x(t0)=x0λ(tf)=φx(tf) x(t_0) = x_0 \\ \lambda(t_f)=\frac{\partial \varphi}{\partial x(t_f)}
    c)若末端固定,则有
    x(t0)=x0x(tf)=xf x(t_0) = x_0 \\ x(t_f) = x_f
    ③ 极值条件

    Hu=0 \frac{\partial H}{\partial u}=0
    ④ 哈密顿函数在最优轨线末端满足

    a)若末端受约束,则有
    H(tf)=φtfγT(tf)Ψtf H(t_f)=-\frac{\partial \varphi}{\partial t_f}-\gamma^{\mathrm{T}}(t_f)\frac{\partial \Psi}{\partial t_f}
    b)若末端自由,则有
    H(tf)=φtf H(t_f)=-\frac{\partial \varphi}{\partial t_f}
    c)若末端固定,则有
    H(tf)=φtf H(t_f)=-\frac{\partial \varphi}{\partial t_f}

    总结

    • 先找对应的模型,或是末端受约束,或是末端自由,或是末端固定

    • 按照“ ① 求解正则方程 —> ② 边界条件 —> ③ 极值条件 —> ④ 哈密顿函数在最优轨线末端满足条件”的顺序解题。解到 “③ 极值条件”一般可以求出 u(t)u(t) ,解到 “④ 哈密顿函数在最优轨线末端满足条件”可以求出 u(t)u(t) 的真正表达式,再把 u(t)u(t) 代回求解 λ(t)\lambda(t)x(t)x(t) ,将末端时刻 tft_f 代入方程中,可求出最优轨线 x(t)x^*(t) 和最优控制解 u(t)u^*(t)


    例题

    (最优控制理论与系统【胡寿松】, 第三版, pp40-41)设一阶系统方程为
    x˙(t)=u(t) \dot x(t)=u(t)
    性能指标取为
    J=tf+120tfu2(t)dt J=t_f+\frac{1}{2}\int_0^{t_f}u^2(t)\mathrm{d}t
    式中 tft_f 自由。试确定最优控制 u(t)u^*(t),使系统由 x(0)=1x(0)=1 转移到 x(tf)=0x(t_f)=0 ,并使性能指标为极小值。


    【解】 本题是复合型性能指标、 tft_f 自由、末端固定、控制变量取值无约束的最优化问题。按照总结中提到的解题步骤来解题。

    ① 求正则方程x(t)x(t)λ(t)\lambda (t)

    构建哈密顿函数
    H=12u2(t)+λu(t) H = \frac{1}{2}u^2(t)+\lambda u(t)
    求解正则方程
    x˙=Hλ1=u(t)λ˙=Hx=0λ(t)=c1 \dot x = \frac{\partial H}{\partial \lambda_1}=u(t) \\ \dot \lambda = -\frac{\partial H}{\partial x}=0 \Rightarrow \lambda(t)=c_1
    ② 边界条件
    x(0)=0,x(tf)=0 x(0)=0,\quad x(t_f)=0 \\
    ③ 极值条件
    Hu=u(t)+λ(t)=0u(t)=λ(t)=c1 \frac{\partial H}{\partial u}=u(t)+\lambda(t)=0\Rightarrow u(t)=-\lambda(t)=-c_1
    ④ 哈密顿函数在最优轨线末端满足

    因为末端固定,所以
    H(tf)=φtf=112u2(1)+c1u(1)=112c12+c12=1c12=12c1=2 H(t_f)=-\frac{\partial \varphi}{\partial t_f}=-1 \\ \Rightarrow \frac{1}{2}u^2(1)+c_1u(1)=-1 \\ \Rightarrow \frac{1}{2}c_1^2+c_1^2=-1 \\ \Rightarrow c_1^2=\frac{1}{2} \\ \Rightarrow c_1=\sqrt{2}
    那么

    x˙(t)=c1=2x(t)=2t+c2 \dot x(t)=-c_1=-\sqrt{2} \\ \Rightarrow x(t)=-\sqrt{2}t+c_2
    因为
    x(0)=c2=1 x(0)=c_2=1
    所以
    x(t)=2t+1 x(t)=-\sqrt{2}t+1

    x(tf)=2tf+1=0tf=12 x(t_f)=-\sqrt{2}t_f+1=0 \\ \Rightarrow t_f=\frac{1}{\sqrt{2}}
    ⑤ 求解结果

    最优轨线
    x(t)=2t+1 x^*(t)=-\sqrt{2}t+1
    最优控制
    u(t)=2 u^*(t)=-\sqrt{2}
    思考:按照步骤一步一步解即可,书上的解法反而让人感觉眼花缭乱,摸不着重点。

    至此,使用变分法解最优控制问题便已全部介绍完毕。


    1. 初始时刻和末端时刻的值 ↩︎

    展开全文
  • 变分法最优控制

    2011-11-28 11:08:15
    泛函分析与变分法,变分法最优控制,变分法及其应用(加藤敏夫),高清.
  • 是《最优控制理论与应用(邵克勇,王婷婷,宋金波)》的读书笔记,相比于其他的书,选择这本书的理由是页数少,能读完。解学书的《最优控制理论与应用》看目录感觉很全,但是太厚了,感觉看不完。 虽然用过h2和h无穷...

    是《最优控制理论与应用(邵克勇,王婷婷,宋金波)》的读书笔记,相比于其他的书,选择这本书的理由是页数少,能读完。解学书的《最优控制理论与应用》看目录感觉很全,但是太厚了,感觉看不完。

    虽然用过h2和h无穷的方法,但是对原理不是了解的很透彻,就是会用。

    本章的逻辑线大概是:什么是泛函?(函数的对应值)——>变量的变分——>微小变化——>连续(k阶连续)——>线性泛函——>泛函的变分——>泛函的极值——>泛函的极值定理

     

     


    2.1 泛函与变分

    • 泛函
      • 定义
        • 泛函可简单理解为“函数的函数”
        • 对应于定义域中的每一个值x,y都有一个(或一组)值与之对应,则称y是x的函数,记为y=f(x)。这里x是自变量,y是因变量。
        • 对应于某一类函数中的每一个确定的函数y(x)(注意,不是函数值),因变量J都有一个确定的值(注意,不是函数)与之对应,则称因变量J为函数y(x)的泛函数,简称泛函。记为J=J【y(x)】或简单记为J。也就是说,泛函可简单理解为“函数的函数”,
        • 它经常以定积分的形式出现。
      • 例子
        • 1

        • 可见,x(t)表示一类函数,一旦函数的表达式确定,则J的值是确定的.J的值随函数x(t)的确定而确定,是一个泛函。
      • (2)泛函的变量y(x)的变分
        • 泛函J【y(x)】的变量y(x)的增量

        • 也称变量y(x)的变分,记为

        • 其中y(x)假定是在某一类函数中任意改变的,有时简记8y(x)为8y。
      • (3)泛函的连续性
        • 若对于变量y(x)的微小改变,存在与之对应的泛函J【y(x)】的微小改变,则称泛函J【y(x)】为连续的。
        • 其中,变量y(x)的微小改变的含义是,对于y(x)与y0(x)有定义的所有x值,|y(x)-y0(x)|很小,表示成下式

        • 其中ε是一个任意给定的很小的正数,则称y(x)与y0(x)有零阶接近度。如图2-2所示,但是它们具有零阶接近度
          • 1

        • 一阶接近度
          • 如果不仅|y(x)-y0(x)|很小,而且|y(x)-y0(x)|也很小,这也意味着y(x)与y0(x)有微小改变,称这种微小改变具有一阶接近度,如图2-3所示。

        • k阶接近度

        • k阶连续

      • (4)线性泛函

      • (5)泛函的变分(或增量)*
        • 当宗量函数y(x)有变分δy(x)时,连续泛函J【y(x)】的增量可以表示为

        • 式中
          • 宗量y(x)的变分

          • 泛函的变分

            • 泛函增量的线性主部,它是δy(x)的线性连续泛函
            • 由此可知,泛函的变分是泛函增量的线性主部,所以泛函的变分也可以称为泛函的微分。
            • 当泛函的变分存在,即其增量△J可用式(2-7)表达时,则称泛函是可微的
          • 高阶无穷小量
            • 1

          • 例子
            • 1

            • 常用定理
              • 1

              • 例子

        • 变分规则
          • 1

      • (6)泛函的极值
        • 极小值
          • 在y0(x)处

        • 极大值
          • 在y0(x)处

        • 强极值
          • 泛函极值是一个相对的比较概念,如果y(x)与y0(x)具有零阶接近度,则泛函达到的极值为强极值;
        • 弱极值
          • 如果y(x)与y0(x)具有一阶(或一阶以上)接近度,则泛函的极值为弱极值
        • *
          • 显然,在y(x)上达到强极值的泛函,必然在y0(x)上达到弱极值,但反之不一定成立。
          • 同时,强极值是范围更大的一类曲线(函数)的泛函中比较出来的,所以强极大值大于或等于弱极大值,而强极小值小于或等于弱极小值
        • 泛函极值定理
          • 1

    展开全文
  • 之前文章主要讲述最优控制问题的一个描述,在此不过多叙述。文章链接为:https://blog.csdn.net/qq_40241332/article/details/95941248 主要分为以下几个部分: 具有等式约束下的条件问题 末态时刻固定,末态无...

    本文是基于在此之前的一篇文章的后续。之前文章主要讲述最优控制问题的一个描述和变分法在泛函中的一些应用,在此不过多叙述。文章链接为:https://blog.csdn.net/qq_40241332/article/details/95941248 和 https://blog.csdn.net/qq_40241332/article/details/106182432

    主要分为以下几个部分:

    • 具有等式约束下的条件问题
    • 末态时刻固定,末态无约束的最优控制问题
    • 末态时刻和末态固定的最优控制问题
    • 末态时刻固定,末态受约束的最优控制问题
    • 末态时刻未定的问题

    1. 具有等式约束下的条件问题

    问题描述如下所示:

    寻找一条连续可微的极值曲线,使得性能泛函

    J=\int^{t_f}_{t_0}F(t,\mathbf x(t),\dot{\mathbf x}(t))dt

    达到极值,极值曲线\mathbf x(t)满足微分方程的等式约束

    \Psi (t,\mathbf x(t),\dot{\mathbf x}(t))=0

    其中\Psi(t,\mathbf x(t),\dot{\mathbf x}(t))m(m\leq n)关于t\mathbf x\dot{\mathbf x}的非线性向量函数。

    定理 1.1 :如果n维向量函数x(t)能使等式约束变分问题取极值,则必然存在m维拉格朗日乘子向量函数\lambda(t),使得泛函

    J_1=\int^{t_f}_{t_0}H(t,\mathbf x(t),\dot{\mathbf x}(t),\lambda(t))dt

    达到无条件极值,即极值曲线x(t)是欧拉方程\frac{\partial H}{\partial \mathbf x}-\frac{d}{dt}\frac{\partial H}{\partial \dot{\mathbf x}}=0和等式约束条件\Psi (t,\mathbf x(t),\dot{\mathbf x}(t))=0的解,其中H(t,\mathbf x(t),\dot{\mathbf x}(t),\lambda(t))=F(t,\mathbf x(t),\dot{\mathbf x}(t))+\lambda^T(t)\Psi (t,\mathbf x(t),\dot{\mathbf x}(t))

    理解:等式约束条件和欧拉方程,有m+n个方程,正好解出n+m个未知数\mathbf x(t)\lambda(t)

    2. 末态时刻固定,末态无约束的最优控制问题

    问题描述:求一容许控制u(t)\in U,t\in [t_0,t_f],在末态时刻t_f固定,状态x(t_f)无约束,初始状态x(t_0)=x_0以及被控系统

    \dot{\mathbf x}(t)=\mathbf f(\mathbf x(t),\mathbf u(t),t)等式约束条件下,使得性能泛函J[\mathbf u(\cdot )]=S(\mathbf x(t_f),t_f)+\int^{t_f}_{t_0}L(t,\mathbf x(t),\mathbf u(t))dt的指标达到最小值。

    Step 1:将动态系统状态方程改写成等式约束,引入拉格朗日乘子,结合原性能泛函,形成新的泛函。

    \mathbf f(\mathbf x(t),\mathbf u(t),t)-\dot{\mathbf x}(t)=0

    J_1[\mathbf u(\cdot)]=S(\mathbf x(t_f),t_f)+\int^{t_f}_{t_0}\{L(\mathbf x(t),\mathbf u(t),t)+\lambda^T(t)[\mathbf f(\mathbf x(t),\mathbf u(t),t)-\dot{\mathbf x}(t)]\}

    Step 2:定义哈密顿函数,重新计算泛函

    H(\mathbf x(t),\mathbf u(t),\lambda (t),t)=L(\mathbf x(t),\mathbf u(t),t)+\lambda^T(t)\mathbf f(\mathbf x(t),\mathbf u(t),t)

    \begin{align*} J_1[\mathbf u(\cdot)]&=S(\mathbf x(t_f),t_f)+\int^{t_f}_{t_0}\{L(\mathbf x(t),\mathbf u(t),t)+\lambda^T(t)[\mathbf f(\mathbf x(t),\mathbf u(t),t)-\dot{\mathbf x}(t)]\}dt\\ &=S(\mathbf x(t_f),t_f)+\int^{t_f}_{t_0}\{H(\mathbf x(t),\mathbf u(t),\lambda^T(t),t)+\dot\lambda^T(t){\mathbf x}(t)\}dt+\lambda^T(t_0)\mathbf x(t_0)-\lambda^T(t_f)\mathbf x(t_f) \end{align*}

    Step 3:求泛函的极值条件,可以采用欧拉方程\frac{\partial H}{\partial \mathbf x}-\frac{d}{dt}\frac{\partial H}{\partial \dot{\mathbf x}}=0来求极值条件,并通过边界条件来确定极值条件得到的方程解的积分常数。

    考虑其初始状态固定,末态时刻固定,而末态状态自由,则泛函对其所有宗量的一阶变分表示如下

    \delta J_1=\left.{\left(\frac{\partial S}{\partial \mathbf x}-\lambda \right )^T\delta \mathbf x}\right|_{t=t_f}+\int^{t_f}_{t_0}\left[\left(\frac{\partial H}{\partial \mathbf x} +\dot{\lambda }\right )^T\delta \mathbf x+\left(\frac{\partial H}{\partial \mathbf u} \right )^T\delta u \right ]dt

    \dot{\lambda }(t)=-\frac{\partial H}{\partial \mathbf x}\lambda (t_f)=\frac{\partial S(\mathbf x(t_f),t_f)}{\partial \mathbf x(t_f)}时,可确定出\lambda(t)\delta J_1=\int^{t_f}_{t_0}\left(\frac{\partial H}{\partial \mathbf u} \right)^T\delta \mathbf udt,泛函求取极值的必要条件为\delat J_1=0

    根据初始状态,可以求解得到最优控制函数\mathbf u^*(t)

    总结:末态无约束最优控制问题的最优控制\mathbf u^*(t),最优状态轨线\mathbf x^*(t)和被选择的拉格朗日乘子函数\lambda (t)需要满足

    1. 规范方程:
      \dot{\mathbf x}(t)=\frac{\partial H}{\partial \lambda}=\mathbf f(\mathbf x(t),\mathbf u(t),t)
      \dot{\lambda}(t)=-\frac{\partial H}{\partial \mathbf x}=-\frac{\partial L}{\partial \mathbf x}-\frac{\partial \mathbf f^T}{\partial \mathbf x}\lambda(协态方程,共轭方程,伴随方程)
    2. 边界条件
      \mathbf x(t_0)=\mathbf x_0,\quad \lambda(t_f)=\frac{\partial S(\mathbf x(t_f),t_f)}{\partial \mathbf x(t_f)}
    3. 极值条件
      \frac{\partial H}{\partial \mathbf u}=0

    3. 末态时刻和末态固定的最优控制问题

    问题描述:初始状态和初始时刻肯定是给出的,而末态时刻t_f和末态固定\mathbf x(t_f)固定,则第二个问题的性能指标中S(\mathbf x(t_f),t_f)可以省去,则泛函性能指标被描述如下所示J[\mathbf u(\cdot )]=\int^{t_f}_{t_0}L(t,\mathbf x(t),\mathbf u(t))dt

    问题比较简单,下面直接给出结论:

    1. 规范方程:
      \dot{\mathbf x}(t)=\frac{\partial H}{\partial \lambda}=\mathbf f(\mathbf x(t),\mathbf u(t),t)
      \dot{\lambda}(t)=-\frac{\partial H}{\partial \mathbf x}=-\frac{\partial L}{\partial \mathbf x}-\frac{\partial \mathbf f^T}{\partial \mathbf x}\lambda(协态方程,共轭方程,伴随方程)
    2. 边界条件
      \mathbf x(t_0)=\mathbf x_0,\quad \mathbf x(t_f)=x_f
    3. 极值条件
      \frac{\partial H}{\partial \mathbf u}=0

    4. 末态时刻固定,末态受约束的最优控制问题

    问题描述:对于被控系统\dot{\mathbf x}(t)=\mathbf f(\mathbf x(t),\mathbf u(t),t)末态时刻t_f固定,而末态\mathbf x(t_f)受等式\mathbf g(\mathbf x(t_f),t_f)=0约束,性能泛函如下所示

    J[\mathbf u(\cdot )]=S(\mathbf x(t_f),t_f)+\int^{t_f}_{t_0}L(t,\mathbf x(t),\mathbf u(t))dt

    其中\mathbf g(\mathbf x(t_f),t_f)=0的维数为p,为使得最优控制的解的存在,当性能指标泛函中L=0时,p\leq n-1;当L\neq 0时,p\leq n

    Step 1:引入待定拉格朗日乘子向量\mu=\left[\mu_1,\mu_2,\cdots,\mu_p \right ]^T,定义如下新的辅助泛函

    J_1[\mathbf u(\cdot )]=S(\mathbf x(t_f),t_f)+\mu^T\mathbf g(\mathbf x(t_f),t_f)+\int^{t_f}_{t_0}H(\mathbf x(t),\mathbf u(t),\lambda (t),t)-\lambda(t)^T\dot{\mathbf x}(t)dt

    其中H(\mathbf x(t),\mathbf u(t),\lambda (t),t)=L(\mathbf x(t),\mathbf u(t),t)+\lambda^T(t)\mathbf f(\mathbf x(t),\mathbf u(t),t)

    Step 2:令\bar{S}(\mathbf x(t_f),t_f)=S(\mathbf x(t_f),t_f)+\mu^T\mathbf g(\mathbf x(t_f),t_f),则性能泛函又可以写为

    J[\mathbf u(\cdot )]=\bar S(\mathbf x(t_f),t_f)+\int^{t_f}_{t_0}H(\mathbf x(t),\mathbf u(t),\lambda (t),t)-\lambda(t)^T\dot{\mathbf x}(t)dt

    Step 3:边界条件为\lambda(t_f)=\frac{\partial \bar S(\mathbf x(t_f),t_f)}{\partial \mathbf x(t_f)}=\frac{\partial S(\mathbf x(t_f),t_f)}{\partial \mathbf x(t_f)}+\frac{\partial \mathbf g^T(\mathbf x(t_f),t_f)}{\partial \mathbf x(t_f)}\mu

    结论:

    1. 边界条件
      \lambda(t_f)=\frac{\partial \bar S(\mathbf x(t_f),t_f)}{\partial \mathbf x(t_f)}=\frac{\partial S(\mathbf x(t_f),t_f)}{\partial \mathbf x(t_f)}+\frac{\partial \mathbf g^T(\mathbf x(t_f),t_f)}{\partial \mathbf x(t_f)}\mu
      \mathbf g(\mathbf x(t_f),t_f)=0
      \mathbf x(t_0)=\mathbf x_0
    2. 规范方程
      \dot{\mathbf x}(t)=\frac{\partial H}{\partial \lambda}=\mathbf f(\mathbf x(t),\mathbf u(t),t)
      \dot{\lambda}(t)=-\frac{\partial H}{\partial \mathbf x}=-\frac{\partial L}{\partial \mathbf x}-\frac{\partial \mathbf f^T}{\partial \mathbf x}\lambda
    3. 极值条件
      \frac{\partial H}{\partial \mathbf u}=0

    5. 末态时刻未定的问题

    末态时刻未定,末态有三种情况,可以时自由的,也可以是固定的,也可以是受约束的。此处暂时先不考虑前两种情况,只考虑第三种情况,因为前两种情况可以由第三种情况衍生。

    问题描述:对于被控系统\dot{\mathbf x}(t)=\mathbf f(\mathbf x(t),\mathbf u(t),t)末态时刻t_f不固定,而末态\mathbf x(t_f)受等式\mathbf g(\mathbf x(t_f),t_f)=0约束,性能泛函如下所示

    J[\mathbf u(\cdot )]=S(\mathbf x(t_f),t_f)+\int^{t_f}_{t_0}L(t,\mathbf x(t),\mathbf u(t))dt

    其中\mathbf g(\mathbf x(t_f),t_f)=0的维数为p,为使得最优控制的解的存在,当性能指标泛函中L=0时,p\leq n-1;当L\neq 0时,p\leq n

    Step 1:引入待定拉格朗日乘子向量\mu=\left[\mu_1,\mu_2,\cdots,\mu_p \right ]^T,定义如下新的辅助泛函

    J_1[\mathbf u(\cdot )]=S(\mathbf x(t_f),t_f)+\mu^T\mathbf g(\mathbf x(t_f),t_f)+\int^{t_f}_{t_0}H(\mathbf x(t),\mathbf u(t),\lambda (t),t)-\lambda(t)^T\dot{\mathbf x}(t)dt

    其中H(\mathbf x(t),\mathbf u(t),\lambda (t),t)=L(\mathbf x(t),\mathbf u(t),t)+\lambda^T(t)\mathbf f(\mathbf x(t),\mathbf u(t),t)

    Step 2:分部积分,则辅助泛函变为

    \begin{align*} J_1[\mathbf u(\cdot )]=S(\mathbf x(t_f),t_f)+\mu^T\mathbf g(\mathbf x(t_f),t_f)+\lambda^T(t_0)\mathbf x(t_0)-\lambda^T(t_f)\mathbf x(t_f)+\int^{t_f}_{t_0}H(\mathbf x(t),\mathbf u(t),\lambda (t),t)-\lambda(t)^T\dot{\mathbf x}(t)dt \end{align*}

    \bar{S}(\mathbf x(t_f),t_f)=S(\mathbf x(t_f),t_f)+\mu^T\mathbf g(\mathbf x(t_f),t_f),则性能泛函又可以写为

    \begin{align*} J[\mathbf u(\cdot )]=\bar S(\mathbf x(t_f),t_f)+\lambda^T(t_0)\mathbf x(t_0)-\lambda^T(t_f)\mathbf x(t_f)+\int^{t_f}_{t_0}H(\mathbf x(t),\mathbf u(t),\lambda (t),t)-\lambda(t)^T\dot{\mathbf x}(t)dt \end{align*}

    Step 3:对其所有变量进行一阶变分

    \begin{aligned} \delta J_{1}=& \frac{\partial \bar{S}^{T}\left(\mathbf x\left(t_{f}\right), t_{f}\right)}{\partial \mathbf x\left(t_{f}\right)} \delta \mathbf x\left(t_{f}\right)+\frac{\partial \bar{S}^{T}\left(\mathbf x\left(t_{f}\right), t_{f}\right)}{\partial \mathbf x\left(t_{f}\right)} \dot{\mathbf x}\left(t_{f}\right) \delta t_{f}+\frac{\partial \bar{S}^{T}\left(\mathbf x\left(t_{f}\right), t_{f}\right)}{\partial t_{f}} \delta t_{f} \\ &-\lambda^{T}\left(t_{f}\right) \delta \mathbf x\left(t_{f}\right)-\left[\dot{\lambda}\left(t_{f}\right) \mathbf x\left(t_{f}\right)+\lambda\left(t_{f}\right) \dot{\mathbf x}\left(t_{f}\right)\right] \delta t_{f} \\ &+\left.\left[H(\mathbf x, \mathbf u, \lambda, t)+\lambda^{T} \mathbf x\right]\right|_{t=t_{f}} \delta t_{f} \\ &+\int_{t_{0}}^{t_{f}}\left[\left(\frac{\partial H}{\partial \mathbf x}+\dot{\lambda}\right)^{T} \delta \mathbf x+\frac{\partial H}{\partial \mathbf u^{T}} \delta \mathbf u\right] d t \end{aligned}

    结论:

    1. 边界条件
      \lambda(t_f)=\frac{\partial \bar S(\mathbf x(t_f),t_f)}{\partial \mathbf x(t_f)}=\frac{\partial S(\mathbf x(t_f),t_f)}{\partial \mathbf x(t_f)}+\frac{\partial \mathbf g^T(\mathbf x(t_f),t_f)}{\partial \mathbf x(t_f)}\mu
      \mathbf g(\mathbf x(t_f),t_f)=0
      \mathbf x(t_0)=\mathbf x_0
    2. 规范方程
      \dot{\mathbf x}(t)=\frac{\partial H}{\partial \lambda}=\mathbf f(\mathbf x(t),\mathbf u(t),t)
      \dot{\lambda}(t)=-\frac{\partial H}{\partial \mathbf x}=-\frac{\partial L}{\partial \mathbf x}-\frac{\partial \mathbf f^T}{\partial \mathbf x}\lambda
    3. 极值条件
      \frac{\partial H}{\partial \mathbf u}=0
    4. 哈密顿函数在最优轨线的末端应有H\left(\boldsymbol{x}^{*}\left(t_{f}^{*}\right), \boldsymbol{u}^{*}\left(t_{f}^{*}\right), \lambda\left(t_{f}^{*}\right), t_{f}^{*}\right)=-\frac{\partial S\left(\boldsymbol{x}\left(t_{f}\right), t_{f}\right)}{\partial t_{f}}-\frac{\partial \boldsymbol{g}^{\tau}\left(\boldsymbol{x}\left(t_{f}\right), t_{f}\right)}{\partial t_{f}} \boldsymbol{\mu}

     

    以上五个问题,主要在于变分法的运用,如果有不懂的,可以多看看变分法的那篇博客,也可留言。

     

     

     

    展开全文
  • 变分法及其在最优控制中的应用,讲义概述。
  • 最优控制
  • 最优控制理论总结——变分法

    千次阅读 2016-11-23 22:17:04
    此总结为中国科学院大学《最优控制理论》课程的总结。课程未结束,不定期更新。
  • 最优控制理论的基础内容——变分法。本文是对一些重要内容作了笔记,包括泛函极值必要条件Euler方程、不同边界条件的处理方式、以及等式约束条件的处理等。
  • 提到的所有的控制方法都是达到一个给定目标,然而在生活中经常出现这样一个问题,多种方案都可以,但要找效果最好的方案,也就是所谓的最优控制问题。从数学方面来讲,最优控制问题就是求解一类带有约束条件的泛函...
  • Daniel Liberzon 的关于变分法最优控制的英文书,Calculus of Variations and Optimal Control Theory,适合入门和打基础。
  • 通俗易懂,讲解很好,易理解,案例明确,过程清晰,很实用。
  • 最近看了几天最优控制,写下些感想,希望各位参考或批评!最优控制的问题描述:1、状态方程的约束 和初始条件,这里把 当作 的导数。2、容许控制,控制量u(t)的约束,3、目标集x(T)或者终点状态的函数(分为固定端...
  • 1. 动态优化的方法(Methods of Dynamic Optimization)动态优化的经典方法是变分法(Calculus of Variations)。但随着方法论的发展,这种方法被更加有力的方法所替代:最优控制理论(Optimal Control)。该方法的...
  • : )父级目录:Hreyulog:目录·《变分法》​zhuanlan.zhihu.com上一节:Hreyulog:变分法(三)极值曲线场、雅可比方程、魏尔斯特拉斯函数、条件极值与等周问题​zhuanlan.zhihu.com最优程序控制引言控制理论由两种...
  • Mathematica的逻辑运算功能强大,在note里做数理推导并展示一气呵成。...之前使用mma做过离散时间的动态规划问题:简单RBC模型与Mathematica应用​mp.weixin.qq.com这里考虑的连续时间的最优控制问题,这...
  • 最优控制

    2012-10-29 16:29:23
    最优控制》主要内容: 变分法、极小值原理、动态规划法、线性二次型问题 首先了解什么是最优控制问题。
  • 变分法或者庞特里亚金最大值原理(Pontryagin's maximum principle)不同,动态规划并非一次性解出状态变量的最优路径和最优控制函数以使得目标泛函最大化,而是将动态优化问题分解为一个个递归问题逐次求解。...
  • 最优控制ppt

    2019-02-27 22:08:46
    系统讲解泛函,极小值原理,线性二次型原理,变分法,等,与胡寿松的最优控制理论与系统相结合看。
  • 最优控制课件0001

    2011-06-14 13:22:56
    优化理论与方法、连续系统最优控制、线性连续系统最优控制变分法
  • 最优控制课件

    2013-11-13 22:25:59
    最优控制课件,适合研究生教学,变分法、最小值原理、动态规划等
  • 最优控制理论与应用

    2019-03-06 18:00:25
    本书是工科院校自动控制类各研究方向的硕士研究生和高年级本科生的“最优控制”课程教材。基本内容有:变分法、连续系统最优控制、线性连续系统的二次型调节器(LQR)、离散系统最优控制、最大值原理、动态规划。
  • 第6章-最优控制6.1 最优控制的基本概念6.2 最优控制中的变分法6.3 极大值原理6.4 线性二次型最优控制问题6.5 利用 MATLAB 求解线性二次型最优控制问题 6.1 最优控制的基本概念 6.2 最优控制中的变分法 6.3 极大值...
  • 要求用程序来求出一共有多少种走。如果每次走1级台阶,一共走10步,这是其中一种走。我们可以简写成 1,1,1,1,1,1,1,1,1,1。如果每次走2级台阶,一共走5步,这是另一种走。我们可以简写成 2,2,2,2,2。当然,除...
  • 最优控制课件 rar

    2009-04-13 09:52:21
    有不少录入错误,没来得及修改,下载的朋友见谅,仅作参考 最优控制课件 第一章最优控制理论 第二章 变分法 第三章最优控制第3章 第四章最优控制第4章 第五章 动态规划 第六章 线性二次型最优调节器
  • 上一次总结了利用变分法推导得到的典型情形下最优控制需要满足的必要条件,具体的推导在大部分最优控制教材中都可以找到,并且在这些教材中一般会将变分法、极小值原理和动态规划作为最优控制的三大理论支撑。...
  • 最优化方法与最优控制(研究生用)第一章最优化方法的一般概念第二章非线性规划第三章线性规划第四章最优控制变分法第五章最小值定理第六章线性二次型最优控制系统第七章动态规划
  • 第三章 用变分法最优控制——泛函极值问题 第四章 极小值原理及其应用 第五章 线性系统二次型指标的最优控制——线性二次型问题 第六章 动态规划 第七章 最优控制的计算方法 第八章 随机线性系统的最优控制 第九章...

空空如也

空空如也

1 2 3 4 5
收藏数 82
精华内容 32
关键字:

最优控制变分法