精华内容
下载资源
问答
  • 用stackelberg微分对策模型描述制造商与零售商的动态广告策略,并根据动态规划原理求出反馈stackelberg均衡解。结果显示,制造商对零售商的广告支持类型取决于双方的边际利润。在合作广告计划中双方的均衡广告策略中...
  • 针对导弹攻防对抗过程中拦截器追击具备较强机动能力弹头的追逃问题,建立了双方追逃微分对策模型并给出求解方法.一是给出导弹追逃质点动力学模型;二是基于微分对策理论...
  • 这篇文章摘抄自沙昌基教授《数理战术学》第六章 单兵种和多兵种作战的微分对策模型。并附上了自己思考。

    准备工作

    这篇文章摘抄自沙昌基教授《数理战术学》第六章 单兵种和多兵种作战的微分对策模型。并附上了自己思考。

    注:全文的公式使用LaTex公式编辑器编辑而成

    预备知识

    设甲、乙双方进行直瞄武器交战,对每一时刻 t t t ,甲方仅有一类作战单位 X X X X X X 的数量为 x = x ( t ) x=x(t) x=x(t) ,乙方共有两类作战单位,第一类作战单位的个数为 y = y ( t ) y=y(t) y=y(t) ,第二类作战单位的个数为 z = z ( t ) z=z(t) z=z(t) ,双方的初始作战单位数量为
    x ( 0 ) = x 0 , y ( 0 ) = y 0 , z ( 0 ) = z 0 (1) x(0)=x_0,y(0)=y_0,z(0)=z_0 \tag{1} x(0)=x0,y(0)=y0,z(0)=z0(1)
    其中
    x 0 > 0 , y 0 > 0 , z 0 > 0 x_0>0,y_0>0,z_0>0 x0>0,y0>0,z0>0
    设甲方分配作战单位 X X X用于攻击乙方两类作战单位 Y Y Y Z Z Z的比例分别为 ϕ 1 = ϕ 1 ( t ) \phi_1=\phi_1(t) ϕ1=ϕ1(t) ϕ 2 = ϕ 2 ( t ) \phi_2=\phi_2(t) ϕ2=ϕ2(t),乙方分配作战单位 Y Y Y Z Z Z用于攻击甲方作战单位 X X X的比例分别为 ψ 1 = ψ 1 ( t ) \psi_1=\psi_1(t) ψ1=ψ1(t) ψ 2 = ψ 2 ( t ) \psi_2=\psi_2(t) ψ2=ψ2(t),则显然有
    { 0 ≤ ϕ 1 ( t ) ≤ 1 , 0 ≤ ϕ 2 ( t ) ≤ 1 0 ≤ ψ 1 ( t ) ≤ 1 , 0 ≤ ψ 2 ( t ) ≤ 1 ϕ 1 ( t ) + ϕ 2 ( t ) ≤ 1 (2) \left\{\begin{matrix} 0 \le \phi_1(t) \le 1, \quad 0 \le \phi_2(t) \le 1 \\ 0 \le \psi_1(t) \le 1, \quad 0 \le \psi_2(t) \le 1 \\ \phi_1(t) + \phi_2(t) \le 1 \end{matrix}\right. \tag{2} 0ϕ1(t)1,0ϕ2(t)10ψ1(t)1,0ψ2(t)1ϕ1(t)+ϕ2(t)1(2)
    此时交战双方的Lanchester方程为
    { x ˙ ( t ) = − ψ 1 c y − ψ 2 d z y ˙ ( t ) = − ϕ 1 a x z ˙ ( t ) = − ϕ 2 b x (3) \left\{\begin{matrix} \dot x(t) = -\psi_1cy-\psi_2dz \\ \dot y(t) = -\phi_1ax \\ \dot z(t) = -\phi_2bx \\ \end{matrix}\right. \tag{3} x˙(t)=ψ1cyψ2dzy˙(t)=ϕ1axz˙(t)=ϕ2bx(3)
    参数说明:

    • a:甲方攻击乙I时,单位时间内消灭乙I作战单位个数, a > 0 a>0 a>0
    • b:甲方攻击乙II时,单位时间内消灭乙II作战单位个数, b > 0 b>0 b>0
    • c:乙I攻击甲方时,单位时间内消灭甲方作战单位个数, c > 0 c>0 c>0
    • d:乙II攻击甲方时,单位时间内消灭甲方作战单位个数, d > 0 d>0 d>0

    作战结束的条件为:甲方有足够兵力将乙方两类作战单位消灭。

    对于甲方来说,目标是战斗结束时甲方剩余作战单位数 x ˉ \bar x xˉ 尽可能

    对于乙方来说,目标是战斗结束时甲方剩余作战单位数 x ˉ \bar x xˉ 尽可能

    在这里记状态向量为 S = ( x , y , z ) T S=(x,y,z)^{\mathrm{T}} S=(x,y,z)T,控制函数为 Φ = ( ϕ 1 , ϕ 2 ) \Phi=(\phi_1,\phi_2) Φ=(ϕ1,ϕ2) Ψ = ( ψ 1 , ψ 2 ) \Psi=(\psi_1,\psi_2) Ψ=(ψ1,ψ2)。当兵力分配矩阵 Φ \Phi Φ Ψ \Psi Ψ 确定后,战斗过程就确定了,甲方剩余实力 x ˉ \bar x xˉ 就确定了。

    因此可以将这个问题转化为微分对策问题,即微分动力系统 ( 3 ) (3) (3)在初值 ( 1 ) (1) (1)与控制函数约束 ( 2 ) (2) (2)的条件下,甲、乙双方的最优策略 Φ \Phi Φ Ψ \Psi Ψ 满足如下关系:
    max ⁡ Φ min ⁡ Ψ ( Φ , Ψ ) = min ⁡ Ψ max ⁡ Φ ( Φ , Ψ ) = g ( Φ ∗ , Ψ ∗ ) (4) \max_\Phi \min_\Psi(\Phi,\Psi)=\min_\Psi \max_\Phi(\Phi,\Psi)=g(\Phi^*,\Psi^*) \tag{4} ΦmaxΨmin(Φ,Ψ)=ΨminΦmax(Φ,Ψ)=g(Φ,Ψ)(4)
    这个公式的前提是
    x ( t ) ≥ 0 , y ( t ) ≥ 0 , z ( t ) ≥ 0 x(t) \ge 0,\quad y(t) \ge 0,\quad z(t) \ge 0 x(t)0,y(t)0,z(t)0

    微分对策问题的求解

    假定作战过程中乙II在 T T T 时刻被消灭,即
    z ( T ) = 0 z(T)=0 z(T)=0
    随后,按照单对单兵种直瞄武器Lanchester方程中给出的原则,甲、乙双方的最优策略是将各自全部兵力投入战斗。在此种策略下,战斗结束时,甲方剩余战斗单位数平方为
    J = x ˉ 2 = x 2 ( T ) − c a y 2 ( T ) J=\bar x^2=x^2(T)-\frac{c}{a}y^2(T) J=xˉ2=x2(T)acy2(T)
    那么式 ( 4 ) (4) (4) 可改写为
    max ⁡ Φ min ⁡ Ψ J = min ⁡ Ψ max ⁡ Φ J = J ∣ Φ ∗ , Ψ ∗ \max_\Phi \min_\Psi J=\min_\Psi \max_\Phi J=J \bigg |_{\Phi^*,\Psi^*} ΦmaxΨminJ=ΨminΦmaxJ=JΦ,Ψ
    求解兵力分配矩阵 Φ \Phi Φ Ψ \Psi Ψ

    【解】

    ① 构建Halmiton函数

    H = λ 1 ( − ψ 1 c y − ψ 2 d z ) + λ 2 ( − ϕ 1 a x ) + λ 3 ( − ϕ 2 b x ) H=\lambda_1(-\psi_1cy-\psi_2dz)+\lambda_2(-\phi_1ax)+\lambda_3(-\phi_2bx) H=λ1(ψ1cyψ2dz)+λ2(ϕ1ax)+λ3(ϕ2bx)

    协态方程为
    { λ ˙ 1 = − ∂ H ∂ x = λ 2 ϕ 1 a + λ 3 ϕ 2 b λ ˙ 2 = − ∂ H ∂ y = λ 1 ψ 1 c λ ˙ 3 = − ∂ H ∂ z = λ 1 ψ 2 d (5) \left\{\begin{matrix} \dot \lambda_1=-\frac{\partial H}{\partial x}=\lambda_2\phi_1a+\lambda_3\phi_2b \\ \dot \lambda_2=-\frac{\partial H}{\partial y}=\lambda_1\psi_1c \\ \dot \lambda_3=-\frac{\partial H}{\partial z}=\lambda_1\psi_2d \end{matrix}\right. \tag{5} λ˙1=xH=λ2ϕ1a+λ3ϕ2bλ˙2=yH=λ1ψ1cλ˙3=zH=λ1ψ2d(5)

    ② 边界条件

    由性能指标 J = x 2 ( T ) − c a y 2 ( T ) J=x^2(T)-\frac{c}{a}y^2(T) J=x2(T)acy2(T)
    φ = x 2 ( T ) − c a y 2 ( T ) \varphi=x^2(T)-\frac{c}{a}y^2(T) φ=x2(T)acy2(T)

    { λ 1 ( T ) = − ∂ φ ∂ x = 2 x ( T ) λ 2 ( T ) = − ∂ φ ∂ y = − 2 c a y ( T ) \left\{\begin{matrix} \lambda_1(T)=-\frac{\partial \varphi}{\partial x}=2x(T) \\ \lambda_2(T)=-\frac{\partial \varphi}{\partial y}=-\frac{2c}{a}y(T) \\ \end{matrix}\right. {λ1(T)=xφ=2x(T)λ2(T)=yφ=a2cy(T)

    ③ 终止条件

    由时间终止条件得
    H = 0 ⇒ λ 1 ( T ) ( − ψ 1 ( T ) c y ( T ) − ψ 2 ( T ) d z ( T ) ) + λ 2 ( T ) ( − ϕ 1 ( T ) a x ( T ) ) + λ 3 ( T ) ( − ϕ 2 ( T ) b x ( T ) ) = 0 H=0 \\ \Rightarrow \lambda_1(T)\bigg (-\psi_1(T)cy(T)-\psi_2(T)dz(T)\bigg )+\lambda_2(T)\bigg (-\phi_1(T)ax(T)\bigg )+\lambda_3(T)\bigg (-\phi_2(T)bx(T)\bigg )=0 H=0λ1(T)(ψ1(T)cy(T)ψ2(T)dz(T))+λ2(T)(ϕ1(T)ax(T))+λ3(T)(ϕ2(T)bx(T))=0
    由既定假设条件可知 z ( T ) = 0 z(T)=0 z(T)=0 ,代入上式,得到
    λ 1 ( T ) ( − ψ 1 ( T ) c y ( T ) ) + λ 2 ( T ) ( − ϕ 1 ( T ) a x ( T ) ) + λ 3 ( T ) ( − ϕ 2 ( T ) b x ( T ) ) = 0 ⇒ λ 3 ( T ) = − λ 1 ( T ) ψ 1 ( T ) c y ( T ) + λ 2 ( T ) ϕ 1 ( T ) a x ( T ) ϕ 2 ( T ) b x ( T ) ⇒ λ 3 ( T ) = − 2 x ( T ) ψ 1 ( T ) c y ( T ) − 2 c a y ( T ) ϕ 1 ( T ) a x ( T ) ϕ 2 ( T ) b x ( T ) ⇒ λ 3 ( T ) = − 2 c b ⋅ ψ 1 ( T ) − ϕ 1 ( T ) ϕ 2 ( T ) ⋅ y ( T ) \lambda_1(T)\bigg (-\psi_1(T)cy(T)\bigg )+\lambda_2(T)\bigg (-\phi_1(T)ax(T)\bigg )+\lambda_3(T)\bigg (-\phi_2(T)bx(T)\bigg )=0 \\ \Rightarrow \lambda_3(T)=-\frac{\lambda_1(T)\psi_1(T)cy(T)+\lambda_2(T)\phi_1(T)ax(T)}{\phi_2(T)bx(T)}\\ \Rightarrow \lambda_3(T)=-\frac{2x(T)\psi_1(T)cy(T)-\frac{2c}{a}y(T)\phi_1(T)ax(T)}{\phi_2(T)bx(T)}\\ \Rightarrow \lambda_3(T)=-\frac{2c}{b} \cdot \frac{\psi_1(T)-\phi_1(T)}{\phi_2(T)} \cdot y(T) λ1(T)(ψ1(T)cy(T))+λ2(T)(ϕ1(T)ax(T))+λ3(T)(ϕ2(T)bx(T))=0λ3(T)=ϕ2(T)bx(T)λ1(T)ψ1(T)cy(T)+λ2(T)ϕ1(T)ax(T)λ3(T)=ϕ2(T)bx(T)2x(T)ψ1(T)cy(T)a2cy(T)ϕ1(T)ax(T)λ3(T)=b2cϕ2(T)ψ1(T)ϕ1(T)y(T)
    将辅助函数 λ 1 ( T ) \lambda_1(T) λ1(T) λ 2 ( T ) \lambda_2(T) λ2(T) λ 3 ( T ) \lambda_3(T) λ3(T)归纳在一起,写为
    { λ 1 ( T ) = − ∂ φ ∂ x = 2 x ( T ) λ 2 ( T ) = − ∂ φ ∂ y = − 2 c a y ( T ) λ 3 ( T ) = − 2 c b ⋅ ψ 1 ( T ) − ϕ 1 ( T ) ϕ 2 ( T ) ⋅ y ( T ) (6) \left\{\begin{matrix} \lambda_1(T)=-\frac{\partial \varphi}{\partial x}=2x(T) \\ \lambda_2(T)=-\frac{\partial \varphi}{\partial y}=-\frac{2c}{a}y(T) \\ \lambda_3(T)=-\frac{2c}{b} \cdot \frac{\psi_1(T)-\phi_1(T)}{\phi_2(T)} \cdot y(T) \end{matrix}\right. \tag{6} λ1(T)=xφ=2x(T)λ2(T)=yφ=a2cy(T)λ3(T)=b2cϕ2(T)ψ1(T)ϕ1(T)y(T)(6)
    题目的假设条件为在 T T T 时刻乙II已经被消灭了,即 z ( T ) = 0 z(T)=0 z(T)=0 ,所以 ϕ 2 ( T ) > 0 \phi_2(T)>0 ϕ2(T)>0

    ④ 求解结果

    根据微分对策原理,对于任意使 Φ ∗ \Phi^* Φ Ψ ∗ \Psi^* Ψ 连续的时刻 t t t ,均使Hamilton函数达到鞍点,即
    H ( S ∗ ( t ) , λ ∗ ( t ) , Φ ∗ ( t ) , Ψ ∗ ( t ) , t ) = max ⁡ Φ min ⁡ Ψ H ( S ∗ ( t ) , λ ∗ ( t ) , Φ ( t ) , Ψ ( t ) , t ) = min ⁡ Ψ max ⁡ Φ H ( S ∗ ( t ) , λ ∗ ( t ) , Φ ( t ) , Ψ ( t ) , t ) H\bigg (S^*(t),\lambda^*(t),\Phi^*(t),\Psi^*(t),t \bigg ) \\ =\max_\Phi \min_\Psi H\bigg (S^*(t),\lambda^*(t),\Phi(t),\Psi(t),t \bigg ) \\ =\min_\Psi \max_\Phi H\bigg (S^*(t),\lambda^*(t),\Phi(t),\Psi(t),t \bigg ) H(S(t),λ(t),Φ(t),Ψ(t),t)=ΦmaxΨminH(S(t),λ(t),Φ(t),Ψ(t),t)=ΨminΦmaxH(S(t),λ(t),Φ(t),Ψ(t),t)
    其中, Φ \Phi Φ Ψ \Psi Ψ 满足式 ( 2 ) (2) (2)

    下面通过分析,简化最优解 S ∗ , λ ∗ , Φ ∗ , Ψ ∗ S^*,\lambda^*,\Phi^*,\Psi^* S,λ,Φ,Ψ 的求解过程。

    由式 ( 6 ) (6) (6) 可以对 λ 1 ∗ ( T ) \lambda_1^*(T) λ1(T) λ 2 ∗ ( T ) \lambda_2^*(T) λ2(T) 进行定性分析,有
    { λ 1 ∗ ( T ) = 2 x ( T ) > 0 λ 2 ∗ ( T ) = − 2 c a y ( T ) < 0 \left\{\begin{matrix} \lambda_1^*(T)=2x(T)>0 \\ \lambda_2^*(T)=-\frac{2c}{a}y(T)<0 \\ \end{matrix}\right. {λ1(T)=2x(T)>0λ2(T)=a2cy(T)<0
    为了方便分析,再重新写一遍Hamilton函数放在这里。
    H = λ 1 ( − ψ 1 c y − ψ 2 d z ) + λ 2 ( − ϕ 1 a x ) + λ 3 ( − ϕ 2 b x ) H=\lambda_1(-\psi_1cy-\psi_2dz)+\lambda_2(-\phi_1ax)+\lambda_3(-\phi_2bx) H=λ1(ψ1cyψ2dz)+λ2(ϕ1ax)+λ3(ϕ2bx)
    甲方的目标是使 H H H 取极大值;

    乙方的目标是使 H H H 取极小值。

    因为 λ 1 ∗ ( T ) > 0 \lambda_1^*(T)>0 λ1(T)>0,应使 ψ 1 ∗ ( t ) \psi_1^*(t) ψ1(t) ψ 2 ∗ ( t ) \psi_2^*(t) ψ2(t) 越大越好,取
    { ψ 1 ∗ ( t ) = 1 ψ 2 ∗ ( t ) = 1 (7) \left\{\begin{matrix} \psi_1^*(t)=1 \\ \psi_2^*(t)=1 \end{matrix}\right. \tag{7} {ψ1(t)=1ψ2(t)=1(7)
    λ 2 ∗ ( T ) < 0 \lambda_2^*(T)<0 λ2(T)<0 ,则应使 ϕ 1 ∗ ( t ) \phi_1^*(t) ϕ1(t) 越大越好,取
    ϕ 1 ∗ ( t ) = 1 − ϕ 2 ∗ ( t ) (8) \phi_1^*(t)=1-\phi_2^*(t) \tag{8} ϕ1(t)=1ϕ2(t)(8)
    那么 λ 3 ∗ ( T ) \lambda_3^*(T) λ3(T)
    λ 3 ∗ ( T ) = − 2 c b ⋅ ψ 1 ∗ ( T ) − ϕ 1 ∗ ( T ) ϕ 2 ∗ ( T ) ⋅ y ( T ) ⇒ λ 3 ∗ ( T ) = − 2 c b ⋅ 1 − ( 1 − ϕ 2 ∗ ( t ) ) ϕ 2 ∗ ( T ) ⋅ y ( T ) ⇒ λ 3 ∗ ( T ) = − 2 c b y ( T ) < 0 \lambda_3^*(T)=-\frac{2c}{b} \cdot \frac{\psi_1^*(T)-\phi_1^*(T)}{\phi_2^*(T)} \cdot y(T) \\ \Rightarrow \lambda_3^*(T)=-\frac{2c}{b} \cdot \frac{1-(1-\phi_2^*(t))}{\phi_2^*(T)} \cdot y(T) \\ \Rightarrow \lambda_3^*(T)=-\frac{2c}{b}y(T)<0 λ3(T)=b2cϕ2(T)ψ1(T)ϕ1(T)y(T)λ3(T)=b2cϕ2(T)1(1ϕ2(t))y(T)λ3(T)=b2cy(T)<0


    分析方法1:

    由式 ( 6 ) (6) (6) ,若有 λ 2 ( t ) < 0 \lambda_2(t)<0 λ2(t)<0 λ 3 ( t ) < 0 \lambda_3(t)<0 λ3(t)<0,则得到 λ ˙ 1 ( t ) < 0 \dot \lambda_1(t)<0 λ˙1(t)<0,说明 λ 1 \lambda_1 λ1 t ∈ [ 0 , T ] t \in [0,T] t[0,T] 单调下降。又因为 λ 1 ( T ) > 0 \lambda_1(T)>0 λ1(T)>0 ,那么可以看出 λ 1 \lambda_1 λ1 t ∈ [ 0 , T ] t \in [0,T] t[0,T] 处,恒有 λ 1 ( t ) > 0 \lambda_1(t)>0 λ1(t)>0

    然后,因为 λ 1 ( t ) > 0 \lambda_1(t)>0 λ1(t)>0,则有 λ ˙ 2 ( t ) > 0 \dot \lambda_2(t)>0 λ˙2(t)>0 λ ˙ 3 ( t ) > 0 \dot \lambda_3(t)>0 λ˙3(t)>0,说明 λ 1 \lambda_1 λ1 λ 2 \lambda_2 λ2 t ∈ [ 0 , T ] t \in [0,T] t[0,T] 单调上升,又因为 λ 2 ( T ) < 0 \lambda_2(T)<0 λ2(T)<0 λ 3 ( T ) < 0 \lambda_3(T)<0 λ3(T)<0,那么可以看出 λ 2 \lambda_2 λ2 λ 3 \lambda_3 λ3 t ∈ [ 0 , T ] t \in [0,T] t[0,T] 处,恒有 λ 2 ( t ) < 0 , λ 3 ( t ) < 0 \lambda_2(t)<0,\lambda_3(t)<0 λ2(t)<0,λ3(t)<0

    分析方法2:

    由微分对策的战术意义可知,甲方的目标是使 H H H 取极大值,乙方的目标是使 H H H 取极小值。那么下式恒成立。
    { λ 1 ( t ) > 0 λ 2 ( t ) < 0 λ 3 ( t ) < 0 \left\{\begin{matrix} \lambda_1(t) > 0 \\ \lambda_2(t) < 0 \\ \lambda_3(t) < 0 \end{matrix}\right. λ1(t)>0λ2(t)<0λ3(t)<0


    根据式 ( 7 ) (7) (7) ,Hamilton函数可改写为
    H = λ 1 c y − λ 1 d z − ( λ 2 ϕ 1 a + λ 3 ϕ 2 b ) x H=\lambda_1cy-\lambda_1dz-(\lambda_2\phi_1a+\lambda_3\phi_2b)x H=λ1cyλ1dz(λ2ϕ1a+λ3ϕ2b)x
    根据式 ( 8 ) (8) (8) 有, ϕ 1 ∗ ( t ) + ϕ 2 ∗ ( t ) = 1 \phi_1^*(t)+\phi_2^*(t)=1 ϕ1(t)+ϕ2(t)=1。所以实际上就是 − λ 2 a -\lambda_2a λ2a − λ 3 b -\lambda_3b λ3b 的加权平均。那么现在就得让 ( λ 2 ϕ 1 a + λ 3 ϕ 2 b ) (\lambda_2\phi_1a+\lambda_3\phi_2b) (λ2ϕ1a+λ3ϕ2b) 的数值尽可能小,这样减去的数值才会小, H H H 才会取极大值。所以要比较 λ 2 a \lambda_2a λ2a λ 3 b \lambda_3b λ3b 中谁更小。取小值进行加权,即
    { ϕ 1 ( t ) = 0 , ϕ 2 ( t ) = 1 , λ 2 ( t ) a > λ 3 ( t ) b ϕ 1 ( t ) = 1 , ϕ 2 ( t ) = 0 , λ 2 ( t ) a < λ 3 ( t ) b \left\{\begin{matrix} \phi_1(t)=0,\phi_2(t)=1, \quad \lambda_2(t)a>\lambda_3(t)b \\ \phi_1(t)=1,\phi_2(t)=0, \quad \lambda_2(t)a<\lambda_3(t)b \end{matrix}\right. {ϕ1(t)=0,ϕ2(t)=1,λ2(t)a>λ3(t)bϕ1(t)=1,ϕ2(t)=0,λ2(t)a<λ3(t)b
    构造辅助函数
    η ( T ) = λ 2 ( T ) a − λ 3 ( T ) b = − 2 c a y ( T ) a + 2 c b y ( T ) b = 0 \eta(T)=\lambda_2(T)a-\lambda_3(T)b \\ =-\frac{2c}{a}y(T)a+\frac{2c}{b}y(T)b =0 η(T)=λ2(T)aλ3(T)b=a2cy(T)a+b2cy(T)b=0

    其意义是,在 T T T 时刻, λ 2 a \lambda_2a λ2a λ 3 b \lambda_3b λ3b 两者数值一样大。

    再讨论 t ∈ [ 0 , T ) t\in[0,T) t[0,T) 的情况。


    η ˙ ( t ) = λ ˙ 2 ( t ) a − λ ˙ 3 ( t ) b = λ 1 ( t ) ψ 1 c a − λ 1 ( t ) ψ 2 d b = λ 1 ( t ) ⋅ 1 ⋅ c a − λ 1 ( t ) ⋅ 1 ⋅ b d = λ 1 ( t ) ( a c − b d ) \dot \eta(t) =\dot \lambda_2(t)a - \dot \lambda_3(t)b \\ =\lambda_1(t)\psi_1ca-\lambda_1(t)\psi_2db \\ =\lambda_1(t)\cdot1\cdot ca-\lambda_1(t)\cdot1\cdot bd \\ =\lambda_1(t)(ac-bd) η˙(t)=λ˙2(t)aλ˙3(t)b=λ1(t)ψ1caλ1(t)ψ2db=λ1(t)1caλ1(t)1bd=λ1(t)(acbd)
    λ 1 ( t ) > 0 \lambda_1(t)>0 λ1(t)>0 ,只需要看 ( a c − b d ) (ac-bd) (acbd) 的符号即可。当 a c < b d ac<bd ac<bd 时,有 η ˙ ( t ) < 0 , t ∈ [ 0 , T ] \dot \eta(t)<0,t \in [0,T] η˙(t)<0t[0,T],又因为 η ( T ) = 0 \eta(T)=0 η(T)=0,所以
    η ( t ) > 0 , t ∈ [ 0 , T ) \eta(t)>0,\quad t \in [0,T) η(t)>0,t[0,T)
    也就是说明
    η ( t ) = λ 2 ( T ) a − λ 3 ( T ) b ⇒ λ 2 ( T ) a > λ 3 ( T ) b \eta(t)=\lambda_2(T)a-\lambda_3(T)b \\ \Rightarrow \lambda_2(T)a>\lambda_3(T)b η(t)=λ2(T)aλ3(T)bλ2(T)a>λ3(T)b
    那么取
    ϕ 1 ∗ ( t ) = 0 , ϕ 2 ∗ ( t ) = 1 \phi_1^*(t)=0,\quad \phi_2^*(t)=1 ϕ1(t)=0,ϕ2(t)=1

    ⑤ 结论

    最优控制函数 Φ ∗ ( t ) \Phi^*(t) Φ(t) Ψ ∗ ( t ) \Psi^*(t) Ψ(t) 的取值为
    Φ ∗ ( t ) = [ ϕ 1 ∗ ( t ) ϕ 2 ∗ ( t ) ] = [ 0 1 ] , Ψ ∗ ( t ) = [ ψ 1 ∗ ( t ) ψ 2 ∗ ( t ) ] = [ 1 1 ] (9) \Phi^*(t)=\begin{bmatrix} \phi_1^*(t) \\ \phi_2^*(t) \end{bmatrix} =\begin{bmatrix} 0 \\ 1 \end{bmatrix},\quad \Psi^*(t)=\begin{bmatrix} \psi_1^*(t) \\ \psi_2^*(t) \end{bmatrix} =\begin{bmatrix} 1 \\ 1 \end{bmatrix} \tag{9} Φ(t)=[ϕ1(t)ϕ2(t)]=[01],Ψ(t)=[ψ1(t)ψ2(t)]=[11](9)
    如果甲方决定集中力量先消灭乙I的话,那么最优控制函数 Φ ∗ ( t ) \Phi^*(t) Φ(t) Ψ ∗ ( t ) \Psi^*(t) Ψ(t) 的取值变化如下。
    Φ ∗ ( t ) = [ ϕ 1 ∗ ( t ) ϕ 2 ∗ ( t ) ] = [ 1 0 ] , Ψ ∗ ( t ) = [ ψ 1 ∗ ( t ) ψ 2 ∗ ( t ) ] = [ 1 1 ] \Phi^*(t)=\begin{bmatrix} \phi_1^*(t) \\ \phi_2^*(t) \end{bmatrix} =\begin{bmatrix} 1 \\ 0 \end{bmatrix},\quad \Psi^*(t)=\begin{bmatrix} \psi_1^*(t) \\ \psi_2^*(t) \end{bmatrix} =\begin{bmatrix} 1 \\ 1 \end{bmatrix} Φ(t)=[ϕ1(t)ϕ2(t)]=[10],Ψ(t)=[ψ1(t)ψ2(t)]=[11]
    综上,体现了“集中兵力,攻击敌方”的作战原则。

    扩展

    考虑一般的单兵种对多兵种作战问题,给出1对 n n n 的直瞄武器战斗的Lanchester方程为
    { x ˙ = − ∑ j = 1 n b j ψ j y j y ˙ = − a j ϕ j x , j = 1 , ⋯   , n \left\{\begin{matrix} \dot x = -\sum_{j=1}^{n} b_j \psi_j y_j \\ \dot y = -a_j \phi_j x \end{matrix}\right. , \quad j = 1,\cdots,n\\ {x˙=j=1nbjψjyjy˙=ajϕjx,j=1,,n
    约束条件为
    { 0 ≤ ψ j ( t ) ≤ 1 0 ≤ ϕ j ( t ) ∑ j = 1 n ϕ j ≤ 1 , j = 1 , ⋯   , n \left\{\begin{matrix} 0 \le \psi_j(t) \le 1 \\ 0 \le \phi_j(t) \\ \sum_{j=1}^{n}\phi_j \le 1 \end{matrix}\right.,\quad j=1,\cdots,n 0ψj(t)10ϕj(t)j=1nϕj1,j=1,,n
    与上述讨论的结果类似,采用微分对策原理,同样会得出相同结论:

    • 乙方各类作战单位全部攻击甲方
    • 甲方集中兵力攻击乙方第 i i i 类作战单位,将其全部歼灭后,再转向另一类作战单位……如此反复

    这种原则与一对二作战的情况及其相似。即甲方的最优火力分配策略仍然是集中火力攻击乙方的一类作战单位,攻击顺序按照交战强度的高低进行分配,最优兵力分配策略与双方当时的实力无关,并且不依赖于时间。

    展开全文
  • 论文研究-纵向合作广告的微分对策模型研究 .pdf,
  • 讨论了周期时变线性系统的一般线性二次型微分对策, 即状态方程非齐次且二次型赢得或损 失函数包含线性项的一般情况。给出了保性能对策问题和鞍点对策问题可解的充要条件和最优策略的 解析构造以及对策值。...
  • 考虑制造商负责回收和处理废旧产品的两级闭环供应链,建立制造商主导的Stackelberg博弈下的微分对策模型,以废旧产品回收量影响的企业声誉为状态变量,利用反馈求解法...
  • #资源达人分享计划#
  • 针对供应链系统中制造商和零售商的合作广告计划问题,利用微分对策构建动态模型,分别研究制造商和零售商在合作和非合作条件下的广告策略.运用动态规划原理,分别得出静态反馈Nash均衡和反馈Stackelberg均衡. 将两种...
  • 很好的关于微分博弈的入门材料,浙大博士论文
  • 在消费者需求受产品减排量和零售商低碳宣传努力影响的情况下, 构建了3 种微分博弈模型. 研究发现, 在一定条件下, 成本分担契约可以实现制造商和零售商利润的Pareto 改善, 而且处于稳定状态时, 随着竞争强度的增加, ...
  • 考虑了品牌广告和大类广告对供应链内企业行为决策的不同作用,利用微分对策理论研究了供应链中供应商和销售商的广告策略,提出了一个Nash博弈模型,通过汉密尔顿—雅可比—贝尔曼方程求解模型的反馈均衡解,得到供应...
  • 基于一个微分对策问题的机器学习能力定量评价 由于用机器学习方法求解诸如最优控制、微分对策这样具有连续动作和状态的问题时,效率(效果/算力)较低,特殊的微分对策问题将是测试机器学习方法的竞争案例。 一个...

    基于一个微分对策问题的机器学习能力定量评价

    由于用机器学习方法求解诸如最优控制、微分对策这样具有连续动作和状态的问题时,效率(效果/算力)较低,特殊的微分对策问题将是测试机器学习方法的竞争案例。

    一个古老的羊-犬博弈问题:羊在半径为 R 的圆形圈内具有定常速率 v 和满足以下限制的任意转弯能力:逃逸路径上每一点与圆心的距离随时间单调不减。羊逃出圆形圈则胜。犬沿着圆周以定常速率 V 围堵以防止羊逃逸,任何时刻具有选择圆周的两个方向之一的能力。
    任务:

    1. 通过运动学精确建模求解犬的最优围堵策略;
    2. 假设犬以最优策略围堵,基于精确建模求解羊可以逃逸胜出
      的条件;
    3. 假设羊理解自己的能力、限制和躲避犬围堵而逃逸的目标,
      但不具备基于运动学的最优化决策知识,假设 2 中羊可以逃
      逸的条件被满足,给出一种机器学习方法,使得羊通过学习
      训练后实现逃逸;
    4. 设计一套评价体系,定量评价 3 中给出的机器学习方法的学
      习能力;
    5. 提出并定量评价更多的羊逃逸机器学习方法

    问题分析:

    对于问题一,通过对犬的运动进行分析,可以将其看作匀速圆周运动,对于羊,可以看作原理圆心的运动。通过对比羊犬的速度与场地半径之间的关系,分别建立犬的圆周运动微分方程以及羊的随机运动微分方程,通过羊全的运动范围确定犬的最优围堵方案。(需要列出具体的方程求解)。
    对于问题二,在问题一的条件下,结合羊犬的运动进行分析,分析极限情况下羊被犬抓住的概率,由此确定羊在犬的最优化策略下的胜出条件。
    对于问题三,通过对羊的运动轨迹进行分析,结合犬对于羊的限制条件,结合问题一与问题二中的条件,结合随机森林算法对羊的路线进行分析,以羊的运动轨迹坐标作为数据集,建立随机森林模型,使用matlab进行求解,最终得到羊通过训练后实现逃逸的路线。
    对于问题四,对羊逃逸学习的随机森林模型进行分析,对羊的运动轨迹、犬的限制以及数据集选取(随机森林模型选取部分数据进行学习)进行分析,采用模糊综合评价分析不同影响因素的判断矩阵,结合matlab得到不同影响因素的权重。并通过影响因素自身的得分得到最终的评价。
    对于问题五,通过最优化模型对羊犬博弈问题进行分析,结合问题四建立的模糊综合评价模型进行评价,得到不同的机器学习方法定量评价。对比不同的评价方法,得到适合本文的评价方法。
    

    模型的求解

    通过对羊的运动轨迹进行分析,结合犬对于羊的限制条件,结合问题一与问题二中的条件,结合随机森林算法对羊的路线进行分析,以羊的运动轨迹坐标作为数据集,建立随机森林模型,使用 matlab 进行求解,最终得到羊通过训练后实现逃逸的路线。

    在这里插入图片描述

    部分程序如下所示:

    import pandas as pd
    from sklearn import preprocessing
    from sklearn.ensemble import RandomForestRegressor
    from sklearn.datasets import load_boston
    boston_house = load_boston()
    boston_feature_name = boston_house.feature_names
    boston_features = boston_house.data
    boston_target = boston_house.target
    rgs = RandomForestRegressor(n_estimators=15)  ##随机森林模型
    rgs = rgs.fit(boston_features, boston_target)
    rgs.predict(boston_features)
    from sklearn import tree
    rgs2 = tree.DecisionTreeRegressor()           ##决策树模型,比较两个模型的预测结果!
    rgs2.fit(boston_features, boston_target)
    rgs2.predict(boston_features)
    
    #构造data子集
    def get_subsample(dataSet,ratio):
        subdataSet=[]
        lenSubdata=round(len(dataSet)*ratio)
        while len(subdataSet) < lenSubdata:
            index=randrange(len(dataSet)-1)
            subdataSet.append(dataSet[index])
        #print len(subdataSet)
        return subdataSet
     
    #选取任意的n个特征,在这n个特征中,选取分割时的最优特征
    def get_best_spilt(dataSet,n_features):
        features=[]
        class_values=list(set(row[-1] for row in dataSet))
        b_index,b_value,b_loss,b_left,b_right=999,999,999,None,None
        while len(features) < n_features:
            index=randrange(len(dataSet[0])-1)
            if index not in features:
                features.append(index)
        #print 'features:',features
        for index in features:
            for row in dataSet:
                left,right=data_spilt(dataSet,index,row[index])
                loss=spilt_loss(left,right,class_values)
                if loss < b_loss:
                    b_index,b_value,b_loss,b_left,b_right=index,row[index],loss,left,right
        #print b_loss
        #print type(b_index)
        return {'index':b_index,'value':b_value,'left':b_left,'right':b_right}
    

    解题关键:

    print("文档及全部程序请联系博主:qq2534659467")
    
    展开全文
  • 由于用机器学习方法求解诸如最优控制、微分对策这样具有连续动作和状态的问题时,效率(效果/算力)较低,特殊的微分对策问题将是测试机器学习方法的竞争案例。 一个古老的羊-犬博弈问题:羊在半径为R的圆形圈内...

    由于用机器学习方法求解诸如最优控制、微分对策这样具有连续动作和状态的问题时,效率(效果/算力)较低,特殊的微分对策问题将是测试机器学习方法的竞争案例。

    一个古老的羊-犬博弈问题:羊在半径为R的圆形圈内具有定常速率v和满足以下限制的任意转弯能力:逃逸路径上每一点与圆心的距离随时间单调不减。羊逃出圆形圈则胜。犬沿着圆周以定常速率V围堵以防止羊逃逸,任何时刻具有选择圆周的两个方向之一的能力。

    任务:

    1. 通过运动学精确建模求解犬的最优围堵策略;

    2. 假设犬以最优策略围堵,基于精确建模求解羊可以逃逸胜出的条件;

    3. 假设羊理解自己的能力、限制和躲避犬围堵而逃逸的目标,但不具备基于运动学的最优化决策知识,假设2中羊可以逃逸的条件被满足,给出一种机器学习方法,使得羊通过学习训练后实现逃逸;

    4. 设计一套评价体系,定量评价3中给出的机器学习方法的学习能力;

    5. 提出并定量评价更多的羊逃逸机器学习方法。

    解题思路、选题思路关注微信公众号 爱数模的小驴

    A题-火星探测器着陆控制方案
    B题-背向瑞利散射光纤激光传感器设计
    C题-配电网可靠性和故障软自愈研究
    D题-基于一个微分对策问题的机器学习能力定量评价

    展开全文
  • 借鉴微分对策的思想,结合最优控制理论中Pontryagin极大值原理和 van Loon路径耦合方法,研究了两家股份制企业之间不断协调和相互适应的博弈过程;突破了传统 Cournot模型只能进行均衡分析的局限性。参与博弈的企业通过...
  • 灰色预测模型主要内容: GM(1,1)模型(1阶1个影响因素); 离散灰色模型(解决GM(1,1)中的理论缺陷); GM(1,N)模型(多个变量影响); GM(n,h)模型(多个变量高阶...微分方程——影子方程 根据已知数据,通...

    灰色预测模型主要内容:

    1. GM(1,1)模型(1阶1个影响因素);
    2. 离散灰色模型(解决GM(1,1)中的理论缺陷);
    3. GM(1,N)模型(多个变量影响);
    4. GM(n,h)模型(多个变量高阶影响);
    5. 多变量离散灰色模型(解决GM(n,h)中的理论缺陷);

    1.GM(1,1)模型内容

    差分方程;

    取均值作中间状态,减少误差;——背景值

    微分方程——影子方程

    根据已知数据,通过软件求出a,b参数后,需要通过关联度来判断预测方程的准确程度,如下例:

    2.灰色预测模型扩展及应用

    (1)灰色预测模型扩展

    1)残差GM(1,1)模型

    数据选取太长时,会出现估计不准情况,所以引申出残差模型。

    之所以选择时间分段,很可能是因为数据选择过长,而这一长段数据不能用同一模型描述,出现模型分段现象。这时使用CM(1,1)残差模型可增加数据预测的准确性。

    这也是灰度预测模型的难点之一:到底选取多少个数据是准确的。(通常选取4个或5个,但很难准确确定某个数)

    2)GM(1,1)模型群

    (2)GM(1,1)模型应用:数列预测、区间预测(比例带/包络带/发展带)、灾变预测、波形预测。

    1)区间预测——比例带:

    2)区间预测——包络带:

    3)区间预测——发展带:

    4)灾变预测

    灾变预测实质上是异常值预测,主要是给出下一个或几个异常值出现的时刻,以便人们提前准备,采取对策。

    上灾变序列和下灾变序列统称灾变序列。灾变预测就是通过对灾变序列的研究,寻找其规律性,预测以后若干次灾变发生的日期。实例:

    然后进行GM(1,1)建模,预测下一个灾害年份。

    5)波形预测

    当原始数据频频波动且摆动幅度较大时,往往难以找到合适的模拟模型,因此可以考虑根据原始数据的波形预测未来行为数据发展变化的波形。思想是:找出等高线。

     

    3.灰色预测中的累加生成建模思想

    灰色预测模型通过数据处理来分析和对待随机量,即通过数据到数据的“映射”、时间序列到时间序列的“映射”来处理和发现规律。通过映射把原来存在扰动项的微分相互抵消掉。右边图示是处理后的结果,可以看出数据的明显变化趋势。

    展开全文
  • 过拟合是指学习模型对训练样本预测得很好,但对新样本预测很差的现象。这通常是由于学习模型能力过于强大,以至于把训练样本自身的一些特点当做了一般性质。 过拟合是无法彻底避免的,只能缓解。模型选择就是要旨在...
  • 数学建模第十讲的博弈模型.ppt
  • 7第七章 对策论 8第八章 层次分析法 9第九章 插值与拟合 10第十章 数据的统计描述和分析 11第十一章 方差分析 12第十二章 回归分析 13第十三章 微分方程建模 14第十四章 稳定状态模型 15第十五章 常微分方程的解法...
  • 对策也叫博弈 , 是自古以来的政治家和军事家都很注意研究的问题。 作为一门正式学科,是在20世纪40年代形成并发展起来的。直到1944年冯·诺依曼(von Neumann) 与摩根斯特恩(O .Morgenstern)的《博弈论与经济行为》一...
  • 本文总结了常用的数学模型方法和它们的主要用途,主要包括数学和统计上的建模方法,关于在数学建模中也挺常用的机器学习算法暂时不作补充,以后有时间就补。至于究竟哪个模型更好,需要用数据来验证,还有求解方法也...
  • 30个重要数学模型

    2014-12-10 15:17:45
    第07章 对策论 第08章 层次分析法 第09章 插值与拟合 第10章 数据的统计描述和分析 第11章 方差分析 第12章 回归分析 第13章 微分方程建模 第14章 稳定状态模型 第15章 常微分方程的解法 第16章 差分方程模型 第17章...
  • 线性规划、常微分方程的解法、马氏链模型、神经网络模型、偏最小二乘、回归时间序列、灰色系统理论及其应用、对策论、排队论、方差分析等29个数学建模必备通用模型及matlab解法
  • 第七章 对策论 第八章 层次分析法 第九章 插值与拟合 第十章 数据的统计描述和分析 第十一章 方差分析 第十二章 回归分析 第十三章 微分方程建模 第十四章 稳定状态模型 第十五章 常微分方程的解法 第十六章 差分...
  • 算法大全第07章_对策论.pdf 算法大全第08章-层次分析法.pdf 算法大全第09章_插值与拟合.pdf 算法大全第10章_数据的统计描述和分析.pdf 算法大全第11章_方差分析.pdf 算法大全第12章_回归分析.pdf 算法大全第13...
  • 算法与程序大全电子书(线性规划、整数规划、非线性规划、动态规划、图与网络、排队论、对策论、层次分析法、插值与拟合、数据的统计描述和分析、方差分析、回归分析、微分方程建模、稳定状态模型、常微分方程解法、...
  • 包括回归分析、方差分析、层次分析法、线性规划、动态规划、排队论、马氏链模型、时间序列模型、多元分析、偏最小二乘回归、模糊数学模型、神经网络模型对策论、微分方程建模、差分模型等,共30个
  • 含线性/非线性规划、整数规划、动态规划、图与网络、排队论、对策论、层次分析法、插值与拟 合、方差分析、微分方程建模、稳定状态模型、马氏链模型、变分法模型、神经网络模型、现代优化算法、 模糊数学模型、偏...
  • 逻辑斯谛回归(Logistic Regression)【又名逻辑回归,对率回归,对数几率回归】:函数、模型及其理论内涵 逻辑斯谛函数(logistic function)【即sigmoid函数】:函数形式的来源 逻辑斯谛函数的形式为: h(z...
  • 数学模型简介 数学建模过程介绍 数学模型求解的基本方法 数学建模与数学软件系统的使用 数学建模论文或报告的写法简介 数学建模参赛队的组队方法 差分方法建模实例

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 401
精华内容 160
关键字:

微分对策模型