精华内容
下载资源
问答
  • 对策论概念
    2021-10-13 19:32:17

    对策论(博弈论)基础

    谈到对策论,必须要讨论一个囚徒困境的例子,首先由两个人,他们犯罪了,他们两个都有选择,招供或者不招供,如果两个都招供,则都判刑为5年。如果两个都不招,就判2年,如果一个招一个不招,就一个6年(不招)一个2年,从个人的角度来看,招供都是最好的选择,但从整体来看就是都不招,所以就有专家提出了Nash均衡。这里(5,5)就是Nash均衡,所以可以看出Nash均衡,怎么取得最优解,其实商量出一个方案是最重要的,但这里又存在一个问题,那就是其中一个人欺骗另一个人怎么办呢,所以就存在另一个问题,那就是多次博弈

    从上面的例子可以看出博弈其实分为了单次博弈 和 多次博弈两种情况,就这篇文章而言,我只讨论单次博弈

    对策行为的基本要素有:

    • 局中人(有限个)

    • 策略集(表示某人拥有的决策数量)
      假如使用 S i 表示为i的策略集,其中  i 表示人数,则我们可能得到如下策略情况: \text{假如使用}S_i\text{表示为i的策略集,其中\ }i\text{表示人数,则我们可能得到如下策略情况:} 假如使用Si表示为i的策略集,其中 i表示人数,则我们可能得到如下策略情况:
      S 1 = { α 1 , α 2 , α 3 , α 4 , α 5 } S_1=\left\{ \alpha _1\text{,}\alpha _2\text{,}\alpha _3\text{,}\alpha _4\left. \text{,}\alpha _5 \right\} \right. S1={α1α2α3α4α5}
      . . . ... ...
      S n = { β 1 , β 2 } S_n=\left\{ \beta _1,\beta _2 \right\} Sn={β1,β2}

    而在游戏中,每个人出一个策略,则可以构成每局游戏中的一个策略组:
    s = { s 1 , s 2 , . . . . , s n } s=\left\{ s_1,s_2,....,s_n \right\} s={s1,s2,....,sn}
    而每个人所有的策略的数量的累乘就是 我们这一局策略总体总和,而有策略就必然有胜负,所以这里就存在了一个映射关系,叫做赢得函数(支付函数),但注意这里谁赢谁输是站在不同的角度上来看的,而且函数的是基于模型来说的, 所以我们之前的策略也要数字化,同时我们得到的这个函数的矩阵我们也需要数字化,例如,你赢为1,平为0,输为-1.
    H ( s )   =  胜负的结果 H\left( s \right) \ =\ \text{胜负的结果} H(s) = 胜负的结果
    放到优化里面,多人博弈就看成了这样的情况,一方不想输,所以努力去找自己的损失最小的值,一方想赢努力去找自己的利益最大值

    对策问题的分类

    主要是为了点明咱们的研究领域,关键因素有:

    • 人数: 二人对策 多人对策 无穷对策
    • 合作:合作博弈 非合作博弈
    • 策略集:有限对策 无限对策
    • 赢得函数:零和对策 非零和对策 (站在谁的角度上去考虑!!!)

    注意:对于二人零和博弈的时候,要注意双方的赢得矩阵要满足这样的一个公式,才是二人零和博弈
    A 2 = − A 1 τ A_2=-A_{1}^{\tau} A2=A1τ

    怎么找到矩阵的最优解(最有纯策略)

    • 首先必须先定义什么是最优解(理想解),即求得最有纯策略,当一方选择了一种策略,逼得另一方只能选择某一中策略(改策略损失最小),即我的利益不一定最大,但可以接受,但对方绝对不好受。

    • 判断解是否存在

    • 判断解是否存在A=\left{ a_{ij} \right} 通过上面最优解的定义,所以我们可以在列中选择一个最小值,然后在行中选择一个最大值。然后在行中选择一个最大值,然后在列中选择一个最小值。如果这两个值相等,则该值就是最优解,数学公式如下:

    A = { a i j } A=\left\{ a_{ij} \right\} A={aij}

    max ⁡ i min ⁡ j   a i j   =   min ⁡ j max ⁡ i   a i j   =   a i ∗ a j ∗ \max _i\min _j\ a_{ij}\ =\ \min _j\max _i\ a_{ij}\ =\ a_{i}^{*}a_{j}^{*} imaxjmin aij = jminimax aij = aiaj

    从函数上来看,这个解存在数值意义如下,从几何上来看,该值在一个马鞍面的中间最低的位置点上
    f ( i , j ∗ ) ≤ f ( i ∗ , j ∗ ) ≤ f ( i ∗ , j ) f\left( i,j^* \right) \le f\left( i^*,j^* \right) \le f\left( i^*,j \right) f(i,j)f(i,j)f(i,j)
    但是这里存在一个问题,也是刚才跳过的一部分,是不是所有的问题都存在最有纯策略,显然不是所有问题都有最优纯策略,那我们怎么去判断,所以我们需要有一个方法去判断:
    H ( x , y ) 有鞍点 < = = > 有解 H\left( x,y \right) \text{有鞍点}<==>\text{有解} H(x,y)有鞍点<==>有解
    但其实在现实生活中,这个方法很耍流氓,因为根本无法使用,所以我们只能先按照它有解去算,如果算出来,左右不相等,就证明其无最优纯策略,需要另寻他法

    矩阵对策–混合策略

    首先我们将博弈的对象设置为2,即这里演变为一个二人博弈:
    S 1 = { α 1 , α 2 , α 3 , α 4 } S_1=\left\{ \alpha _1,\alpha _2,\alpha _3,\alpha _4 \right\} S1={α1,α2,α3,α4}
    S 2 = { β 1 , β 2 , β 3 } S_2=\left\{ \beta _1,\beta _2,\beta _3 \right\} S2={β1,β2,β3}
    s = { s 1 , s 2 } s=\left\{ s_1,s_2 \right\} s={s1,s2}

    上一节我们讨论到了如果最优纯策略失效以后,我们应该怎么办,其实我们可以换一个思路来看,最优纯策略是不是在选择以后,是不是对方选定的策略是百分之百,而最优纯策略失效以后,就是说我们选什么对方选的策略都不是百分之百,但是我们可以得到一个以下的关系,即选择的概率加起来是百分之百的,并且我们计算每个选择的策略的概率是多少。
    P ( α 1 ) + P ( α 2 ) + P ( α 3 ) + P ( α 4 ) = 1 P\left( \alpha _1 \right) +P\left( \alpha _2 \right) +P\left( \alpha _3 \right) +P\left( \alpha _4 \right) =1 P(α1)+P(α2)+P(α3)+P(α4)=1
    P ( β 1 ) + P ( β 2 ) + P ( β 3 ) = 1 P\left( \beta _1 \right) +P\left( \beta _2 \right) +P\left( \beta _3 \right) =1 P(β1)+P(β2)+P(β3)=1

    而通过每个策略的概率乘以对应的矩阵值,我们可以得到一个期望值,这个也可以视为一个最优的情况,这就是矩阵的混合策略
    a 1 P ( α 1 ) + a 2 P ( α 2 ) + a 3 P ( α 3 ) + a 4 P ( α 4 ) = E X a_1P\left( \alpha _1 \right) +a_2P\left( \alpha _2 \right) +a_3P\left( \alpha _3 \right) +a_4P\left( \alpha _4 \right) =EX a1P(α1)+a2P(α2)+a3P(α3)+a4P(α4)=EX
    但是注意这只是一个数学上存在意义的方法,但在实际生活中,这个意义就很难说了,因为概率的选择是很关键的,而且概率这门学科是从数学的意义出发的,但在实际生活中,很难达到那种要求。而且概率的选择很可能占有很多主观性

    推广

    我们将原来的问题进行推广和细化,假如存在两个人,有如下策略集,同时我们增加了两个变量x和y,一人对应一个(其相对的可能性):
    S 1 = { α 1 , α 2 , α 3 , . . . , α n } S_1=\left\{ \alpha _1,\alpha _2,\alpha _3,...,\alpha _n \right\} S1={α1,α2,α3,...,αn}
    x = { x 1 , x 2 , x 3 , . . . , x n } x=\left\{ x_{1,}x_2,x_3,...,x_n \right\} x={x1,x2,x3,...,xn}
    S 2 = { β 1 , β 2 , β 3 , . . . , β m } S_2=\left\{ \beta _1,\beta _2,\beta _3,...,\beta _m \right\} S2={β1,β2,β3,...,βm}
    y = { y 1 , y 2 , y 3 , . . . , y m } y=\left\{ y_{1,}y_2,y_3,...,y_m \right\} y={y1,y2,y3,...,ym}

    上面的x和y的括号应该是“()”,这个时候我们可以得到一个新的策略关系,得到不再是赢得矩阵A,而是期望值E:
    对 G = { S 1 , S 2 , A } 进 行 扩 展 对 G=\left\{ S_{1},S_{2},A \right\}进行扩展 G={S1,S2,A}
    G ∗ = { S 1 ∗ , S 2 ∗ , E } G^*=\left\{ S_{1}^{*},S_{2}^{*},E \right\} G={S1,S2,E}
    其中 E 表示期望 \text{其中}E\text{表示期望} 其中E表示期望
    S 1 ∗ 表示为一个 n 维的向量的集合,维数由 S 1 的策略个数决定。注意x是无数个,数学上表示为 S_{1}^{*}\text{表示为一个}n\text{维的向量的集合,维数由}S_1\text{的策略个数决定。注意x是无数个,数学上表示为} S1表示为一个n维的向量的集合,维数由S1的策略个数决定。注意x是无数个,数学上表示为
    S 1 ∗ = { x ∈ E n ∣ x i ≥ 0 , ∑ i = 1 n x i = 1 } S_{1}^{*}=\left\{ x\in E^n|x_i\ge 0,\sum_{i=1}^n{x_i=1} \right\} S1={xEnxi0,i=1nxi=1}
    同理: S 2 ∗ = { y ∈ E m ∣ y i ≥ 0 , ∑ i = 1 m y i = 1 } \text{同理:}S_{2}^{*}=\left\{ y\in E^m|y_i\ge 0,\sum_{i=1}^m{y_i=1} \right\} 同理:S2={yEmyi0,i=1myi=1}

    那接下来我们继续去找鞍点(思路不变),我们要把它按照几何图形找出来,利用线性代数中的特征值与二次型,即:
    E ( X , Y ) = X τ A Y E\left( X,Y \right) =X^{\tau}AY E(X,Y)=XτAY

    注意这里的鞍点是一定存在的,有相关资料已经证明了。通过带入x y进行计算以后,我们可以得到一个关于x y的关系式,我们可以针对E(X,Y)求得其最大值。或者使用求偏导的方法去求解

    矩阵对策的基本定理
    • 混合策略点总是存在的

    • 有解<=>有鞍点

    • 假如存在两个策略
      G 1 = { S 1 , S 2 , A 1 } G_1=\left\{ S_1,S_2,A_1 \right\} G1={S1,S2,A1}
      G 2 = { S 1 , S 2 , A 2 } G_2=\left\{ S_1,S_2,A_2 \right\} G2={S1,S2,A2}

    则他们的关系如下:
    A 2 = A 1 + L A_2=A_1+L A2=A1+L
    同时他们的解集相同,所以可以帮助来化解问题,相似的数乘,也不会改变解集,都可以帮助来化简

    • 优超于的概念:
      • 对于行来说:就是该行的所有值都大于等于另一行的值,则该行优超于另一行
      • 对于列来说:就是该列的所有值都小于等于另一列的值,则该列优超于另一列
      • 同时这样也可以扩展到线性组合上面,即一行加到另一行,实现优超(线性优超)

    该行优超于其他行,则被优超的那行是可以去掉的,这可以用来降维

    更多相关内容
  • 对策论的基本概念.pptx
  • 引入了集值映射不动点在图象意义下的Tikhonov良定性概念.此概念是Lemaire等提出的单值映射不动点概念...最后,作为在对策论中的应用,导出了n人有限非合作对策关于Nash平衡点和n人非合作多目标对策关于弱Pareto-Nash平
  • 摘要网络金融安全问题是特定历史发展阶段的问题是应对金融全球化负面影响的产物网上银行的安全既是用户最关心的问题也是舆论长期关注的焦点文章首先探讨网络金融概念特点继而分析我国网络金融安全现状最后提出改善...
  • 博弈论 / 对策论

    万次阅读 多人点赞 2019-04-22 17:15:05
    1 引言 社会及经济的发展带来了人与人之间或团体之间的竞争及...现代对策论起源于 1944 年 J.,Von Neumann 和 O.,Morgenstern 的著作《Theory of Games and Economic Behavior》。 对策论亦称竞赛论或博弈论。...

    1 引言 

    社会及经济的发展带来了人与人之间或团体之间的竞争及矛盾,应用科学的方法来 解决这样的问题开始于 17 世纪的科学家,如 C.,Huygens 和 W.,Leibnitz 等。现代对策论起源于 1944 年 J.,Von Neumann 和 O.,Morgenstern 的著作《Theory of Games and Economic Behavior》。

    对策论亦称竞赛论或博弈论。是研究具有斗争或竞争性质现象的数学理论和方法。 一般认为,它既是现代数学的一个新分支,也是运筹学中的一个重要学科。对策论发展 的历史并不长,但由于它所研究的现象与人们的政治、经济、军事活动乃至一般的日常 生活等有着密切的联系,并且处理问题的方法又有明显特色。所以日益引起广泛的注意。

    深度学习的生成对抗网络的目标函数就是这个原理:二人零和博弈思想,用极大极小原理来判断某个对策是否有鞍点

    在日常生活中,经常看到一些具有相互之间斗争或竞争性质的行为。具有竞争或对抗性质的行为称为对策行为。在这类行为中。参加斗争或竞争的各方各自具有不同的目标和利益。为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案。对策论就是研究对策行为中斗争各方是否 存在着最合理的行动方案,以及如何找到这个合理的行动方案的数学理论和方法。 

    目录

    1 引言 

    2 对策问题           例题1 囚徒的困境

    2.1  对策的基本要素     (i)局中人  (ii)策略集(iii) 赢得函数(支付函数)  

    2.2 零和对策(矩阵对策)           例题2  

    什么是鞍点    最优纯策略 

    极大极小原理-----判断某个对策是否有鞍点       对策问题的多个解之间的关系(两条性质)

    3 零和对策的混合策略 

    3.1 零和对策的混合策略               3.2 混合策略对策问题的鞍点           例题3 

    3.3 关于对策解集性质的主要结果的三个定理

    4 零和对策的线性规划解法  例题4 

     5 二人非常数和对策 

    5.1 常数和对策                    5.2 纯策略问题 ---分析囚徒困境

    5.3 双矩阵对策   5.4 Nash平衡点 / 纳什均衡

    5.5 混合对策问题 

    (1) 混合对策问题的基本概念:赢得值         (2)混合对策问题的求解方法        例题5           习题


    2 对策问题 

    对策问题的特征是参与者为利益相互冲突的各方,其结局不取决于其中任意一方的努力而是各方所采取的策略的综合结果。 先考察一个实际例子。 

    例题1 囚徒的困境

     警察同时逮捕了两人并分开关押,逮捕的原因是他们持有大量伪币,警方怀疑他们伪造钱币,但没有找到充分证据,希望他们能自己供认,这两个 人都知道:如果他们双方都不供认,将被以持有大量伪币罪被各判刑 18 个月;如果双 方都供认伪造了钱币,将各被判刑 3 年;如果一方供认另一方不供认,则供认方将被从 宽处理而免刑,但另一方面将被判刑 7 年。将嫌疑犯 A、B 被判刑的几种可能情况列于表 1。

    表 1 中每对数字表示嫌疑犯 A、B 被判刑的年数。如果两名疑犯均担心对方供认并希 望受到最轻的惩罚,最保险的办法自然是承认制造了伪币。     从这一简单实例中可以看出对策现象中包含有的几个基本要素。

    2.1  对策的基本要素 

    (i)局中人 

    (ii)策略集

    (iii)赢得函数(支付函数) 

    本节我们只讨论有两名局中人的对策问题,其结果可以推广到一般的对策模型中 去。 

    2.2 零和对策(矩阵对策)

    零和对策是一类特殊的对策问题。在这类对策中,只有两名局中人,每个局中人都 只有有限个策略可供选择。在任一纯局势下,两个局中人的赢得之和总是等于零,即双 方的利益是激烈对抗的。 

    例题2  

     

    什么是鞍点

    最优纯策略

    极大极小原理-----判断某个对策是否有鞍点

    给定一个对策G ,如何判断它是否具有鞍点呢?为了回答这一问题,先引入下面 的极大极小原理。 

        上述定理给出了对策问题有稳定解(简称为解)的充要条件

    对策问题的多个解之间的关系(两条性质)

      当对策问题有解时, 其解可以不唯一,当解不唯一时,解之间的关系具有下面两条性质: 

    3 零和对策的混合策略 

    具有稳定解的零和问题是一类特别简单的对策问题,它所对应的赢得矩阵存在鞍 点,任一局中人都不可能通过自己单方面的努力来改进结果。然而,在实际遇到的零和对策中更典型的是 μ + ν ≠ 0 的情况。由于赢得矩阵中不存在鞍点,此时在只使用纯策略的范围内,对策问题无解

    3.1 零和对策的混合策略

    3.2 混合策略对策问题的鞍点

     使用纯策略的对策问题(具有稳定解的对策问题)可以看成使用混合策略的对策问 题的特殊情况,相当于以概率 1 选取其中某一策略,以概率 0 选取其余策略。

    例题3 

     

    3.3 关于对策解集性质的主要结果的三个定理

    4 零和对策的线性规划解法

    例题4 

    编写程序如下: 

    clear 
    a=[1/3,1/2,-1/3;-2/5,1/5,-1/2;1/2,-3/5,1/3];b=10; 
    a=a+b*ones(3);   %把赢得矩阵的每个元素变成大于0的数 
    [x0,u]=linprog(ones(3,1),-a',-ones(3,1),[],[],zeros(3,1)); 
    x=x0/u,u=1/u-b 
    [y0,v]=linprog(-ones(3,1),a,ones(3,1),[],[],zeros(3,1)); 
    y=y0/(-v),v=1/(-v)-b 

    下面我们使用式(2)和(3),利用 LINGO 编程求例 4 的解。LINGO 程序如下: 

    model: 
    sets: 
    player1/1..3/:x; 
    player2/1..3/:y; 
    game(player1,player2):c; 
    endsets 
    data: 
    ctrl=?; !ctrl取1求局中人1的策略,ctrl取0求局中人2的策略; 
    c=0.3333333 0.5 -0.3333333 
    -0.4 0.2 -0.5 
    0.5 -0.6 0.3333333; 
    enddata 
    max=u*ctrl-v*(1-ctrl); 
    @free(u);@free(v); 
    @for(player2(j):@sum(player1(i):c(i,j)*x(i))>u); 
    @for(player1(i):@sum(player2(j):c(i,j)*y(j))<v); 
    @sum(player1:x)=1; 
    @sum(player2:y)=1; 
    end 

    由定理4知,混合对策问题的求解问题可以转化为求不等式约束的可行点,而 LINGO软件很容易做到这一点。我们编写如下Lingo程序求解上述问题。 

    model: 
    sets: 
    player1/1..3/:x; 
    player2/1..3/:y; 
    game(player1,player2):c; 
    endsets 
    data: 
    c=0.3333333 0.5 -0.3333333 
      -0.4 0.2 -0.5 
      0.5 -0.6 0.3333333; 
    enddata 
    @free(u); 
    u=@sum(game(i,j):c(i,j)*x(i)*y(j)); 
    @for(player1(i):@sum(player2(j):c(i,j)*y(j))<u); @for(player2(j):@sum(player1(i):c(i,j)*x(i))>u); 
    @sum(player1:x)=1; 
    @sum(player2:y)=1; 
    end 

     

     5 二人非常数和对策 

    5.1 常数和对策

    所谓常数和对策是指局中人I和局中人II所赢得的值之和为一个常数。显然,二人零和对策是二人常数和对策的特例,即常数为零。 对于二人常数和对策,有纯策略对策混合策略对策,其求解方法与二人零和对策是相同的。 二人非常数和对策也称为双矩阵对策。也有纯策略对策和混合策略对策两种策略。

    5.2 纯策略问题 ---分析囚徒困境

    例1给出了典型的二人非常数和对策,每人的赢得矩阵是不相同的,因此称为双矩阵对策

    问题分析: 这是一个二人非常数和对策问题。从表面上看,两犯罪嫌疑人拒不供认,只能被判18个月徒刑,结果是最好的。但仔细分析,却无法做到这一点。因为犯罪嫌疑人A如 果采用不供认策略,他可能被判刑的刑期为18个月或7年,而犯罪嫌疑人B 可能判的刑 期为0或18个月。而 A选择供认,他被判的刑期为0或3年,此时,犯罪嫌疑人B 可能判 的刑期为3年或7年。因此,犯罪嫌疑人 A一定选择供认。基于同样的道理,犯罪嫌疑 人B 也只能选择供认。 选择供认是他们最好的选择,各自被判3年。

    5.3 双矩阵对策 

    5.4 Nash平衡点 / 纳什均衡

    5.5 混合对策问题 

    如果不存在使式(4)成立的对策,则需要求混合对策。类似于二人零和对策情况, 需要给出混合对策的最优解。 

    (1) 混合对策问题的基本概念:赢得值

    对于混合对策问题有如下定理

    (2)混合对策问题的求解方法 

    由定义6可知,求解混合对策就是求非合作对策的平衡点,进一步由定理8得到, 求解非合作对策的平衡点,就是求解满足不等式约束(5)的可行点。因此,混合对策问题的求解问题就转化为求不等式约束(5)的可行点,而LINGO软件可以很容易做到 这一点。

    例题5  

    有甲、乙两支游泳队举行包括三个项目的对抗赛。这两支游泳队各有一名健 将级运动员(甲队为李,乙队为王),在三个项目中成绩都很突出,但规则准许他们每 人只能参加两项比赛,每队的其他两名运动员可参加全部三项比赛。已知各运动员平时 成绩(秒)见表 3。 

     

    clc,clear 
    a=[59.7 63.2 57.1 58.6 61.4 64.8
     67.2 68.4 63.2 61.5 64.7 66.5 
    74.1 75.5 70.3 72.6 73.4 76.9]; 
    m=3;n=3;kk=3;T=1000; 
    sc1=[5:-2:1,zeros(1,3)]; %1-6 名的得分 
    sc2=repmat(sc1,kk,1); 
    for i=1:m     
        for j=1:n         
            b=a;         
            b(i,3)=T;b(j,4)=T; %不参加比赛,时间成绩取为充分大          
            [b,ind]=sort(b,2); %对 b 的每一行进行排序         
            for k=1:m             
                sc2(k,ind(k,:))=sc1; %计算得分         
            end         
            A_sc(i,j)=sum(sum(sc2(:,1:m)));  %统计得分 
            B_sc(i,j)=sum(sum(sc2(:,m+1:end)));     
        end    
    end 
    A_sc,B_sc 
    fid=fopen('txt2.txt','w'); 
    fprintf(fid,'%f\n',A_sc'); 
    fwrite(fid,'~','char');       %往纯文本文件中写 LINGO 数据的分割符 fprintf(fid,'%f\n',B_sc'); 
    fclose(fid); 

    按照定理8,求最优混合策略,就是求不等式约束(5)的可行解,写出相应的LINGO 程序如下:

    model: 
    sets: 
    pa/1..3/:x; 
    pb/1..3/:y; 
    link(pa,pb):c1,c2; 
    endsets 
    data: 
    c1=@file(txt2.txt); 
    c2=@file(txt2.txt); 
    enddata 
    v1=@sum(link(i,j):c1(i,j)*x(i)*y(j)); 
    v2=@sum(link(i,j):c2(i,j)*x(i)*y(j)); 
    @for(pa(i):@sum(pb(j):c1(i,j)*y(j))<v1); 
    @for(pb(j):@sum(pa(i):c2(i,j)*x(i))<v2); 
    @sum(pa:x)=1;@sum(pb:y)=1; 
    @free(v1);@free(v2); 
    end 

     

    习题

     

    展开全文
  • 基于RFID的物联网感知层信息安全对策论文 最近几年以来计算机和网络技术的迅速发展带动了以Inter为基础的物联网也进入到快速发展的轨道二十世纪末就已经提出来了物联网的概念然而物联网进入普通民众视野则是最近几年...
  • 针对大学生心理健康问题,研究了有效对策的原因,并提出了解决大学生心理健康问题的建议。 本文认为,当前的心理健康问题是复杂多样的,主要是由社会环境,负能量导向教育,家庭教育和中学生自我概念发展失衡四个...
  • 对策也叫博弈 , 是自古以来的政治家和军事家都很注意研究的问题。 作为一门正式学科,是在20世纪40年代形成并发展起来的。直到1944年冯·诺依曼(von Neumann) 与摩根斯特恩(O .Morgenstern)的《博弈与经济行为》一...

    对策也叫博弈 , 是自古以来的政治家和军事家都很注意研究的问题。 作为一门正式学科,是在20世纪40年代形成并发展起来的。直到1944年冯·诺依曼(von Neumann) 与摩根斯特恩(O .Morgenstern)的《博弈论与经济行为》一书出版,标志着现代系统博弈理论的初步形成。书中提出的标准型、扩展型和合作型博弈模型解的概念和分析方法 , 奠定了这门学科的理论基础 , 成为使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论。然而 , 诺依曼的博弈论的局限性也日益暴露出来。由于它过于抽象 , 使应用范围受到很大限制,所以影响力很有限。20世纪50年代,纳什( Nash)建立了非合作博弈的“纳什均衡”理论, 标志着博弈的新时代开始 , 是纳什在经济博弈论领域划时代的贡献 , 是继冯·诺依曼之后最伟大的博弈论大师之一。1994年纳什获得了诺贝尔经济学奖。他提出的著名的纳什均衡概念在非合作博弈理论中起着核心作用。由于纳什均衡的提出和不断完善 , 为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础。

    对策论基础

    对策论亦称竞赛论或博弈论, 是研究具有斗争或竞争性质现象的数学理论和方法。 一般认为 , 它是现代数学的一个新分支 , 是运筹学的一个重要学科。对策论发展的历史并 不长, 但由于它研究的问题与政治、经济、军事活动乃至一般的日常生活等有着密切联系,并且处理问题的方法具有明显特色 , 所以日益引起广泛注意。

    在日常生活中, 经常会看到一些相互之间具有斗争或竞争性质的行为 , 如下棋、打牌、 体育比赛等。还比如战争活动中的双方 , 都力图选取对自己最有利的策略, 千方百计去战胜对手。在政治方面 , 国际间的谈判 , 各种政治力量之间的 斗争 , 各国际集团之间的斗 争等无一不具有斗争的性质。在经济活动中, 各国之间、各公司企业之间的经济谈判 , 企业之间为争夺市场而进行的竞争等 , 举不胜举。

    具有竞争或对抗性质的行为称为对策行为。在这类行为中 , 参加斗争或竞争的各方各自具有不同的目标和利益。为了达到各自的目 标和利益 , 各方必须考虑对手的各种可能的行动方案 , 并力图选取对自己最有利或最合理的方 案。对策论就是研究对策行为中斗争各方是否存在着最合理行动方案 , 以及如何找到最合理行动方案的数学理论和方法。

    以下称具有对策行为的模型为对策模型或对策。 对策模型的种类可以千差万别 , 但本质上都必须包括以下三个基本要素。

    1. 局中人

    在一个对策行为(或一局对策)中,有权决定自己行动方案的对策参加者, 称为局中人。通常用 I 表示局中人的集合。如果有n个局中人, 则 I = {1, 2, ⋯, n}。一般要求一个对策中至少要有两个局中人。对策中关于局中人的概念具有广义性,也就是不一定具体到人,也可以是组织,团地。需要强调的一点是 , 在对策中总是假定每一个局中人都是“ 理智的”决策者或竞争者 , 即对任一局中人来讲 , 不存在利用其他局中人决策的失误来扩大自身利益的可能性。

    2. 策略集

    一局对策中, 可供局中人选择的一个实际可行的完整的行动方案称为一个策略。 参加对策的每一局中人i,i∈I,都有自己的策略集 Si。一般,每一局中人的策略集中至少应包括两个策略。

    3. 赢得函数(支付函数)

    在一局对策中,各局中人选定的策略形成的策略组称为一个局势, 即若Si是第i个局中人的一个策略,则 n个局中人的策略组:s=(s1 ,s2 ,⋯,sn)就是一个局势。全体局势的集合S可用各局中人策略集的笛卡儿积表示 , 即S= S1×S2×⋯×Sn,当一个局势出现后,对策的结果也就确定了。也就是说, 对任一局势 s∈ S, 局中人i可以得到一个赢得值 Hi (s)。显然, Hi (s)是局势 s的函数,称为第 i个局中人的赢得函数。

    在齐王与田忌赛马的例子中,局中人集合为 I={1,2},齐王和田忌的策略集可分别 用 S1 ={a1 ,a2 , a3 , a4 ,a5 ,a6 }和 S2 ={β1 ,β2 ,β3 ,β4 ,β5 ,β6 }表示。这样,齐王的任一策略 ai 和田忌的任一策略βj 就形成了一个局势sij。如果a1=(上,中,下),β1 =(上,中,下),则在局 势 s11下齐王的赢得值为H1(s11) = 3 , 田忌的赢得值为H2(s11)=- 3, 如此等等。以上讨论了局中人、策略集和赢得函数这三个概念。当这三个基本要素确定后 , 一个对策模型也就给定了。

    对策问题举例及对策的分类

    对策论在经济管理的众多领域中有着十分广 泛的应用 , 下面列举几个可以用对策论思想和模型进行分析的例子。

    费用分摊问题:假设沿某一河流有相邻的 3 个城市 A、B、C,各城市可单独建 立水厂, 也可合作兴建一个大水厂。经估算 , 合建一个大水厂 , 加上敷设管道的费用 , 要比单独建3个小水厂的总费用少。但合建大厂的方案能否实施, 要看总的建设费用分摊得是否合理。如果某个城市分摊到的费用比它单独建设水厂的费用还多的话 , 它显然不会接受合作的方案。问题是应如何合理地分摊费用, 使合作兴建大水厂的方案得以实现?

    拍卖问题:最常见的一种拍卖形式是先由拍卖商把拍卖品描述一番,然后提出第一个报价。接下来由买者报价, 每一次报价都要比前一次高 , 最后谁出的价最高拍卖品即归谁所有。假设有n个买主给出的报价分别为p1 ,⋯, pn ,且不妨设 pn > pn - 1 > ⋯ >p1 ,则买主 n 只要报价略高于 pn - 1 , 就能买到拍卖品, 即拍卖品实际上是在次高价格上卖出的。现在的问题是 , 各买主之间可能知道他 人的估价 , 也可能不知道他人的估价 , 每人应如何报价对自己能以较低的价格得到拍卖品最为有利 ? 最后的结果又会怎样 ?

    囚犯难题:设有两个嫌疑犯因涉嫌作案被警官拘留,警官分别对两人进行审讯。根据法律,如果两个人都承认此案是他们干的, 则每人各判刑7年; 如果两人都不承认 , 则由于证据不足 , 两人各判刑1年 ; 如果只有一人承认并揭发对方, 则承认者予以宽大释放 , 而不承认者将判刑9年。因此, 对两个囚犯来说 , 面临着一个在“承认”和“不承认” 这两个策略间进行选择的难题。

    上面几个例子都可看成是一个对策问题 , 所不同的是有些是二人对策 , 有些是多人对策;有些是有限对策, 有些是无限对策;有些是零和对策, 有些是非零和对策; 有些是合作对策, 有些是非合作对策等等。为了便于对不同的对策问题进行研究, 可以根据不同方式 进行分类 , 通常的分类方式有 :

    (1) 根据局中人的个数,分为二人对策和多人对策;
    (2) 根据各局中人的赢得函数的代数和是否为零,分为零和对策与非零和对策;
    (3) 根据各局中人间是否允许合作,分为合作对策和非合作对策;
    (4) 根据局中人的策略集中的策略个数,分为有限对策和无限对策。
    此外 , 还有许多其他的分类方式。例如根据策略的选择是否与时间有关, 可分为静态对策和动态对策 ; 根据对策模型的数学特征 , 可分为矩阵对策、连续对策、微分对策、阵地对策、凸对 策、随机对策等 。

    在众多对策模型中,占有重要地位的是二人有限零和对策(finite two-person zero- sum game) , 又称为矩阵对策。这类对策是到目前为止在理论研究和求解方法方面都比较完善的一个对策分支。矩阵对策可以说是一类最简单的对策模型 , 其研究思想和方法十分具有代表性 , 体现了对策论的一般思想和方法 , 且矩阵对策的基本结果也是研究其他对策模型的基础。

    矩阵对策的基本定理

    矩阵对策的数学模型

    二人有限零和对策就是矩阵对策 , 是指只有两个参加对策的局中人 , 每个局中人都只有有限个策略可供选择。在任一局势下, 两个局中人的赢得之和总是等于零 , 即双方的利益是激烈对抗的。“齐王赛马”就是一个矩阵对策的例子 , 齐王和田忌各有6个策略, 一局 对策结束后 , 齐王的所得必为田忌的所失 , 反之亦然。

    在矩阵对策中,一般用I、II分别表示两个局中人,并设局中人I有 m个纯策略α1 ,α2 , ⋯,αm ,局中人II有 n 个纯策略β1 ,β2 , ⋯,βn , 则局中人I、 II的策略集分别为:S1 ={α1 ,α2 ,⋯,αm},S2 ={β1,β2,⋯,βn},当局中人I选定纯策略αi 和局中人II选定纯策略βj 后,就形成了一个纯局势(αi ,βj )。可见这样的纯局势共有m×n个。对任一纯局势(αi,βj),记局中人I的赢得值为aij,并称:

    \begin{bmatrix} a_{11}\, a_{11}...\,a_{1n}\\ a_{21}\, a_{22}...\,a_{2n}\\ ...\, ...\...\\ a_{m1}\, a_{m2}...\,a_{mn}\\ \end{bmatrix}

    为局中人I的赢得矩阵(或为局中人II的支付矩阵)。由于假定对策为零和的,故局中人II的赢得矩阵就是 - A。

    当局中人I、II和策略集 S1 、S2 及局中人I的赢得矩阵 A 确定后, 一个矩阵对策也就给定。通常 , 将一个矩阵对策记成G={I,II;S1,S2;A}或 G={S1,S2;A}

    \underset{i}{max}\, \underset{j}{min} a_{ij} =\underset{j}{min}\, \underset{i}{max}\, a_{ij} = a_{i^{*}j^{*}}等式成立 , 记 VG = ai*j*。 则称VG为对策G的值, 称使该式成立的纯局势(αi*,βj*)为G在纯策略下的解(或平衡局势),αi*与βj*分别称为局中人I,II的最优纯策略。

    矩阵对策 G = { S1 , S2 ; A}在纯策略意义下有解的充分必要条件是 : 存在纯局势(αi* ,βj* )使得对一切i=1,⋯,m,j=1,⋯,n,均有:

    aij* ≤ai* j* ≤ai* j或者ai * j * 是矩阵 A 的一个鞍点

    矩阵对策的值是唯一的。即当局中人I采用构成解的最优纯策略时 , 能保证他的赢得VG不依赖于对方的纯策略。

    矩阵对策的混合策略

    对矩阵对策 G= { S1 , S2 ; A}来说,局中人I有把握的至少赢得是 v1 = \underset{i}{max}\, \underset{j}{min} a_{ij},局中人II有把握的至多损失是v2 = \underset{j}{min}\, \underset{i}{max}\, a_{ij}

    一般,局中人I赢得值不会多于局中人II损失值,即总有v1 <= v2.

    设有矩阵对策G={S1,S2;A},其中S1 ={α1,α2,⋯,αm},S2 ={β1,β2,⋯, βn},A=(aij )m×n记

    S_{1}^{*} = \left \{ x \in E^{m} / x_{i} \geqslant 0,i = 1,...,m,\sum_{i= 1}^{m}x_{i} = 1\right \} \ S_{2}^{*} = \left \{ y \in E^{n} / y_{j} \geqslant 0,j = 1,...,n,\sum_{j= 1}^{n}y_{j} = 1\right \}

    则s1,s2分别称局中人I和II的混合策略集,x \in S_{1}^{*}y \in S_{2}^{*}分别称局中人I和II的混合策略,

    局中人I的赢得函数记成E(x,y)=xT Ay=∑∑aijxiyj这样得到的一个新的对策记成 G* = { S1* , S2* , E}, 称 G* 为对策 G 的混合扩充。

    一个混合策略x=(x1,⋯,xm)T 可设想成当两个局中人多次重复进行对策G时,局中人I分别采取纯策略 α1 , ⋯,αm 的频率。若只进行一次对策, 混合策略 x = ( x1 , ⋯, xm )T 可设想成局中人I对各纯策略的偏爱程度。

    设G* ={S1* ,S2* ;E}是矩阵对策G={S1 ,S2 ;A}的混合扩充,如果

    \underset{x\in S_{1}^{*}}{max}\, \underset{y\in S_{2}^{*}}{min} E(x,y)=\underset{y\in S_{2}^{*}}{min}\, \underset{x\in S_{1}^{*}}{max}\, E(x,y)记其值为VG。则称VG 为对策G* 的值,称使上式成立的混合局势(x* ,y* )为G在混合策略意义下的解(或简称解) , x* 和 y* 分别称为局中人I和II的最优混合策略(或简称最优策略)。当G 在纯策略意义下解不存在时, 自动认为讨论的是在混合策略意义下的解,相应的局中人I的赢得函数为 E(x,y)。

    矩阵对策G={S1 ,S2 ;A}在混合策略意义下有解的充要条件是:存在 x* ∈ S1* , y* ∈S2* ,使(x* , y* )为函数 E( x, y)的一个鞍点,即对一切 x∈S1* , y∈S2* ,有E(x,y* )≤E(x* ,y* )≤E(x* ,y)

    矩阵对策的基本定理

    对任一矩阵对策G={S1,S2;A},一定存在混合策略意义下的解。

    设(x* ,y* )是矩阵对策G的解,v=VG,则:

    (1) 若 xi* >0,则∑aij yj*  = v。

    (2)若yj* >0,则∑aij xi*  = v。

    (3) 若∑aij yj* < v,则 xi* = 0

    (4) 若∑aij xi* > v ,则则 yj* = 0

    设有两个矩阵对策:G1 ={S1,S2;A1},G2 ={S1,S2;A2},其中A1 =(aij),A2 =(aij +L),L为任一常数,则有:

    (1) VG = VG + L

    ( 2 ) T ( G1 ) = T ( G2 )

    设有两个矩阵对策G1 ={S1,S2;A},G2 ={S1 ,S2 ;αA}其中α> 0 为任一常数。则(1) VG =αVG,( 2 ) T ( G1 ) = T ( G2 )

    设G={S1,S2;A}为—矩阵对策,且A=-AT 为斜对称矩阵(亦称这种对策 为对称对策)。则

    (1) VG =0
    (2) T1 (G) = T2 (G),其中 T1 (G)和 T2 (G)分别为局中人I和II的最优策略集。

    设有矩阵对策G={S1,S2;A},其中S1 ={α1,⋯,αm},S2 ={β1,⋯,βn},

    A=(aij),如果对一切j=1,⋯,n都有ai0j≥ak0j,即矩阵A的第i0 行元素均不小于第k0 行的对应元素,则称局中人I的纯策略αi0 优超于αk0 ;同样,若对一切 i= 1,⋯, m,都有 aij0 ≤ail0 即矩阵 A的第l0 列元素均不小于第 j0 列的对应元素,则称局中人II的纯策略

    βj 0 优 超 于 βl 0 。

    设G={S1,S2;A}为矩阵对策,其中S1 ={α1,⋯,αm},S2 ={β1,⋯,βn},

    A=(aij )如果纯策略α1 被其余纯策略α2 ,⋯,αm 中之一所优超,由G可得到一个新的矩 阵对策 G′= { S′1 , S2 ; A′}其中S′1 ={α2 ,⋯,αm},A′= ( ai j ′) ( m - 1 ) × n,aij =aij i=2,⋯,m j=1,⋯,n。于是有:

    ( 1 ) V G′ = V G ;

    (2) G′中局中人II的最优策略就是其在 G中的最优策略;

    (3)若(x2* ,⋯,xm* )T 是G′中局中人I的最优策略,则x* =(0,x2* ,⋯,xm* )T 便是其 在 G中的最优策略。

    上面定理实际给出了一个化简赢得矩阵 A的原则,称之为优超原则。根据这个原则,当局中人I的某纯策略 ai 被其他纯策略或纯策略的凸线性组合所优超时 , 可在矩阵 A 中 划去第 i 行而得到一个与原对策 G 等价但赢得矩阵阶数较小的对策 G′, 而 G′的求解往往 比 G 的求解容易些 , 通过求解 G′而得到 G 的解。类似地 , 对局中人II来说 , 可以在赢得矩 阵 A 中划去被其他列或其他列的凸线性组合所优超的那些列。

    矩阵对策的解法

    我们根据上面的定理,可以得到一些矩阵对策的解法,如2x2矩阵对策的公式法求解,图解法,求线性方程组解解法等,也可以利用线性规划求解。线性规划方法是具有一般性的 , 另外还有两种具有一般性的解法 : 求全部解的矩阵法和至少保证求出一个解的微分方程法。

    其他类型对策简介

    其他类型的对策有:

    二人无限零和对策

    矩阵对策最简单的推广就是局中人的策略集 从有限集变为无限集, 例如是 [ 0 , 1 ] 区 间。

    多人非合作对策

    指局中人之间互不合作 , 对策略的选择不允许事先有任何交换信息的行为 , 不允许订立任何约定 , 矩阵对策就是一种非合作对策

    合作对策

    合作对策的基本特征是参加对策的局中人可以进行充分的合作, 即可以事先商定好, 把各自的策略协调起来 ; 可以在对策后对所得到的支付进行重新分配。合作的形式是所有局中人可以形成若干联盟 , 每个局中人仅参加一个联盟 , 联盟的所得要在联盟的所有成员中进行重新分配。一般说来 , 合作可以提高联盟的所得 , 因而也可以提高每个联盟成员的所得。但联盟能否形成以及形成哪种联盟 , 或者说一个局中人是否参加联盟以及参加哪个联盟, 不仅取决于对策的规则 , 更取决于联盟获得的所得如何在成员间进行合理的重新分配。如果分配方案不合理 , 就可能破坏联盟的形成, 以至于不能形成有效的联盟。因此 , 在合作对策中, 每个局中人如何选择自己的策略已经不是要研究的主要问题了 , 应当强调的是如何形成联盟,以及联盟的所得如何被合理分配(即如何维持联盟)。

    其实,关于对策论或者叫博弈论,有很多著名的故事和实例,如囚徒问题,纳什均衡等等,这里只是简单介绍。

    展开全文
  • 排队模型 排队(Queuing Theory)也称随机服务系统理论,就是为解决服务的数量超过服务机构(服务台、服务员等)的容量。也就是说,到达的顾客不能立即得到服务,因而出现了排队现而发展的一门学科。 性态...

    排队论模型

    • 排队论(Queuing Theory)也称随机服务系统理论,就是为解决服务的数量超过服务机构(服务台、服务员等)的容量。也就是说,到达的顾客不能立即得到服务,因而出现了排队现而发展的一门学科。

      • 性态问题,即研究各种排队系统的概率规律性,主要是研究队长分布、等待时间分布和忙期分布等,包括了瞬态和稳态两种情形。
      • 最优化问题,又分静态最优和动态最优,前者指最优设计。后者指现有排队系统的最优运营。
      • 排队系统的统计推断,即判断一个给定的排队系统符合于哪种模型,以便根据排队理论进行分析研究。
    • 基本概念

      • 在这里插入图片描述
      • 图中虚线所包含的部分为排队系统。

      • 凡要求服务的对象统称为顾客,为顾客服务的人或物称为服务员,由顾客和服务员组成服务系统。

      • 排队系统的组成和特征

        • 输入过程:指顾客到来时间的规律性

          • 顾客的组成可能是有限的,也可能是无限的
          • 顾客到达的方式可能是一个—个的,也可能是成批的。
          • 顾客到达可以是相互独立的,即以前的到达情况对以后的到达没有影响;否则是相关的。
          • 输入过程可以是平稳,即相继到达的间隔时间分布及数学期望、方差等数字特征都与时间无关,否则是非平稳。
        • 排队规则:指到达排队系统的顾客按怎样的规则排队等待,可分为损失制,等待制和混合制三种。

          • 损失制(消失制)。当顾客到达时,所有的服务台均被占用,顾客随即离去。
          • 等待制。当顾客到达时,所有的服务台均被占用,顾客就排队等待,直到接受完服务才离去。
          • 混合制。介于损失制和等待制之间的是混合制,即既有等待又有损失。有队列长度有限排队等待时间有限两种情况,在限度以内就排队等待,超过一定限度就离去。
            • 排队方式还分为单列、多列和循环队列
        • 服务过程

          • 服务机构。主要有以下几种类型:单服务台;多服务台并联(每个服务台同时为不同顾客服务);多服务台串联(多服务台依次为同一顾客服务);混合型。

          • 服务规则。按为顾客服务的次序采用以下几种规则:

            • 先到先服务
            • 后到先服务
            • 随机服务
            • 优先服务
      • 排队模型的符号表示

        • 排队模型用六个符号表示,在符号之间用斜线隔开,即 X /Y / Z / A/ B /C

          • 第一个符号 X 表示顾客到达流或顾客到达间隔时间的分布;
          • 第二个符号Y 表示服务时间的分布;
          • 第三个符号 Z 表示服务台数目;
          • 第四个符号 A 是系统容量限制;
          • 第五个符号 B 是顾客源数目;
          • 第六个符号C 是服务规则,如先到先服务 FCFS,后到先服务 LCFS 等。
        • 表示顾客到达间隔时间和服务时间的分布的约定符号为:

          • M —指数分布( M 是 Markov 的字头,因为指数分布具有无记忆性,即 Markov性);
          • D —确定型(Deterministic);
          • E(k)k 阶爱尔朗(Erlang)分布;
          • G —一般(general)服务时间的分布;
          • GI —一般相互独立(General Independent)的时间间隔的分布。
          • M / M /1表示相继到达间隔时间为指数分布、服务时间为指数分布、单服务台、等待制系统。
          • D / M / c 表示确定的到达时间、服务时间为指数分布、 c 个平行服务台(但顾客是一队)的模型。
        • 排队系统的运行指标

          • 平均队长:指系统内顾客数(包括正被服务的顾客与排队等待服务的顾客)的数学期望,记作 L**s
          • *平均排队长:指系统内等待服务的顾客数的数学期望,记作 *Lq
          • 平均逗留时间:顾客在系统内逗留时间(包括排队等待的时间和接受服务的时间)的数学期望,记作W**s
          • 平均等待时间:指一个顾客在排队系统中排队等待时间的数学期望,记作W**q
          • 平均忙期:指服务机构连续繁忙时间(顾客到达空闲服务机构起,到服务机构再次空闲止的时间)长度的数学期望,记为T**b
          • 由于顾客被拒绝而使企业受到损失的损失率以及以后经常遇到的服务强度
      • 输入过程与服务时间的分布

        • 泊松流与指数分布

          • 形成泊松流。这三个条件是:

            • 在不相重叠的时间区间内顾客到达数是相互独立的,我们称这性质为无后效性。
            • 对充分小的 Δt ,在时间区间[t,t + Δt)内有一个顾客到达的概率与t 无关,而约与区间长 Δt 成正比,即 P1 (t,t + Δt) = λΔt + ot) ,其中ot) ,当 Δt → 0 时,是关于 Δt 的高阶无穷小。λ > 0 是常数,它表示单位时间有一个顾客到达的概率,称为概率强度。
            • 对于充分小的 Δt ,在时间区间[t,t + Δt)内有两个或两个以上顾客到达的概率极小,以致可以忽略
          • 正如在概率论中所学过的,我们说随机变量{N(t) = N(s + t) − N(s)}服从泊松分布。它的数学期望和方差分别是E[N(t)] = λt; Var[N(t)] = λt。

          • 当输入过程是泊松流时,那么顾客相继到达的时间间隔T 必服从指数分布。

      • 常用的连续型概率分布

        • 均匀分布
          • 区间 (a,b) 内的均匀分布记作U(a,b) 。
          • 服从U(0,1) 分布的随机变量又称为随机数,它是产生其它随机变量的基础。如若 XU(0,1) 分布,则Y = a + (ba)X 服从U(a,b) 。
        • 正态分布
          • μ 为期望,σ**2 为方差的正态分布记作 N(μ,σ2 ) 。
        • 指数分布
          • 指数分布是单参数λ 的非对称分布,记作 Exp(λ)
          • 它的数学期望为 1/λ,方差为 1/λ**2
          • 指数分布是唯一具有无记忆性的连续型随机变量,即有 P(X > t + s | X > t) = P(X > s) ,在排队论、可靠性分析中有广泛应用。
        • Gamma 分布
          • Gamma 分布是双参数α,β 的非对称分布,记作G(α,β ) ,期望是αβ
          • α = 1时蜕化为指数分布。 n 个相互独立、同分布(参数 λ )的指数分布之和是 Gamma 分布(α = n, β = λ) 。
          • Gamma 分布又称爱尔朗分布。
        • Weibull 分布
          • Weibull 分布是双参数α,β 的非对称分布,记作W(α, β ) 。
          • α = 1时蜕化为指数分布。
        • Beta 分布
          • Beta 分布是区间(0,1) 内的双参数、非均匀分布,记作 B(α, β ) 。
      • 常用的离散型概率分布

        • 离散均匀分布
        • Bernoulli 分布(两点分布)
          • Bernoulli 分布是 x = 1,0 处取值的概率分别是 p 和1− p 的两点分布,记作Bern( p) 。
        • 泊松(Poisson)分布
          • 泊松分布与指数分布有密切的关系。
          • 当顾客平均到达率为常数 λ 的到达间隔服从指数分布时,单位时间内到达的顾客数 K 服从泊松分布
          • 记作 Poisson(λ) 。
        • 二项分布
          • 二项分布是n 个独立的 Bernoulli 分布之和。
          • 记作 B(n, p) 。
          • n,k 很大时, B(n, p) 近似于正态分布 N(np,np(1− p)) ;当n 很大、 p 很小,且np 约为常数λ 时, B(n, p) 近似于 Poisson(λ)。

    对策论

    • 对策论亦称竞赛论或博弈论。研究具有斗争或竞争性质现象的数学理论和方法。

    • 它既是现代数学的一个新分支,也是运筹学中的一个重要学科。

    • 对策的基本要素

      • 局中人
        • 在一个对策行为(或一局对策)中,有权决定自己行动方案的对策参加者,称为局中人。
        • 一般要求一个对策中至少要有两个局中人。
      • 策略集
        • 一局对策中,可供局中人选择的一个实际可行的完整的行动方案称为一个策略。
        • 一般,每一局中人的策略集中至少应包括两个策略。
      • 赢得函数(支付函数)
        • 在一局对策中,各局中人所选定的策略形成的策略组称为一个局势
        • 当局势出现后,对策的结果也就确定了。也就是说,对任一局势, sS ,局中人i 可以得到一个赢得 H**i(s) 。
        • 显然, H**i(s) 是局势 s 的函数,称之为第i 个局中人的赢得函数。
    • 零和对策(矩阵对策)

      • 在这类对策中,只有两名局中人,每个局中人都只有有限个策略可供选择。
      • 在任一纯局势下,两个局中人的赢得之和总是等于零,即双方的利益是激烈对抗的。
      • 零和对策G 具有稳定解的充要条件为 μ +ν = 0。
      • 若存在m 维概率向量 xn 维概率向量 y ,使得对一切m 维概率向量 xn 维概率向量 y在这里插入图片描述
        则称(x, y) 为混合策略对策问题的鞍点。
      • 任意混合策略对策问题必存在鞍点,即必存在概率向量 xy ,使得:在这里插入图片描述

    层次分析法

    • 层次分析法(Analytic Hierarchy Process,简称 AHP),人们在进行社会的、经济的以及科学管理领域问题的系统分析中,面临的常常是一个由相互关联、相互制约的众多因素构成的复杂而往往缺少定量数据的系统。层次分析法为这类问题的决策和排序提供了一种新的、简洁而实用的建模方法。

    • 运用层次分析法建模,大体上可按下面四个步骤进行:

      1. 建立递阶层次结构模型;

        • 首先要把问题条理化、层次化,构造出一个有层次的结构模型。

        • 复杂问题被分解为元素的组成部分。

        • 这些元素又按其属性及关系形成若干层次。上一层次的元素作为准则对下一层次有关元素起支配作用。

          • 最高层:这一层次中只有一个元素,一般它是分析问题的预定目标或理想结果,因此也称为目标层。
          • 中间层:这一层次中包含了为实现目标所涉及的中间环节,它可以由若干个层次组成,包括所需考虑的准则、子准则,因此也称为准则层
          • 最底层:这一层次包括了为实现目标可供选择的各种措施、决策方案等,因此也称为措施层或方案层
            • 在这里插入图片描述
       >   - 
      
      1. 构造出各层次中的所有判断矩阵;

        • 层次结构反映了因素之间的关系,但准则层中的各准则在目标衡量中所占的比重并不一定相同,在决策者的心目中,它们各占有一定的比例。
        • 可以采取对因子进行两两比较建立成对比较矩阵的办法。
        • 每次取两个因子 x ix j ,以 a**ij 表示 x ix jZ 的影响大小之比,全部比较结果用矩阵 A = (a**ij)(n×n) 表示,称 AZX 之间的成对比较判断矩阵(简称判断矩阵)
        • 从心理学观点来看,分级太多会超越人们的判断能力,既增加了作判断的难度,又容易因此而提供虚假数据。实验结果也表明,采用 1~9 标度最为合适。
        • 最后,应该指出,一般地作n(n −1)/2 次两两判断是必要的。这种作法的弊病在于,任何一个判断的失误均可导致不合理的排序,而个别判断的失误对于难以定量的系统往往是难以避免的。
      2. 层次单排序及一致性检验;

        • 判断矩阵 A 对应于最大特征值λmax 的特征向量W ,经归一化后即为同一层次相应因素对于上一层次某因素相对重要性的排序权值,这一过程称为层次单排序。
      3. 层次总排序及一致性检验。

        • 上面我们得到的是一组元素对其上一层中某元素的权重向量。我们最终要得到各元素,特别是最低层中各方案对于目标的排序权重,从而进行方案选择。总排序权重要自上而下地将单准则下的权重进行合成。

    向量W ,经归一化后即为同一层次相应因素对于上一层次某因素相对重要性的排序权值,这一过程称为层次单排序。

    1. 层次总排序及一致性检验。

      • 上面我们得到的是一组元素对其上一层中某元素的权重向量。我们最终要得到各元素,特别是最低层中各方案对于目标的排序权重,从而进行方案选择。总排序权重要自上而下地将单准则下的权重进行合成。
    展开全文
  • 高中生物概念教学难点与对策.doc
  • 通过商战和军事对策的实例引进了矩阵对策上的计策等形式结构,研究了计策及将计就计等概念的性质.定量地研究了当某个局中人识破对手的计策时,应以什么尺度决定是否使用...
  • 论文研究-超对策理论的改进及应用.pdf, ...本文提出“制约垒”概念来反映基于决策目标之下决策分析、选择、控制的动态过程, 最后以“海湾危机”全过程为实际背景, 用改进的超对策方法进行了分析。
  • 计算机软件专业创新创业人才培养对策论文摘要:从客观的角度来分析,高职计算机软件专业创新创业人才培养难度并不低,在很多方面都要按照科学、合理的模式来进行,这样才能在具体教育成就上更好的巩固。文章针对高职...
  • 计算机网络信息安全及防护对策云计算环境下计算机网络安全策略计算机网络信息技术安全及防范对策 随着计算机技术水平的不断提高很多家庭都有了计算机设备在获取信息日益方便的背景下人们也开始重视个人的数据和信息...
  • 论文研究-带模糊参数的对策模型.pdf, ... 采用模糊测度刻划对策中的不确定性,定义了新的均衡概念,并给出了均衡解的充分必要条件以及与Nash均衡的关系.
  • 随着大数据在教育领域的应用,... 首先阐述了教育大数据的概念和特点,对大数据环境下大学教育资源共享的现状进行了研究,分析了存在的问题,最后提出了对大学教育资源共享的建议。在大数据范围内进行当前状态调查。
  • 本文对国内外学术论文和消防标准中有关城市火灾风险的各种概念构建或思想学说进行了整理,归纳出还原、整体和复杂等三个不同阶段的若干视角及其主要观点,展现了其系统化、多维化演进态势和中国学者的一系列...
  • 论文研究-煤炭企业技术进步的评价与...而且利用DEA有效性概念, 判断企业是否技术有效或规模有效, 对非有效的情况, 计算出实际输入的计算指标值与有效情况下要求输入计算指标值在数量上的差距, 对症下药, 提出解决对策
  • 作为一门新兴的工具性学科,计算机课程占职业学校教学的很大比重,研究计算机科学的教学方法,...谈计算机概念教学全文如下:【摘要】文章分析了概念教学过程中应注意的问题和概念教学中采取的包括淡化、浅化、深化、跨...
  • 论文研究-效用可转移的... 本文以合作度为广义联盟而定义了一种广义合作对策模型,给出核心解集及其上下界,并定义了一种唯一解——妥协解的概念,证明了这种解的一些性质.
  • 专业班级 电子商务 学生姓名 指导教师 完成日期 杭州市电子商务服务业发展的主要问题及对策 摘 要近年来电子商务服务业的发展在我国社会经济发展中发挥着越来越重要的作用本文首先阐述了电子商务服务业的概念以及...
  • 棋牌游戏与事件对策

    2021-01-15 05:08:02
    博弈的原意便是下棋,博弈概念也源于棋类游戏,而博弈的现有成果还难以描述和处理棋牌游戏这一类复杂的动态过程.为此,在分析棋牌游戏特点的基础上,指出它们属于离散事件的动态过程;在阐述离散事件动态系统(DEDS)...
  • 摘要随着信息技术的快速进步云计算的应用范围逐渐变大计算机安全问题也日益引起人们的关注云计算是基于Internet的新兴技术应用使计算机在软件背景...概念进而分析了基于云计算背景的计算机安全问题最后提出了相应的对策...
  • 中国正处于快速的城市化和经济快速发展的过程中。 对基础设施建设的需求越来越高,但政府资金有限,无法满足其需求。 随着政府对公共基础设施建设投资的减少,以及民营资本企业在公共基础设施建设中的作用开始发挥...
  • 电子商务对国际贸易的影响和对策分析的论文 摘要国内经济发展正处于瓶颈时期随着互联网的不断发展电子商务在国内飞速发展并对各行各业造成深远影响本文结合电子商务概念及对国际贸易影响进行分析浅析应对策略 关键词...
  • 当前,我国资优学生教育的概念定义,政策保障,选拔机制,课程和教学等方面存在很多问题。 解决这些问题,不仅需要摆脱人们对资优教育的偏见,而且还需要对资优生的选拔政策,培训计划和师资培训进行系统的改革。
  • 云计算是一种新兴的计算模式它将计算任务分布在大量的计算机构成的资源池上借助于云计算用户可以获取近乎无限的资源国家十二五规划中云计算已经...云计算又分析了云计算的优点最后重点探讨了云环境下的数据安全问题及对策...
  • 云计算是一种新兴的计算模式它将计算任务分布在大量的计算机构成的资源池上借助于云计算用户可以获取近乎无限的资源国家十二五规划中云计算已经...云计算又分析了云计算的优点最后重点探讨了云环境下的数据安全问题及对策...
  • 针对传统模糊支付矩阵对策求解方法不能保证局中人的模糊值始终相同且求解复杂的问题,通过引入α-矩阵对策概念,提出一种求解支付为梯形模糊数的矩阵对策线性规划方法.该方法中局中人双方的对策值始终相同,且此...
  • 因此,一些教师纯粹是为了对付考试而教学,为了让学生在考试中出好成绩,一方面减少学生上机的时间,另一方面采取“填鸭式”“满堂灌”教授一些计算机知识和概念,不断让学生做习题,学生是知识的被动的接受者,他们...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 3,735
精华内容 1,494
热门标签
关键字:

对策论概念