精华内容
下载资源
问答
  • 对策也叫博弈 , 是自古以来的政治家和军事家都很注意研究的问题。 作为一门正式学科,是在20世纪40年代形成并发展起来的。直到1944年冯·诺依曼(von Neumann) 与摩根斯特恩(O .Morgenstern)的《博弈与经济行为》一...

    对策也叫博弈 , 是自古以来的政治家和军事家都很注意研究的问题。 作为一门正式学科,是在20世纪40年代形成并发展起来的。直到1944年冯·诺依曼(von Neumann) 与摩根斯特恩(O .Morgenstern)的《博弈论与经济行为》一书出版,标志着现代系统博弈理论的初步形成。书中提出的标准型、扩展型和合作型博弈模型解的概念和分析方法 , 奠定了这门学科的理论基础 , 成为使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论。然而 , 诺依曼的博弈论的局限性也日益暴露出来。由于它过于抽象 , 使应用范围受到很大限制,所以影响力很有限。20世纪50年代,纳什( Nash)建立了非合作博弈的“纳什均衡”理论, 标志着博弈的新时代开始 , 是纳什在经济博弈论领域划时代的贡献 , 是继冯·诺依曼之后最伟大的博弈论大师之一。1994年纳什获得了诺贝尔经济学奖。他提出的著名的纳什均衡概念在非合作博弈理论中起着核心作用。由于纳什均衡的提出和不断完善 , 为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础。

    对策论基础

    对策论亦称竞赛论或博弈论, 是研究具有斗争或竞争性质现象的数学理论和方法。 一般认为 , 它是现代数学的一个新分支 , 是运筹学的一个重要学科。对策论发展的历史并 不长, 但由于它研究的问题与政治、经济、军事活动乃至一般的日常生活等有着密切联系,并且处理问题的方法具有明显特色 , 所以日益引起广泛注意。

    在日常生活中, 经常会看到一些相互之间具有斗争或竞争性质的行为 , 如下棋、打牌、 体育比赛等。还比如战争活动中的双方 , 都力图选取对自己最有利的策略, 千方百计去战胜对手。在政治方面 , 国际间的谈判 , 各种政治力量之间的 斗争 , 各国际集团之间的斗 争等无一不具有斗争的性质。在经济活动中, 各国之间、各公司企业之间的经济谈判 , 企业之间为争夺市场而进行的竞争等 , 举不胜举。

    具有竞争或对抗性质的行为称为对策行为。在这类行为中 , 参加斗争或竞争的各方各自具有不同的目标和利益。为了达到各自的目 标和利益 , 各方必须考虑对手的各种可能的行动方案 , 并力图选取对自己最有利或最合理的方 案。对策论就是研究对策行为中斗争各方是否存在着最合理行动方案 , 以及如何找到最合理行动方案的数学理论和方法。

    以下称具有对策行为的模型为对策模型或对策。 对策模型的种类可以千差万别 , 但本质上都必须包括以下三个基本要素。

    1. 局中人

    在一个对策行为(或一局对策)中,有权决定自己行动方案的对策参加者, 称为局中人。通常用 I 表示局中人的集合。如果有n个局中人, 则 I = {1, 2, ⋯, n}。一般要求一个对策中至少要有两个局中人。对策中关于局中人的概念具有广义性,也就是不一定具体到人,也可以是组织,团地。需要强调的一点是 , 在对策中总是假定每一个局中人都是“ 理智的”决策者或竞争者 , 即对任一局中人来讲 , 不存在利用其他局中人决策的失误来扩大自身利益的可能性。

    2. 策略集

    一局对策中, 可供局中人选择的一个实际可行的完整的行动方案称为一个策略。 参加对策的每一局中人i,i∈I,都有自己的策略集 Si。一般,每一局中人的策略集中至少应包括两个策略。

    3. 赢得函数(支付函数)

    在一局对策中,各局中人选定的策略形成的策略组称为一个局势, 即若Si是第i个局中人的一个策略,则 n个局中人的策略组:s=(s1 ,s2 ,⋯,sn)就是一个局势。全体局势的集合S可用各局中人策略集的笛卡儿积表示 , 即S= S1×S2×⋯×Sn,当一个局势出现后,对策的结果也就确定了。也就是说, 对任一局势 s∈ S, 局中人i可以得到一个赢得值 Hi (s)。显然, Hi (s)是局势 s的函数,称为第 i个局中人的赢得函数。

    在齐王与田忌赛马的例子中,局中人集合为 I={1,2},齐王和田忌的策略集可分别 用 S1 ={a1 ,a2 , a3 , a4 ,a5 ,a6 }和 S2 ={β1 ,β2 ,β3 ,β4 ,β5 ,β6 }表示。这样,齐王的任一策略 ai 和田忌的任一策略βj 就形成了一个局势sij。如果a1=(上,中,下),β1 =(上,中,下),则在局 势 s11下齐王的赢得值为H1(s11) = 3 , 田忌的赢得值为H2(s11)=- 3, 如此等等。以上讨论了局中人、策略集和赢得函数这三个概念。当这三个基本要素确定后 , 一个对策模型也就给定了。

    对策问题举例及对策的分类

    对策论在经济管理的众多领域中有着十分广 泛的应用 , 下面列举几个可以用对策论思想和模型进行分析的例子。

    费用分摊问题:假设沿某一河流有相邻的 3 个城市 A、B、C,各城市可单独建 立水厂, 也可合作兴建一个大水厂。经估算 , 合建一个大水厂 , 加上敷设管道的费用 , 要比单独建3个小水厂的总费用少。但合建大厂的方案能否实施, 要看总的建设费用分摊得是否合理。如果某个城市分摊到的费用比它单独建设水厂的费用还多的话 , 它显然不会接受合作的方案。问题是应如何合理地分摊费用, 使合作兴建大水厂的方案得以实现?

    拍卖问题:最常见的一种拍卖形式是先由拍卖商把拍卖品描述一番,然后提出第一个报价。接下来由买者报价, 每一次报价都要比前一次高 , 最后谁出的价最高拍卖品即归谁所有。假设有n个买主给出的报价分别为p1 ,⋯, pn ,且不妨设 pn > pn - 1 > ⋯ >p1 ,则买主 n 只要报价略高于 pn - 1 , 就能买到拍卖品, 即拍卖品实际上是在次高价格上卖出的。现在的问题是 , 各买主之间可能知道他 人的估价 , 也可能不知道他人的估价 , 每人应如何报价对自己能以较低的价格得到拍卖品最为有利 ? 最后的结果又会怎样 ?

    囚犯难题:设有两个嫌疑犯因涉嫌作案被警官拘留,警官分别对两人进行审讯。根据法律,如果两个人都承认此案是他们干的, 则每人各判刑7年; 如果两人都不承认 , 则由于证据不足 , 两人各判刑1年 ; 如果只有一人承认并揭发对方, 则承认者予以宽大释放 , 而不承认者将判刑9年。因此, 对两个囚犯来说 , 面临着一个在“承认”和“不承认” 这两个策略间进行选择的难题。

    上面几个例子都可看成是一个对策问题 , 所不同的是有些是二人对策 , 有些是多人对策;有些是有限对策, 有些是无限对策;有些是零和对策, 有些是非零和对策; 有些是合作对策, 有些是非合作对策等等。为了便于对不同的对策问题进行研究, 可以根据不同方式 进行分类 , 通常的分类方式有 :

    (1) 根据局中人的个数,分为二人对策和多人对策;
    (2) 根据各局中人的赢得函数的代数和是否为零,分为零和对策与非零和对策;
    (3) 根据各局中人间是否允许合作,分为合作对策和非合作对策;
    (4) 根据局中人的策略集中的策略个数,分为有限对策和无限对策。
    此外 , 还有许多其他的分类方式。例如根据策略的选择是否与时间有关, 可分为静态对策和动态对策 ; 根据对策模型的数学特征 , 可分为矩阵对策、连续对策、微分对策、阵地对策、凸对 策、随机对策等 。

    在众多对策模型中,占有重要地位的是二人有限零和对策(finite two-person zero- sum game) , 又称为矩阵对策。这类对策是到目前为止在理论研究和求解方法方面都比较完善的一个对策分支。矩阵对策可以说是一类最简单的对策模型 , 其研究思想和方法十分具有代表性 , 体现了对策论的一般思想和方法 , 且矩阵对策的基本结果也是研究其他对策模型的基础。

    矩阵对策的基本定理

    矩阵对策的数学模型

    二人有限零和对策就是矩阵对策 , 是指只有两个参加对策的局中人 , 每个局中人都只有有限个策略可供选择。在任一局势下, 两个局中人的赢得之和总是等于零 , 即双方的利益是激烈对抗的。“齐王赛马”就是一个矩阵对策的例子 , 齐王和田忌各有6个策略, 一局 对策结束后 , 齐王的所得必为田忌的所失 , 反之亦然。

    在矩阵对策中,一般用I、II分别表示两个局中人,并设局中人I有 m个纯策略α1 ,α2 , ⋯,αm ,局中人II有 n 个纯策略β1 ,β2 , ⋯,βn , 则局中人I、 II的策略集分别为:S1 ={α1 ,α2 ,⋯,αm},S2 ={β1,β2,⋯,βn},当局中人I选定纯策略αi 和局中人II选定纯策略βj 后,就形成了一个纯局势(αi ,βj )。可见这样的纯局势共有m×n个。对任一纯局势(αi,βj),记局中人I的赢得值为aij,并称:

    \begin{bmatrix} a_{11}\, a_{11}...\,a_{1n}\\ a_{21}\, a_{22}...\,a_{2n}\\ ...\, ...\...\\ a_{m1}\, a_{m2}...\,a_{mn}\\ \end{bmatrix}

    为局中人I的赢得矩阵(或为局中人II的支付矩阵)。由于假定对策为零和的,故局中人II的赢得矩阵就是 - A。

    当局中人I、II和策略集 S1 、S2 及局中人I的赢得矩阵 A 确定后, 一个矩阵对策也就给定。通常 , 将一个矩阵对策记成G={I,II;S1,S2;A}或 G={S1,S2;A}

    \underset{i}{max}\, \underset{j}{min} a_{ij} =\underset{j}{min}\, \underset{i}{max}\, a_{ij} = a_{i^{*}j^{*}}等式成立 , 记 VG = ai*j*。 则称VG为对策G的值, 称使该式成立的纯局势(αi*,βj*)为G在纯策略下的解(或平衡局势),αi*与βj*分别称为局中人I,II的最优纯策略。

    矩阵对策 G = { S1 , S2 ; A}在纯策略意义下有解的充分必要条件是 : 存在纯局势(αi* ,βj* )使得对一切i=1,⋯,m,j=1,⋯,n,均有:

    aij* ≤ai* j* ≤ai* j或者ai * j * 是矩阵 A 的一个鞍点

    矩阵对策的值是唯一的。即当局中人I采用构成解的最优纯策略时 , 能保证他的赢得VG不依赖于对方的纯策略。

    矩阵对策的混合策略

    对矩阵对策 G= { S1 , S2 ; A}来说,局中人I有把握的至少赢得是 v1 = \underset{i}{max}\, \underset{j}{min} a_{ij},局中人II有把握的至多损失是v2 = \underset{j}{min}\, \underset{i}{max}\, a_{ij}

    一般,局中人I赢得值不会多于局中人II损失值,即总有v1 <= v2.

    设有矩阵对策G={S1,S2;A},其中S1 ={α1,α2,⋯,αm},S2 ={β1,β2,⋯, βn},A=(aij )m×n记

    S_{1}^{*} = \left \{ x \in E^{m} / x_{i} \geqslant 0,i = 1,...,m,\sum_{i= 1}^{m}x_{i} = 1\right \} \ S_{2}^{*} = \left \{ y \in E^{n} / y_{j} \geqslant 0,j = 1,...,n,\sum_{j= 1}^{n}y_{j} = 1\right \}

    则s1,s2分别称局中人I和II的混合策略集,x \in S_{1}^{*}y \in S_{2}^{*}分别称局中人I和II的混合策略,

    局中人I的赢得函数记成E(x,y)=xT Ay=∑∑aijxiyj这样得到的一个新的对策记成 G* = { S1* , S2* , E}, 称 G* 为对策 G 的混合扩充。

    一个混合策略x=(x1,⋯,xm)T 可设想成当两个局中人多次重复进行对策G时,局中人I分别采取纯策略 α1 , ⋯,αm 的频率。若只进行一次对策, 混合策略 x = ( x1 , ⋯, xm )T 可设想成局中人I对各纯策略的偏爱程度。

    设G* ={S1* ,S2* ;E}是矩阵对策G={S1 ,S2 ;A}的混合扩充,如果

    \underset{x\in S_{1}^{*}}{max}\, \underset{y\in S_{2}^{*}}{min} E(x,y)=\underset{y\in S_{2}^{*}}{min}\, \underset{x\in S_{1}^{*}}{max}\, E(x,y)记其值为VG。则称VG 为对策G* 的值,称使上式成立的混合局势(x* ,y* )为G在混合策略意义下的解(或简称解) , x* 和 y* 分别称为局中人I和II的最优混合策略(或简称最优策略)。当G 在纯策略意义下解不存在时, 自动认为讨论的是在混合策略意义下的解,相应的局中人I的赢得函数为 E(x,y)。

    矩阵对策G={S1 ,S2 ;A}在混合策略意义下有解的充要条件是:存在 x* ∈ S1* , y* ∈S2* ,使(x* , y* )为函数 E( x, y)的一个鞍点,即对一切 x∈S1* , y∈S2* ,有E(x,y* )≤E(x* ,y* )≤E(x* ,y)

    矩阵对策的基本定理

    对任一矩阵对策G={S1,S2;A},一定存在混合策略意义下的解。

    设(x* ,y* )是矩阵对策G的解,v=VG,则:

    (1) 若 xi* >0,则∑aij yj*  = v。

    (2)若yj* >0,则∑aij xi*  = v。

    (3) 若∑aij yj* < v,则 xi* = 0

    (4) 若∑aij xi* > v ,则则 yj* = 0

    设有两个矩阵对策:G1 ={S1,S2;A1},G2 ={S1,S2;A2},其中A1 =(aij),A2 =(aij +L),L为任一常数,则有:

    (1) VG = VG + L

    ( 2 ) T ( G1 ) = T ( G2 )

    设有两个矩阵对策G1 ={S1,S2;A},G2 ={S1 ,S2 ;αA}其中α> 0 为任一常数。则(1) VG =αVG,( 2 ) T ( G1 ) = T ( G2 )

    设G={S1,S2;A}为—矩阵对策,且A=-AT 为斜对称矩阵(亦称这种对策 为对称对策)。则

    (1) VG =0
    (2) T1 (G) = T2 (G),其中 T1 (G)和 T2 (G)分别为局中人I和II的最优策略集。

    设有矩阵对策G={S1,S2;A},其中S1 ={α1,⋯,αm},S2 ={β1,⋯,βn},

    A=(aij),如果对一切j=1,⋯,n都有ai0j≥ak0j,即矩阵A的第i0 行元素均不小于第k0 行的对应元素,则称局中人I的纯策略αi0 优超于αk0 ;同样,若对一切 i= 1,⋯, m,都有 aij0 ≤ail0 即矩阵 A的第l0 列元素均不小于第 j0 列的对应元素,则称局中人II的纯策略

    βj 0 优 超 于 βl 0 。

    设G={S1,S2;A}为矩阵对策,其中S1 ={α1,⋯,αm},S2 ={β1,⋯,βn},

    A=(aij )如果纯策略α1 被其余纯策略α2 ,⋯,αm 中之一所优超,由G可得到一个新的矩 阵对策 G′= { S′1 , S2 ; A′}其中S′1 ={α2 ,⋯,αm},A′= ( ai j ′) ( m - 1 ) × n,aij =aij i=2,⋯,m j=1,⋯,n。于是有:

    ( 1 ) V G′ = V G ;

    (2) G′中局中人II的最优策略就是其在 G中的最优策略;

    (3)若(x2* ,⋯,xm* )T 是G′中局中人I的最优策略,则x* =(0,x2* ,⋯,xm* )T 便是其 在 G中的最优策略。

    上面定理实际给出了一个化简赢得矩阵 A的原则,称之为优超原则。根据这个原则,当局中人I的某纯策略 ai 被其他纯策略或纯策略的凸线性组合所优超时 , 可在矩阵 A 中 划去第 i 行而得到一个与原对策 G 等价但赢得矩阵阶数较小的对策 G′, 而 G′的求解往往 比 G 的求解容易些 , 通过求解 G′而得到 G 的解。类似地 , 对局中人II来说 , 可以在赢得矩 阵 A 中划去被其他列或其他列的凸线性组合所优超的那些列。

    矩阵对策的解法

    我们根据上面的定理,可以得到一些矩阵对策的解法,如2x2矩阵对策的公式法求解,图解法,求线性方程组解解法等,也可以利用线性规划求解。线性规划方法是具有一般性的 , 另外还有两种具有一般性的解法 : 求全部解的矩阵法和至少保证求出一个解的微分方程法。

    其他类型对策简介

    其他类型的对策有:

    二人无限零和对策

    矩阵对策最简单的推广就是局中人的策略集 从有限集变为无限集, 例如是 [ 0 , 1 ] 区 间。

    多人非合作对策

    指局中人之间互不合作 , 对策略的选择不允许事先有任何交换信息的行为 , 不允许订立任何约定 , 矩阵对策就是一种非合作对策

    合作对策

    合作对策的基本特征是参加对策的局中人可以进行充分的合作, 即可以事先商定好, 把各自的策略协调起来 ; 可以在对策后对所得到的支付进行重新分配。合作的形式是所有局中人可以形成若干联盟 , 每个局中人仅参加一个联盟 , 联盟的所得要在联盟的所有成员中进行重新分配。一般说来 , 合作可以提高联盟的所得 , 因而也可以提高每个联盟成员的所得。但联盟能否形成以及形成哪种联盟 , 或者说一个局中人是否参加联盟以及参加哪个联盟, 不仅取决于对策的规则 , 更取决于联盟获得的所得如何在成员间进行合理的重新分配。如果分配方案不合理 , 就可能破坏联盟的形成, 以至于不能形成有效的联盟。因此 , 在合作对策中, 每个局中人如何选择自己的策略已经不是要研究的主要问题了 , 应当强调的是如何形成联盟,以及联盟的所得如何被合理分配(即如何维持联盟)。

    其实,关于对策论或者叫博弈论,有很多著名的故事和实例,如囚徒问题,纳什均衡等等,这里只是简单介绍。

    展开全文
  • 计算机网络信息安全及防护对策云计算环境下计算机网络安全策略计算机网络信息技术安全及防范对策 随着计算机技术水平的不断提高很多家庭都有了计算机设备在获取信息日益方便的背景下人们也开始重视个人的数据和信息...
  • 论文研究-带模糊参数的对策模型.pdf, ... 采用模糊测度刻划对策中的不确定性,定义了新的均衡概念,并给出了均衡解的充分必要条件以及与Nash均衡的关系.
  • 电子商务对国际贸易的影响和对策分析的论文 摘要国内经济发展正处于瓶颈时期随着互联网的不断发展电子商务在国内飞速发展并对各行各业造成深远影响本文结合电子商务概念及对国际贸易影响进行分析浅析应对策略 关键词...
  • 论文研究-效用可转移的... 本文以合作度为广义联盟而定义了一种广义合作对策模型,给出核心解集及其上下界,并定义了一种唯一解——妥协解的概念,证明了这种解的一些性质.
  • 论文研究-超对策理论的改进及应用.pdf, ...本文提出“制约垒”概念来反映基于决策目标之下决策分析、选择、控制的动态过程, 最后以“海湾危机”全过程为实际背景, 用改进的超对策方法进行了分析。
  • 通过商战和军事对策的实例引进了矩阵对策上的计策等形式结构,研究了计策及将计就计等概念的性质.定量地研究了当某个局中人识破对手的计策时,应以什么尺度决定是否使用...
  • 他们大都是先借助中文,集中力量先解决摘要的结构和内容等概念性方面的问题,先写出中文稿,然后,再将其译成英文。但在这样的译文中往往存在许多问题,大多数需要重新组织和翻译,主要是因为他们对英语医学论文摘要...

    原则上说,医学论文摘要应该使用英文直接编写,但是这对许多医务人员来说尚有一定难度。他们大都是先借助中文,集中力量先解决摘要的结构和内容等概念性方面的问题,先写出中文稿,然后,再将其译成英文。但在这样的译文中往往存在许多问题,大多数需要重新组织和翻译,主要是因为他们对英语医学论文摘要格式和文体缺乏基本的了解,对英语句子结构和用词特点缺乏基本知识。对此,蓝译编译提出以下对策。

    dc7984b51905725b95d91249f5aac904.png

    一、正确使用语态和时态,达到完整性和规范性。在翻译英文摘要时,采用被动语态可以避免提及有关的执行者,使行文显得客观。同时,被动语态的句子在结构上有较大的调节余地,有利于采用恰当的修辞手段,扩展名词短语,扩大句子的信息量,有利于突出相关的概念、问题、实事、结论等内容。但在叙述结果和提出结论或建议时,常用主动语态。

    英文论文摘要中,所采用的时态主要有一般现在时,一般过去时和现在完成时。在背景介绍和目的说明时,用一般现在时或现在完成时。凡陈述研究的材料、方法和结果时,用过去时。分析结果或发现的原因时,或者提出结论性意见时,如果作者认为具有普遍意义,可用现在时;如果作者认为自己的分析或结论只限于本研究范围或者仅是一种可能性,则用一般过去时为好。

    二、使用专业术语和搭配,保证明确性、简洁性。在医学论文摘要翻译和写作中,使用技术性强的专业术语,保证意义的准确性和表达的简洁。在结构式摘要中的各个部分中经常会提到许多医学术语,它们都有固定的英语表达,但相当一部分作者由于没有掌握这些术语搭配,以至于译文表述不准确。

    三、尽量使用单词代替短语,力求简洁。在医学论文摘要翻译中,用词冗余也是一个突出表现,影响了摘要的简洁性。这类冗余可见于在表达对……做出比较(做实验,做调查,有影响等),常常用冗长的短语,而不会用简洁的动词。在论文摘要中,尽量用单词代替短语的使用,同样有助于达到简洁性。

    四、注重词的内涵意义,提高选词的准确传意性。日常通用英语词汇用在不同的学科中虽然基本含义不变,但其确切含义则存在较大差别。因此,在翻译和写作过程中,其意义的选择必须与其专业相符合。在确定某一词所属词类的基础上,应根据专业特点和具体语境来确定其确切选词。

    五、了解缩略语和特殊符号的书写,力求准确、规范。医学专业英语中,应用缩略语和特殊符号有利于写作和排版,可减轻读者的视觉负担。需要注意的是,在医学论文英文摘要中,首次使用缩略语应用括号注明;“~”符号在汉语中表示数字范围,在英文中则为代字符,英文中要表示数字范围时,则应用连字符“-”。

    总之,译好英文文摘,还要具备良好的英文表达能力以及熟悉和掌握大量的专业用语。了解英语结构式摘要中常用的术语搭配、句型和文摘的结构特点,在完整性的的基础上注意增强结构式摘要的准确性、简洁性和规格性。反复练习,才能写译出较高水平的医学英文文摘。

    00502bee127ebb1d4ae9ed8c2feea7c1.png
    展开全文
  • 无线局域网的安全与对策,王海亮,曹秀英,首先简要的介绍了无线局域网的基本概念和主要特点,其次详细论述了无线局域网的安全状况、存在问题以及主要的安全标准,提出几种
  • 随着大数据在教育领域的应用,... 首先阐述了教育大数据的概念和特点,对大数据环境下大学教育资源共享的现状进行了研究,分析了存在的问题,最后提出了对大学教育资源共享的建议。在大数据范围内进行当前状态调查。
  • 论文研究-煤炭企业技术进步的评价与...而且利用DEA有效性概念, 判断企业是否技术有效或规模有效, 对非有效的情况, 计算出实际输入的计算指标值与有效情况下要求输入计算指标值在数量上的差距, 对症下药, 提出解决对策
  • 本文对国内外学术论文和消防标准中有关城市火灾风险的各种概念构建或思想学说进行了整理,归纳出还原、整体和复杂等三个不同阶段的若干视角及其主要观点,展现了其系统化、多维化演进态势和中国学者的一系列...
  • 针对大学生心理健康问题,研究了有效对策的原因,并提出了解决大学生心理健康问题的建议。 本文认为,当前的心理健康问题是复杂多样的,主要是由社会环境,负能量导向教育,家庭教育和中学生自我概念发展失衡四个...
  • 会计论文人工智能对财会的挑战及对策之会计学研究 本文是一篇会计论文本文首先分析了人工智能全面应用和我国财会转型的大时代背景指出两者结合的必然性与必要性之后对人工智能理论财会概念财会人工智能进行阐释指出...
  • 当前,我国资优学生教育的概念定义,政策保障,选拔机制,课程和教学等方面存在很多问题。 解决这些问题,不仅需要摆脱人们对资优教育的偏见,而且还需要对资优生的选拔政策,培训计划和师资培训进行系统的改革。
  • 首先介绍了PPKC和IPKC的概念,然后对比了几种典型攻击方法对PPKC和IPKC安全性的不同影响。利用IPKC的特殊性,提出了一种专门针对IPKC的攻击方法——错误探测攻击方法(Errors Sniffing Attacks, ESA);新型公钥密码...
  • 云计算是一种新兴的计算模式它将计算任务分布在大量的计算机构成的资源池上借助于云计算用户可以获取近乎无限的资源国家十二五规划中云计算已经...云计算又分析了云计算的优点最后重点探讨了云环境下的数据安全问题及对策...
  • 云计算是一种新兴的计算模式它将计算任务分布在大量的计算机构成的资源池上借助于云计算用户可以获取近乎无限的资源国家十二五规划中云计算已经...云计算又分析了云计算的优点最后重点探讨了云环境下的数据安全问题及对策...
  • 博弈

    2005-08-02 18:03:00
    博弈论 博弈论(Game Theory,又称对策论)研究决策主体的行为在发生直接的相互作用时,人们如何进行决策以及这种决策的均衡问题。博弈论是研究理性的决策者之间冲突与合作的理论。里面有很多好的帖子, 比较经典, ...

    博弈论
    博弈论(Game Theory,又称对策论)研究决策主体的行为在发生直接的相互作用时,人们如何进行决策以及这种决策的均衡问题。博弈论是研究理性的决策者之间冲突与合作的理论。

    里面有很多好的帖子, 比较经典, 值得收藏

    我的"博弈论"学习历程

    通过自己学习博弈论的过程来一起分享博弈论的概念和精华, 一起分享学习过程.

    是谁在华容道放走了曹操:博弈论破解“三国”中的千古之谜(1)

    展开全文
  • 大采高综采的关键技术问题与对策,袁永,屠世浩,大采高综采是厚煤层高采出率开采技术的重要发展方向,论文在界定大采高综采概念、分析其工作面开采基本特征的基础上,系统总结了
  • 博弈学科整体概览

    2020-07-23 17:05:37
    博弈论又被称为对策论(Game Theory)既是现代数学的一个新分支,也是运筹学的一个重要学科。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。博弈论考虑游戏中的...

    一、博弈论的概念

    博弈论又被称为对策论(Game Theory)既是现代数学的一个新分支,也是运筹学的一个重要学科。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。博弈论已经成为经济学的标准分析工具之一。

    二、博弈论的发展历程

    博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。博弈论思想古已有之,中国古代的《孙子兵法》等著作就不仅是一部军事著作,而且算是最早的一部博弈论著作。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。

    博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。

    近代对于博弈论的研究,开始于策梅洛(Zermelo),波莱尔(Borel)及冯·诺依曼(von Neumann)。

    1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统地应用于经济领域,从而奠定了这一学科的基础和理论体系。

    1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。此外,莱因哈德·泽尔腾、约翰·海萨尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的学科。

    三、博弈论的要素

    (1)局中人:在一场竞赛或博弈中,每一个有决策权的参与者成为一个局中人。只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为 “多人博弈”。

    (2)策略:一局博弈中,每个局中人都有选择实际可行的完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。

    (3)得失:一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。

    (4)对于博弈参与者来说,存在着一博弈结果 。

    (5)博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。所谓纳什均衡,它是一稳定的博弈结果。

    四、博弈论的目的

    博弈策略求解是博弈问题中的一个重要内容,另外一个重要的内容是博弈规则的设计:
      也就是说,假设博弈的参与者都是足够理性的,如何设计一个博弈规则能确保公正性或者达到设计者的最大利益。主要的难点是:规则复杂,计算量大。
    主要应用于:

    • 拍卖竞价:互联网广告投放、车牌竞价
    • 供需匹配:污染权、学校录取
    • 公正选举:选举制度、表决制度、议席分配

    五、稳定分配理论(stable matchings theory)

    稳定分配理论是由2012诺奖获得者沙普利使用合作博弈的方法来研究和对比不同的匹配方法而创立的理论。该理论的难点在于要保证一个配对是稳定的。
    稳定匹配的核心思想是实现一种稳定状态,在这种状态下,在匹配完结时不再存在这样两个市场主体,它们都更中意于他人,胜过它们当前的另一半匹配对象。在现实中,我们熟悉的8分钟相亲、学校和学生匹配等例子就是基于稳定市场匹配理论的思想发展而来的。其中双边模型延迟接受算法是稳定匹配理论的两块重要基石。
    双边匹配模型很多市场及社会制度的主要功能就是让其中的主体能和另一个主体相匹配:例如,学生和学校,职员和公司,适婚男女之间。这种市场匹配主要分为单边市场匹配(Single-Sided MarketMatch)双边市场匹配(Two-Sided MarketMatch)

    单边市场匹配”指市场中仅存在一个集合,集合中的个体根据各自的偏好相互匹配。然而,单边市场匹配中的“室友”现象会导致匹配的不稳定。当假设存在四个“室友”{1,2,3,4},其中1最偏好2,2最偏好3,3最偏好1,且他们把4都列为最不偏好者。在这种情况下,任何两两分组都无法实现稳定,因为和4分在一起的人会结束当前匹配去和已经匹配的人再次匹配,且这次新的匹配将会成功,使得市场一直无法实现稳定(Gale&Shapley,1962)。
    双边匹配模型”最早由Gale和Shapley(1962)从研究学生申请学校模型和婚姻稳定问题而提出。所谓的“双边市场”是指存在这样一个市场,市场中有两类个体集合,第一类集合中的个体只能和第二类集合中的个体相匹配。他们证明了在这样一个双边市场中,只要个体的偏好具有完备性及可传递性,以及市场足够的自由,能允许个体进行任何潜在可能的匹配,那么市场中总是存在稳定匹配。同样以4个室友为例,假设任意2个人睡上铺,2个人睡下铺,现在要求只有睡不同铺的人相互匹配,此时就形成了双边市场匹配模型。同时,Gale和Sha-pley指出市场匹配稳定时满足以下两个条件:(1)市场中不存在来自不同类的两个个体在偏好上可以实现相互匹配,但没有匹配的情况;(2)已经配对成功的个体不会尝试结束当前的配对,并试图与来自另一类且已匹配成功的个体进行匹配。
    双边匹配模型存在稳定匹配这一特性,使得其在理论和实践上都得到了广泛的关注,其中一个重要的运用就是劳动力市场的匹配。Shapley和Shubik(1972)利用数学模型抽象了一个充斥着不可分割商品的双边市场,市场中的每一位参与者既是商品的需求者也是商品的供给者。他们发现在这更为一般化的市场中匹配稳定的性质依旧很稳健。
      Roth最早对双边匹配模型在解决实践问题中的应用进行了研究。他意识到Shapley有关稳定市场匹配的理论和计算可让市场的运作方式变得更清晰。20世纪50年代,美国内科医生的初级劳动力市场的组织方式能保证绝大多数个体匹配成功,但这种匹配缺乏稳定性。Roth(1984)的后续实验研究将Shapley的匹配设计应用于内科医生的初级劳动力市场,他的研究结果表明该种匹配方法能减少原有组织方式下所产生的匹配不稳定及其它存在的无序问题。

    G-S算法(Gale-Shapley)

    在规则设计里面有不同的算法,比方说有GS算法:
    在生活中,人们通常会碰到与资源匹配相关的决策问题(如求职就业、报考录取等),这些需要双向选择的情况被称为是双边匹配问题。在双边匹配问题中,需要双方互相满足对方的需求才会达成匹配。
    1962年,美国数学家大卫·盖尔和博弈论学家沙普利提出了针对双边稳定匹配问题的解决算法,并将其应用于稳定婚姻问题的求解。
    稳定婚姻问题(stable marriage problem)是指在给定成员偏好的条件下,分两组成员寻找稳定匹配。由于这种匹配并不是简单地价高者得,所以匹配解法应考虑双方意愿。
    稳定婚姻问题的稳定解是指不存在未达成匹配的两个人都更倾向于选择对方胜过自己当前的匹配对象。

    最大交易圈算法(Top-Trading Cycle algorithm)

    匹配问题中,还有一类交换不可分的的标的物的匹配问题,被称为单边匹配问题,如远古时期以物易物、或者宿舍的床位分配。
    1974年,沙普利和斯夫提出了针对单边匹配问题的稳定匹配算法:最大交易圈算法(TTC),算法过程如下:
    首先每个交易者连接一条指向他最喜欢的标的物的边,并从每一个标的物连接到其占有者或者是具有最高优先权的交易者。
    此时形成一张有向图,且比存在交易圈,对于交易圈中的交易者,将每人指向节点所代表的标的物赋予其,同时交易者放弃原先占有的标的物,占有者和匹配成功的标的物离开匹配市场
    接着从剩余的交易者和标的物之间重复进行交易圈匹配,直到无法形成交易圈,算法停止。

    室友匹配问题

    在这里插入图片描述在这里插入图片描述

    六、博弈论的类型

    博弈的分类根据不同的基准也有不同的分类。

    一般认为,博弈主要可以分为合作博弈和非合作博弈。合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。

    从行为的时间序列性,博弈论进一步分为静态博弈、动态博弈两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。通俗的理解:"囚徒困境"就是同时决策的,属于静态博弈;而棋牌类游戏等决策或行动有先后次序的,属于动态博弈。

    按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。完全博弈是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。不完全信息博弈是指如果参与人对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的信息,在这种情况下进行的博弈就是不完全信息博弈。

    经济学家们所谈的博弈论一般是指非合作博弈,由于合作博弈论比非合作博弈论复杂,在理论上的成熟度远远不如非合作博弈论。非合作博弈又分为:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈。与上述四种博弈相对应的均衡概念为:纳什均衡(Nash equilibrium),子博弈精炼纳什均衡(subgame perfect Nash equilibrium),贝叶斯纳什均衡(Bayesian Nash equilibrium),精炼贝叶斯纳什均衡(perfect Bayesian Nash equilibrium)。

    博弈论还有很多分类,比如:以博弈进行的次数或者持续长短可以分为有限博弈和无限博弈;以表现形式也可以分为一般型(战略型)或者展开型;以博弈的逻辑基础不同又可以分为传统博弈和演化博弈。

    下面列举了一些我们经常会提到的博弈模型,可以作为入门的兴趣导师——

    智猪博弈——搭好顺风车,借力成事

    Boxed pigs game, 一个著名的纳什均衡的例子

    枪手博弈——对比关系及策略决定强弱

    囚徒困境——个人理性与集体的非理性

    Prisoner’s Dilemma, 是博弈论的非零和博弈中具代表性的例子,反映個人最佳選擇並非团体最佳選擇

    斗鸡博弈——狭路相逢勇者未必胜

    Chicken Game,又叫草鸡博弈、懦夫博弈、胆小鬼博弈

    分蛋糕博弈——讨价还价的策略

    以牙还牙——有一种智慧叫宽恕

    Tit for tat,是一个用于博弈论的重复囚徒困境(Reiterated Prisoner’s Dilemma)非常有效的策略

    鹰鸽博弈——路径依赖法则新解

    Hawk Dove game ——进化中的路径依赖
    该模型的两个纯策略均衡类似于胆小鬼博弈,而混合策略均衡则导出了进化稳定策略的概念。此外还有不完全信息条件下的贝叶斯博弈版本。

    蜈蚣博弈——从后往前的推理

    Centipede game

    猎鹿博弈——合作是硬道理

    Stag Hunt Game, 又称猎鹿模型(Stag Hunt Model)、猎人的帕累托效率

    酒吧博弈——求同存异的智慧

    Bar Problem

    鲇鱼效应——有竞争才有发展

    Catfish Effect

    重复博弈——冲突与合作方能共享

    Repeated Games, 是指同样结构的博弈重复许多次,其中的每次博弈称为“阶段博弈”(stage games)。重复博弈是动态博弈中的重要内容,它可以是完全信息的重复博弈,也可以是不完全信息的重复博弈。
    重复博弈所指的是一类特殊的扩展形式的博弈(extensive form game)。此类博弈中包含一个基础博弈(base game)——称为阶段博弈(stage game);在整个重复博弈中,该阶段博弈会被重复一定次数。阶段博弈一般是一个大家熟悉的博弈(如囚徒困境)。类似的,非重复博弈也可称为单一阶段博弈(single stage game)或单次博弈(single shot game)。

    协和谬误——欲罢不能的错上加错

    Coordination Problem, 即某件事情在投入了一定成本、进行到一定程度而后发现不宜继续下去,却苦于各种原因而将错就错,欲罢不能

    信息甄别——酒好不怕巷子深

    人质困境——雪上加霜的囚徒困境

    脏脸博弈——都是共同知识惹的祸

    成本博弈——摆脱沉没成本羁绊的策略

    手表定律——标准不同结论就不同

    Watch Law

    策略均衡——谁也不得罪

    strategy equilibrium

    本文部分选自
    作者:深度学习与先进智能决策
    链接:https://juejin.im/post/5e33cf9f5188252c5232b039
    来源:掘金
    著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

    展开全文
  • 博弈——game thoery

    千次阅读 2007-04-18 10:11:00
    博弈论(game thoery),又称对策论、竞赛论或游戏论,用于分析竞争双方的 态势与对策及其反应,研究决策主体的行为发生直接相互作用时的决策,以及这些决策的均衡问题。博弈论为经济主体的相机决策提供了数理模型依据...
  • 接着对供应链优化模型进行总结 ,包括排队论、对策论、网络流和策略评价模型 ,并重点讨论了一些典型的混合整数规划 ( Mixed Integer Programming,MIP)模型 ;在此基础上 ,对供应链优化模型框架进行分析 ,并讨论了供应...
  • 在云计算网络环境下可充分发挥互联网的高效性及瞬时性近年来我国云计算技术快速普及运用其安全性受到了各界的广泛关注基于此本文立足云计算网络环境的基本概念分析了其目前面临的主要安全问题并提出相应的解决对策...
  • 法学论文的题目如何选定 课题选定的四项要求: 1、有学术性、理论性 2、有实践... 学位论文的选题应当是:研究一项法律理论,或者研究一项法律制度,或者研究一个法律原则,或者研究一个法律概念。 答辩委员会成...
  • 论文研究-费用分摊问题与群决策方法.pdf, 费用分摊(Cost Allocation)问题是综合性...本文简要回顾了关于费用分摊问题研究的主要结果,包括传统型费用分摊方法和基于多人合作对策概念对策型费用分摊方法。作为本文的
  • 针对局中人以三角模糊数的形式参与合作对策的问题,给出了T-模糊联盟间相互影响的基本概念.探讨了T-模糊联盟间相互独立时模糊特征函数的表达式及模糊特征函数具有K-严格...
  •  一、会计职业道德的基本特征及概念 (一)原性则 (二)无私性 (三)服务性 (四)时代性 二、会计职业道德建设的基本途径 (一)加强政治学习,提高对会计职业道德建设重要性的认识 (二)加强职业道德教育,增强财会...
  • 概念文章的目的是针对以下方面提出建议:(1)既有货币和金融体系中的系统性缺陷,尤其是造成兴衰周期的机制; (2)认知和行动因素限制了中央银行持续有效地调节或限制这些周期的能力。 借鉴早期的研究(我们自己...
  • 项目管理中问题与对策探讨 121 应用P3E进行IT项目管理初探 123 影响项目的因素及经验总结 134 用项目总结来减少问题的重复发生 136 有效控制质量、工期、成本三大目标 138 在项目管理中面对面交流最重要 139 IT项目...

空空如也

空空如也

1 2 3
收藏数 50
精华内容 20
关键字:

对策论概念