精华内容
下载资源
问答
  • 以N条包含一个制造商和一个零售商的单链式供应链为研究对象,分别讨论了多供应链间Nash博弈和Stackelberg博弈问题,对N条供应链间博弈均衡解进行了分析和求解,证明了N条供应链博弈下均衡解的存在性和唯一性。...
  • 双重三角模糊矩阵博弈主动预警响应决策模型
  • 简要介绍社会困境的涵义,详细阐述博弈决策的理性选择理论、认知转换理论和生物进化理论,并且从认知控制、社会认知以及奖励预期3个过程揭示博弈决策的神经机制.未来研究应力求突破先前理论模型的不足,深入考察个体...
  • 在非合作和合作两种不同情景下,不考虑缺货损失条件,研究一个主导方供应商和两个跟从方制造商不同订货成本结构的两层精敏供应链上游段Stackelberg博弈的EOQ决策模型。引入供应商价格折扣策略,通过模型分析与求解,...
  • 基于随机微分博弈的保险公司最优决策模型,罗琰,,本文研究了基于保险公司与自然之间二人-零和随机微分博弈的最优投资及再保险问题。假设保险公司具有指数效用,自然是博弈的“虚�
  • 合作博弈下直饮水设施最佳成本决策模型及实证,张雪花,胥然然,本文采用合作博弈的分析方法来解决直饮水设施建设运营成本确定的难题。首先建立供水方与用户的合作博弈模型,然后利用沙普利(Sha
  • 从风险与安全的角度提出一种新的用户行为决策模型,将服务提供者和用户作为非合作博弈的对立方,在不完全信息静态博弈的基础上研究博弈参与者之间的交互行为。从博弈参与者的相互依赖的行动选择角度建立博弈模型,求...
  • 的激励机制, 建立WSNs 节点信任博弈模型以反映信任建立过程中表现出的有限理性和每次博弈过程的收益. 基于 演化博弈论研究节点信任策略选择的演化过程, 给出WSNs 节点信任演化的复制动态方程, 提出并证明在不同...
  • 论文研究-考虑产品结构的供应链设计决策模型及其博弈分析.pdf, 结合供应链运作的特点,从MRP 中的物料单(BOM)入手考虑产品结构建立了以供应链收益最大化为目标的多层供应...
  • 基于动态博弈分析的企业反倾销应诉“成本-收益”决策模型研究,刘爱东,曾辉祥,反倾销涉案企业参与应诉与否或参与程度的决策,取决于应诉收益与应诉成本的权衡。基于动态博弈理论,建立不完备信息下出口企业应
  • 模糊决策环境下两个竞争零售商之间的Stackelberg博弈模型
  • 分析医药物流网络需求特征,描述了一个包含药品生产企业、第三方物流企业、物流中心、销售终端在内的“三方四层”医药物流联盟结构体系,建立了合作博弈模式下的医药物流网络节点决策的双层规划模型,上层规划以联盟...
  • 针对多传感器信息融合系统中普遍存在的冲突信息环境下的融合系统决策问题,提出了一种新的基于威胁博弈决策级信息融合模型。该模型将冲突环境下的融合过程视为局部决策空间、策略空间和全局决策空间上的变换过程,...
  • 介绍了扩展博弈决策模型及其操作流程,通过双支付参数分别讨论了决策中心与诊断资源联盟间的成本博弈、诊断资源间的决策信息熵递减博弈;并运用多属性决策方法进行决策结论的仲裁。以工程装备故障为例,简述了本博弈...
  • 数值算例分析表明,合作博弈决策下供应链总利润最优、制造和再制造产品市场销售价格最高,而合作博弈和Stackelberg主从博弈都会以牺牲再制造产品利润为代价获得最优利润,因此再制造部门会偏好纳什均衡博弈,采取以...
  • 1.2.1 囚徒的困境一、基本模型囚徒的困境是图克(Tucker)1950年提出的。该博弈博弈论最经典、著名的博弈。该博弈本身讲的是一个法律刑侦或犯罪学方面的问题,但可以扩展到许多经济问题,以及各种社会问题,可以...

    1.2.1 囚徒的困境

    一、基本模型

    囚徒的困境是图克(Tucker)1950年提出的。

    该博弈是博弈论最经典、著名的博弈。

    该博弈本身讲的是一个法律刑侦或犯罪学方面的问题,但可以扩展到许多经济问题,以及各种社会问题,可以揭示市场经济的根本缺陷。

    假设囚徒2选择不坦白,囚徒1选择坦白的收益(0) > 选择不坦白的收益(-1),所以囚徒1选择坦白。

    (根据个体理性的原则,囚徒1根据自身利益最大的原则行事,不会关心此时另一方会被重判8年的问题)

    假设囚徒2选择坦白,囚徒1选择坦白的收益(-5) > 选择不坦白的收益(-8),所以囚徒1仍然选择坦白。

    也就是说,无论囚徒2选择坦白还是不坦白,囚徒1都会选择坦白。“坦白”是囚徒1的一个“上策”。


    同理可以分析:

    假设囚徒1选择不坦白,囚徒2选择坦白的收益(0) > 选择不坦白的收益(-1),所以囚徒2选择坦白。

    假设囚徒1选择坦白,囚徒2选择坦白的收益(-5) > 选择不坦白的收益(-8),所以囚徒2仍然选择坦白。

    也就是说,无论囚徒1选择坦白还是不坦白,囚徒2也都会选择坦白。“坦白”也是囚徒2的一个“上策”。


    所以该博弈的最终结果必然是囚徒1和囚徒2都选择坦白。


    二、双寡头削价竞争

    在市场竞争方面典型的囚徒的困境现象之一是寡头之间的价格战。


    和囚徒的困境博弈完全相似:

    假设寡头2选择高价,寡头1选择低价的收益(150) > 选择高价的收益(100),所以寡头1选择低价。

    假设寡头2选择低价,寡头1选择低价的收益(70) > 选择高价的收益(20),所以寡头1仍然选择低价。

    也就是说,无论寡头2选择高价还是低价,寡头1都会选择低价。“低价”是寡头1的一个“上策”。


    同理可以分析:

    假设寡头1选择高价,寡头2选择低价的收益(150) > 选择高价的收益(100),所以寡头2选择低价。

    假设寡头1选择低价,寡头2选择低价的收益(70) > 选择高价的收益(20),所以寡头2仍然选择低价。

    也就是说,无论寡头1选择高价还是低价,寡头2都会选择低价。“低价”也是寡头2的一个“上策”。


    所以该博弈的最终结果必然是寡头1和寡头2都选择低价。

    1.2.2 赌胜博弈

    赌博、竞技等构成的博弈问题,在经济中也有许多应用,赌胜博弈也是一类重要的博弈问题,对经济竞争和合作也有很大启示。

    赌胜博弈的特点是一方得等于另一方失,不可能双赢,属于“零和博弈”。

    一、田忌赛马

    • 该博弈中有两个博弈方即齐威王和田忌
    • 两博弈方可选择的策略是己方马的出场次序,因为三匹马的排列次序共有3!=3*2=6种,因此双方各有6种可选择的策略
    • 双方在决策前都不能预先知道对方的决策,因此可以看做是同时选择策略的,决策没有先后次序关系
    • 如果把赢一千斤铜记成得益1,输一千斤铜记成得益-1,则两博弈方在双方各种策略的组合下的得益矩阵如下:


    取胜关键:不让对方猜到自己策略,尽可能猜出对方策略


    二、猜硬币博弈



    三、石头、剪子、布




    1.2.3 产量决策的古诺模型

    古诺模型是寡头产量竞争,是市场经济中最常见的问题之一。
    古诺1838年提出,直到现在还是经常使用。
    古诺模型有很多扩展。

    古诺模型与囚徒困境相似,对理解市场经济和博弈分析本身都有重要价值。

    一、三厂商离散产量












    二、n个厂商连续产量博弈

    该博弈中各博弈方的可选策略数都是无穷大,意味着我们不可能用罗列的办法或者矩阵、图表的形式把它们表达出来。



    总结上面几个式子为:

    因此,厂商i的产量决策与其他厂商的产量决策之间是复杂的相互依存关系

    其实,如果把上一个三厂商离散变量的模型改为连续产量的,就是现在这个模型的一个具体的例子。



    展开全文
  • 针对制造/再制造产品的市场竞争与合作问题, 考虑广告投入对产品消费者效用的...数值算例分析表明, 合作博弈决策下供应链总利润最优、制造和再制造产品市场销售价格最高, 而合作博弈和Stackelberg主从博弈都会以牺牲再
  • 粒度决策演化模型是基于时间序列对粗糙集在动态数据预测方面的一种方法,...但是在预测过程中出现属性支持度相同的属性时如何解决冲突模型并未说明,在粒度决策演化模型的基础上利用博弈论方法对解决这种冲突进行研究。
  • 平时自己收集整理的数学建模资料,上传让大家共享,顺便赚点积分
  • 博弈模型——Part 1

    2021-04-29 10:15:51
    博弈模型——Part 1 引入:什么是模型?(model) 答:是基于现实问题的决策问题固化后的产物。把复杂的、抽象的现实决策问题,转化为直接的、可解释的、结构化的问题。 固化——例如:研究企业竞争力时,其...

    博弈论模型——Part 1

    引入:什么是模型?(model)

    答:是基于现实问题的决策问题固化后的产物。把复杂的、抽象的现实决策问题,转化为直接的、可解释的、结构化的问题。

    固化——例如:研究企业竞争力时,其影响因素复杂多样,从企业自身属性到外在环境因素,多种多样,如果全部考虑,则分析非常复杂困难,几乎无法找到核心。但是模型可以划分边界,使得问题的研究聚焦固化。(假设的意图是为了使决策问题限制在一定范围之内)

    结构化——可解释的且直白易分析。非结构化的问题是抽象的,例如如何做人,这是非结构化的,例如根据烹饪书做一款点心,这是结构化问题。

    模型的分类:

    • 理论模型(例如马克思主义中国化模型)
    • 数理模型
      1. 运筹&优化
      2. 统计

    在做模型之前,需要根据其最后的用途来决定它固化的程度和结构化的程度。

    通过博弈论模型,可以将两方或者多方的关系进行固化。

    博弈建模是管理科学研究中最为常见的一种理论研究方法,实证分析时会借助理论模型

    Ⅰ 博弈论导论完全信息博弈

    Part 1

    • 博弈论的由来

    新古典经济学:理性人假定;稀缺资源有效配置下的人的经济行为;价格制度下完全竞争性的完全信息的市场配置问题。

    但是现实问题中,会出现寡头或者信息不对称,于是出现了博弈论。

    将信息固化为两类,一类是H,一类是L,为了方便进行结构化。

    • 博弈论的历史

    NASH(1953年)的讨价还价模型被认为是博弈论的起点。

    博弈论是研究多个主体之间管理行为的主要理论和研究方法。

    • 博弈论的基本研究范式——SCP

    Structure:博弈的结构

    • 参与人:博弈论中选择行动以最大化自己效用的决策主体
    • 信息:可能有概率信息,两方不一致(信息不对称)
      1. 完美信息:只一个参与人对其他参与人(包括“自然”)的行文选择有准确的了解,及每一个信息集只包含一个值。对已经发生的信息和将要发生的信息都非常了解。
      2. 完全信息:自然不首先行动或者自然的行动的初始行动所有参与人观察到的情况。知道所有的状态和状态发生的概率(但不确定具体是哪一个)信息不对称:一般指信息不完美。例如:甲生产厂知道自己产品是良品还是差品,但是销售商乙只知道良品的概率(完全但不完美信息)
      3. 共同知识:指“所有参会人知道所有参与人知道所有参与人知道……”的知识。

    Conduct:参与人行为

    • 行动:外生变量&决策变量(一般少于3个)
      1. Aj表示第j个参与人的一个特定行动
      2. 行动的顺序
    • 战略:参与人选择行动的规则
      1. 参与人的“相机行动方案”
      2. 静态博弈中,战略和行动是等同的(经济学上意义比较强)
      3. 作为一种行动规则,战略必须是完备的。
      4. 行动:A是最优的,战略:当B,C等于X时,A是最优的

    Performance:博弈结构(绩效)

    • 支付函数:参与人从博弈中获得的效用水平
      1. 博弈的基本特征是一个参与人的支付不仅取决于自己的战略选择,而且取决于所有其他参与人的战略选择
      2. 博弈建模其关键在于支付函数的构建
    • 结果:博弈分析真正感兴趣的要素的集合
    • 均衡:所有参与人的最优战略组合

    难点:(1)问题固化的是否合理清晰

         (2)结论是否可信

     

    纳什均衡:给定别人战略的情况下,没有任何单个参与人可以通过改变当前的战略获益,从而没有人有积极性打破这种均衡。(敌不动我不动,动则伤身)

    例如:两个企业联合起来形成卡特尔,垄断获利更大,但是两个寡头企业竞争形成的纳什均衡其总获益明显小于卡特尔

    纳什均衡分析常用于:公共产品的供给、大国军备竞赛、经济改革、中小学减负

    展开全文
  • sHEN等建立了特许权期的决策模型(BOTCCM),得出了特许权期的可行区间,但BOTCCM模型未能提供在该区间内选择具体的特许权期时间点的方法。这是该模型在应用中的一个重要缺陷,需要进一步改进和完善。应用博弈论原理...
  • 为解决服务型制造系统(service-oriented manufacturing system,SOMS)中的核心企业外包任务面向单一供应商的分配决策问题,提出并建立了一对一Stackelberg外包任务分配决策博弈模型。在该博弈模型中,将核心企业映射为...
  • 博弈模型

    2015-08-01 09:09:00
    【概述】 最近的几次比赛,博弈的题目一直不少,而且博弈问题是一块比较复杂、庞大的内容,因此在这里小结一下,希望能够帮自己理清一些思路,争取也多来几个系列,呵呵。 竞赛中出现的组合游戏问题一般都满足...

    转自 http://www.cppblog.com/sdfond/archive/2010/02/06/107364.html

     

    【概述】
      最近的几次比赛,博弈的题目一直不少,而且博弈问题是一块比较复杂、庞大的内容,因此在这里小结一下,希望能够帮自己理清一些思路,争取也多来几个系列,呵呵。

    竞赛中出现的组合游戏问题一般都满足以下特征:
        1. 二人博弈游戏,每个人都采用对自己最有利的策略,并且是两个人轮流做出决策
        2. 在游戏中的任意时刻,每个玩家可选择的状态是固定的,没有随机成分
        3. 游戏在有限步数内结束,没有平局出现
      大部分的题目都满足上述条件,因此这里只讨论在上述条件范畴内的博弈问题。这类博弈问题,通常还有若干分类。一种是规定移动最后一步的游戏者获胜,这种规则叫做Normal Play Rule;另一种是规定移动最后一步的游戏者输,这种规则叫做Misere Play Rule,也称为Anti-SG游戏。此外,对于游戏的双方,如果二者博弈的规则相同,那么称为这类游戏是对等(impartial games)的;否则称为不平等游戏(partizan games )。当初WHU的那场比赛就是由于对于这个概念不是很清晰,导致看完题目之后就用SG定理来做,浪费了很多机时。实际上,解决不平等博弈问题的方法和普通的博弈问题(SG游戏)是有区别的,一般会采用动态规划或者surreal number。

    【博弈基础知识】
      在SG游戏中,最为人熟知的是必胜必败态,也叫NP态理论。注意的是,P态对应的是先手必败态,N态对应的是先手必胜态。必胜必败态理论是:
      1. All terminal positions are P-positions
      2. From every N-position, there is at least one move to a P-position
      3. From every P-position, every move is to an N-position
      英文的表述非常简洁清晰,而且这个理论也很好理解,如果在当前状态的下一步可以走到必败态,那么当前玩家就可以走到那个 状态,把必败态推给另一方;如果所有可达状态都是必胜态,那么当前玩家无论如何走,都会把必胜态让给对方。根据必胜必败态理论,我们可以递归的求出每个状 态是N态还是P态。必胜必败态理论其实已经把博弈问题转化成了一个有向图,借助图这个模型来分析问题,使得问题变得形象了许多。需要注意的是,这种SG游 戏对应的有向图是无环的,因为如果有环,那么游戏双方就可能在环上不停的转换状态,游戏不能在有限步终止,这样就不满足组合游戏的特征3了。
      然而在很多时候仅仅知道某个状态是必胜还是必败是不够的,因为如果存在多个组合游戏(比如经典的Nim),对应的状态集合非常大,无法直接利用必胜必败态理论求解,因此需要用到博弈论中一个很重要的工具:SG函数。
      某个状态的SG函数值定义为当前状态所有不可达的状态编号中最小的编号,其中终止态的SG函数值是0。有了这个工具,就引入一个非常强大的定理——SG分解定理:

      多个组合游戏的SG函数值是每个组合游戏的函数值的和。(这里的和定义为异或操作)
      
      SG分解定理的证明不是很难,其实和Nim的证明很像。根据这个定理,我们就知道为什么Nim的解法是异或所有的石子个数了,因为每堆石子的SG值就是石子的个数。SG分解定理告诉我们任何SG游戏都可以转化成Nim游戏来做。
      Nim中的一个变形就是拿走最后一块石子的人算输。通过修改SG的计算规则,可以得出相同的结论(因为当石子个数是1的时候SG值为0,因此要单独处理);当然也可以利用一个叫做SJ定理的方法来做,依然是要处理当所有堆的SG值不大于1的情况。

    【博弈基本模型】
       除了Nim模型,很多模型都看似复杂,最后都划归到了Nim模型上,然后利用SG分解来做的。在证明两种模型等价的时候,可以通过计算SG值判断是否相 同,或者通过判断必胜策略的走法将其转化为Nim。许多模型非常的神奇,其获胜策略又千差万别,因此无法一一列举,但是掌握一些经典模型是必须的,这样通 过模型的转化可以简化问题的难度。
      经典模型1:Nim变种。包括:
        (1) 楼梯Nim。把奇数台阶的石子作为Nim,二者等价,因为必胜的策略是相同的。
        (2) 每次可以取k堆,这个是经典的Moore Nim。它是泛化的Nim游戏。
        (3) 两堆石子,每次可以取一堆或两堆,从两堆取得时候个数必须相同,谁先取完获胜。这个是著名的威佐夫博弈,跟黄金分割数有关,具体证明不是很清楚,但是用SG值打表可以找出规律。代码如下:

    #include <cstdio>
    #include <cmath>
    #include <algorithm>
    using namespace std;

    int main()
    {
        const double k = (sqrt(5.0) + 1) / 2.0;
        int a, b, t;

        while (scanf("%d %d", &a, &b) == 2)
        {
            if (a > b)
                swap(a, b);
            t = b - a;
            if (a == (int)(t * k))
                puts("0");
            else
                puts("1");
        }

        return 0;
    }


        (4) Subtraction Games。一种通用的Nim游戏,每次从可用状态集合中选择下一步的状态,有很多变形,核心思想还是计算SG函数值。
        (5) Take-and-Break Game。每次把局面分成多个Nim子游戏,利用SG分解定理求出对应的SG值。
      经典模型2:翻硬币游戏(Coin Turning Game)
        (1) 一维的翻硬币游戏,每次可以翻1个或两个。通过单独考虑每个可以翻的硬币发现,Coin Turning Game的SG值和Nim等价,因此两个模型等价。需要注意的是,许多翻硬币游戏根据题目的要求,一般编号从0开始。
        (2) 一维的翻硬币游戏,每次可以翻1个或两个,限定了翻第二枚硬币的范围,那么就和Subtraction Game等价了。
        (3) 一维的翻硬币游戏,每次可以翻1个、2个或3个,这个游戏叫做Mock Turtles,有一个神奇的规律,是Odious Number序列。
        (4) 高维的翻硬币游戏,需要用到Nim积和Tartan定理。
      翻硬币模型的变化更多,很多模型都有一些奇妙的规律,需要打表才能发现。
      经典模型3:删边游戏(Green Hackenbush)
        (1) 树的删边游戏:Colon原理证明这种模型和Nim依然是等价的,多个叉的SG值异或就是对应根节点的SG值。
        (2) 无向图删边游戏:利用Fursion定理收缩圈,然后就转换成树的删边游戏了,不过这个定理还不会证。

    转载于:https://www.cnblogs.com/usedrosee/p/4693624.html

    展开全文
  • 学习目标 了解博弈论的产生和发展情况 掌握博弈博弈论的概念博弈论的分类 了解和掌握博弈论的经典模型 掌握纯策略和混合策略Nash均衡解的求解方法 掌握联盟博弈及夏普利值的概念会求解两人联盟和三人联盟情况下的...
  • 在明确市场主体需求的基础上,分别对发电商、售电商和大用户主体构建了市场决策模型;根据Berge-NS均衡模型制定了电力市场多主体非合作博弈竞争的流程和步骤,并利用磷虾群(KH)优化算法对各市场主体竞价策略的动态...
  • 博弈论总结 四大博弈模型 SG函数

    千次阅读 多人点赞 2020-09-03 16:18:18
    1.两人游戏,每人轮流做出决策,且每人的决策都是对自己有利的。(让自己赢) 2.有一个终止状态,到终止状态后游戏结束,不会有平局状态。(获胜的条件) 3.游戏可以在有限步数内结束。(不会无限重复,得不到答案)...

    一、博弈论

    1、博弈论是什么

    博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。

    2、平等博弈

    在我们平时做题碰见的博弈都是平等博弈,平等博弈满足下面这几个要求:
    1.两人游戏,每人轮流做出决策,且每人的决策都是对自己有利的。(让自己赢)
    2.有一个终止状态,到终止状态后游戏结束,不会有平局状态。(获胜的条件)
    3.游戏可以在有限步数内结束。(不会无限重复,得不到答案)
    4.所有规定对两人都是一样的。(平等游戏)

    二、四大博弈模型

    1、巴什博弈:

    1.定义: 只有一堆物品,共n个,两人轮流从这堆物品中取物,规定每次至少取一个,最多取m个,最后取完这堆物品的人获胜。

    2.结论: n%(m+1) != 0,先手肯定获胜

    3.证明: 关于严格证明这里不多提,自己可以分析一下,每次给对手留剩m+1的倍数,最后一轮自己一定获胜,所以就看第一次取,自己能否构建这个局势(剩下m+1的倍数个物品),使得对手必输。


    2、尼姆博弈

    1.定义:任意堆物品,每堆物品的个数也任意,双方轮流取物品,每次只能从一堆中取至少一个物品,取到最后一件物品的人获胜。

    2.结论: 把每堆物品数全部异或起来,若值为0,则先手必败,否则先手必胜。

    3.证明: 我们也是不严格证明,我们将每堆物品数异或起来为0这个状态称为必败态,顾名思义,这个状态下,谁取谁必败。因为当这个状态时,经过两人轮流取物,后者始终可以维持这个必败态,即A取完后,B一定可以取一个数,使得取完后每堆物品数异或起来仍为0。这样一直到最后一轮,B取完一定会使每堆数都为0,此时同样也是必败态(异或起来为0),这时B获胜,A面对所有堆都为0这个状态取,直接失败。
    所以当每堆物品数全部异或起来,若值为0,此时已是必败态,先手必败;若值不为0,则先手一定会取一个数使得每堆数异或起来为0,达到必败态,从而后手必败。
    注: 博弈时,每个人都会走当前最优策略,所以每个人都会尽量给对方创造必败态,给自己创造必胜态。


    3、斐波那契博弈(k倍动态减法)

    1.定义: 有一堆物品,共n个,两人轮流取物,先手可取任意件,但不能不取,也不能把物品取完,之后每次取的物品数不能超过上一次的两倍,且至少为1件,取走最后一件物品的人获胜。

    2.结论: 当且仅当n不是斐波那契数时,先手胜。

    3.证明: 此博弈的证明需要各种不等式关系证明,一般记住结论即可,具体证明可以看这篇文章

    扩展:k倍动态减法

    1.定义: 有一堆物品,共n个,两人轮流取物,先手可取任意件,但不能不取,也不能把物品取完,之后每次取的物品数不能超过上一次的k倍,且至少为1件,取走最后一件物品的人获胜。
    和斐波那契博弈一样,只不过拿的不是2倍了,而是一个任意的k倍,当k为2时就是完全的斐波那契博弈了。

    2.结论: 我们手动构建一个a数列,若n是该数列中的数时,先手必败,否则后手必败。即该数列是必败态。

    3.证明: 代码如下,具体证明可以看这篇文章

    4.构建队列模板

    #include<iostream>
    using namespace std;
    const int N = 10010;
    
    int main()
    {
    	int n,k,a[N],b[N];
    	cin >> n >> k;
    	a[0] = b[0] = 1;
    	int i = 0,j = 0;
    	while(n > a[i])
    	{
    		i++;
    		a[i] = b[i-1] + 1;
    		while(a[j+1] * k < a[i])
    			j++;
    		if(a[j] * k < a[i])
    			b[i] = b[j] + a[i];
    		else
    			b[i] = a[i];
    	}
    	if(n == a[i])
    		cout << "lose" << endl;
    	else
    		cout << "win" << endl;
    
    	return 0;
    }

    4、威佐夫博弈

    1.定义: 有两堆物品,数量分别为a个和b个,两人轮流取物,每次可以从一堆中取出任意个,也可以从两堆中取出相同数量的物品,每次至少要取一个,最后取完所有物品的人获胜。

    2.结论: 我们规定两堆数量为a和b且a < b,若a和b的差值乘上1.618恰好是a的值,则次为必败态,先手必败。有时追求精度可记w = (int)[( (sqrt(5)+1) / 2) * (b-a)],若w == a,则先手必败,否则先手必胜。

    3.证明: 这个证明比较神奇,也出现了神奇的黄金分割率618,具体证明可以看这篇文章

    4.代码模板:

    #include<iostream>
    #include<cmath>
    #include<algorithm>
    using namespace std;
    
    int main()
    {
    	int a,b;
    	cin >> a >> b;
    	if(b < a)
    		swap(a,b);
    	double c = (double)(b-a);
    	int w = (int)(((sqrt(5)+1) / 2) * (b-a));
    	if(w == a)
    		cout << "lose" << endl;
    	else
    		cout << "win" << endl;
    
    	return 0;
    }

    三、SG函数

    1.mex函数: mex函数就是求集合中未出现的最小自然数。如mex{1,4,5,8} = 0,mex{0,1,5,9,13} = 2 。

    2.SG函数: SG函数是将一个ICG(公平组合游戏)看作一个有向无环图,每一个局面看作一个结点,给所有当前局面和能走到的下一个局面建一条有向边。

    对于一个给定的有向无环图,定义关于图的每个顶点的SG函数SG如下,SG(x)= mex({ SG(y1),SG(y2),…,SG(yk)}) (y是x的后继) 。

    在有向图游戏中,对于每个节点x,设从x出发共有k条有向边,分别到达节点y1,y2,…,yk,SG(x)为x的后继节点的SG函数值构成的集合再执行mex运算的结果为该节点x的SG函数值。

    整个有向图游戏G的SG函数值被定义为有向图游戏起点的SG函数值。

    3.结论:
    先定义 有向图游戏的和的SG函数值等于它包含的各个子游戏SG函数值的异或值。而终点也就是游戏结束局面的SG(x) = 0。
    则有:

    有向图游戏的某个局面必胜,当且仅当该局面对应节点的SG函数值大于0
    有向图游戏的某个局面必败,当且仅当该局面对应节点的SG函数值等于0

    具体证明可以参考这篇文章


    这些就是基础博弈的一些总结,后期可能会修改增加。
    小白自用笔记,简单整理。

    展开全文
  • 现有防御决策中的随机博弈模型大多由矩阵博弈与马尔可夫决策组成,矩阵博弈中假定防御者已知攻击者收益,与实际不符。将攻击者收益的不确定性转换成对攻击者类型的不确定性,构建了由静态贝叶斯博弈与马尔可夫决策...
  • 建立一种基于情绪的Nash-Q决策模型,它由认知层和情绪层组成.认知层模型由Nash-Q算法实现,情绪层建立在情绪记忆和评价理论之上,由高兴、伤心、恐惧、厌烦组成情绪空间,建立相应刺激与情绪映射模型、情绪与行为动作...
  • 斯塔克尔伯格竞争模型(主从博弈模型

    万次阅读 多人点赞 2018-05-25 16:10:24
    斯塔克尔伯格竞争模型(主从博弈模型) 基本概念 古诺模型实际上是假定两个寡头厂商同时作出各自的产量决策的。 现在假设厂商1先决定它的产量,然后厂商2知道厂商1的产量后再做出它的产量决策。因此,在确定...
  • 在此基础上,建立了政府决策者(公共停车场)与私人效益最大化追求者(私营停车场)参与的NASH博弈模型,探讨NASH平衡条件下的两类停车场的最优收费模式.同时,比较了两类停车场共存的博弈竞价机制与单一私营停车场...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 6,236
精华内容 2,494
关键字:

博弈决策模型