精华内容
下载资源
问答
  • 前言 完整大图请点击链接

    前言

    完整大图请点击链接
    在这里插入图片描述

    展开全文
  • 博弈论信息经济学 非合作博弈理论 完全信息静态博弈 不完全信息静态博弈
  • 博弈论——完全信息博弈

    千次阅读 2019-01-01 11:44:40
    一场博弈中的基本属性: N个玩家 每个玩家都具有非空备选策略集Ai,i∈NA_{i}, i\in NAi​,i∈N 收益函数ui:A1×A2×...×AN→R for i∈Nu_{i}:A_{1}\times A_{2} \times...\times A_{N}\...

    版权声明:本文为原创文章,未经博主允许不得用于商业用途。

    基本概念

    一场博弈中的基本属性:

    • N个玩家

    • 每个玩家都具有非空备选策略集 A i , i ∈ N A_{i}, i\in N Ai,iN

    • 收益函数 u i : A 1 × A 2 × . . . × A N → R   f o r   i ∈ N u_{i}:A_{1}\times A_{2} \times...\times A_{N}\rightarrow R\space for\space i \in N ui:A1×A2×...×ANR for iN (即所有策略的笛卡儿积作为总体策略集合,其中每个玩家的每种策略都对应一个收益)

      • 收益函数可以被偏序关系取代
    • 博弈结果(outcome): a = ( a 1 , a 2 , . . . , a N ) a=(a_{1},a_{2},...,a_{N}) a=(a1,a2,...,aN),其中 a i a_{i} ai对应第i个玩家所选的策略

    • 结果空间(outcome space): A = A 1 × A 2 × . . . × A N A=A_{1}\times A_{2} \times...\times A_{N} A=A1×A2×...×AN

    • 对于每种结果,定义 a − i = ( a 1 , . . . a i − 1 , a i + 1 , . . . a N ) = a / a i a_{-i}=(a_{1},...a_{i-1},a{i+1},...a_{N})=a/a_{i} ai=(a1,...ai1,ai+1,...aN)=a/ai,即当玩家i选择策略a时其余玩家采取的策略

    • A − i = A 1 × . . . × A i − 1 × A i + 1 × . . . × A N A_{-i}=A_{1}\times ...\times A_{i-1}\times A_{i+1}\times...\times A_{N} Ai=A1×...×Ai1×Ai+1×...×AN,即其余玩家的结果空间

    • 纳什均衡:策略 a a a为纳什均衡点当且仅当:

      ∀ i ∈ N , ∀ a i ∈ A i , u i ( a i ∗ , a − i ∗ ) ≥ u i ( a i , a − i ∗ ) \forall i\in N, \forall a_{i}\in A_{i},u_{i}(a^{*}_{i}, a^{*}_{-i})\geq u_{i}(a_{i}, a_{-i}^{*}) iN,aiAi,ui(ai,ai)ui(ai,ai),即所有玩家的策略改变策略都不会获得更多收益,所有玩家都没有改变策略的动机。

    • 完全信息博弈即所有玩家的策略偏序关系公开

    策略式博弈(Strategy Games)

    ​ 策略式博弈即为最简单的博弈,具有有限的玩家、非空策略集和收益函数,可以表示为:
    G = { N , { A i } i = 1 N , { u i } i = 1 N } G=\{N,\{A_{i}\}_{i=1}^{N},\{u_{i}\}_{i=1}^{N}\} G={N{Ai}i=1N{ui}i=1N}
    例如经典的囚徒困境可以表示为:

    confessdon’t confess
    confess-6 -60 -12
    don’t confess-12 00 0

    玩家: N = { 1 , 2 } N=\{1,2\} N={1,2}

    策略: A 1 = A 2 = { c , d } A_{1}=A_{2}=\{c,d\} A1=A2={c,d}

    收益: u 1 ( c , c ) = − 6 , u 1 ( c , d ) = 0... u_{1}(c,c)=-6, u_{1}(c,d)=0 ... u1(c,c)=6,u1(c,d)=0...

    寻找纳什均衡方法:

    • u ∈ Z u\in Z uZ

      • 1、对每个玩家,找到对于 A − i A_{-i} Ai中每种策略的的最优收益策略。
      • 2、满足所有玩家最优策略的策略即为纳什均衡点。
    • u ∈ R u\in R uR

      • 1、对每个玩家求出其收益最高的函数(以其策略为自变量,导数为0)
      • 2、联立所有玩家的等式,满足所有等式的解集

    例题:古诺竞争模型(Cournot Competition)

    两家公司需要决定生产量q, G = { { 1 , 2 } , { q 1 , q 2 } , { u 1 , u 2 } } G=\{\{1,2\},\{q_{1},q_{2}\},\{u_{1}, u_{2}\}\} G={{1,2},{q1,q2},{u1,u2}}

    其中商品价格为 p ( q 1 + q 2 ) = m a x ( 0 , a − b ( q 1 + q 2 ) ) p(q_{1}+q_{2})=max(0,a-b(q_{1}+q_{2})) p(q1+q2)=max(0,ab(q1+q2))

    成本为线性函数 c i ( q i ) = c q i c_{i}(q_{i})=cq_{i} ci(qi)=cqi

    收益为 u i ( q 1 , q 2 ) = ( m a x { 0 , a − b ( q 1 + q 2 ) } − c ) q i u_{i}(q_{1}, q_{2})=(max\{0, a-b(q_{1}+q_{2})\}-c)q_{i} ui(q1,q2)=(max{0,ab(q1+q2)}c)qi

    其中 a > b , c > 0 , q 1 ≥ 0 , q 2 ≥ 0 a>b, c>0, q_{1}\geq 0, q_{2}\geq 0 a>b,c>0,q10,q20

    首先寻找player1的纳什均衡,不妨假设其收益大于0,否则他将停止生产。

    则其收益函数为: u 1 = ( a − b ( q 1 + q 2 ) − c ) q 1 u_{1}=(a-b(q_{1}+q_{2})-c)q_{1} u1=(ab(q1+q2)c)q1

    q 1 q_{1} q1求导: u ′ = − 2 b q 1 + a − c − b q 2 u'=-2bq_{1}+a-c-bq_{2} u=2bq1+acbq2,导数为0时取得收益最大值,此时 q 1 = a − c − b q 2 2 b q_{1}=\frac{a-c-bq_{2}}{2b} q1=2bacbq2

    对于player2根据对称性可得 q 2 = a − c − b q 1 2 b q_{2}=\frac{a-c-bq_{1}}{2b} q2=2bacbq1

    联立两等式解得: q 1 ∗ = q 2 ∗ = a − c 3 b q_{1}^{*}=q_{2}^{*}=\frac{a-c}{3b} q1=q2=3bac,即 a ∗ = ( a − c 3 b , a − c 3 b ) a^{*}=(\frac{a-c}{3b}, \frac{a-c}{3b}) a=(3bac,3bac)

    可以拓展到N个玩家博弈,此时同理根据对称性,所有玩家的策略都为 a − c ( n + 1 ) b ) \frac{a-c}{(n+1)b}) (n+1)bac)

    混合策略博弈(Mixed Strategy)

    由于纯策略式博弈经常没有纳什均衡点,因此引入混合策略博弈。

    基本概念:

    ​ 在混合策略中每个玩家的策略集为 Δ ( A i ) \Delta (A_{i}) Δ(Ai)为定义在 R N R^{N} RN上的所有概率分布函数。即为每种策略分配一个概率。

    ​ 则博弈结果即为 p = ( p 1 , p 2 , . . . p N ) ,   w h e r e   p i ∈ Δ ( A i ) p=(p_{1},p_{2},...p_{N}),\ where\ p_{i}\in \Delta (A_{i}) p=(p1,p2,...pN), where piΔ(Ai),博弈收益函数应为混合策略的收益期望值,即为 U i ( p ) = ∑ a ∈ A p ( a ) u i ( a ) U_{i}(p)=\sum_{a\in A} p(a)u_{i}(a) Ui(p)=aAp(a)ui(a)

    定理:所有有限博弈都具有混合策略纳什均衡(MNE)

    可以证明当所有人的任何纯策略收益相等时可以达到纳什均衡

    例题:

    在这里插入图片描述

    如图所示,Player1的最优策略为(U,L), (D, R),Player2的最优策略的为(U, R), (D, L),因此没有纳什均衡点。

    如果使用混合策略,则令 p 1 = ( m , 1 − m ) , p 2 = ( n , 1 − n ) p_{1}=(m,1-m), p_{2}=(n,1-n) p1=(m,1m),p2=(n,1n),则:

    Player2取L时Player1收益 U 1 = 2 m + 5 ( 1 − m ) U_{1}=2m+5(1-m) U1=2m+5(1m)

    Player2取R时Player1收益 U 1 = 4 m + 2 ( 1 − m ) U_{1}=4m+2(1-m) U1=4m+2(1m)

    联立解得:m=3/5

    同理求得:n=3/4

    因此混合策略纳什均衡时策略为: p 1 = ( 3 / 5 , 2 / 5 ) , p 2 = ( 3 / 4 , 1 / 4 ) p_{1}=(3/5, 2/5), p_{2}=(3/4, 1/4) p1=(3/5,2/5),p2=(3/4,1/4)

    占优策略(Dominant Strategy)

    基本概念:

    • 弱(weakly)占优策略:如果任意情况下( ∀ a − i ∈ A − i \forall a_{-i}\in A_{-i} aiAi)玩家某一策略的收益不差于其他任意策略,则此策略弱占优。
    • 严格(strictly)占优策略:如果玩家某一策略的收益优于其他任意策略,则此策略严格占优。

    显然当一个博弈中某个玩家存在占优策略时,其一定会选择占优策略作为博弈结果。

    对应的也有被占优策略:

    • 弱被占优策略(Weakly Dominated Strategy):若对于所有情况下玩家的策略a不优于另一策略b,则策略a被b弱占优。
    • 严格被占优策略(Strictly DS):若一个策略a差于策略b,则a被b严格占优。

    显然如果a被b严格占优则a是永远不会被选择的,因此可以借此缩小博弈的规模。

    对于混合策略,如果存在某种混合策略p’收益永远高于p,则p被p’严格占优(易知如果a在纯策略中被严格占优则在混合策略中被严格占优,反之不成立)。

    • 信念(Belief):对于一种混合策略博弈博弈的结果 p = ( p i , p − i ) p=(p_{i},p_{-i}) p=(pi,pi) p − i p_{-i} pi即为一个信念。简单来说就是玩家i对于其他玩家行为在 Δ A − i \Delta A_{-i} ΔAi上的一种合理推测。
    • 理性(rationality):在某种信念下的最优策略就是理性的。
      • 所有在混合策略纳什均衡中概率不为零的纯策略都是理性的,换句话说只要没有被严格占优就是理性策略。

    例题1:

    第二高价竞拍模型:

    有N个玩家参与竞拍,对于每位玩家商品的实际价值为 v i ≥ 0 v_{i}\geq 0 vi0,竞拍价格为 b i ≥ 0 b_{i}\geq 0 bi0,收益为 v i − b i v_{i}-b_{i} vibi

    竞拍规则为最高价者成功,并且按照第二高竞拍价格交易。

    对于每个玩家, b i = v i b_{i}=v_{i} bi=vi为一个弱占优策略,因此纳什均衡策略为 ( v 1 , v 2 , . . . , v N ) (v_{1},v_{2},...,v_{N}) (v1,v2,...,vN)

    证明:

    不失一般性的,对于第i个玩家:

    • 若存在另一玩家竞价 b k > v i b_{k}>v_{i} bk>vi,则玩家i会停止竞价保证收益>0。

    • 若所有玩家的竞价都低于 v i v_{i} vi,则玩家i的收益为 v i − b i v_{i}-b_{i} vibi,设其余玩家最高竞价为 b k &lt; v i b_{k}&lt;v_{i} bk<vi,则只需 b i &gt; b k b_{i}&gt;b_{k} bi>bk即可竞拍成功,此时收益为 b k − v i b_{k}-v_{i} bkvi,和玩家i的竞价无关。因此 b i = v i b_{i}=v_{i} bi=vi为弱占优策略。

    例题2:

    Beauty Contest(选美竞赛)

    有n个玩家从[0,50]中选择一个实数作为自己的评分,越接近所有玩家评分均值2/3收益越大:

    U = 50 − ( a i − 2 3 ∑ j a j n ) 2 U=50-(a_{i}-\frac{2}{3}\frac{\sum _{j}a_{j}}{n})^{2} U=50(ai32njaj)2

    显然对于一种信念 a − i a_{-i} ai,玩家i的最优策略为使后一项为0,此时收益最大为50。即
    a i − 2 3 ∑ j a j n = 0 ⇒ ( 3 − 2 n ) a i ∗ = 2 ∑ j ≠ i a j n ⇒ a i ∗ = 2 ∑ j ≠ i a j 3 n − 2 ≤ 2 ( n − 1 ) 50 3 n − 2 a_{i}-\frac{2}{3}\frac{\sum _{j}a_{j}}{n}=0 \Rightarrow (3-\frac{2}{n})a^*_{i}=\frac{2\sum _{j\neq i}a_{j}}{n}\Rightarrow a_{i}^{*}=\frac{2\sum _{j\neq i}a_{j}}{3n-2}\leq \frac{2(n-1)50}{3n-2} ai32njaj=0(3n2)ai=n2j̸=iajai=3n22j̸=iaj3n22(n1)50
    因此 a i ∗ ∈ [ 0 , 2 ( n − 1 ) 50 3 n − 2 ] a_{i}^{*}\in [0, \frac{2(n-1)50}{3n-2}] ai[0,3n22(n1)50]

    由于所有玩家都是理性的,且知道其他玩家都是理性的,因此在第二轮中重复上述推理,则:

    a i ∗ ∈ [ 0 , ( 2 ( n − 1 ) 3 n − 2 ) 2 50 ] a_{i}^{*}\in [0, (\frac{2(n-1)}{3n-2})^{2}50] ai[0,(3n22(n1))250]

    重复上述过程,由于系数 2 ( n − 1 ) 3 n − 2 ] &lt; 1 \frac{2(n-1)}{3n-2}]&lt;1 3n22(n1)]<1,因此最终 a i ∗ ∈ [ 0 , ε ] , ε → 0 a^*_{i}\in[0,\varepsilon], \varepsilon\rightarrow0 ai[0,ε],ε0 ,则取极限后 a i ∗ = 0 a_{i}^{*}=0 ai=0,即所有玩家的评分都为0。

    展开全文
  • 博弈论——非完全信息博弈

    千次阅读 2019-01-03 15:55:52
    ​ 在实际情况中,博弈对手的收益大多为不可见的,即每个玩家有公共信息和私有信息。 贝叶斯博弈 基本概念 在贝叶斯博弈中为每位玩家增加一个类型空间Θi\Theta_{i}Θi​包含其所有的私有信息(针对不同策略的不同...

    版权声明:本文为原创文章,未经博主允许不得用于商业用途。

    ​ 在实际情况中,博弈对手的收益大多为不可见的,即每个玩家有公共信息和私有信息。

    贝叶斯博弈

    基本概念

    • 在贝叶斯博弈中为每位玩家增加一个类型空间 Θ i \Theta_{i} Θi包含其所有的私有信息(针对不同策略的不同收益函数)

    • 所有玩家类型空间的选择满足概率分布 p = p ( θ 1 , . . . , θ N )   o n   × i = 1... n Θ i p=p(\theta_{1},...,\theta_{N})\ on\ \times_{i=1...n}\Theta_{i} p=p(θ1,...,θN) on ×i=1...nΘi

    • 玩家i的一种纯策略 a i = ( a i ( θ i 1 ) , a i ( θ i 2 ) , . . . , a i ( θ i n i ) ) a_{i}=(a_{i}(\theta_i^1),a_i(\theta_i^2),...,a_i(\theta_i^{n_i})) ai=(ai(θi1),ai(θi2),...,ai(θini)),其中 n i n_i ni为玩家i类型空间的大小(可以看成 Θ i → A i \Theta_i\rightarrow A_i ΘiAi的映射)。

    • 收益函数可以写作 u i ( a 1 , . . . a N , θ 1 , . . . , θ N ) , θ i ∈ Θ i u_i(a_1,...a_N,\theta_1,...,\theta_N),\theta_i \in \Theta_i ui(a1,...aN,θ1,...,θN),θiΘi,即针对每一种博弈结果,玩家的每种类型都有一个收益。

    • 贝叶斯博弈中类型空间的选取满足贝叶斯公式,即 p ( θ − i ∣ θ i ) = p ( θ i , θ − i ) p ( θ i ) p(\theta_{-i}|\theta_i)=\frac{p(\theta_i,\theta_{-i})}{p(\theta_i)} p(θiθi)=p(θi)p(θi,θi)

    • 博弈结果需要每位玩家在每个类型上选择一种最优策略,因此最终结果表示为 ( ( a 1 ( θ 1 1 ) , . . . , a 1 ( θ 1 n 1 ) ) , . . . , ( a N ( θ N 1 ) , . . . , a N ( θ N n N ) ) ((a_1(\theta_1^1),...,a_1(\theta_1^{n_1})),...,(a_N(\theta_N^1),...,a_N(\theta_N^{n_N})) ((a1(θ11),...,a1(θ1n1)),...,(aN(θN1),...,aN(θNnN))

    • 玩家i某一类型收益为所有其余玩家所有策略的期望: U i ( a i ( θ i ) , a − i ) = ∑ θ − i p ( θ − i ∣ θ i ) u i ( a − i ( θ − i ) , a i , θ − i , θ i ) U_i(a_i(\theta_i),a_{-i})=\sum_{\theta_{-i}}p(\theta_{-i}|\theta_i)u_i(a_{-i}(\theta_{-i}),a_i,\theta_{-i},\theta_i) Ui(ai(θi),ai)=θip(θiθi)ui(ai(θi),ai,θi,θi)

      综上,贝叶斯博弈可以表示为 G = { N , { A i } , { Θ i } , { u i } , p } G=\{N,\{A_i\},\{\Theta_i\},\{u_i\},p\} G={N,{Ai},{Θi},{ui},p}

    例题1:

    Bank Runs

    两名客户在银行中都有100的资产,如果遇到好的银行家则两人都可以获得150,否则失去所有资产。

    客户可以取出自己的存款,但银行只有100的资金,一个取出另一个资产为0,如果两个人都选择取出则每人获得50。

    其中:Player1以概率p相信银行家,Player2知道银行家的好坏。

    化规为贝叶斯博弈:

    策略集为: A 1 = A 2 = W , N A_1=A_2={W,N} A1=A2=W,N(W即withdraw, N即not)

    类型空间为: Θ 1 = { 1 } , Θ 2 = { G , B } \Theta_1=\{1\},\Theta_2=\{G,B\} Θ1={1},Θ2={G,B},Player1只有一种类型,Player2具有类型G(好银行家)和B(坏银行家)

    概率分布只针对玩家1, p 1 ( θ 2 = G ) = p p_1(\theta_2=G)=p p1(θ2=G)=p

    则:

    • 如果Player1选择W,则玩家2最优策略为: B 2 ( W , G ) = { W } ;   B 2 ( W , B ) = { W } B_2(W,G)=\{W\}; \ B_2(W,B)=\{W\} B2(W,G)={W}; B2(W,B)={W}。则:
      • U 1 ( W , B 2 ) = 50 p + 50 ( 1 − p ) = 50 U_1(W,B_2)=50p+50(1-p)=50 U1(W,B2)=50p+50(1p)=50
      • U 1 ( N , B 2 ) = 0 p + 0 ( 1 − p ) = 0 U_1(N,B_2)=0p+0(1-p)=0 U1(N,B2)=0p+0(1p)=0

    显然此时Player1无理由更换策略,因此达到贝叶斯纳什均衡。

    • 如果Player1选择N,则玩家2最优策略为: B 2 ( N , G ) = { N } : B 2 ( N , B ) = { W } B_2(N,G)=\{N\}:B_2(N,B)=\{W\} B2(N,G)={N}:B2(N,B)={W}。则:
      • U 1 ( W , B 2 ) = 100 p + 50 ( 1 − p ) U_1(W,B_2)=100p+50(1-p) U1(W,B2)=100p+50(1p)
      • U 1 ( N , B 2 ) = 150 p + 0 ( 1 − p ) U_1(N,B_2)=150p+0(1-p) U1(N,B2)=150p+0(1p)

    因此当 U 1 ( N , B 2 ) ≥ U 1 ( W , B 2 ) U_1(N,B_2)\geq U_1(W,B_2) U1(N,B2)U1(W,B2)时达到贝叶斯均衡,即 p ≥ 0.5 p\geq 0.5 p0.5

    例题2:

    第一高价拍卖:

    更改之前的规则:两名玩家参与竞拍,玩家只知道自己的实际价值,其他玩家的实际价值为[0,1]的任意实数,且等概率,竞拍价格为 b i = a v i , ( a &gt; 0 ) b_i=av_i,(a&gt;0) bi=avi,(a>0)

    玩家1收益函数定义为:

    v 1 − b 1   i f   b 1 &gt; b 2 v_1-b_1\ if\ b_1&gt;b_2 v1b1 if b1>b2

    v 1 / 2 − b 1   i f   b 1 = b 2 v_1/2-b_1\ if\ b_1=b_2 v1/2b1 if b1=b2

    0   o t h e r w i s e 0\ otherwise 0 otherwise

    则玩家1的收益为: U 1 ( b i , b j ( v j ) , v i ) = ( v i − b i ) p [ b i &gt; b j ( v j ) ] + ( v i − b i ) / 2 p [ b i = b j ( v j ) ] + 0 p [ b i &lt; b j ( v j ) ] U_1(b_i,bj(v_j),v_i)=(v_i-b_i)p[b_i&gt;b_j(v_j)]+(v_i-b_i)/2p[b_i=b_j(v_j)]+0p[b_i&lt;b_j(v_j)] U1(bi,bj(vj),vi)=(vibi)p[bi>bj(vj)]+(vibi)/2p[bi=bj(vj)]+0p[bi<bj(vj)],其中 b i &gt; b j ⇔ b i &gt; a v j ⇔ b i / a &gt; v j b_i&gt;b_j\Leftrightarrow b_i&gt;av_j\Leftrightarrow b_i/a&gt;v_j bi>bjbi>avjbi/a>vj

    ​ 由于 v j v_j vjz在[0,1]为均匀分布,因此 b i 在 [ 0 , a v j ] b_i在[0,av_j] bi[0,avj]为均匀分布,因此:

    p [ b i &gt; b j ] = b i / a , U i ( b i , b j , v i ) = ( v i − b i ) b i / a , 当 b i = v i / 2 p[b_i&gt;b_j]=b_i/a,U_i(b_i,b_j,v_i)=(v_i-b_i)b_i/a,当b_i=v_i/2 p[bi>bj]=bi/a,Ui(bi,bj,vi)=(vibi)bi/a,bi=vi/2时取得最大值。

    ​ 如果拓展到N个博弈玩家则 U 1 ( b i , b j ( v j ) , v i ) = ( v i − b i ) p [ b i &gt; m a x { b j ( v j ) } ] + ( v i − b i ) / 2 p [ b i = m a x { b j ( v j ) } ] U_1(b_i,bj(v_j),v_i)=(v_i-b_i)p[b_i&gt;max\{b_j(v_j)\}]+(v_i-b_i)/2p[b_i=max\{b_j(v_j)\}] U1(bi,bj(vj),vi)=(vibi)p[bi>max{bj(vj)}]+(vibi)/2p[bi=max{bj(vj)}]

    b i &gt; m a x { b j } ⇔ v i &gt; m a x { v j } b_i&gt;max\{b_j\}\Leftrightarrow v_i&gt;max\{v_j\} bi>max{bj}vi>max{vj},且各玩家的真实价值相互独立,因此 p [ v i &gt; m a x { v j } ] = ∏ j ≠ i p [ v i &gt; v j ] = v i N − 1 = ( b i / a ) N − 1 p[v_i&gt;max\{v_j\}]=\prod_{j\neq i} p[v_i&gt;v_j]=v_i^{N-1}=(b_i/a)^{N-1} p[vi>max{vj}]=j̸=ip[vi>vj]=viN1=(bi/a)N1,收益为 ( v i − b i ) ( b i / a ) N − 1 (v_i-b_i)(b_i/a)^{N-1} (vibi)(bi/a)N1

    求导得: b i n − 2 ( ( ( N − 1 ) v i − N b i ) = 0 ⇒ b i = N − 1 N v i b_i^{n-2}(((N-1)v_i-Nb_i)=0\Rightarrow b_i=\frac{N-1}{N}v_i bin2(((N1)viNbi)=0bi=NN1vi

    展开全文
  • 决策需要信息,几乎所有需要决策的场合我们都掌握着有限信息,这使得现实中往往是有限信息博弈。...下面就由这两个例子展开,并将在博弈论中的一些知识点做出介绍。 【囚徒困境】中基于收益矩阵的模型

    决策需要信息,几乎所有需要决策的场合我们都掌握着有限信息,这使得现实中往往是有限信息博弈。完全信息在这里指的是每个参与人对其他参与人的支付函数有着完全的了解。而静态指的是同时行动的博弈,或者不同时但后行动者不知道之前行动者的决策。
    在完全信息静态博弈中的均衡是纳什均衡。最典型的例子是囚徒困境与智猪博弈。下面就由这两个例子展开,并将在博弈论中的一些知识点做出介绍。
    【囚徒困境】中基于收益矩阵的模型描述如下:
    这里写图片描述
    【注】博弈中参与人只拥有有限个离散性的纯战略供其选择称为离散型策略。而在另外一些博弈中,每个参与者的纯策略可以是来自连续范围的一个数,如厂商定价,称为连续型策略。离散型策略静态博弈可以用支付表来表示,如上图。
    对于囚徒A与B来说,无论对方采取什么策略,自己的策略是“坦白”时总是比“抵赖”要好些,在两人无法通信的情况下,两人都会选择“坦白”。
    【优势战略均衡】在这里,无论对方选择什么,“坦白”的收益是严格大于“抵赖”,所以“坦白”是一个严格优势策略,对应的“抵赖”则是一个劣势策略。所有人都有自己的优势策略,由此产生的优势策略组合是一个优势战略均衡。
    但是这里需要注意的是,双方各自的优势策略却导致了集体的利益最差,如果两人都选择“抵赖”收益将是各自-1,但是优势策略下的收益却是-8.囚徒困境反映了个人理性与集体理性的冲突。个人的最优选择从社会角度看并不是最优的。社会生活中有很多例子:公共品的给予,商家的价格战,团队生产中的偷懒(三个和尚没水喝),小学生减负越减越重,各国军备竞赛等。
    【如何走出囚徒困境】如果有可信的承诺或者是惩罚(第三方实施),会使两人合作,促进集体利益最高。
    【智猪博弈】智猪博弈的收益矩阵模型如下:
    这里写图片描述
    在此处,小猪有优势与劣势策略,但大猪没有,只能根据小猪的策略做出最佳应对,而小猪不会选择劣势策略,因此剔除小猪“按”的策略,此时,大猪的策略只能为“等”。
    【重复剔除劣势战略均衡】严格劣势策略为不管其他参与人怎样选择呢策略,参与人选择策略A时的收益严格小于策略B时的收益。因此严格劣势策略不会被选取,不断剔除严格劣势策略简化博弈,直到没有劣势策略为止。如果剩下唯一的策略组合,那么该策略称为重复剔除劣势战略均衡。
    【弱优势策略】若对某些参与者而言,不管其他参与者做何种决策,如果A策略至少与B策略一样好,或者某些时候严格好于B策略,那么A策略就叫做弱优势策略,相对的,B为弱劣势策略。逐次剔除弱劣势策略可能会去掉某些纳什均衡。
    【优势战略均衡与重复剔除劣势战略均衡】前者是选择法,要求每个参与人是理性的;后者是排除法,要求“共同知识”。
    【纳什均衡】在其他人保持自己的策略不变的情况下,没有人可以通过改变自己的策略获得更高的收益。
    【注】每个优势战略均衡或者重复剔除劣势战略均衡一定是纳什均衡,但反之不然;纳什均衡一定是在重复剔除劣势策略中未被剔除的战略组合,反之不然,除非是唯一组合了。
    【多重均衡与协调】一般来说,博弈不一定只有一个均衡。具有多重均衡的博弈被称为协调博弈。

    展开全文
  • 完全信息静态博弈 文章目录完全信息静态博弈博弈的标准式与纳什均衡博弈的标准式重复提出严格劣战略纳什均衡的导出和定义应用举例古诺双头垄断模型贝特兰德的双头垄断模型最后要价仲裁公共财问题混合战略与均衡的...
  • 这一篇主要介绍非合作博弈中,完全信息静态博弈的相关知识。 切记非合作博弈的条件:参与人具有足够智力且极端个人主义,即以自己的效用作为唯一的衡量标准。 要理解完全信息静态博弈,首先要了解以下2个概念: ...
  • 博弈论——非完全信息扩展式博弈

    千次阅读 2019-01-04 14:15:04
    在扩展式博弈中,有些时候博弈信息是不完全的: 玩家不知道其他玩家之前的决策 玩家不记得自己之前的决策 此时使用虚线连接这些信息集相同的决策点。 基本概念 非完全信息扩展式博弈表示为:G={N,J,P,I,{ui}}G...
  • 配套笔记!值得期待!本课程介绍了博弈论的基本概念、完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈、合作博弈以及演化博弈。
  • 完全信息静态博弈的标准式描述 特别的博弈 纯战略与混合战略 劣战略与优战略 纳什均衡和纳什定理 优战略与纳什均衡的关系 关于纳什均衡与优战略的例子 例子1:囚徒的困境 例子2:石头剪刀布博弈 参考文献 ...
  • 博弈论(Game Theory)、多智能体强化学习(MARL)及群体智能等研究领域相关。《博弈论信息经济学》读书笔记,由“房地产开发博弈”一例详细地介绍博弈论的基础概念,一文区分博弈理论中的完美信息完全信息
  • 文章目录博弈论什么是博弈论?博弈的前提博弈的要素博弈的分类非合作博弈——有限两人博弈囚徒困境合作博弈——无限多人博弈囚徒困境巴什博弈 博弈论 什么是博弈论? 我个人的理解是,通过分析与事情有关的所有元素...
  • 博弈论简介

    2015-10-22 21:33:13
    作为科技工作者应该了解博弈论基础:完全信息静态博弈,不完全信息静态/动态博弈等。
  • 博弈论入门

    2021-04-19 15:30:07
    1 非合作与合作博弈1.2.2 战略博弈和扩展博弈1.2.3 完全与不完全信息博弈1.3 博弈论和竞争均衡理论1.4 理性行为 1. 1 博弈论 博弈论是一个分析工具包,它被设计用来帮助我们理解所观察到的决策主体相互作用时的现象...
  • 完全信息博弈:同时进行决策的情况 ,比如石头剪刀布 黄色的树林里分出两条路,可惜我不能同时去涉足,我在那路口久久伫立,我向着一条路极目望去,直到它消失在从林的深处。但我却选了另外一条路,它荒草萋萋,...
  • 博弈论(二)完全信息静态博弈

    千次阅读 2020-07-14 12:39:43
    Applications of Nash equilibrium 最优反应求解纯策略纳什均衡 严格剔除劣策略纳什均衡 Mixed strategy Nash equilibrium   完全信息静态博弈(static games of complete information)。其中假设参与人是理性的...
  • 博弈论引论

    2015-01-13 21:21:44
    在结构上把静态完全信息和不完全信息博弈合并到一起,放入策略博弈部分;  2. 使用偏好序而不是效用函数表达效用,这种表达使得本书看起来更抽象严格。阅读的时候需要适应。  3. 介绍了某些其他教材里通常没有...
  • 博弈论概要

    2019-05-02 19:59:08
    博弈论博弈论的定义发展过程要素博弈类型纳什均衡案例一 囚徒困境案例二 智猪博弈案例三 美女的硬币博弈论的意义 博弈论的定义 《博弈圣经》博弈论的定义:我们把动物利用大自然移动的瘾魂,在决策人期待的空间里,...
  • 博弈论

    千次阅读 2020-06-18 22:04:09
    博弈论,又称为对策论(Game Theory)、赛局理论等,既是现代数学的一个新分支,也是运筹学的一个重要学科。 博弈论主要研究公式化了的激励结构间的相互作用,是研究具有斗争或竞争性质现象的数学理论和方法。 博弈...
  • 博弈论教程

    2018-11-01 20:48:50
    书中侧重理论的依据和主要概念的讲解第一篇 战略博弈;第二篇 完全信息扩展博弈
  • 博弈论综述

    2021-07-26 10:23:22
    博弈论:双方或者多方在竞争,合作,冲突等情况下,充分了解各方信息,并依此选择一种能为本方争取最大利益的最优决策的理论。 重要性:经济史上普遍认为有三次伟大的革命:“边际分析革命”,“凯恩斯革命”,...
  • 图1 完全信息静态博弈下的两人博弈有效求解方法 1. 纯战略 两人有限战略——划线法 表1 划线法求解“囚徒... 博弈论教程. 北京: 清华大学出版社, 北京交通大学出版社, 2007. 转载于:https://www.cnblogs.com/6DAN_H...
  • 完全信息背景下海外并购的风险与规避——基于博弈论的观点,姚晓波,,在金融危机背景下,中国众多本土企业海外并购的热情增加,纷纷采取抄底行为。但在信息完全的情况下,海外并购也面临着巨大的风
  • 信息矩阵 便于直观展示博弈的内容,矩阵位于2维空间,适用于2名玩家的博弈。 3名玩家的博弈用cube或者多个矩阵表示。 d c d 0,0 4,-1 c -1,4 3,3 其中,列表头代表...
  •   博弈树:博弈树是图论中树的概念在博弃中的具体应用。博弈树能直观有效地展示博弈中参与者的行动顺序、轮到某一参与者行动时他可选择的行动以及他拥有的信息,在树的顶部还可以展示各种行动组合产生的各参与者...
  •   通常用博弈的战略式表述去描述和分析静态博弈,而对动态博弈的描述和分析就借助博弈的扩展式表述。回顾第2章给出的战略式表述,其中心内容包含三个要素:(1)参与者
  • 博弈论学习笔记

    2021-07-21 14:03:34
    博弈论学习笔记 一、博弈论(Game Theory)介绍 起源:《孙子兵法》最早的一部博弈论专著,但没有理论化 关键人物:冯·诺依曼,博弈论之父,《博弈论与经济行为》证明了博弈论基本原理 关键人物:约翰·纳什,...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 9,815
精华内容 3,926
关键字:

博弈论完全信息博弈