博弈论——不完全信息静态博弈(九)

发布时间 2023-08-22 21:41:01作者: 郝hai

前述各种静态博弈实例均有一个共同点,即每个参与者完全知晓自己和对手的支付相关信息。但实际问题中,经常出现某个(或所有)参与者对于其他参与者(甚至自身)支付或策略的信息了解并不充分的情况。一般地,在不完全信息博弈中,并非所有人均知晓同样的信息。博弈参与者除了均知晓的公共信息外,还具有各自的私有信息,后面用参与者的类型集来表示。由于参与者的私有信息对其他参与者是未知的,因此在决策时,参与者只能对对手的私有信息进行猜测,同时还要对其他参与者对自己的私有信息的猜测作出猜测,这种猜测之猜测序列可以无限持续下去。这一点与共同知识非常相似,所不同的时,基于公共知识可得到的是确定性的推断,而不完全信息下,参与者只能获得一定条件下的概率性猜测。

一、不完全信息静态博弈案例

1.1 暗标拍卖

暗标拍卖通常有这样几个基本特征:(1)密封递交标书; (2)统一时间公证开标; (3) 标价最高者以所报标价中标。
由于博弈方的标书密封递交和同时开标, 各博弈方在选择策略之前都无法知道其他博弈方策略, 而且是一次性选择, 因此这是静态博弈问题。各博弈方无法知道确知其他博弈方拍得标的物的得益,最多能根据一般情况或以往经验作大致判断。 这意味着, 暗标拍卖博弈是不完全信息博恋, 且是不完全信息静态博弈。

1.2 古诺模型

假设:两寡头同时作产量 决策, 市场需求为$P(Q)=a-Q, Q=q_1+q_2 $为市场总产量, \(q_1、q_2\)分别是两个厂商产量。厂商 1 成本函数\(C_1=C_1(q_1)=c_1q_1\), 即无固定成本, 边际成本为\(c_1\), 这是两个厂商都知道的。厂商 2 的成本有两种可能情况, 一种\(C_2=C_2\left(q_2\right)=c_Hq_2\), 另一种\(C_2=C_2\left(q_2\right)=c_L q_2\), 而\(c_H>c_L\), 究竟是哪种成本厂商 2 自己知道,厂商 1 只知道前一种的概率\(\theta\),后一种的概率\(1-\theta\)

  • 当高成本,\(q_{2}^{*}(c_{H})\) 满足:$$\max_{q_2}\left[\left(a-q_1-q_2\right)-c_{\mathrm{H}}\right] q_2$$
  • 当低成本,\(q_{2}^{*}(c_{L})\) 满足:$$\max_{q_2} \left[\left(a-q_1-q_2\right)-c_L\right] q_2$$
  • 厂商一的策略:$$\max _{q_1}\left\{\theta\left[a-q_1-q_2^{*}\left(c_H\right)-c_1\right] q_1+(1-\theta)\left[a-q_1-q_2^*({c_L})-c_1\right] q_1\right\} $$
  • 求解:三个式子各自求极值,然后联立求解,得:

\[\begin{aligned} & q_2^*\left(c_H\right)=\frac{a-2 c_H+c_1}{3}+\frac{1-\theta}{6}\left(c_H-c_L\right) \\\\ & q_2^*\left(c_L\right)=\frac{a-2 c_L+c_1}{3}-\frac{\theta}{6}\left(c_H-c_L\right) \\\\ & q_1^*=\frac{a-2 c_1+\theta c_H+(1-\theta) c_L}{3} \end{aligned} \]

讨论:当 \(c_2=c_H\)时,\(q_2^*(c_H)>q_2^*\);当\(c_2=c_L\)时,\(q_2^*(c_L)<q_2^*\)。当厂商2实际高成本时,他本应生产较少,但他考虑到对方不知道自己高成本, 所以对方选择的产量会小于知道自已高成本时的最佳产量, 因此自己可以适当多生产一些。

二、不完全信息静态博弈模型

在完全信息静态博弈时,我们将其表示为:$$G=\{ N,S_1, \cdots, S_n ; u_1, \cdots, u_n \} $$,其中\(S_i\)是博弈方\(i\)的策略空间, 即全部可选策略的集合,\(u_i\)是其得益函数\(u_i=u_i(s_1,\cdots,s_n)\)
到了不完全信息静态博弈中,需要表示信息的不完全性,用\(T\)来表示:\(t_i\)表示博弈方\(i\)的类型,\(T\) 表示博弈方\(i\)的类型空间\(t_i \in T_i\)\(u_i(a_1, \cdots, a_n, t_i)\)表示博弈方\(i\)在策略组合 \((a_1, \cdots, a_n)\)下的得益。信息不完全可以通过\(t_i\)的取值只有博弈方\(i\)知道而其他博弈方不清楚这一情况来反映。
另一个需要添加的是博弈方对不完全信息概率的判断:如果用博弈方\(i\)在自己类型为\(t_i\) 的前提下, 对其他博弈方类型的所有可能(或类型组合) $$(t_1,⋯ t_{i − 1} , t_{i+1}, ⋯, t_n )$$ 的条件概率$$p_i=p_i\left\{t_{-i} \mid t_i\right\} $$, 作为反映不完全信息的概率判断, 则可用$$G=\left\{N,A_1, \cdots, A_n ; T_1, \cdots, T_n ; p_1, \cdots, p_n ; u_1, \cdots ,u_n\right\}$$表示不完全信息静态博弈问题,常常参与人集\(N\)可以省略。

以不完全信息古诺博弈为例:
\begin{aligned} & \text { 厂商 } 1 \text { 的行动空间- } A_1=\left\{q_1\right\} \\ & \text { 厂商 } 2 \text { 的行动空间- } A_2=\left\{q_2\right\} \\ & \text { 厂商 } 1 \text { 的类型空间- } T_1=\left\{c_1\right\} \\ & \text { 厂商 } 2 \text { 的类型空间- } T_2=\left\{c_H, c_L\right\} \\ & \text { 厂商 } 1 \text { 的得益- - } u_1=\pi_1\left(q_1, q_2, t_1\right) \\ & \text { 厂商 } 2 \text { 的得益-- } u_2=\pi_2\left(q_1, q_2, t_2\right)\\ & \text { 厂商 } 1 \text { 条件概率- } p_1\{c_H|c_1\}=\theta;p_1\{c_L|c_1\}=1-\theta\\ &\text { 厂商 } 2 \text { 条件概率- } p_2\{c_1|c_H\}=1; p_2\{c_1|c_L\}=1 \end{aligned}

2.1海萨尼变换

海萨尼( Harsanyi )1967年提出将“不完全信息静态博弈” 转化为“完全但不完美信息动态博弈”:

  • 第一步:引进虚拟博弈方 “自然”, “自然”进行动态博弈第一阶段的行动选择
    “自然” 为每个博弈方随机选择类型\(t=\left(t_1, \ldots, t_n \right)\),其中$t_i \in T_i, i=1, \cdots $
  • 第二步:表示不完全信息
    每个博弈方知道自己的类型,但不知道“自然”为其他博弈方选择的类型,只知道所选类型的概率分布。
  • 第三步:博弈方在动态博弈第二阶段进行原来的静态博弈\(a_1, \ldots, a_n\)
  • 第四步:表示得益
    除 “自然” 博弈方外, 其余博弈方各自得益$u_i=u_i \left(a_1, \ldots, a_n \right) $

在作了海萨尼转换之后, 仍然有对 “类型” 的判断问题。但这时对类型的判断形式上变成了对博弈进程,即 “自然”对实际博弈方类型选择的判断, 其概率分布与类型的概率分布相同, 即 “自然”以概率分布\(p_1, \cdots p_n\)分别选择\(t_1, \cdots, t_n\)

在“市场进入”博弈中,假设在位企业A知道进入企业B的成本函数类型,但进入企业对在位企业的成本信息是不完全的。从得益矩阵中可以看出,在在位企业A是高成本的情况下,如果企业B决定进入,此时在位企业A的选择是“默许”。当在位企业A是低成本的情况时,如果进入企业B决定“进入”,显然在位企业A的选择应该是“斗争”,因此在信息完全情况下,如果企业B决定“进入”,显然在位企业A的选择应该是“斗争”。因此在信息完全情况下,如果在位者是高成本,企业B的最佳策略选择是“进入”,如果在位企业A是低成本,进入者的最优选择是“不进入”。如果企业B并不知道在位企业A的成本类型,企业B此时的最优选择就依赖于它在多大程度上认为在位企业A是高成本或低成本的。现在假定企业B认为在位企业A是高成本的概率为\(p\),低成本的概率为\(1-p\),通过海萨尼转换,我们可以把上述不完全信息的“市场进入”静态博弈转换为完全但不完美的动态博弈,如下图所示:

此时,“自然”首先随机选择在位企业A成本的类型,然后我们就可以使用标准的动态分析中的“逆向归纳法”来分析该完全但不完美动态博弈。与完全信息博弈之间在策略和策略空间方面的相同。

2.2 贝叶斯纳什均衡

将纳什均衡推广到不完全信息静态博弈中,基本思想与完全信息静态博弈的纳什均衡是一样的, 各博弈方的策略必须是对其他博弈方策略(或策略组合)的最佳反应。不同的是, 这里的策略比完全信息静态博弈复杂一些,不是简单的行为选择,而是由类型决定行为选择的函数。这种策略有新含义的纳什均衡, 称为 “贝叶斯纳什均衡”。
在不完全信息静态博弈$$G=\{A_1,⋯,A_n;T_1,⋯,T_n; p_1 , ⋯, p_n ; u_ 1 , ⋯, u_n\} $$ 中, 如果对任意博弈方\(i\)和他的每一种可能的类型 \(t_i \in T_i\), 策略函数\(S_i^*\left(t_i\right)\)所对应的行动\(a_i\) 都能最大化其期望得益。

\[\max_{a_i \in A_i} \sum_{t=i} \left \{u_i \left[S_i^*\left(t_1\right), \cdots, S_{i-1}^*, a_i, S_{i+1}^*\left(t_{i+1}\right), \cdots, S_n^*\left(t_n \right), t_i\right] p\left(t_{-i} \mid t_i\right)\right\} \]

则称策略组合 \(S^*=\left(S_1^*, \cdots, S_n^*\right)\)\(G\)的一个 (纯策略) 贝叶斯纳什均衡。

三、示例

3.1 暗标拍卖

假设:
(1) 两投标者:博弈方1、博弈方 2
(2) 两博弈方对拍品估价: \(v_1, v_2\)
(3) 若标价\(b_i\)中标, 其得益:\(v_i-b_i\)
(4) 各博弈方不知对方估价, 但知对方估价是 [0,1] 上的均匀分布,即取[0,1] 中任何数值的概率相等。
(5) 博弈方都风险中性:一单位期望得益和一单位确定性得益价值相同。
表示为不完全信息静态博弈
把上述问题表示为标准的不完全信息静态博弈, 需要找出两个博弈方的行为空间、类型空间、判断和得益函数。
*行为空间:博弈方\(i\)的行为就是自己的标价 \(b_i\),其中\(0\leq b_i\leq v_i\leq 1\)
*类型空间:博弈方\(i\)的类型即自己的估价\(v_i\), 类型空间\(T_i\)就是 估价可能取值区间 [0,1]
*判断:博弈方知道对方的类型是[0,1]上的标准分布, 这就是他们对对方类型的判断。
*得益函数:

\[u_i = u_i(b_1, b_2, v_1,v_2 ) =\begin{cases} v_i-b_i, \text { 当 } b_i>b_j \\\\ \left(v_i-b_i\right) / 2, \text { 当 } b_i=b_j \\\\ 0, \text { 当 } b_i<b_j \end{cases}\]

式中\(i=1\)\(j = 2\)\(i=2\)\(j=1\)
寻找贝叶斯纳什均衡
先要构筑两博弈方的策略空间,即根据类型决定行为的函数关系:
本博弈中, 博弈方\(i\)的策略是符合要求的函数关系\(b_i(v_i)\), 所有这种函数关系\(b_i(v_i)\) 的集合构成博弈方\(i\)的策略空间。
分析贝叶斯均衡
策略组合\([b_1(v_1), b_2(v_2)]\)是一个贝叶斯纳什均衡, 意味着博弈方 1 的策略\(b_1(v_1)\)与博弈方 2 的策略\(b_2(v_2)\)相互是对对方的最优反应,对每个博弈方\(i\)的每个类型 \(v_i \in [0,1], b_i(v_i)\)都满足中标的期望得益最大化:

\[\operatorname{Max}_{b_i}\{[v_i-b_i(v_{\mathrm{i}}] P(b_i>b_j)+1/2[v_i-b_i(v_{\mathrm{i}})] P(b_i=b_j\} \]

【例1】假设博弈方的报价:由基价和估价的一个固定比例组成,即:
$$b_1(v_1)=a_1+c_1 v_1, \quad b_2(v_2)=a_2+c_2 v_2$$
其中\(a_1<1、a_2<1\)\(c_1 \geq 0、c_2\geq 0\)
简化:由于\(v_j\)服从均匀分布, $b_j=b_j(v_j)=a_j+c_jv_j $也服从均匀分布, 因此 $P\{b_i=b_j\}=0 $(概率趋近于0) 。这样上式变为:

\[\begin{aligned} & \max_{b_i}(v_i-b_i) P\{b_i>a_j+c_j v_j\} =max_{b_i}(v_i-b_i) P\{v_j<\frac{b_i-a_j}{c_j}\} =\max _{b_i}(v_i-b_i) \frac{b_i-a_j}{c_j} \end{aligned} \]

求一阶导可得:$b_i=(a_j+v_i) / 2 $

分析:当 \(v_i<a_j\) (博弈方\(i\)估价小于博弈方\(j\)的基价)则博弈方\(i\)一定不会中标,所以\(v_i\)至少大于等于\(a_j\)才有希望,综合来看,\(v_i\)的最佳反应为:

\[b_i(v_i)=\begin{cases}\frac{v_i+a_j}{2} & \text { 当 } v_i \geqslant a_j \\\\ a_j & \text { 当 } v_i<a_j\end{cases} \]

若要求双方策略是严格的线性函数,可以要求\(a_j \leq 0\),这样$ v_i$ 的最佳反应变为:

\[b_i(v_i)=\frac{v_i+a_j}{2} \]

将此式与之前的策略空间 $$b_i(v_i)=a_i+c_i v_i$$相比较,最终可得$a_i=a_j / 2, c_i=1 / 2 $,另一个博弈方同理,联立得最终结果:
$$a_i=a_j=0, c_i=c_j=1 / 2$$
计算出$ b_i=v_i/2$,即博弈方最佳策略:把报价定为对拍品估价的一半。

上述贝叶斯纳什均衡是在上述暗标拍卖博弈中, 双方采用线性策略时唯一的贝叶斯纳什均衡。如果没有限定采用线性策略, 贝叶斯纳什均衡会发生改变。如果博弈方估价的概率分布不是上述标准分布, 暗标拍卖博弈的贝叶斯纳什均衡也会发生变化。此外,参与投标人数更多时情况也要更复杂一些,但分析思路是相同的。

3.2 “市场进入”博弈

对于进入企业B来说,虽然不知道在位企业A究竟选择低成本阻止还是高成本阻止,但它知道企业A只能有这两种策略选择以及相应策略选择的概率分布。若企业A属于高成本阻止的概率为\(p\),则企A属于低成本阻止的概率就为\(1-p\)。如果企业A的阻止成本高,则A将默许企业B进入市场;如果企业A的阻止成本低,则企业A将阻止企业B的进入。在以上两种情况下,对照本节最上面的收益矩阵图,企业B的收益分别为30和-10。所以,B选择进人的期望收益为\(30p+(−10)(1−p)\);选择不进人的期望收益为0。显然,只要企业B选择进入的期望收益大于不进入的期望收益,B就应该选择进入;否则,企业B选择不进入。也就是说,企业B的选择取决于\(30p+(-10)(1-p)\geq 0\),即只要企业A高阻止成本的概率大于25%时,企业选择进入是其最优策略。这时的贝叶斯纳什均衡为:企业B选择进入,高成本在位企业A选择默许,而低成本在位企业A选择阻止。

参考文献

  1. 第六章 不完全信息静态表示
  2. 不完全信息静态博弈--贝叶斯纳什均衡
  3. 3.3不完全信息静态博弈(一)