- 1、本文档共21页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
《博弈论:原理、模型与教程》
第二部分 完全信息动态博弈
第 7 章 子博弈精炼 Nash均衡
7.2 子博弈精炼 Nash均衡的求解(重点!)
(已精细订正!)
定义 7-1 虽然给出了子博弈精炼 Nash的定义,但没有说明如何
求解子博弈精炼均 Nash衡。
下面以图 6-8 中扩展式博弈为例, 介绍一种 最常用的求解子博弈精炼 Nash 均衡的方法 —逆向归纳法。
(讲!)
1/21
1
A
x 1
B
2 x2
x4
C
D
2, 1
1 x3
x5
E
F1,1
x6
x7
1, 2
6
3, 0
图 6-8
博弈树
考察图 6-8 中的博弈 。参与人 1 在博弈开始时(即在信息集
I1 ( x1 ) 上面临两种选择—行动 A 和行动 B 。参与人 1 此时选择哪种行
动呢?对于理性的参与人 1 来讲,只会选择使自己支付最大化的行
动。从图 6-8 很容易知道参与人 1 选择行动 B 时所得到的支付为
2 ;
但是,如果参与人 1 选择行动 A ,则所得支付就要取决于参与人
2 在
信息集 I 2 ( x2 ) 上的选择,以及博弈达到决策结 x3 时参与人 1 在信息集 I1 ( x3 ) 上的选择。 也就是说,参与人 1 选择行动 A 所得支付,取决于
子博弈 (x2 ) 的结果 。因此,为了确定参与人 1 在博弈开始时的选择,
就必须确定参与人 1 选择行动 A 的所得支付,而为了确定参与人
1 选
择行动 A 的所得支付,就必须先求解 子博弈 (x2 ) 。如何求解博弈
( x2 )
呢?可以采用同样的方法来求解子博弈
(x2 ) ,即在求解子博弈
( x3 )
的基础上,确定参与人 2 在信息集 I 2 ( x2
) 上的选择,从而求解子博弈
( x2 ) 。
2/21
由以上分析可以得到图 6-8 中博弈的 求解过程:
首先求解 博弈树中 最底层的子博弈 ( x3 ) 得到子博弈 ( x3 ) 的结果为
(3,0) (即参与人 1 选择 E );
再求解博弈 ( x2 ) ,容易得到博弈的结果 (1,1)(即参与人 2 选择 D );最后求解 原博弈,即子博弈 (x1) ,得到博弈的结果为 (2,1) (即参与人1选择 B)。
(讲!)
考察更一般的情形。 对于图 7-6 中的博弈树,参与人 i 在信息集
I i ({ xi }) 选择行动 L 还是行动 R ,取决于选择行动 L 和行动 R 所带来的
后果。由于参与人 i 选择行动 L 时使博弈进入了子博弈
(xi 1) ,因此参
与人 i 选择行动 L 的后果就是得到子博弈
( xi 1) 。同样,参与人 i 选择
行动 R 的后果就是得到子博弈
( xi 2 ) 。所以,参与人 i
在信息集 I i ({ xi })
上的最优选择,取决于参与人
i 在信息集 I i ({ xi }) 上可能采取的行动,
所导致的各个子博弈。也就是说, 参与人 i 在信息集 I i ({ xi })
上的最优
选择,一定是使博弈进入能给自己带来最大支付的子博弈。
因此,为
了确定参与人 i 在信息集 I i ({ xi
}) 上的选择,就必须先求解参与人 i 在信
息集 I i ({ xi }) 上可能采取的行动所导致的各个子博弈。 而对于各个子博
弈求解又可以采用同样方法进行。
3/21
i
xi
L
R
j
xi
j
L
2
xi
1
R
L
R
7-6 一般情形的博弈
由以上分析可以得到求解有限 展式博弈的一般步 :
找出博弈的所有子博弈 1。
按照博弈 行的 “反方向”逐一求解各个子博弈,即最先求解最底
子博弈,再求解上一 的子博弈, ?? ,直至原博弈 。也就是 ,
在求解每一个子博弈 , 子博弈要么不含有其他任何子博弈, 要么
所含子博弈都已被求解。
由于原博弈为有限扩展式博弈,因此博弈的子博弈有限。
4/21
上述求解有限扩展式的方法亦称 “逆向归纳法” ( backward induction )。由于逆向归纳法对各个子博弈逐一进行求解, 因此逆向归纳法所得到的解在各个子博弈上构成均衡。 这也意味着 逆向归纳法所得的解为子博弈精炼 Nash均衡 。
(重点,讲!)
【例 7-2 】 考察如图 7-7 所以的扩展式博弈。图 7-7 中,博弈存
在 5 个子博弈,即子博弈
( x3 ) 、 ( x4 ) 、 ( x5 ) 、 (x2 ) 和 (x1 ) (即原
博弈),其中 (x3) 、 (x4 )
和 ( x5 ) 为最底层的子博弈 。
下面利用逆向归纳法求解博弈的子博弈精炼 Nash均衡。
1
x1
L
R
2
2
x2
R
x3
L
L
R
1
1
x10
x11
x4
x5
2, 3
5,
文档评论(0)