《博弈论：原理、模型与教程》第章子博弈炼Nash均衡第节子博弈炼Nash均衡的求解.docx

下载文档 降价啦

14
0
约1.09万字
约 21页
2021-01-18 发布于山东
举报
版权申诉
保障服务

《博弈论：原理、模型与教程》第章子博弈炼Nash均衡第节子博弈炼Nash均衡的求解.docx

1、本文档共21页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

《博弈论：原理、模型与教程》第二部分完全信息动态博弈第 7 章子博弈精炼 Nash均衡 7.2 子博弈精炼 Nash均衡的求解（重点！）（已精细订正！）定义 7－1 虽然给出了子博弈精炼 Nash的定义，但没有说明如何求解子博弈精炼均 Nash衡。下面以图 6－8 中扩展式博弈为例，介绍一种最常用的求解子博弈精炼 Nash 均衡的方法 —逆向归纳法。（讲！） 1/21 1 A x 1 B 2 x2 x4 C D 2， 1 1 x3 x5 E F1，1 x6 x7 1， 2 6 3， 0 图 6-8 博弈树考察图 6－8 中的博弈。参与人 1 在博弈开始时（即在信息集 I1 ( x1 ) 上面临两种选择—行动 A 和行动 B 。参与人 1 此时选择哪种行动呢？对于理性的参与人 1 来讲，只会选择使自己支付最大化的行动。从图 6－8 很容易知道参与人 1 选择行动 B 时所得到的支付为 2 ；但是，如果参与人 1 选择行动 A ，则所得支付就要取决于参与人 2 在信息集 I 2 ( x2 ) 上的选择，以及博弈达到决策结 x3 时参与人 1 在信息集 I1 ( x3 ) 上的选择。也就是说，参与人 1 选择行动 A 所得支付，取决于子博弈 (x2 ) 的结果。因此，为了确定参与人 1 在博弈开始时的选择，就必须确定参与人 1 选择行动 A 的所得支付，而为了确定参与人 1 选择行动 A 的所得支付，就必须先求解子博弈 (x2 ) 。如何求解博弈 ( x2 ) 呢？可以采用同样的方法来求解子博弈 (x2 ) ，即在求解子博弈 ( x3 ) 的基础上，确定参与人 2 在信息集 I 2 ( x2 ) 上的选择，从而求解子博弈 ( x2 ) 。 2/21 由以上分析可以得到图 6－8 中博弈的求解过程：首先求解博弈树中最底层的子博弈 ( x3 ) 得到子博弈 ( x3 ) 的结果为 (3,0) （即参与人 1 选择 E ）；再求解博弈 ( x2 ) ，容易得到博弈的结果 (1,1)（即参与人 2 选择 D ）；最后求解原博弈，即子博弈 (x1) ，得到博弈的结果为 (2,1) （即参与人1选择 B）。（讲！）考察更一般的情形。对于图 7－6 中的博弈树，参与人 i 在信息集 I i ({ xi }) 选择行动 L 还是行动 R ，取决于选择行动 L 和行动 R 所带来的后果。由于参与人 i 选择行动 L 时使博弈进入了子博弈 (xi 1) ，因此参与人 i 选择行动 L 的后果就是得到子博弈 ( xi 1) 。同样，参与人 i 选择行动 R 的后果就是得到子博弈 ( xi 2 ) 。所以，参与人 i 在信息集 I i ({ xi }) 上的最优选择，取决于参与人 i 在信息集 I i ({ xi }) 上可能采取的行动，所导致的各个子博弈。也就是说，参与人 i 在信息集 I i ({ xi }) 上的最优选择，一定是使博弈进入能给自己带来最大支付的子博弈。因此，为了确定参与人 i 在信息集 I i ({ xi }) 上的选择，就必须先求解参与人 i 在信息集 I i ({ xi }) 上可能采取的行动所导致的各个子博弈。而对于各个子博弈求解又可以采用同样方法进行。 3/21 i xi L R j xi j L 2 xi 1 R L R 7－6 一般情形的博弈由以上分析可以得到求解有限展式博弈的一般步：找出博弈的所有子博弈 1。按照博弈行的 “反方向”逐一求解各个子博弈，即最先求解最底子博弈，再求解上一的子博弈， ?? ，直至原博弈。也就是，在求解每一个子博弈，子博弈要么不含有其他任何子博弈，要么所含子博弈都已被求解。由于原博弈为有限扩展式博弈，因此博弈的子博弈有限。 4/21 上述求解有限扩展式的方法亦称 “逆向归纳法” （ backward induction ）。由于逆向归纳法对各个子博弈逐一进行求解，因此逆向归纳法所得到的解在各个子博弈上构成均衡。这也意味着逆向归纳法所得的解为子博弈精炼 Nash均衡。（重点，讲！）【例 7-2 】考察如图 7－7 所以的扩展式博弈。图 7－7 中，博弈存在 5 个子博弈，即子博弈 ( x3 ) 、 ( x4 ) 、 ( x5 ) 、 (x2 ) 和 (x1 ) （即原博弈），其中 (x3) 、 (x4 ) 和 ( x5 ) 为最底层的子博弈。下面利用逆向归纳法求解博弈的子博弈精炼 Nash均衡。 1 x1 L R 2 2 x2 R x3 L L R 1 1 x10 x11 x4 x5 2, 3 5,