《博弈论:原理、模型与教程》第章子博弈炼Nash均衡第节子博弈炼Nash均衡的求解.docx

《博弈论:原理、模型与教程》第章子博弈炼Nash均衡第节子博弈炼Nash均衡的求解.docx

  1. 1、本文档共21页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
《博弈论:原理、模型与教程》 第二部分 完全信息动态博弈 第 7 章 子博弈精炼 Nash均衡 7.2 子博弈精炼 Nash均衡的求解(重点!) (已精细订正!) 定义 7-1 虽然给出了子博弈精炼 Nash的定义,但没有说明如何 求解子博弈精炼均 Nash衡。 下面以图 6-8 中扩展式博弈为例, 介绍一种 最常用的求解子博弈精炼 Nash 均衡的方法 —逆向归纳法。 (讲!) 1/21 1 A x 1 B 2 x2 x4 C D 2, 1 1 x3 x5 E F1,1 x6 x7 1, 2 6 3, 0 图 6-8 博弈树 考察图 6-8 中的博弈 。参与人 1 在博弈开始时(即在信息集 I1 ( x1 ) 上面临两种选择—行动 A 和行动 B 。参与人 1 此时选择哪种行 动呢?对于理性的参与人 1 来讲,只会选择使自己支付最大化的行 动。从图 6-8 很容易知道参与人 1 选择行动 B 时所得到的支付为 2 ; 但是,如果参与人 1 选择行动 A ,则所得支付就要取决于参与人 2 在 信息集 I 2 ( x2 ) 上的选择,以及博弈达到决策结 x3 时参与人 1 在信息集 I1 ( x3 ) 上的选择。 也就是说,参与人 1 选择行动 A 所得支付,取决于 子博弈 (x2 ) 的结果 。因此,为了确定参与人 1 在博弈开始时的选择, 就必须确定参与人 1 选择行动 A 的所得支付,而为了确定参与人 1 选 择行动 A 的所得支付,就必须先求解 子博弈 (x2 ) 。如何求解博弈 ( x2 ) 呢?可以采用同样的方法来求解子博弈 (x2 ) ,即在求解子博弈 ( x3 ) 的基础上,确定参与人 2 在信息集 I 2 ( x2 ) 上的选择,从而求解子博弈 ( x2 ) 。 2/21 由以上分析可以得到图 6-8 中博弈的 求解过程: 首先求解 博弈树中 最底层的子博弈 ( x3 ) 得到子博弈 ( x3 ) 的结果为 (3,0) (即参与人 1 选择 E ); 再求解博弈 ( x2 ) ,容易得到博弈的结果 (1,1)(即参与人 2 选择 D );最后求解 原博弈,即子博弈 (x1) ,得到博弈的结果为 (2,1) (即参与人1选择 B)。 (讲!) 考察更一般的情形。 对于图 7-6 中的博弈树,参与人 i 在信息集 I i ({ xi }) 选择行动 L 还是行动 R ,取决于选择行动 L 和行动 R 所带来的 后果。由于参与人 i 选择行动 L 时使博弈进入了子博弈 (xi 1) ,因此参 与人 i 选择行动 L 的后果就是得到子博弈 ( xi 1) 。同样,参与人 i 选择 行动 R 的后果就是得到子博弈 ( xi 2 ) 。所以,参与人 i 在信息集 I i ({ xi }) 上的最优选择,取决于参与人 i 在信息集 I i ({ xi }) 上可能采取的行动, 所导致的各个子博弈。也就是说, 参与人 i 在信息集 I i ({ xi }) 上的最优 选择,一定是使博弈进入能给自己带来最大支付的子博弈。 因此,为 了确定参与人 i 在信息集 I i ({ xi }) 上的选择,就必须先求解参与人 i 在信 息集 I i ({ xi }) 上可能采取的行动所导致的各个子博弈。 而对于各个子博 弈求解又可以采用同样方法进行。 3/21 i xi L R j xi j L 2 xi 1 R L R 7-6 一般情形的博弈 由以上分析可以得到求解有限 展式博弈的一般步 : 找出博弈的所有子博弈 1。 按照博弈 行的 “反方向”逐一求解各个子博弈,即最先求解最底 子博弈,再求解上一 的子博弈, ?? ,直至原博弈 。也就是 , 在求解每一个子博弈 , 子博弈要么不含有其他任何子博弈, 要么 所含子博弈都已被求解。 由于原博弈为有限扩展式博弈,因此博弈的子博弈有限。 4/21 上述求解有限扩展式的方法亦称 “逆向归纳法” ( backward induction )。由于逆向归纳法对各个子博弈逐一进行求解, 因此逆向归纳法所得到的解在各个子博弈上构成均衡。 这也意味着 逆向归纳法所得的解为子博弈精炼 Nash均衡 。 (重点,讲!) 【例 7-2 】 考察如图 7-7 所以的扩展式博弈。图 7-7 中,博弈存 在 5 个子博弈,即子博弈 ( x3 ) 、 ( x4 ) 、 ( x5 ) 、 (x2 ) 和 (x1 ) (即原 博弈),其中 (x3) 、 (x4 ) 和 ( x5 ) 为最底层的子博弈 。 下面利用逆向归纳法求解博弈的子博弈精炼 Nash均衡。 1 x1 L R 2 2 x2 R x3 L L R 1 1 x10 x11 x4 x5 2, 3 5,

文档评论(0)

137****0220 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档