- 1、本文档共24页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第4章 博弈分析方法 4.1 博弈的表达 4.1.1 博弈的基本式 4.1.2 博弈的策略式 4.1.3 博弈的扩展式 4.2 博弈的求解 4.1 博弈的表达 任何一个博弈用三个基本要素来描述: (1)博弈的参与者。用N={1,2,…,n}来表示 (2)每一个参与者的行动。用Si={sij}来表示第i个参与者的第j个行动 (3)收益。用收益函数u(s1,s2,…sn)来表示各参与者的收益。 4.1.1 博弈的基本式 博弈表达的基本式由参与者集合N、策略集S和收益函数u三个要素组成,即G={N,S,u},其中N={1,2,…,n},S={S1,S2,…,Sn},u={u1,u2,…,un}.收益函数ui:S→R,表示第i位参与者在不同行动组合下所得到的收益。 基本式也可写为G={S1,S2,…,Sn; u1,u2,…,un}或简写为G={S,U} 试写出囚徒困境的基本式 (1)参与者集合:囚徒1,囚徒2,N={1,2} (2)策略集:囚徒1 S1={坦白,抵赖};囚徒2 S2={坦白,抵赖}。策略S11=S21=坦白, S12=S22=抵赖。 (3)收益: u1(s11,s21)=-5 u1(s11,s22)=0 u1(s12,s21)=-8 u1(s12,s22)=-1 u2(s11,s21)=-5 u2(s11,s22)=-8 u2(s12,s21)=0 u2(s12,s22)=-1 4.1.2 博弈的策略式 博弈的基本式可用博弈的策略式(正则式,矩阵表)和扩展式(博弈树,展开型)来表达。 策略式又叫正则型或矩阵表。表中的“行”表示参与者1的策略,“列”表示参与者2的策略,“格”表示对应于参与者策略组合的收益。 策略式常用于 试把囚徒困境用矩阵表表示。 4.1.3 展开型 又叫博弈树,扩展式。 根:博弈的出发节点 枝:从根引出的若干条枝,在每条枝的尽头是一个决策节。决策节是某个参与者必须做出决策的位置。 从节点出发的每一条枝对应于局中人的一个选择。如果一个节点没有从它那儿发出枝,则该节点为终点节(博弈结束) 例 把囚徒困境用博弈树表示出来。 例:A、B玩游戏报数,从1至30,每次报1个或2个数,报30的输。试试看,写出其扩展型。 练习 三个同学玩“黑白配”,与其他人不同的被淘汰。试写出其基本式、矩阵式、博弈树。 4.2 博弈的求解 博弈求解的目的是预测博弈的均衡结果 4.2.1严格占优策略解 占优策略:如果不管其他参与者选择什么样的策略,参与者i的策略si’的收益总优于其他策略的收益,则策略si’强优于其他策略。该策略称为严格占优策略;如果每一个参与者都有严格优策略,博弈就有一个占优策略解。 寻找所有参与者的严格占优策略,由全部严格占优策略构成的博弈的解即是严格占优策略均衡。 囚徒困境中,坦白是每一个参与者的严格占优策略,故(坦白,坦白)是占优策略解。 4.2.2 逐步剔除严格劣策略均衡(IEDS) 严格劣策略:如果参与者i的策略si’所带来的收益总少于其他任何策略,则称si’为严格劣策略。 IEDS过程:参与者1知道参与者2是理性的,将不选择严格劣策略,故先划去对2来说的严格劣策略;再分析并找出自己的严格劣策略,划去;…直至找出逐步剔除严格劣策略均衡解。 如果我们通过这样的过程求得惟一的策略组合,则这个策略组合为逐步剔除严格劣策略均衡,并称博弈是逐步剔除严格劣策略可解的。 试分析: 4.2.3 逐步剔除弱劣策略 弱劣策略:如果参与者i的策略si’所带来的收益至少少于一个其他策略si’’ ,则称si’ 为弱劣策略。 例: 纳什均衡 在一个存在n个参与者的博弈中,如果一个策略组合S*,如果保持其他参与者的策略不变,而任意一个参与者的策略都是最优的,则策略组合S*就是纳什均衡。 试分析囚徒困境,猎鹿博弈,鸽派与鹰派,情侣博弈,博弈的纳什均衡。 混合策略纳什均衡 考虑石头、剪刀、布的游戏的均衡。 4.2.4 后退归纳法(逆推法) 1,从扩展式博弈的终点开始,以找到该博弈的每一个最后子博弈,然后求出纳什均衡,并计算出相应的收益; 2,将每一个最后子博弈的起点变成结束点,将计算出的每一个最后子博弈在纳什均衡下的收益写在其下方,得到的新的扩展式博弈称为压缩的扩展式博弈。经过一次压缩,就剔除了最后子博弈。 3,重复第一步和第二步,并重新得到一个压缩式博弈和相应的纳什均衡。一直进行到只剩下一个子博弈为止。在逆推过程中找到的一系列子博弈的纳什均衡组合就是该扩展式博弈的一个完美均衡。 小蜈蚣博弈 假设有两个参与者1,2。可选行动为C-进行游戏,D-终止游戏。扩展式博弈如下。 试分析下图扩展式博弈的子博弈完美均衡。 非完全信息博弈 豪尔绍尼转换:不同状态的出现服从一定的概率分布,并且这个概率分布是公共信息. 从而将非完全信
您可能关注的文档
- _吡喃酮衍生物的合成及聚集荧光增强性质研究.pdf
- 2013河南事业单位考试专用教材-申论第1篇.pdf
- DB11T_857-2012_车用压缩天然气纤维缠绕气瓶使用与定期检查要求.pdf
- HGT 2601-2011 高温承压用离心铸造合金炉管.pdf
- HGT 3112-2011 浮头列管式石墨换热器.PDF
- HGT_2098-2011_釜用机械密封类型、主要尺寸及标志.pdf
- NB47010-2010T+承压设备用不锈钢和耐热钢锻件.pdf
- NBT47020-47029-2012等标准公告.pdf
- NBT_47009-2010_低温承压设备用低合金钢锻件.pdf
- QCT 849-2011 舞台车.pdf
- 仓库保管员述职报告 仓库保管员述职报告总结 (21篇).docx
- 教师高级职称述职报告 教师高级职称述职报告要求字数多少 (17篇).docx
- 加油站经理述职报告 加油站经理述职报告2023年 (17篇).docx
- 销售主管述职报告范文 销售主管述职报告范文大全 (17篇).docx
- 机修班长述职报告 机修班长述职报告 (20篇).docx
- 村干部半年述职报告 村干部半年述职报告 (17篇).docx
- 学生会组织部述职报告 (15篇).docx
- 教师职称评定述职报告 初中教师职称评定述职报告 (17篇).docx
- 信贷述职报告 信贷述职报告怎么写 (17篇).docx
- 入党述职报告范文 入党述职报告范文大全 (19篇).docx
1亿VIP精品文档
相关文档
最近下载
- PEP人教版小学英语五年级下册Unit-4-When-is-the-art-show-Part-B-Let's-talk课件培训资料.pptx
- 20222023学年语文六年级下册小升初文学文化常识精选题(有解析).docx
- 血管性疾病-PPT_可编辑.ppt VIP
- 水利工程防洪度汛预案及措施(范例).pdf
- 基于PLC的消防给水泵控制系统设计.docx
- 苹果酒标准文本.pdf
- 幼儿园申报市一级园自评报告.docx VIP
- 2023年人教版高中地理选择性必修3期末综合检测试卷及答案.doc VIP
- 学习身边的小雷锋(课件)全国通用 主题班会.pptx VIP
- 太原市2024年高三年级模拟考试(二)二模数学试卷(含答案).pdf
文档评论(0)