F-博弈论专题-4-1混合纳什均衡.ppt

  1. 1、本文档共22页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
博弈论专题4-1 混合纳什均衡 一、混合策略 二、混合策略纳什均衡 三、应用分析 一、混合策略 “对硬币”博弈的例子 两个参与人各握有一枚硬币,双方同时选择是正面向上(记作O)还是背面向上(记作R),即他们的策略空间都是{O, R}。若两枚硬币是一致的(即全部背面向上或者全部正面向上),参与人2赢得参与人1的硬币;若两枚硬币不一致,则参与人1赢得参与人2的硬币。 博弈矩阵 对硬币博弈的特征: 每位参与人都想猜透对方的策略,而每位参与人又都不能让对方猜透自己的策略 在“对硬币”游戏中,我们会以50%的概率选择正面(O),以50%的概率选择反面(R)。像这种以一定的概率分布来选择自己策略的行为,在博弈论中称之为混合策略(mixed strategy)。 纯策略与混合策略 纯策略: 参与人在给定信息下只选择一种特定策略(或行动)。 混合策略: 参与人给定信息下以某种概率分布随机地选择不同的行动。它可以定义为策略空间(集)上概率分布。 对比:智猪博弈与猜硬币博弈 例:点球射门 攻方的策略是:攻左边,或攻右边 守方的策略是:守左边,或守右边(以守方的方向为准) (3)石头、剪子、布 再看猎鹿博弈 风险与均衡 某种行动的概率与期望收益:猎鹿?猎兔? 如果猎兔的概率是0.5时,均衡是什么?0.6呢? 二、混合战略Nash均衡 问题: 在“猜硬币”游戏中,我们往往会以50%的概率选择正面(O),以50%的概率选择反面(R),即选择混合战略σ=(0.5,0.5)。那么有没有参与人会偏离混合战略σi=(0.5,0.5)呢? 在“猜硬币”博弈中,当双方都选择混合战略 σi=(0.5,0.5)时,双方的期望收益都为0。 E(1O)=-1×0.5+1×0.5=0 E(1R) =1×0.5+-1×0.5=0 如果参与人1保持混合战略σ1=(0.5,0.5) ,那么无论参与人2选择其它什么样的混合战略,只要参与人1保持混合战略σ1=(0.5,0.5)不变,参与人2的期望收益都为0,不会增大。也就是说,偏离并不能给参与人2带来好处。 同理,偏离也不能给参与人1带来好处。 因此,在“猜硬币”博弈中,双方都不会偏离混合战略组合σ=((0.5,0.5),(0.5,0.5))。像这样的混合战略组合我们称之为混合战略Nash均衡。 三、混合策略应用分析 (一)警察与小偷 (二)监督博弈 (三)社会福利博弈 (一)警察与小偷 某镇有一酒馆和商店,分在小镇的东西头,警察不能同时兼顾两个地方。商店价值2万元,酒馆价值1万元。警察在这头时小偷会去另一头行窃,但双方到底在哪边是不确定的。双方的策略应是什么? 警察要使损失最小化,小偷寻求收益最大化 1、如果警察以0.5的概率分别巡视两个地方,那么小偷的策略是什么? 2、警察以2/3及1/3的概率分别巡视商店和酒馆,小偷该如何? 3、混合纳什均衡策略是 警察:P商店=2/3,P酒馆=1/3 小偷:相反 案例 推牌九及赌场 每次加倍押赌,会有什么样的结果? 喝酒中的老虎、杠子、鸡、虫,有无纯策略? (二)监督博弈 税收机关与纳税人 雇主与雇员 这里,V是雇员的贡献,W是雇员的工资,H是雇员的付出,C是检查的成本。同时,我们假定HWV,WC。在这个假设下,该博弈不存在纯战略纳什均衡。 求解混合战略纳什均衡得知:雇主检查的概率?*=H/W,雇员偷懒的概率?*=C/W。 求解雇主支付W为多少时,其期望收益最大。 l? 如果雇主能够没收雇员的抵押金F,前述两个问题的答案会发生怎样变化?如何理解这种变化? l?根据上述分析,雇主是否会收取抵押金,如何收取?雇员是否愿交抵押金? l?两个其它方面完全相同的企业在相互竞争中,一个收取抵押金,一个不收,说更有竞争优势? l?从社会福利最大化角度看,作为政府是否应禁止雇主向雇员收取抵押金?为什么? 社会福利博弈 课堂测试: 求解猎人的混合纳什均衡策略。 即,选择两种策略的期望收益无差异的概率。 * * -1,1 1,-1 右边 1,-1 -1,1 左边 攻 右边 左边 守 例:石头、剪子、布 5, 5 3, 0 0, 3 3, 3 鹿 兔子 猎人2 鹿 兔子 猎 人 1 猎鹿博弈 风险上策均衡(兔子,兔子) 3,0 2,1 商店 1,2 3,0 酒馆 警察 商店 酒馆 小偷 课堂讨论 (0,0) (-1,1) 不救济 (-1,3) (3,2) 救济 游荡 找工作 政府 流浪汉 5, 5 3, 0 0, 3 3, 3 鹿 兔子 猎人2 鹿 兔子 猎 人 1 猎鹿博弈 风险上策均衡(兔子,兔子)

您可能关注的文档

文档评论(0)

ctuorn0371 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档