- 1、本文档共24页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
其他对策模型
7.1
阵地对策
71阵地对策
阵地对策
对策论中所谓局中人的个策略是指局中人的一个完整地行动方案,例
如赛马的例子中,出赛马的一个次序是一个完整地行动方案。但是有的对策
现象中完整地行动方案是不容易说清楚的,例如下象棋,要走很多步,毎步
又有很多可供选择的走法,那么一个由始至终的行动方案怎么说得清楚呢?
但是这种类型的对策现象有它的特点,即它规定了各步该谁走,而走的局中
人又有多少种走法可选择,另外走的局中人走时是否能知道别的局中人在他
此步之前是怎么走的信息等等。因此根据此类对策现象的特点来形成数学模
型也是对策论的工作之一,由于这类对策现象是一步一步走的,所以给它起
个名字叫“阵地对策
71阵地对策
假如给局中人编上号码1,2,,n则每步上都规定了是哪个局中人的步,对
于不是局中人的步而是机遇步,我们规定这种步是局中人“0的步,那么
每一步都有一个数与之对应。而每一步上都是可供选择的路(即走法)的集
合。毎步都指出能知道什么信息。最后在各路的终点(即无择路可走出去
的点)上规定了各局中人的“得失”。所以这样的对策可用树状图来表达
即:(1)一棵定向的树,树根表示第一步,其后各分叉点表示后继各
步
(2)每个分叉点上所有枝条的个数,即为该步择路的个数
(3)树的各个分叉点上者给定0,1…n中一个数。即规定在这点上
是哪个局中人的步(带数“0的步即为机遇步
(4)带数”0的分叉点上,如果它有k个枝条,则在这个枝条上
规定了—个概率分布,即给出k个数
2.…k
71阵地对策
特点
(5)诸分叉点全体组成的点集有一个划分,它把一切分叉点完全无遗
地分在互斥的子集(称为信息集)内。这些子集满足下列假设
i)属于同信息集的一切分叉点都是属于同一个局中人的步
(ⅱ)同信息集的各个分叉点有相同数目的择路。
(ⅲ)带数o的分叉点所在的信息集只能有这一个分叉点。
(6)这棵树的每个树梢上都定义有n个实数F1F2,…Fn分别表示
局中人1,2……n的得失“
71阵地对策
例14猜数对策
局中人甲秘密地选定1,2,3三个数之一。局中人乙猜甲所选的数,并且说出他所
猜的是什么数,每一次局中人乙说出他所猜的数后,甲按照实际情况回答太高
太低”或正确”。对策继续进行到乙回答出为止。甲的支付数等于乙回答出正确
答案所需要的次数
显然局中人甲的策略是选择数1,2,或3。局中人乙的策略可以用一组数(G;HL)
来表示。其中G是第一次猜的数,H是局中人乙听到甲回答“太高”后第二次猜的数。
是局中人乙听到甲回答太低”后第二次猜的数。很清楚,最多猜两次对策就结束
了。因此局中人乙有五个策略(1;0,2),(10,3),(213),(31,0),(3;2,0)其中
0表示这种情况不存在
局中人甲得到的支付数,是局中人乙直到听局中人甲说“正确”时共回答的次
数。支付矩阵列出如下
猜数对策甲的支付
局中人乙的策咯
(1;0,2)(1;0,3)(2;1,3)(3;1,0)(3;2,0)
局中人甲
2
212
2
71阵地对策
猜数对策也是一个阵地对策,可用图4-1的树状图来描写
(3,)(
(邸
①
2-2
(22(22)
平确⑤A园
,→1
正确、太趁
图4-1
7.2
连续对策
7.2连续对策
在一个有限对策里,每个局中人的策略集是有限的,即策略的,
毕食小有限数可是许多车事和经济的对策往往涉及无穷多个
题。例如在一海域里潜行的潜水艇,为躲过敌方飞机的侦察
何选择
出水换气的地点的对策问题。其策略数目就是无穷多个
具有无穷多个策略的对策称为无限对策。最简单的一种是被称为连续对策。
连续对策在其最简单的形式下可描述如下:局中人甲在0,1]闭区间中选择-
点X,同时局中人乙在01区间中选择个点Y,而在局势(X,)之下,局
中人甲得到支付为M(X,y)
假定对策是零和的,则局中人乙得到的支付为-M(X,)
并且假设支付函数M(X,Y)对于每个X,mnM(X,Y)存在,而对于每个
maxM(X,Y)也存在,所以对局中人甲来说,存在一个策略,使他至少得
到哑mM(xy)。同样对局中人乙来说,存在一个策略使他至少得到
min maxM(X,Y
容易证明下式成立
M(X)≤ min max M(X,Y)
7.2连续对策
如果上式的等号成立,那么设策略Xo,Yo使
M(x,Y)≥M(X)对于切Y成立
M(X,)sM(X,X)对于切X成立
则称X0是局中人甲的最优纯策略,Y0是局中人乙的最优纯策略。(XoY)
称为此连续对策的鞍点
如果上式的等号不成立。就没有最优纯策略。于是和有限两人零和对策中引
混合策略(即是有限集上的概率分布函数)的概念一样,我们引无限集上的概
分布函数为无限对策中的混合策略。即连续对策的混合策略是一个从[1]闭
区间中选择—个
文档评论(0)