- volcanoVol
-
纳什均衡也就是纳什平衡(Nash equilibrium),又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。
在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什平衡。
一个策略组合被称为纳什平衡,当每个博弈者的平衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。
扩展资料:
纳什均衡的由来:
纳什平衡可以分成两类:“纯战略纳什平衡”和“混合战略纳什平衡”。要说明纯战略纳什平衡和混合战略纳什平衡,要先说明纯战略和混合战略。
所谓纯战略是提供给玩家要如何进行赛局的一个完整的定义。特别地是,纯战略决定在任何一种情况下要做的移动。
战略集合是由玩家能够施行的纯战略所组成的集合。而混合战略是对每个纯战略分配一个机率而形成的战略。混合战略允许玩家随机选择一个纯战略。
混合战略博弈均衡中要用概率计算,因为每一种策略都是随机的,达到某一概率时,可以实现支付最优。因为机率是连续的,所以即使战略集合是有限的,也会有无限多个混合战略。
当然,严格来说,每个纯战略都是一个“退化”的混合战略,某一特定纯战略的机率为1,其他的则为0。
故“纯战略纳什平衡”,即参与之中的所有玩家都玩纯战略;而相应的“混合战略纳什平衡”,之中至少有一位玩家玩混合战略。
并不是每个赛局都会有纯战略纳什平衡,例如“钱币问题"就只有混合战略纳什平衡,而没有纯战略纳什平衡。不过,还是有许多赛局有纯战略纳什平衡(如协调赛局,囚徒困境和猎鹿赛局)。
甚至,有些赛局能同时有纯战略和混合战略平衡。
参考资料来源:百度百科-纳什平衡
相关推荐
纳什均衡是什么?
纳什均衡又称非合作博弈均衡,是博弈论中的一个重要术语,以约翰·纳什的名字命名。在博弈过程中,无论对方的战略选择是什么,一方都会选择一定的战略,这就叫主导战略。如果两个博弈者的战略组合构成各自的主导战略,则该组合被定义为纳什均衡。当每个球员的平衡策略是达到其预期收益的最大值时,一个策略组合被称为纳什均衡,同时,所有其他球员遵循这一策略。扩展资料;纳什均衡可分为两类:纯战略纳什均衡和混合战略纳什均衡。要解释纯策略纳什均衡和混合策略纳什均衡,首先要解释纯策略和混合策略。所谓纯策略,就是为玩家提供一个完整的游戏定义。特别是,纯粹的策略决定了在任何情况下都要进行的运动,策略集合是玩家可以执行的纯策略集合。混合策略是通过给每一个纯策略分配一个概率而形成的策略,混合策略允许玩家随机选择纯策略,在混合策略博弈的均衡中,由于每个策略都是随机的,当达到一定的概率时,就可以得到最优支付。由于概率是连续的,即使策略集是有限的,也会有无限的混合策略。当然,严格地说,每个纯策略都是一个“退化”混合策略,一个特定纯策略的概率为1,另一个为0。因此,“纯战略纳什均衡”是指所有参与者都玩纯战略,而相应的“混合战略纳什均衡”则是指至少有一个参与者玩混合战略。并不是每一个博弈都会有纯战略纳什均衡,比如“硬币问题”只有混合战略纳什均衡,而不是纯战略纳什均衡。然而,仍有许多博弈具有纯战略纳什均衡(如协调博弈、囚徒困境博弈和鹿博弈)。甚至,有些游戏可以同时拥有纯策略和混合策略平衡。参考资料来源;百度百科——纳什平衡2023-07-06 22:06:031
纳什均衡是什么?
纳什均衡也就是纳什平衡(Nash equilibrium),又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什平衡。一个策略组合被称为纳什平衡,当每个博弈者的平衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。扩展资料:纳什均衡的由来:纳什平衡可以分成两类:“纯战略纳什平衡”和“混合战略纳什平衡”。要说明纯战略纳什平衡和混合战略纳什平衡,要先说明纯战略和混合战略。所谓纯战略是提供给玩家要如何进行赛局的一个完整的定义。特别地是,纯战略决定在任何一种情况下要做的移动。战略集合是由玩家能够施行的纯战略所组成的集合。而混合战略是对每个纯战略分配一个机率而形成的战略。混合战略允许玩家随机选择一个纯战略。混合战略博弈均衡中要用概率计算,因为每一种策略都是随机的,达到某一概率时,可以实现支付最优。因为机率是连续的,所以即使战略集合是有限的,也会有无限多个混合战略。当然,严格来说,每个纯战略都是一个“退化”的混合战略,某一特定纯战略的机率为1,其他的则为0。故“纯战略纳什平衡”,即参与之中的所有玩家都玩纯战略;而相应的“混合战略纳什平衡”,之中至少有一位玩家玩混合战略。并不是每个赛局都会有纯战略纳什平衡,例如“钱币问题"就只有混合战略纳什平衡,而没有纯战略纳什平衡。不过,还是有许多赛局有纯战略纳什平衡(如协调赛局,囚徒困境和猎鹿赛局)。甚至,有些赛局能同时有纯战略和混合战略平衡。参考资料来源:百度百科-纳什平衡2023-07-06 22:06:181
纳什均衡通俗解释是什么?
纳什均衡通俗解释是:纳什平衡是博弈论的一个重要术语,以约翰·纳什命名。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果任意一位参与者在其他所有参与者的策略确定的情况下,其选择的策略是最优的,那么这个组合就被定义为纳什平衡。扩展资料:纳什平衡可以分成两类,“纯战略纳什平衡”和“混合战略纳什平衡”。所谓纯战略是提供给玩家要如何进行赛局的一个完整的定义。特别地是,纯战略决定在任何一种情况下要做的移动。战略集合是由玩家能够施行的纯战略所组成的集合。而混合战略是对每个纯战略分配一个机率而形成的战略。混合战略允许玩家随机选择一个纯战略。混合战略博弈均衡中要用概率计算,因为每一种策略都是随机的,达到某一概率时,可以实现支付最优。因为机率是连续的,所以即使战略集合是有限的,也会有无限多个混合战略。2023-07-06 22:06:301
纳什均衡的计算!
纯策略:划线法 (4,1) (3,0) (3,2) (7,3) 每个括号第一个数为Player1的收益,第二个数为Player2的收益。 当局中人2选择策略1时,比较纵向两个括号内第一个数,可知局中人1最大收益为4,在4下划线 当局中人2选择策略2时,同上,可知局中人1最大收益为7,在7下划线 当局中人1选择策略1时,比较横向两个括号内第二个数,可知局中人2最佳收益为1,在1下划线 当局中人1选择策略2时,同上,可知局中人2最大收益为3,在3下划线 所以有纯策略那是均衡,双方都取策略1或双方都取策略2 (4,1)及(7,3)拓展资料纳什均衡是指博弈中这样的局面,对于每个参与者来说,只要其他人不改变策略,他就无法改善自己的状况。纳什证明了在每个参与者都只有有限种策略选择并允许混合策略的前提下,纳什均衡定存在。以两家公司的价格大战为例,价格大战存在着两败俱伤的可能,在对方不改变价格的条件下既不能提价,否则会进一步丧失市场;也不能降价,因为会出现赔本甩卖。于是两家公司可以改变原先的利益格局,通过谈判寻求新的利益评估分摊方案。相互作用的经济主体假定其他主体所选择的战略为既定时,选择自己的最优战略的状态,也就是纳什均衡。命名原因约翰·福布斯·纳什(John Forbes Nash Jr)1948年作为年轻数学博士生进入普林斯顿大学。其研究成果见于题为《非合作博弈》(1950)的博士论文。该博士论文导致了《n人博弈中的均衡点》(1950)和题为《非合作博弈》(1951)两篇论文的发表。纳什在上述论文中,介绍了合作博弈与非合作博弈的区别。他对非合作博弈的最重要贡献是阐明了包含任意人数局中人和任意偏好的一种通用解概念,也就是不限于两人零和博弈。该解概念后来被称为纳什均衡。2023-07-06 22:06:482
博弈论(2)—纳什均衡
如果想观看相关视频可以在西瓜视频(账号zidea)或者哔哩哔哩(账号zidea2015)找到我发布视频解说,注意头像和使用头像一致。 又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。 在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作 最佳应对 。 如果两个博弈的局中人的策略组合分别构成各自的 最佳应对 ,那么这个组合就被定义为纳什均衡。 在给出纳什均衡解释前,我们先得把一个概念说清楚最佳应对。 纳什均衡是刻画局势,如果一个局势下,每个局中人的策略都是相对其他局中人当前策略的最佳对应,则称该局势是一个 纳什均衡 如果一个局中人的某个策略对其他局中人的任何策略都是最佳对应,那么这个策略就是该局中人的 占优策略 在纳什均衡下,局中人没有人会想要改变改变,因为谁改变谁就可能在博弈中处于不利地位。 首先我们来看一看在囚徒困境中纳什均衡,对于囚徒困境的问题的纳什均衡是 双方都坦白 ,属于占优策略 其实不管局中人 2 是抗拒还是坦白,对于局中人的最佳应对都是坦白。从而可以看出纳什均衡点并不一定是整体的最优解。有人可能会说那么为什么不是对于两个人都有利的(抗拒,抗拒)呢,这里最佳应对是无论对手进行策略对自己都是最佳策略,在最后 maxmin 时候就更会了解为什么他们会做出坦白选择,这是一个规避风险的策略。 <img src="./image_003/005.jpg"> 这就是纯策略纳什均衡,混合策略下纳什均衡,女生看舞蹈概率 p 看足球的概率就是 1 - p,男生看舞蹈概率 q 看足球的概率就是 1 - q 妻子随机性的目的: 使丈夫无机可乘,不管丈夫选择哪个策略,其期望收益均相同 当丈夫给出概率分布不会让妻子在看足球和看,关于 以我对丈夫了解他更喜欢看足球, 局中人 1 的策略选择分布记为 , 局中人 2 的策略选择分布记为 。假设局中人 1 的策略分布不变,局中人 2 策略选择的效用为 剪刀—石头—布的混合 纳什均衡态 任何有限博弈(参与人与策略数目均为有限)都至少存在一个纳什均衡,这个均衡可能是纯策略纳什均衡(例如剪刀-石头-布),也可能是混合策略均衡,纳什均衡的多重性(例如性别之战)2023-07-06 22:06:551
设某个纯策略博弈的纳什均衡不存在试问:相应的混合策略博弈的纳什均衡会存在吗?试举一例说明.
【答案】:在同时博弈中,纯策略的纳什均衡可能存在,也可能不存在,但相应的}昆合策略纳什均衡总是存在的。例如表10-9所示,在下面的二人同时博弈中,根据条件策略下划线法可知由于没有一个单元格中两个数字之下均有下划线,故纯策略的纳什均衡不存在,但是相应的混合策略纳什均衡却是存在的。首先分别计算甲厂商和乙厂商的混合策略: E甲=4P1ql+9P1(1-ql)+7(1-P1)ql+2(1-P1)(1-q1) =p1(7 -1Oql) +5q1 +2 E乙= 6P1ql+P1(1- q1)+3(1-p1)ql+8(1- P1)(1- q1) =5q1(2p1 -1) -7P1+8 其次分别计算甲厂商和乙厂商的条件混合策略:最后,混合策略纳什均衡参见图10-1中点e,此时混合策略纳什均衡可以表示为: ((P1,p2)(q1,q2))=((0.5,0.5)(0.7,0.3)) 但不存在纯策略博弈的纳什均衡。2023-07-06 22:07:011
关于博弈论的纳什均衡题目 急急急急急!
用最优反应法分析纯策略纳什均衡的方法如下:1、对博弈者2的每一种策略,找出使得博弈者1收益最高的策略,并在相应的收益数值下划线2、对博弈者1的每一种策略,找出使得博弈者2收益最高的策略,并在相应的收益数值下划线3、如果有一个格子里,有两个下划线,则该格子即为一个纯策略纳什均衡。所以,共有3个纯策略纳什均衡:(b,x),(a,z),(c,w),对应收益分别为(8,9),(8,7),(8,7)。2023-07-06 22:07:251
下面的博弈中有没有纯策略的纳什均衡
纯策略纳什均衡是指在一个纯策略组合中,如果给定其他的策略不变,该节点不会单方面改变自己的策略,否则不会使节点访问代价变小。惟一纯策略均衡的有限次重复博弈的结果就是重复原博弈惟一的纯策略纳什均衡,这就是这种重复博弈惟一的子博弈完美纳什均衡路径。2023-07-06 22:07:381
纳什平衡理论具体是什么?
纳什平衡,在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什平衡。一个策略组合被称为纳什平衡,当每个博弈者的平衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。扩展资料:纳什平衡的命名来由为美国数学家小约翰·富比士·纳什。该概念的其中一个版本已知最早于1838年被安托万·奥古斯丁·库尔诺运用于他的寡占理论中。在库尔诺的理论中,商行们需选择合适的产量以获得最大利润,然而一家商行的理想产量取决于其他商行的产量。当每一家商行的理想产量都需要根据已知其他商行的产量来做出调整,以达到最大利润时,一种纯策略的纳什平衡——库尔诺平衡就形成了。在分析平衡稳定性的过程中,库尔诺还提出了最适反应动态(或最佳反应动态)的概念。然而纳什对平衡的定义比库尔诺的更为广泛,也比帕勒托效率平衡的定义更为广泛,因为纳什的定义没有针对“形成哪种平衡最为理想”作出评判。参考资料来源:百度百科 纳什平衡2023-07-06 22:08:094
在只有两个参与人且每个参与人都有三个策略可供选择的情况下,纯策略的纳什均衡最多可有几个?
纯策略的纳什均衡最多有9个,因为每个人都有三个策略可供选择,故会出现9种支付。结果,故最多可有9个。2023-07-06 22:08:401
纯战略纳什均衡
假定房地产市场需求有限,A、B两个开发商都想开发一定规模的房地产,但是市场对房地产的需求只能满足一个房地产的开发量,而且,每个房地产商必须一次性开发这一定规模的房地产才能获利。在这种情况下,无论是对开发商A还是开发商B,都不存在一种策略完全优于另一种策略,也不存在一个策略完全劣于另一个策略。 因为,如果A选择开发,则B的最优策略是不开发;如果A选择不开发,则B的最优策略是开发;类似地,如果B选择开发,则A的最优策略是不开发;如果B选择不开发,则A的最优策略是开发。这样就形成了一个循环选择。 根据纳什均衡含义就是:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是你最好的策略。即双方在对方给定的策略下不愿意调整自己的策略。 这个博弈的纳什均衡点不止一个,而是两个:要么A选择开发,B不开发;要么A选择不开发,B选择开发。在这种情况下,A与B都不存在优势策略,也就是A和B不可能只要选择某一个策略而不考虑对方的所选择的策略。实际上,在有两个或两个以上纳什均衡点的博弈中,其最后结果难以预测。2023-07-06 22:08:481
纯战略的纳什均衡是什么
混合策略表示的是博弈方对各个纯策略的偏好程度,混合策略纳什均衡是对多次博弈达到均衡结局的各个纯策略选择的概率估计2023-07-06 22:08:551
请教占优均衡和纯策略纳什均衡之间的区别
简单来说,占优策略是不管对方有什么策略,"我"都有唯一最优的策略,不会随着情况不同改变。而纳什均衡则是,根据对方的选择来决定自己的最优策略,会根据情况而变。所以,占优策略均衡一定是纳什均衡,而纳什均衡却不一定是占优策略均衡。2023-07-06 22:09:031
什么叫鹰鸽博弈论
鹰-鸽(Hawk-Dove)博弈 (1) 参与人:争食的两只动物-动物1和动物2。 动物1和动物2的行动空间都是一样的,即:Ai={鹰,鸽} i=1,2 支付矩阵如下: (2) 此博弈属于完全信息静态博弈,根据奇数定理知道共有三个纳什均衡,两个纯策略纳什均衡和一个混合策略纳什均衡。 两个纯策略纳什均衡是:(鹰,鸽)和(鸽,鹰)。混合策略纳什均衡是:动物1和动物2分别以50%的概率随机地选择鹰(象鹰一样行动)或者鸽(象鸽一样行动)。 纯策略纳什均衡可以用划线法或箭头法求解。混合策略纳什均衡则可根据无差异原则求解概率分布,即: 首先,动物1应该以q的概率选择鹰,以1-q的概率选择鸽,使得动物2在鹰或者鸽之间无差异,那么可得q*:由4(1-q) = q+3(1-q) 得q*=50%; 其次,动物2应该以a的概率选择鹰,以1-a的概率选择鸽,使得动物1在鹰或者鸽之间无差异,那么可得a*:由4(1-a) = a+3(1-a) 得a*=50%。 (3) 此博弈实际就是一个斗鸡博弈,在现实生活许多现象都与此类似,如市场进入、前苏联与美国在世界各地争抢地盘等。 有两方进行对抗,有侵略型和和平型 两种战略,因此称为鹰鸽博弈。相比来说,鹰派更注重实力,而鸽派更注重道义;鹰派注重利益,鸽派注重信义;鹰派注重眼前,鸽派注重长远;鹰派注重战术,鸽派注重战略;鹰派倾向于求快,鸽派倾向于求稳。但是,鹰派与鸽派到底何者更好一些,恐怕难以一概而论。此一时,彼一时,此一处,彼一处,不同的条件、不同的目标等不同的因素使得鹰派、鸽派各有其存在的根据和发展的空间,应该具体情况具体对待。2023-07-06 22:09:091
动态博弈写出该博弈的策略式表达 找出纯策略纳什均衡 急求大神详解!!
要识别纳什均衡其实可以使用划线法,首先我们从经销商的角度来看,如果制造商采取产品升级策略,那么经销商的最佳策略是继续特价销售,如果制造商采取不升级,那么经销商的最佳策略是采取不停止特价销售;接着我们站在制造商的角度来看,如果经销商采取停止特价销售,那么制造商的最佳策略是产品升级如果经销商继续特价销售,制造商的最佳策略是采取产品升级。因此综合上面的分析不难发现,该博弈中的优势策略即为唯一的纳什均衡策略(继续特价销售,产品升级)。第三个问题其实是将原有的静态博弈模型转变为了一个动态博弈模型,可以通过逆推归纳法来分析,由于比较麻烦如果你有需要可以直接找我,将原有的博弈展开成为一个博弈树不难发现,无论是谁先动,该博弈的子博弈完美纳什均衡仍然是经销商选择继续特价销售,制造商选择产品升级。如果加入更新成本后,响应的在产品升级那一列中制造商的收益都减5,然后继续使用划线法,不难发现新博弈模型中(停止特价销售,不升级)是新的纳什均衡。2023-07-06 22:09:161
假设两个人在玩博弈论,每个人有2个纯策略。问题是这个博弈论最多有几个纯策略纳什均衡?最少有多少个?
最多4个pure,最少0个pure。最多4个,选什么都一样就是4个,比如无论两人选什么,每个人的payoff都是0。那么每一组pure都是纳什均衡。(如果强制要求每个payoff都不一样,那么最多是2个。)最少0个。例如两个人选择Yes或No,Player1是和对方一样时payoff为1,不一样时payoff为-1;Player2反之,和player1一样时payoff为-1,不一样时payoff为1。这个就不存在pure纳什均衡。只有一个mix纳什均衡,两个player都半半的几率选择yes和no。2023-07-06 22:09:261
什么是纳什均衡?
纳什均衡是指纳什平衡,纳什平衡(Nash equilibrium),又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什平衡。扩展资料:纳什均衡的影响1、改变了经济学的体系和结构。非合作博弈论的概念、内容、模型和分析工具等,均已渗透到微观经济学、宏观经济学、劳动经济学、国际经济学、环境经济学等经济学科的绝大部分学科领域。2、扩展了经济学研究经济问题的范围。原有经济学缺乏将不确定性因素、变动环境因素以及经济个体之间的交互作用模式化的有效办法,因而不能进行微观层次经济问题的解剖分析。3、形成了基于经典博弈的研究范式体系。即可以将各种问题或经济关系,按照经典博弈的类型或特征进行分类,并根据相应的经典博弈的分析方法和模型进行研究,将一个领域所取得的经验方便地移植到另一个领域。4、扩大和加强了经济学与其他社会科学、自然科学的联系。纳什均衡之所以伟大,就因为它普通,而且普通到几乎无处不在。纳什平衡理论既适用于人类的行为规律,也适合于人类以外的其他生物的生存、运动和发展的规律。参考资料来源:百度百科-纳什平衡2023-07-06 22:09:383
纳什均衡点怎么找
(1)如果是完全信息博弈 张三认为李四:左,中,右的策略概率设为p1,p2,1-p1-p2 张三上策略的期望收益为E1=12*p1+42*p2+42*(1-p1-p2) 同理 中:E2=24*p1+12*p2+60*(1-p1-p2) 下:E3=72*p1+36*p2+42*(1-p1-p2) 如果是完全信息博弈,则较优策略为三者相同,即E1=E2=E3 可解得p1=0.0370 p2=0.3700 1-p1-p2=0.5930 同理李四认为张三:上中下的策略概率为q1 q2 (1-q1-q2) 李四的左策略的期望收益为T1=83*q1+12*q2+47*(1-q1-q2) 中策略收益为T2=56*q1+42*q2+95*(1-q1-q2) 右策略的收益为T3=45*q1+76*q2+59*(1-q1-q2) 同理解得q1=0.6276 q2=0.0140 (1-q1-q2)=0.3584 综上所述 在完全信息博弈的情况下张三的混合策略的策略概率为上0.6276 中0.0140 下0.3584 李四的混合策略的策略概率为左0.0370 中0.3700 右0.5930 其中张三的期望收益为40.8900 李四的期望收益为50.4516 (2)如果是不完全信息无限重复博弈,开始时双方都是以0.333的自然混合概率预测,根据两者的信息背叛不同,回归结果也可不同,此题条件不足.但结果是会是纯策略,博弈次数则无法确定 作业2:纯策略纳什均衡的收益为(60,76)混合策略纳什均衡的收益为(40.8900,50.4516) 实际中应该是纯策略占优2023-07-06 22:10:272
1、找到纯策略纳什均衡。 2、找到所有子博弈完美均衡。
1.pure-strategy NE={(T,L,E),(B,L,W),(B,R,E)}2.subgame-perfect NE={(B,LW),(B,R,E),(B,μ2,μ3)} μ2=(4/5L,1/5R) μ3=(2/5W,3/5E)2023-07-06 22:10:431
解释上策均衡、严格下策反复消去策略均衡、纯策略纳什均衡混合策略纳什均衡,并阐述他们之间的关系.
先有上策均衡strictly better Nash Equilibrium,后有严格下策strictly dominated的概念。模型中存在多个上策NE均衡时,才出现混合策略NE即Mixed strategy NE,此时的混合策略为纯策略pure strategy的集合,集合里面的每个元素都是上策,其预期收益相等。先解释这么多,加分后再往下讲。2023-07-06 22:10:511
博弈会不会出现同时存在纯策略纳什均衡和混合策略纳什均衡?
会出现的,根据四个均衡可以推出纯策略纳什均衡和混合策略纳什均衡会同时存在。 严格占优策略均衡、重复剔除的占优策略均衡、纯策略纳什均衡和混合策略纳什均衡。一般将上述四种均衡统称为纳什均衡。 在这四种均衡概念中每种均衡依次是前一种均衡的扩展。前一种均衡是后一种均衡的特例。严格占优策略均衡是重复剔除的占优策略均衡的特例;重复剔除的占优策略均衡是纯策略纳什均衡的特例;纯策略纳什均衡是混合策略纳什均衡的特例。 如果将完全信息静态博弈中存在某种均衡的所有博弈定义为一个集合,那么就存在前一种均衡的博弈集合是后一种均衡的博弈集合的子集。完全信息静态博弈四种均衡概念之间的关系可以用图表示。 纯策略纳什均衡是指在一个纯策略组合中,如果给定其他的策略不变,该节点不会单方面改变自己的策略,否则不会使节点访问代价变小。 混合策略纳什均衡:在n个参与人的博弈G={S<sub>1</sub> ,... S<sub>n</sub> ; u<sub>1</sub> ,...u<sub>n</sub>}中,混合策略组合构成一个纳什均衡,如果对于所有的i=1,2...,n下式成立: 也就是说,如果一个策略组合使任何一个参与人的策略都是相对于其他参与人的策略的最佳策略,这个策略就构成一个纳什均衡,不管这个策略是混合策略还是纯策略。 混合策略纳什均衡是面对其他博弈者选择的不确定性的一个理性对策,其主要特征是作为混合策略一部分的每一个纯策略有相同的期望值,否则,一个博弈者会选择那个期望值最高的策略而排除所有其他策略,这意味着原初的状态不是一个均衡。2023-07-06 22:11:001
怎么求混合策略纳什均衡
混合策略均衡求解的一个原则是混合策略均衡赋予正概率的所有纯策略的期望收益相等。假设这是个两个玩家的游戏。玩家a有2种纯策略a和b,不能相互支配。玩家b有2种纯策略c和d,不能相互支配。设a选a的几率是p,则选b的几率为1-p;设b选c的几率是q,则选d的几率为1-q当a取某一个p=p0,b获得的总效用不为自己q的取值而改变;b取某一个q=q0,a获得的总效用不为自己p的取值而改变,此时我们说(p0,1-p0)和(q0,1-q0)是一对混合策略下的纳什均衡。拓展资料:混合策略纳什均衡:在n个参与人的博弈G={S1,...Sn;u1,...un}中,混合策略组合构成一个纳什均衡,如果对于所有的i=1,2...,n下式成立:也就是说,如果一个策略组合使任何一个参与人的策略都是相对于其他参与人的策略的最佳策略,这个策略就构成一个纳什均衡,不管这个策略是混合策略还是纯策略。混合策略纳什均衡是面对其他博弈者选择的不确定性的一个理性对策,其主要特征是作为混合策略一部分的每一个纯策略有相同的期望值,否则,一个博弈者会选择那个期望值最高的策略而排除所有其他策略,这意味着原初的状态不是一个均衡。严格占优策略均衡、重复剔除的占优策略均衡、纯策略纳什均衡和混合策略纳什均衡。一般将上述四种均衡统称为纳什均衡。在博弈G={S1,S2Sn;U1,U2Un}中第i个博弈方策略空间为Si={Si1Sik}则博弈方以概率分布Pi=(PiPik)随机在k个可选策略中选的的策略称为一个混合策略纳什均衡。在这四种均衡概念中每种均衡依次是前一种均衡的扩展。前一种均衡是后一种均衡的特例。严格占优策略均衡是重复剔除的占优策略均衡的特例;重复剔除的占优策略均衡是纯策略纳什均衡的特例;纯策略纳什均衡是混合策略纳什均衡的特例。如果将完全信息静态博弈中存在某种均衡的所有博弈定义为一个集合,那么就存在前一种均衡的博弈集合是后一种均衡的博弈集合的子集。实现1、最大化收益法:即最大化各个参与人的效用函数。2、收益相等法:根据前面分析的猜硬币博弈中参与人的策略的思路,每个参与人的混合策略都使其余参与人的任何纯策略的期望收益相等,因此,解混合策略纳什均衡可以令参与人的各个纯策略收益相等,构成方程组求解。2023-07-06 22:11:102
求一篇关于博弈论的演讲稿 3分钟左右 主要阐述一下纳什均衡。
纳什均衡是一种策略组合,使得每个参与人的策略是对其他参与人策略的最优反应。假设有n个局中人参与博弈,如果某情况下无一参与者可以独自行动而增加收益(即为了自身利益的最大化,没有任何单独的一方愿意改变其策略的[1] ),则此策略组合被称为纳什均衡。所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡,从实质上说,是一种非合作博弈状态。纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。纳什均衡也不意味着博弈双方达到了一个整体的最优状态,需要注意的是,只有最优策略才可以达成纳什均衡,严格劣势策略不可能成为最佳对策,而弱优势和弱劣势策略是有可能达成纳什均衡的。在一个博弈中可能有一个以上的纳什均衡,而囚徒困境中有且只有一个纳什均衡。纳什的主要学术贡献体现在1950年和1951年的两篇论文,1950年他才把自己的研究成果写成题为“非合作博弈”的文章刊登在美国全国科学院每月公报上,立即引起轰动。说起来这全靠师兄戴维·盖尔之功,就在遭到冯·诺依曼贬低,嘲笑几天之后,他遇到盖尔,像说梦话似的告诉他自己已经将冯·诺依曼的“最小最大原理找到了普遍化的方法和均衡点。纳什这个初出茅庐的小子,根本不知道竞争的险恶,从没想到学术欺骗的后果。结果还是戴维·盖尔充当了他的“经纪人”,起草致科学院的短信,系主任列夫谢茨则利用方便的人脉关系亲自将文稿递交给科学院。纳什写的文章不多,他辩解说:少了才是精品。1996年诺贝尔经济学奖得主莫尔里斯当牛津大学艾奇沃思经济学讲座教授时也没有发表过什么文章,特殊的人才,必须有特殊的选拔办法。Nash平衡是指博弈中这样的局面,对于每个参与者来说,只要其他人不改变策略,他就无法改善自己的状况。Nash在证明了在每个参与者都只有有限种策略选择、并允许混合策略的前提下,Nash平衡一定存在。以两家公司的价格大战为例,Nash平衡意味着两败俱伤的可能:在对方不改变价格的条件下,既不能提价,否则会进一步丧失市场;也不能降价,因为会出现赔本甩卖。于是两家公司可以改变原先的利益格局,通过谈判寻求新的利益评估分摊方案,也就是Nash平衡。类似的推理当然也可以用到选举,群体之间的利益冲突,潜在战争爆发前的僵局,议会中的法案争执等。纳什均衡可以分成两类:“纯战略纳什均衡”和“混合战略纳什均衡”。要说明纯战略纳什均衡和混合战略纳什均衡,要先说明纯战略和混合战略。所谓纯战略是提供给玩家要如何进行赛局的一个完整的定义。特别地是,纯战略决定在任何一种情况下要做的移动。战略集合是由玩家能够施行的纯战略所组成的集合。而混合战略是对每个纯战略分配一个机率而形成的战略。混合战略允许玩家随机选择一个纯战略。混合战略博弈均衡中要用概率计算,因为每一种策略都是随机的,达到某一概率时,可以实现支付最优。因为机率是连续的,所以即使战略集合是有限的,也会有无限多个混合战略。当然,严格来说,每个纯战略都是一个“退化”的混合战略,某一特定纯战略的机率为 1,其他的则为 0。故“纯战略纳什均衡”,即参与之中的所有玩家都玩纯战略;而相应的“混合战略纳什均衡”,之中至少有一位玩家玩混合战略。并不是每个赛局都会有纯战略纳什均衡,例如“钱币问题"就只有混合战略纳什均衡,而没有纯战略纳什均衡。不过,还是有许多赛局有纯战略纳什均衡(如协调赛局,囚徒困境和猎鹿赛局)。甚至,有些赛局能同时有纯战略和混合战略均衡。最后几自己讲一个类似于囚徒困境的例子好了。2023-07-06 22:11:181
夫妻之争主要针对的多重纯策略纳什均衡,及多重策略纳什均衡求混合策略
纯策略纳什均衡:无论妻子如何选择,丈夫坚持自己的选择; 无论丈夫如何选择,妻子坚持自己的选择;混合策略纳什均衡:夫妻二人一同欣赏歌剧; 夫妻二人一同去看球赛。2023-07-06 22:11:241
求那什均衡解?
博弈的纳什均衡解,纯战略纳什均衡最简单的方法是划线法,先固定一个然后另一收益大就在下面划线,再固定另一个收益对另外一个量划线,最后两个都有线的就是纯战略纳什均衡,混合战略纳什均衡要计算,但是一个有限博弈的纯战略纳什均衡和混合战略纳什均衡个数之和一定是奇数,如果你求出的纯战略纳什均衡有偶数个,那么一定有另外一个混合战略纳什均衡。混合策略纳什均衡:在n个参与人的博弈G={S1,...Sn;u1,...un}中,混合策略组合构成一个纳什均衡,如果对于所有的i=1,2...,n下式成立:也就是说,如果一个策略组合使任何一个参与人的策略都是相对于其他参与人的策略的最佳策略,这个策略就构成一个纳什均衡,不管这个策略是混合策略还是纯策略。混合策略纳什均衡是面对其他博弈者选择的不确定性的一个理性对策,其主要特征是作为混合策略一部分的每一个纯策略有相同的期望值,否则,一个博弈者会选择那个期望值最高的策略而排除所有其他策略,这意味着原初的状态不是一个均衡。2023-07-06 22:11:341
为什么说猜硬币博弈中不存在纳什均衡?
不是不存在纳什均衡,是不存在纯策略的纳什均衡。纳什均衡的定义是双方都选择最优反应策略,因此分析建立于假设对方选择某一策略时自己的最有反应是什么。而猜硬币的博弈中并不存在针对对方所有策略的统一最有反应,因此没有纯策略的纳什均衡。但是存在混合策略的纳什均衡,即双方皆以二分之一的几率选择任意策略,此时双方的期望收获都是0。拓展资料:纳什平衡是博弈论的一个重要术语,以约翰·纳什命名。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果任意一位参与者在其他所有参与者的策略确定的情况下,其选择的策略是最优的,那么这个组合就被定义为纳什平衡。纳什均衡可分为“纯战略纳什均衡”和“混合战略纳什均衡”两大类。 所谓纯策略就是为玩家提供一个完整的游戏玩法定义。特别是,纯粹的策略决定了在任何情况下要完成的动作。 策略集是玩家可以实施的一组纯策略。 混合策略是通过为每个纯策略分配一个概率而形成的策略。混合策略允许玩家随机选择一个纯策略。 在混合策略博弈均衡中应该使用概率计算,因为每个策略都是随机的。 当达到一定的概率时,就可以实现最优支付。 因为概率是连续的,即使策略集是有限的,也会有无穷多的混合策略。纳什均衡的定义:在博弈G={S1,,Sn:u1,,un}中,如果由各个博弈方的各一个策略组成的某个策论组合(s1*,,sn*)中,任一博弈方i的策论si*,都是对其余博弈方策略的组合(s1*,s*i-1,s*i+1,,sn*)的最佳对策,也即ui(s1*,s*i-1, si*,s*i+1,,sn*)≥ui(s1*,s*i-1, sij*,s*i+1,,sn*)对任意sij∈Si都成立,则称(s1*,,sn*)为G的一个纳什均衡。2023-07-06 22:12:164
关于博弈论的几道判断题!!求助博弈论高手!
对错,不愿单独偏离是纳什均衡的判断标准,但是子博弈完美纳什均衡的要求更为严格对错 策略是指在……情况下做了……,而行动是在某一阶段的行为对 纳什均衡的一致预测性错 囚徒困境博弈的重复博弈?错错错 反例:斯塔克伯格模型,先行动方Q=3,后行动方Q=1.5对错 “聪明过头没好事”错2023-07-06 22:12:232
几个 博弈论考试的判断题,求答案!!
错 不一定是减少,弱纳什均衡可能导致收益不会改变错 可能是混合策略纳什均衡错 还要知道参与人,以及他们的策略 错 存在先发制人错 会集中在200米处2023-07-06 22:12:301
什么是Nash Equilibrium?
纳什均衡,Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。定义 假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的 纳什均衡最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己利益最大化。所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。纳什均衡,从实质上说,是一种非合作博弈状态。纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。纳什均衡也不意味着博弈双方达到了一个整体的最优状态,以下的囚徒困境就是一个例子。编辑本段数学定义 纳什均衡的定义:在博弈G=﹛S1,…,Sn:u1,…,un﹜中,如果由各个博弈方的各一个策略组成的某个策论组合(s1*,…,sn*)中,任一博弈方i的策论si*,都是对其余博弈方策略的组合(s1*,…s*i-1,s*i+1,…,sn*)的最佳对策,也即ui(s1*,…s*i-1,si*,s*i+1,…,sn*)≥ui(s1*,…s*i-1,sij*,s*i+1,…,sn*)对任意sij∈Si都成立,则称(s1*,…,sn*)为G的一个纳什均衡。编辑本段命名原因 约翰·福布斯·纳什(John Forbes Nash Jr)1948年作为年轻数学博士生进入普林斯顿大学。其研究成果见于题为《非合作博弈》(1950)的博士论文。该博士论文导致了《n人博弈中的均衡点》(1950)和题为《非合作博弈》(1951)两篇论文的发表。纳什在上述论文中,介绍了合作博弈与非合作博弈的区别。他对非合作博弈的最重要贡献是阐明了包含任意人数局中人和任意偏好的一种通用解概念,也就是不限于两人零和博弈。该解概念后来被称为纳什均衡。纳什的主要学术贡献体现在1950年和1951年的两篇论文,1950年他才把自己的研究成果写成题为“非合作博弈”的文章刊登在美国全国科学院每月公报上,立即引起轰动。说起来这全靠师兄戴维·盖尔之功,就在遭到冯·诺依曼贬低,嘲笑几天之后,他遇到盖尔,像说梦话似的告诉他自己已经将冯·诺依曼的“最小最大原理找到了普遍化的方法和均衡点。纳什这个初出茅庐的小子,根本不知道竞争的险恶,从没想到学术欺骗的后果。结果还是戴维·盖尔充当了他的“经纪人”,起草致科学院的短信,系主任列夫谢茨则利用方便的人脉关系亲自将文稿递交给科学院。纳什写的文章不多,他辩解说:少了才是精品。中国国内提一个教授,要求在“核心的刊物”上发表多少篇文章。按照这个标准可能纳什还不一定够资格。 1996年诺贝尔经济学奖得主莫尔里斯当牛津大学艾奇沃思经济学讲座教授时也没有发表过什么文章,特殊的人才,必须有特殊的选拔办法。Nash平衡是指博弈中这样的局面,对于每个参与者来说,只要其他人不改变策略,他就无法改善自己的状况。Nash在证明了在每个参与者都只有有限种策略选择、并允许混合策略的前提下,Nash平衡一定存在。以两家公司的价格大战为例,Nash平衡意味着两败俱伤的可能:在对方不改变价格的条件下,既不能提价,否则会进一步丧失市场;也不能降价,因为会出现赔本甩卖。于是两家公司可以改变原先的利益格局,通过谈判寻求新的利益评估分摊方案,也就是Nash平衡。类似的推理当然也可以用到选举,群体之间的利益冲突,潜在战争爆发前的僵局,议会中的法案争执等。编辑本段分类 纳什均衡可以分成两类:“纯战略纳什均衡”和“混合战略纳什均衡”。要说明纯战略纳什均衡和混合战略纳什均衡,要先说明纯战略和混合战略。所谓纯战略是提供给玩家要如何进行赛局的一个完整的定义。特别地是,纯战略决定在任何一种情况下要做的移动。战略集合是由玩家能够施行的纯战略所组成的集合。而混合战略是对每个纯战略分配一个机率而形成的战略。混合战略允许玩家随机选择一个纯战略。混合战略博弈均衡中要用概率计算,因为每一种策略都是随机的,达到某一概率时,可以实现支付最优。因为机率是连续的,所以即使战略集合是有限的,也会有无限多个混合战略。当然,严格来说,每个纯战略都是一个“退化”的混合战略,某一特定纯战略的机率为 1,其他的则为 0。故“纯战略纳什均衡”,即参与之中的所有玩家都玩纯战略;而相应的“混合战略纳什均衡”,之中至少有一位玩家玩混合战略。并不是每个赛局都会有纯战略纳什均衡,例如“钱币问题"就只有混合战略纳什均衡,而没有纯战略纳什均衡。不过,还是有许多赛局有纯战略纳什均衡(如协调赛局,囚徒困境和猎鹿赛局)。甚至,有些赛局能同时有纯战略和混合战略均衡。编辑本段经典案例囚徒困境 (1950年,数学家塔克任斯坦福大学客座教授,在给一些心理学家作讲演时,讲到两个囚犯的故事。)假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证 纳什均衡据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。囚徒困境博弈A╲B 坦白 抵赖 坦白 -8,-8 0,-10 抵赖 -10,0 -1,-1 关于案例,显然最好的策略是双方都抵赖,结果是大家都只被判1年。但是由于两人处于隔离的情况,首先应该是从心理学的角度来看,当事双方都会怀疑对方会出卖自己以求自保、其次才是亚当·斯密的理论,假设每个人都是“理性的经济人”,都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程:假如他坦白,如果我抵赖,得坐10年监狱,如果我坦白最多才8年;假如他要是抵赖,如果我也抵赖,我就会被判一年,如果我坦白就可以被释放,而他会坐10年牢。综合以上几种情况考虑,不管他坦白与否,对我而言都是坦白了划算。两个人都会动这样的脑筋,最终,两个人都选择了坦白,结果都被判8年刑期。基于经济学中Rational agent的前提假设,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被释放就不会出现。这样两人都选择坦白的策略以及因此被判8年的结局,纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战:按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。但是我们可以从“纳什均衡”中引出“看不见的手”原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。硬币正反 你正在图书馆枯坐,一位陌生美女主动过来和你搭讪,并要求和你一起玩个数学游戏。美女提议:“让我们各自亮出硬币的一面,或正或反。如果我们都是正面,那么我给你3元,如果我们都是反面,我给你1元,剩下的情况你给我2元就可以了。”那么该不该和这位姑娘玩这个游戏呢?这基本是废话,当然该。问题是,这个游戏公平吗?每一种游戏依具其规则的不同会存在两种纳什均衡,一种是纯策略纳什均衡,也就是说玩家都能够采取固定的策略(比如一直出正面或者一直出反面),使得每人都赚得最多或亏得最少;或者是混合策略纳什均衡,而在这个游戏中,便应该采用混合策略纳什均衡。nm 美女出正面 美女出反面 你出正面 +3,-3 -2,+2 你出反面 -2,+2 +1,-1 假设我们出正面的概率是x,反面的概率是1-x,美女出正面的概率是y,反面的概率是1-y。为了使利益最大化,应该在对手出正面或反面的时候我们的收益都相等,由此列出方程就是3x + (-2)*(1-x)=(-2) * x + 1*( 1-x )解方程得x=3/8。同样,美女的收益,列方程-3y + 2( 1-y)= 2y+ (-1) * ( 1-y)解得y也等于3/8,而美女每次的期望收益则是 2(1-y)- 3y = 1/8元。这告诉我们,在双方都采取最优策略的情况下,平均每次美女赢1/8元。其实只要美女采取了(3/8,5/8)这个方案,不论你再采用什么方案,都是不能改变局面的。如果全部出正面,每次的期望收益是 (3+3+3-2-2-2-2-2)/8=-1/8元;如果全部出反面,每次的期望收益也是(-2-2-2+1+1+1+1+1)/8=-1/8元。而任 何策略无非只是上面两种策略的线性组合,所以期望还是-1/8元。但是当你也采用最佳策略时,至少可以保证自己输得最少。否则,你肯定就会被美女采用的策略针对,从而赔掉更多。编辑本段重要影响 纳什均衡理论奠定了现代主流博弈理论和经济理论的根本基础,正如克瑞普斯(Kreps,1990)在《博弈论和经济建模》一书的引言中所说,“在过去的一二十年内,经济学在方法论以及语言、概念等方面,经历了一场温和的革命,非合作博弈理论已经成为范式的中心……在经济学或者与经济学原理相关的金融、会计、营销和政治科学等学科中,现在人们已经很难找到不懂纳什均衡能够‘消费"近期文献的领域。”纳什均衡的重要影响可以概括为以下六个方面1.改变了经济学的体系和结构。非合作博弈论的概念、内容、模型和分析工具等,均已渗透到微观经济学、宏观经济学、劳动经济学、国际经济学、环境经济学等经济学科的绝大部分学科领域,改变了这些学科领域的内容和结构,成为这些学科领域的基本研究范式和理论分析工具,从而改变了原有经济学理论体系中各分支学科的内涵。2.扩展了经济学研究经济问题的范围。原有经济学缺乏将不确定性因素、变动环境因素以及经济个体之间的交互作用模式化的有效办法,因而不能进行微观层次经济问题的解剖分析。纳什均衡及相关模型分析方法,包括扩展型博弈法、逆推归纳法、子博弈完美纳什均衡等概念方法,为经济学家们提供了深入的分析工具。3.加强了经济学研究的深度。纳什均衡理论不回避经济个体之间直接的交互作用,不满足于对经济个体之间复杂经济关系的简单化处理,分析问题时不只停留在宏观层面上而是深入分析表象背后深层次的原因和规律,强调从微观个体行为规律的角度发现问题的根源,因而可以更深刻准确地理解和解释经济问题。4.形成了基于经典博弈的研究范式体系。即可以将各种问题或经济关系,按照经典博弈的类型或特征进行分类,并根据相应的经典博弈的分析方法和模型进行研究,将一个领域所取得的经验方便地移植到另一个领域。5.扩大和加强了经济学与其他社会科学、自然科学的联系。纳什均衡之所以伟大,就因为它普通,而且普通到几乎无处不在。纳什均衡理论既适用于人类的行为规律,也适合于人类以外的其他生物的生存、运动和发展的规律。纳什均衡和博弈论的桥梁作用,使经济学与其他社会科学、自然科学的联系更加紧密,形成了经济学与其他学科相互促进的良性循环。6.改变了经济学的语言和表达方法。在进化博弈论方面相当有造诣的坎多利(Kandori,1997)对保罗·萨缪尔森(Paul Samuelson)的名言“你甚至可以使一只鹦鹉变成一个训练有素的经济学家,因为它必须学习的只有两个词,那就是‘供给"和‘需求"”,曾做过一个幽默的引申,他说,“现在这只鹦鹉需要再学两个词,那就是‘纳什均衡"”。2023-07-06 22:12:415
什么是纳什均衡法则?
阿蒋和小姬是一对正泡在蜜月中的小两口,周六到了,安排什么节目好呢?周六晚上,中国足球队要在世界杯小组赛中和巴西队比赛。阿蒋天生就是个超级球迷,国内的甲级联赛他从不肯放过,何况是国家队和心目中的偶像巴西队的比赛?无巧不成书,也正好是这个周六的晚上,俄罗斯一个著名芭蕾舞剧团莅临该市演出芭蕾舞剧《胡桃夹子》。而小姬非常喜欢钢琴、芭蕾这样的高雅艺术,对俄罗斯的歌剧和芭蕾更是崇拜得五体投地,她怎么肯放过正宗俄罗斯的芭蕾舞剧呢?怎么办?其实这事也不难解决:一个在自己家里看电视转播的足球赛,一个去剧院看芭蕾舞演出。但是,问题在于他们是热恋中的情侣,分开度过难得的周六,是他们最不乐意的事情。这样一来,他们真是面临了一场“博弈”。我们不妨这样给阿蒋和小姬的“满意程度”赋值:如果阿蒋看球,让小姬一个人去看芭蕾,双方的满意度都为0;若是两个人一起去看足球,阿蒋的满意度为2,小姬的满意度1;两个人一起去看芭蕾,阿蒋的满意程度为1;小姬的满意程度为2;应该不会有小姬独自看球而阿蒋独自去看芭蕾的可能,不过,人们还是把这写出来,设想双方的满意程度都是-1。在这个博弈中,双方之间不存在“囚徒困境”中那样的最佳策略,但是他们总会做出一个较好的选择,因他们是蜜月中的夫妻。因此面对的是一种策略优势不那么明显的博弈,而这种博弈的结局,恰恰是纳什均衡研究的对象。策略优势不明显,指的是双方都没有“不论对方采取什么策略,我采取这个策略总比采取任何别的策略更好”的严格优势策略,因此,他们只需寻找一种双方“相对优势策略”的组合。双方都去看足球,或者双方都去看芭蕾。就是我们所说的相对优势策略的组合,一旦处于这样的位置,双方都不想单独改变策略,因为单独改变没有好处。比方说两人一起看足球,阿蒋得2,小姬得1。如果阿蒋改变主意单独去看足球,变成双方都得0,没有好处;如果小姬改变主意单独去看芭蕾,也变成双方都是0,也没有好处,所以两人一起去看足球是稳定的结局。同样,两人去看芭蕾也是稳定的结局。这种稳定的结局就是“纳什均衡”,在情侣博弈中,双方都去看足球,或者双方都去看芭蕾,是博弈的两个纳什均衡。形象地说,纳什均衡实际上就是一种“僵局”,给定别人不改变策略的情况下,没有人有兴趣单独改变策略,而且,这种单独改变不会给他们带来好处。在这种博弈中,如果一方知道了对方的策略以后,就可以做出对自己最有利的选择。因此,保证策略的随机性是十分必要的。这个概念是由普林斯顿大学数学家约翰·纳什于1950年建立的。由于对博弈论做出奠基性的贡献,他在1984年荣获诺贝尔经济学奖。如果用科学的语言来描述纳什均衡,指的是在一策略组合中,所有的参与者面临这样的一种情况:当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略,他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。听起来很拗口,而且难以理解,但却是不折不扣的科学,而且备受经济学家们的青睐。诺贝尔经济学奖获得者萨缪尔森有一句幽默的话:你可以将一只鹦鹉训练成经济学家,因为它所需要学习的只有两个词:供给与需求。博弈论专家坎多瑞引申说:要成为现代经济学家,这只鹦鹉必须再多学一个词,这个词就是“纳什均衡”。由此可见纳什均衡在现代经济学中的重要性。某个小镇上只有一名警察,他要负责整个镇的治安。现在我们假定,小镇的一头有一家酒馆,另一头有一家银行。再假定该地有一个小偷,要实施偷盗。因为分身乏术,警察一次只能在一个地方巡逻;而小偷也只能去一个地方。假定银行需要保护的财产价格为2万元,酒馆的财产价格为1万元。若警察在某地进行巡逻,而小偷也选择了去该地,就会被警察抓住;若警察没有巡逻的地方而小偷去了,则小偷偷盗成功。那么,警察怎么巡逻才能使效果最好?一个明显可取的做法是,警察权衡轻重,只对银行进行巡逻。这样,警察可以保住2万元的财产不被偷窃。可是如此,假如小偷去了酒馆,偷窃一定成功。这种做法是警察的最好做法吗?有没有对这种策略改进的措施?在纳什均衡被发现之前,也许没有别的答案。但是纳什均衡为我们开辟一个观察问题的新视角。对于这个例子,虽然没有纯策略纳什均衡点,也就是参与者在他的策略空间中选取唯一确定的策略。但是却存在混合策略均衡点,在这个混合策略均衡点下,参与者的策略选择是他们的最优(混合)策略选择。这样,对于警察的一个最好的做法是,警察抽签决定去银行还是酒馆。因为银行的价值是酒馆的两倍,所以用两个签代表银行,比如抽到1、2号签去银行,抽到3号签去酒馆。这样警察有2/3的机会去银行进行巡逻,1/3的机会去酒馆。而小偷的最优选择是:以同样抽签的办法决定去银行还是去酒馆偷盗,只是抽到1、2号签去酒馆,抽到3号签去银行,那么,小偷有1/3的机会去银行,2/3的机会去酒馆。而且,他们的策略都应当是随机的,不能让对方知道自己的策略,哪怕是“倾向性”的策略。如果一方知道对方其中一个策略的“可能性”大,那么就能做出对自己最有利的决定,赢的可能性就会大。就单次情侣博弈而言,存在着两个“纳什均衡”:或者一起看球,或者一起看芭蕾。但是,最后结局究竟落实到哪一种情形,却是博弈论本身尚未解决的问题。我们可以根据经验来分析,在更多情况下,结果还会体现先动优势,虽然双方都会得好处,但是先行动的一方得益多一些。我国古代已有“先下手为强”的说法。大量例子说明,在有多个“纳什均衡”的情况下,常常是先动手的一方会占一些优势。在这里,由于决策或行动有了先后次序,所以叫做“动态博弈”。比方说。两人还没商量,小姬就打电话告诉阿蒋:我已经买了票,周六一起去看芭蕾,好吗?况且他们是恋人,小姬已经开口说了,阿蒋还会驳她的面子吗?如果我们觉得没经过商量就先买了票有点过分,那么就可以把情况改为小姬打电话给阿蒋,建议一起去看芭蕾,得到同意才去买票。我们可以设想,阿蒋接到小姬的电话,也不会驳她的面子。而使双方最终得到满意的结局。2023-07-06 22:13:021
一个静态博弈中,纯策略纳什均衡一定存在对吗
纳什均衡就是一种静态均衡啊,静态博弈指的是所有博弈方同时或可看做同时选择策略的博弈。动态博弈指得是有先后次序的选择且后选择的一方可以看到之前博弈方选择的结果,比如下棋。2023-07-06 22:13:102
管理经济学两家竞争企业a b,请问该博弈的纳什均衡策略是什么
纳什均衡可以分成两类:“纯战略纳什均衡”和“混合战略纳什均衡”。 要说明纯战略纳什均衡和混合战略纳什均衡,要先说明纯战略和混合战略。 所谓纯战略是提供给玩家要如何进行赛局的一个完整的定义。特别地是,纯战略决定在任何一种情况下要做的移动。战略集合是由玩家能够施行的纯战略所组成的集合。而混合战略是对每个纯战略分配一个机率而形成的战略。混合战略允许玩家随机选择一个纯战略。混合战略博弈均衡中要用概率计算,因为每一种策略都是随机的,达到某一概率时,可以实现支付最优。因为机率是连续的,所以即使战略集合是有限的,也会有无限多个混合战略。 当然,严格来说,每个纯战略都是一个“退化”的混合战略,某一特定纯战略的机率为 1,其他的则为 0。 故“纯战略纳什均衡”,即参与之中的所有玩家都玩纯战略;而相应的“混合战略纳什均衡”,之中至少有一位玩家玩混合战略。并不是每个赛局都会有纯战略纳什均衡,例如“钱币问题"就只有混合战略纳什均衡,而没有纯战略纳什均衡。不过,还是有许多赛局有纯战略纳什均衡(如协调赛局,囚徒困境和猎鹿赛局)。甚至,有些赛局能同时有纯战略和混合战略均衡。2023-07-06 22:13:201
博弈论矩阵 纯策略和混合策略
现在两个人博弈,B仔选列,A仔选行。 B仔会得到前一个收益,例如B仔选象棋A仔选电影,那B仔获得收益3,A仔获得收益2。 纯策略的意思就是在完全信息博弈——也就是A仔和B仔知道所有可能获得收益的情况下,A仔做出决定”我就选择象棋",这样如果B仔选了电影,A仔就能获得最高收益3,但如果B仔选了象棋,他们哥俩就等零收益跪了。。 混合策略就是指B仔不会明确地自己作出决定,而是以某种概率做出选择,比如抛硬币,抛出mao爷爷就选象棋,否则选电影;因为博弈论最初的假设就是人会倾向于更大的收益做出确定的选择,混合策略则随机化了人们的决定,一般会用在一些情况更复杂的博弈里。。 说实在的楼主,不知道你要问什么,而且博弈论我也不大懂,只是对你的问题很感兴趣,咱可以讨论讨论。。。。2023-07-06 22:13:302
设某个纯策略博弈的纳什均衡是有限的一试问:相应的混合策略博弈的纳什均衡会是无限的吗?试举一例说明:
【答案】:会存在,如表10-8所示。2023-07-06 22:13:371
为什么纳什均衡不一定是占优策略?
简单来说,占优策略是不管对方有什么策略,"我"都有唯一最优的策略,不会随着情况不同改变。而纳什均衡则是,根据对方的选择来决定自己的最优策略,会根据情况而变。所以,占优策略均衡一定是纳什均衡,而纳什均衡却不一定是占优策略均衡。扩展资料:案例硬币正反你正在图书馆枯坐,一位陌生美女主动过来和你搭讪,并要求和你一起玩个数学游戏。美女提议:“让我们各自亮出硬币的一面,或正或反。如果我们都是正面,那么我给你3元,如果我们都是反面,我给你1元,剩下的情况你给我2元就可以了。”那么该不该和这位姑娘玩这个游戏呢?这基本是废话,当然该。问题是,这个游戏公平吗?每一种游戏依具其规则的不同会存在两种纳什平衡,一种是纯策略纳什平衡,也就是说玩家都能够采取固定的策略(比如一直出正面或者一直出反面),使得每人都赚得最多或亏得最少;或者是混合策略纳什平衡,而在这个游戏中,便应该采用混合策略纳什平衡。参考资料来源:百度百科-纳什均衡2023-07-06 22:13:522
什么是纳什均衡?
纳什均衡又称非合作博弈均衡,是博弈论中的一个重要术语,以约翰·纳什的名字命名。在博弈过程中,无论对方的战略选择是什么,一方都会选择一定的战略,这就叫主导战略。如果两个博弈者的战略组合构成各自的主导战略,则该组合被定义为纳什均衡。当每个球员的平衡策略是达到其预期收益的最大值时,一个策略组合被称为纳什均衡,同时,所有其他球员遵循这一策略。扩展资料;纳什均衡可分为两类:纯战略纳什均衡和混合战略纳什均衡。要解释纯策略纳什均衡和混合策略纳什均衡,首先要解释纯策略和混合策略。所谓纯策略,就是为玩家提供一个完整的游戏定义。特别是,纯粹的策略决定了在任何情况下都要进行的运动,策略集合是玩家可以执行的纯策略集合。混合策略是通过给每一个纯策略分配一个概率而形成的策略,混合策略允许玩家随机选择纯策略,在混合策略博弈的均衡中,由于每个策略都是随机的,当达到一定的概率时,就可以得到最优支付。由于概率是连续的,即使策略集是有限的,也会有无限的混合策略。当然,严格地说,每个纯策略都是一个“退化”混合策略,一个特定纯策略的概率为1,另一个为0。因此,“纯战略纳什均衡”是指所有参与者都玩纯战略,而相应的“混合战略纳什均衡”则是指至少有一个参与者玩混合战略。并不是每一个博弈都会有纯战略纳什均衡,比如“硬币问题”只有混合战略纳什均衡,而不是纯战略纳什均衡。然而,仍有许多博弈具有纯战略纳什均衡(如协调博弈、囚徒困境博弈和鹿博弈)。甚至,有些游戏可以同时拥有纯策略和混合策略平衡。参考资料来源;百度百科——纳什平衡2023-07-06 22:14:171
什么是纳什均衡?
纳什均衡又称非合作博弈均衡,是博弈论中的一个重要术语,以约翰·纳什的名字命名。在博弈过程中,无论对方的战略选择是什么,一方都会选择一定的战略,这就叫主导战略。如果两个博弈者的战略组合构成各自的主导战略,则该组合被定义为纳什均衡。当每个球员的平衡策略是达到其预期收益的最大值时,一个策略组合被称为纳什均衡,同时,所有其他球员遵循这一策略。扩展资料;纳什均衡可分为两类:纯战略纳什均衡和混合战略纳什均衡。要解释纯策略纳什均衡和混合策略纳什均衡,首先要解释纯策略和混合策略。所谓纯策略,就是为玩家提供一个完整的游戏定义。特别是,纯粹的策略决定了在任何情况下都要进行的运动,策略集合是玩家可以执行的纯策略集合。混合策略是通过给每一个纯策略分配一个概率而形成的策略,混合策略允许玩家随机选择纯策略,在混合策略博弈的均衡中,由于每个策略都是随机的,当达到一定的概率时,就可以得到最优支付。由于概率是连续的,即使策略集是有限的,也会有无限的混合策略。当然,严格地说,每个纯策略都是一个“退化”混合策略,一个特定纯策略的概率为1,另一个为0。因此,“纯战略纳什均衡”是指所有参与者都玩纯战略,而相应的“混合战略纳什均衡”则是指至少有一个参与者玩混合战略。并不是每一个博弈都会有纯战略纳什均衡,比如“硬币问题”只有混合战略纳什均衡,而不是纯战略纳什均衡。然而,仍有许多博弈具有纯战略纳什均衡(如协调博弈、囚徒困境博弈和鹿博弈)。甚至,有些游戏可以同时拥有纯策略和混合策略平衡。参考资料来源;百度百科——纳什平衡2023-07-06 22:14:311
什么是纳什均衡,有何作用?
纳什均衡又称非合作博弈均衡,是博弈论中的一个重要术语,以约翰·纳什的名字命名。在博弈过程中,无论对方的战略选择是什么,一方都会选择一定的战略,这就叫主导战略。如果两个博弈者的战略组合构成各自的主导战略,则该组合被定义为纳什均衡。当每个球员的平衡策略是达到其预期收益的最大值时,一个策略组合被称为纳什均衡,同时,所有其他球员遵循这一策略。扩展资料;纳什均衡可分为两类:纯战略纳什均衡和混合战略纳什均衡。要解释纯策略纳什均衡和混合策略纳什均衡,首先要解释纯策略和混合策略。所谓纯策略,就是为玩家提供一个完整的游戏定义。特别是,纯粹的策略决定了在任何情况下都要进行的运动,策略集合是玩家可以执行的纯策略集合。混合策略是通过给每一个纯策略分配一个概率而形成的策略,混合策略允许玩家随机选择纯策略,在混合策略博弈的均衡中,由于每个策略都是随机的,当达到一定的概率时,就可以得到最优支付。由于概率是连续的,即使策略集是有限的,也会有无限的混合策略。当然,严格地说,每个纯策略都是一个“退化”混合策略,一个特定纯策略的概率为1,另一个为0。因此,“纯战略纳什均衡”是指所有参与者都玩纯战略,而相应的“混合战略纳什均衡”则是指至少有一个参与者玩混合战略。并不是每一个博弈都会有纯战略纳什均衡,比如“硬币问题”只有混合战略纳什均衡,而不是纯战略纳什均衡。然而,仍有许多博弈具有纯战略纳什均衡(如协调博弈、囚徒困境博弈和鹿博弈)。甚至,有些游戏可以同时拥有纯策略和混合策略平衡。参考资料来源;百度百科——纳什平衡2023-07-06 22:14:441
什么是纳什均衡理论?
算来算去算自己。★ 穷尽算计,自私自利,傲慢自我,只能导致自他个体和整体都受害。★ 照见空性,放下自我,用心利他,则会导致自他个体和整体都受益。★ 自他一切生命体,内心都是趋利避害的核心诉求。★ 纳什均衡理论是在说起心动念与命运的因果关系。★ 善恶必报,报通三世。这是真理,不是鸡汤,不是伦理,不是工具,不是阴谋。★ 诸恶莫作,众善奉行,自净其意,是诸佛教。2023-07-06 22:15:022
怎么求纯策略纳什均衡和混合纳什策略?
纯战略纳什均衡最简单的方法是划线法,先固定一个然后另一收益大就在下面划线,再固定另一个收益对另外一个量划线,最后两个都有线的就是纯战略纳什均衡,混合战略纳什均衡要计算,但是一个有限博弈的纯战略纳什均衡和混合战略纳什均衡个数之和一定是奇数,如果你求出的纯战略纳什均衡有偶数个,那么一定有另外一个混合战略纳什均衡。混合策略纳什均衡:在n个参与人的博弈G={S1,...Sn;u1,...un}中,混合策略组合构成一个纳什均衡,如果对于所有的i=1,2...,n下式成立:也就是说,如果一个策略组合使任何一个参与人的策略都是相对于其他参与人的策略的最佳策略,这个策略就构成一个纳什均衡,不管这个策略是混合策略还是纯策略。混合策略纳什均衡是面对其他博弈者选择的不确定性的一个理性对策,其主要特征是作为混合策略一部分的每一个纯策略有相同的期望值,否则,一个博弈者会选择那个期望值最高的策略而排除所有其他策略,这意味着原初的状态不是一个均衡。2023-07-06 22:15:512
怎么求纯策略纳什均衡和混合纳什策略
纯战略纳什均衡最简单的方法是划线法,先固定一个然后另一收益大就在下面划线,再固定另一个收益对另外一个量划线,最后两个都有线的就是纯战略纳什均衡,混合战略纳什均衡要计算,但是一个有限博弈的纯战略纳什均衡和混合战略纳什均衡个数之和一定是奇数,如果你求出的纯战略纳什均衡有偶数个,那么一定有另外一个混合战略纳什均衡。混合策略纳什均衡:在n个参与人的博弈G={S1,...Sn;u1,...un}中,混合策略组合构成一个纳什均衡,如果对于所有的i=1,2...,n下式成立:也就是说,如果一个策略组合使任何一个参与人的策略都是相对于其他参与人的策略的最佳策略,这个策略就构成一个纳什均衡,不管这个策略是混合策略还是纯策略。混合策略纳什均衡是面对其他博弈者选择的不确定性的一个理性对策,其主要特征是作为混合策略一部分的每一个纯策略有相同的期望值,否则,一个博弈者会选择那个期望值最高的策略而排除所有其他策略,这意味着原初的状态不是一个均衡。2023-07-06 22:16:042
怎么求纯策略纳什均衡和混合纳什策略
纯战略纳什均衡最简单的方法是划线法,先固定一个然后另一收益大就在下面划线,再固定另一个收益对另外一个量划线,最后两个都有线的就是纯战略纳什均衡,混合战略纳什均衡要计算,但是一个有限博弈的纯战略纳什均衡和混合战略纳什均衡个数之和一定是奇数,如果你求出的纯战略纳什均衡有偶数个,那么一定有另外一个混合战略纳什均衡。混合策略纳什均衡:在n个参与人的博弈G={S1,...Sn;u1,...un}中,混合策略组合构成一个纳什均衡,如果对于所有的i=1,2...,n下式成立:也就是说,如果一个策略组合使任何一个参与人的策略都是相对于其他参与人的策略的最佳策略,这个策略就构成一个纳什均衡,不管这个策略是混合策略还是纯策略。混合策略纳什均衡是面对其他博弈者选择的不确定性的一个理性对策,其主要特征是作为混合策略一部分的每一个纯策略有相同的期望值,否则,一个博弈者会选择那个期望值最高的策略而排除所有其他策略,这意味着原初的状态不是一个均衡。2023-07-06 22:16:163
什么是纳什均衡?
纳什均衡也就是纳什平衡(Nash equilibrium),又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什平衡。一个策略组合被称为纳什平衡,当每个博弈者的平衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。扩展资料:纳什均衡的由来:纳什平衡可以分成两类:“纯战略纳什平衡”和“混合战略纳什平衡”。要说明纯战略纳什平衡和混合战略纳什平衡,要先说明纯战略和混合战略。所谓纯战略是提供给玩家要如何进行赛局的一个完整的定义。特别地是,纯战略决定在任何一种情况下要做的移动。战略集合是由玩家能够施行的纯战略所组成的集合。而混合战略是对每个纯战略分配一个机率而形成的战略。混合战略允许玩家随机选择一个纯战略。混合战略博弈均衡中要用概率计算,因为每一种策略都是随机的,达到某一概率时,可以实现支付最优。因为机率是连续的,所以即使战略集合是有限的,也会有无限多个混合战略。当然,严格来说,每个纯战略都是一个“退化”的混合战略,某一特定纯战略的机率为1,其他的则为0。故“纯战略纳什平衡”,即参与之中的所有玩家都玩纯战略;而相应的“混合战略纳什平衡”,之中至少有一位玩家玩混合战略。并不是每个赛局都会有纯战略纳什平衡,例如“钱币问题"就只有混合战略纳什平衡,而没有纯战略纳什平衡。不过,还是有许多赛局有纯战略纳什平衡(如协调赛局,囚徒困境和猎鹿赛局)。甚至,有些赛局能同时有纯战略和混合战略平衡。参考资料来源:百度百科-纳什平衡2023-07-06 22:16:301
博弈论的纳什均衡
纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人仍采取b*,而局中人A却采取另一种策略a,那么局中人A的支付不会超过他采取原来的策略a*的支付。这一结果对局中人B亦是如此。这样,“均衡偶”的明确定义为:一对策略a*(属于策略集A)和策略b*(属于策略集B)称之为均衡偶,对任一策略a(属于策略集A)和策略b(属于策略集B),总有:偶对(a, b*) ≤ 偶对(a*,b*) ≥偶对(a*,b)。对于非零和博弈也有如下定义:一对策略a*(属于策略集A)和策略b*(属于策略集B)称为非零和博弈的均衡偶,对任一策略a(属于策略集A)和策略b(属于策略集B),总有:对局中人A的偶对(a, b*) ≤偶对(a*,b*);对局中人B的偶对(a*,b)≤偶对(a*,b*)。有了上述定义,就立即得到纳什定理:任何具有有限纯策略的二人博弈至少有一个均衡偶。这一均衡偶就称为纳什均衡点。纳什定理的严格证明要用到不动点理论,不动点理论是经济均衡研究的主要工具。通俗地说,寻找均衡点的存在性等价于找到博弈的不动点。 纳什均衡点概念提供了一种非常重要的分析手段,使博弈论研究可以在一个博弈结构里寻找比较有意义的结果。但纳什均衡点定义只局限于任何局中人不想单方面变换策略,而忽视了其他局中人改变策略的可能性,因此,在很多情况下,纳什均衡点的结论缺乏说服力,研究者们形象地称之为“天真可爱的纳什均衡点”。塞尔顿(R·Selten)在多个均衡中剔除一些按照一定规则不合理的均衡点,从而形成了两个均衡的精炼概念:子博弈完全均衡和颤抖的手完美均衡。 囚徒困境在博弈论中,含有占优战略均衡的一个著名例子是由塔克给出的“囚徒困境”(prisoner"s dilemma)博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果两个犯罪嫌疑人都坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪,各被判刑8年;如果只有一个犯罪嫌疑人坦白,另一个人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。下表给出了这个博弈的支付矩阵。 囚徒困境博弈 [Prisoner"s dilemma]A╲B 坦白 抵赖 坦白 8,8 0,10 抵赖 10,0 1,1 对A来说,尽管他不知道B作何选择,但他知道无论B选择什么,他选择“坦白”总是最优的。显然,根据对称性,B也会选择“坦白”,结果是两人都被判刑8年。但是,倘若他们都选择“抵赖”,每人只被判刑1年。在表2.2中的四种行动选择组合中,(抵赖、抵赖)是帕累托最优,因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。但是,“坦白”是任一犯罪嫌疑人的占优战略,而(坦白,坦白)是一个占优战略均衡,即纳什均衡。不难看出,此处纳什均衡与帕累托存在冲突。单从数学角度讲,这个理论是合理的,也就是选择都坦白。但在这样多维信息共同作用的社会学领域显然是不合适的。正如中国古代将官员之间的行贿受贿称为“陋规”而不是想方设法清查,这是因为社会体系给人行为的束缚作用迫使人的策发生改变。比如,从心理学角度讲,选择坦白的成本会更大,一方坦白害得另一方加罪,那么事后的报复行为以及从而不会轻易在周围知情人当中的“出卖”角色将会使他损失更多。而8年到10年间的增加比例会被淡化,人的尊严会使人产生复仇情绪,略打破“行规”。我们正处于大数据时代,向更接近事实的处理一件事就要尽可能多地掌握相关资料并合理加权分析,人的活动动影像动因复杂,所以囚徒困境只能作为简化模型参考,具体决策还得具体分析。 智猪博弈 一、经济学中的“智猪博弈”(Pigs"payoffs) 这个例子讲的是:假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽(两猪均在食槽端),另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是在去往食槽的路上会有两个单位猪食的体能消耗,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时行动(去按按钮),收益比是7∶3;小猪先到槽边,收益比是6∶4。那么,在两头猪都有智慧的前提下,最终结果是小猪选择等待。智猪博弈由纳什于1950年提出。实际上小猪选择等待,让大猪去按控制按钮,而自己选择“坐船”(或称为搭便车)的原因很简单:在大猪选择行动的前提下,小猪选择等待的话,小猪可得到4个单位的纯收益,而小猪行动的话,则仅仅可以获得大猪吃剩的1个单位的纯收益,所以等待优于行动;在大猪选择等待的前提下,小猪如果行动的话,小猪的收入将不抵成本,纯收益为-1单位,如果小猪也选择等待的话,那么小猪的收益为零,成本也为零,总之,等待还是要优于行动。用博弈论中的报酬矩阵可以更清晰的刻画出小猪的选择: 小猪 行动 等待 大猪 行动 5,1 4,4 等待 9,-1 0,0 从矩阵中可以看出,当大猪选择行动的时候,小猪如果行动,其收益是1,而小猪等待的话,收益是4,所以小猪选择等待;当大猪选择等待的时候,小猪如果行动的话,其收益是-1,而小猪等待的话,收益是0,所以小猪也选择等待。综合来看,无论大猪是选择行动还是等待,小猪的选择都将是等待,即等待是小猪的占优策略。在小企业经营中,学会如何“搭便车”是一个精明的职业经理人最为基本的素质。在某些时候,如果能够注意等待,让其他大的企业首先开发市场,是一种明智的选择。这时候有所不为才能有所为!高明的管理者善于利用各种有利的条件来为自己服务。“搭便车”实际上是提供给职业经理人面对每一项花费的另一种选择,对它的留意和研究可以给企业节省很多不必要的费用,从而使企业的管理和发展走上一个新的台阶。这种现象在经济生活中十分常见,却很少为小企业的经理人所熟识。在智猪博弈中,虽然小猪的“捡现成”的行为从道义上来讲令人不齿,但是博弈策略的主要目的不正是使用谋略最大化自己的利益吗? 美女的硬币 一位陌生美女主动过来和你搭讪,并要求和你一起玩个游戏。美女提议:“让我们各自亮出硬币的一面,或正或反。如果我们都是正面,那么我给你3元,如果我们都是反面,我给你1元,剩下的情况你给我2元就可以了。”听起来不错的提议。如果我是男性,无论如何我是要玩的,不过经济学考虑就是另外一回事了,这个游戏真的够公平吗? 绅士/美女 女正面 女反面 正面 3,-3 -2,+2 反面 -2,+2 1,-1 假设我们出正面的概率是x,反面的概率是1-x。为了使利益最大化,应该在对手出正面或反面的时候我们的收益都相等,不然对手总是可以改变正反面出现的概率让我们的总收入减少,由此列出方程就是3x+(-2)*(1-x)=(-2)*x+1*(1-x)这个方程通俗的说就是在对手一直出正面你得到的利益,和你对手一直出反面得到利益是一样的且最大。解方程得x=3/8,也就是说平均每八次出示3次正面,5次反面是我们的最优策略。而将x=3/8代入到收益表达式3*x+(-2)*(1-x)中就可得到每次的期望收入,计算结果是-1/8元。同样,设美女出正面的概率是y,反面的概率是1-y,列方程-3y+2(1-y)=2y+(-1)*(1-y)解得y也等于3/8,而美女每次的期望收益则是2(1-y)-3y=1/8元。这告诉我们,在双方都采取最优策略的情况下,平均每次美女赢1/8元。其实只要美女采取了(3/8,5/8)这个方案,不论你再采用什么方案,都是不能改变局面的。如果全部出正面,每次的期望收益是(3+3+3-2-2-2-2-2)/8=-1/8元如果全部出反面,每次的期望收益也是(-2-2-2+1+1+1+1+1)/8=-1/8元。而任何策略无非只是上面两种策略的线性组合,所以期望还是-1/8元。但是当你也采用最佳策略时,至少可以保证自己输得最少。否则,你肯定就会被美女采用的策略针对,从而赔掉更多。看起来这个博弈模型似乎没有什么用处,但是其实这可能牵涉了金融市场定价中最重要的一个模型:定价权重模型了。总的来说“博弈论”其本质是将日常生活中的竞争矛盾以游戏的形式表现出来,并使用数学和逻辑学的方法来分析事物的运作规律。既然有游戏的参与者那么也必然存在游戏规则的制定者。深入的了解竞争行为的本质,有助于我们分析和掌握竞争中事物之间的关系,更方便我们对规则进行制定和调整,使其最终按照我们所预期的目的进行运作。2023-07-06 22:16:431
纳什均衡是什么?
纳什均衡也就是纳什平衡(Nash equilibrium),又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什平衡。一个策略组合被称为纳什平衡,当每个博弈者的平衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。扩展资料:纳什均衡的由来:纳什平衡可以分成两类:“纯战略纳什平衡”和“混合战略纳什平衡”。要说明纯战略纳什平衡和混合战略纳什平衡,要先说明纯战略和混合战略。所谓纯战略是提供给玩家要如何进行赛局的一个完整的定义。特别地是,纯战略决定在任何一种情况下要做的移动。战略集合是由玩家能够施行的纯战略所组成的集合。而混合战略是对每个纯战略分配一个机率而形成的战略。混合战略允许玩家随机选择一个纯战略。混合战略博弈均衡中要用概率计算,因为每一种策略都是随机的,达到某一概率时,可以实现支付最优。因为机率是连续的,所以即使战略集合是有限的,也会有无限多个混合战略。当然,严格来说,每个纯战略都是一个“退化”的混合战略,某一特定纯战略的机率为1,其他的则为0。故“纯战略纳什平衡”,即参与之中的所有玩家都玩纯战略;而相应的“混合战略纳什平衡”,之中至少有一位玩家玩混合战略。并不是每个赛局都会有纯战略纳什平衡,例如“钱币问题"就只有混合战略纳什平衡,而没有纯战略纳什平衡。不过,还是有许多赛局有纯战略纳什平衡(如协调赛局,囚徒困境和猎鹿赛局)。甚至,有些赛局能同时有纯战略和混合战略平衡。参考资料来源:百度百科-纳什平衡2023-07-06 22:16:571
什么是纳什均衡
纳什平衡,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什平衡。一个策略组合被称为纳什平衡,当每个博弈者的平衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。2023-07-06 22:17:231
什么是纳什均衡?
纳什均衡也就是纳什平衡(Nash equilibrium),又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什平衡。一个策略组合被称为纳什平衡,当每个博弈者的平衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。扩展资料:纳什均衡的由来:纳什平衡可以分成两类:“纯战略纳什平衡”和“混合战略纳什平衡”。要说明纯战略纳什平衡和混合战略纳什平衡,要先说明纯战略和混合战略。所谓纯战略是提供给玩家要如何进行赛局的一个完整的定义。特别地是,纯战略决定在任何一种情况下要做的移动。战略集合是由玩家能够施行的纯战略所组成的集合。而混合战略是对每个纯战略分配一个机率而形成的战略。混合战略允许玩家随机选择一个纯战略。混合战略博弈均衡中要用概率计算,因为每一种策略都是随机的,达到某一概率时,可以实现支付最优。因为机率是连续的,所以即使战略集合是有限的,也会有无限多个混合战略。当然,严格来说,每个纯战略都是一个“退化”的混合战略,某一特定纯战略的机率为1,其他的则为0。故“纯战略纳什平衡”,即参与之中的所有玩家都玩纯战略;而相应的“混合战略纳什平衡”,之中至少有一位玩家玩混合战略。并不是每个赛局都会有纯战略纳什平衡,例如“钱币问题"就只有混合战略纳什平衡,而没有纯战略纳什平衡。不过,还是有许多赛局有纯战略纳什平衡(如协调赛局,囚徒困境和猎鹿赛局)。甚至,有些赛局能同时有纯战略和混合战略平衡。参考资料来源:百度百科-纳什平衡2023-07-06 22:17:381
什么是纳什均衡?
纳什均衡也就是纳什平衡(Nash equilibrium),又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什平衡。一个策略组合被称为纳什平衡,当每个博弈者的平衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。扩展资料:纳什均衡的由来:纳什平衡可以分成两类:“纯战略纳什平衡”和“混合战略纳什平衡”。要说明纯战略纳什平衡和混合战略纳什平衡,要先说明纯战略和混合战略。所谓纯战略是提供给玩家要如何进行赛局的一个完整的定义。特别地是,纯战略决定在任何一种情况下要做的移动。战略集合是由玩家能够施行的纯战略所组成的集合。而混合战略是对每个纯战略分配一个机率而形成的战略。混合战略允许玩家随机选择一个纯战略。混合战略博弈均衡中要用概率计算,因为每一种策略都是随机的,达到某一概率时,可以实现支付最优。因为机率是连续的,所以即使战略集合是有限的,也会有无限多个混合战略。当然,严格来说,每个纯战略都是一个“退化”的混合战略,某一特定纯战略的机率为1,其他的则为0。故“纯战略纳什平衡”,即参与之中的所有玩家都玩纯战略;而相应的“混合战略纳什平衡”,之中至少有一位玩家玩混合战略。并不是每个赛局都会有纯战略纳什平衡,例如“钱币问题"就只有混合战略纳什平衡,而没有纯战略纳什平衡。不过,还是有许多赛局有纯战略纳什平衡(如协调赛局,囚徒困境和猎鹿赛局)。甚至,有些赛局能同时有纯战略和混合战略平衡。参考资料来源:百度百科-纳什平衡2023-07-06 22:18:021
什么情况下会达成纳什均衡?
纳什均衡又称非合作博弈均衡,是博弈论中的一个重要术语,以约翰·纳什的名字命名。在博弈过程中,无论对方的战略选择是什么,一方都会选择一定的战略,这就叫主导战略。如果两个博弈者的战略组合构成各自的主导战略,则该组合被定义为纳什均衡。当每个球员的平衡策略是达到其预期收益的最大值时,一个策略组合被称为纳什均衡,同时,所有其他球员遵循这一策略。扩展资料;纳什均衡可分为两类:纯战略纳什均衡和混合战略纳什均衡。要解释纯策略纳什均衡和混合策略纳什均衡,首先要解释纯策略和混合策略。所谓纯策略,就是为玩家提供一个完整的游戏定义。特别是,纯粹的策略决定了在任何情况下都要进行的运动,策略集合是玩家可以执行的纯策略集合。混合策略是通过给每一个纯策略分配一个概率而形成的策略,混合策略允许玩家随机选择纯策略,在混合策略博弈的均衡中,由于每个策略都是随机的,当达到一定的概率时,就可以得到最优支付。由于概率是连续的,即使策略集是有限的,也会有无限的混合策略。当然,严格地说,每个纯策略都是一个“退化”混合策略,一个特定纯策略的概率为1,另一个为0。因此,“纯战略纳什均衡”是指所有参与者都玩纯战略,而相应的“混合战略纳什均衡”则是指至少有一个参与者玩混合战略。并不是每一个博弈都会有纯战略纳什均衡,比如“硬币问题”只有混合战略纳什均衡,而不是纯战略纳什均衡。然而,仍有许多博弈具有纯战略纳什均衡(如协调博弈、囚徒困境博弈和鹿博弈)。甚至,有些游戏可以同时拥有纯策略和混合策略平衡。参考资料来源;百度百科——纳什平衡2023-07-06 22:18:141
纳什均衡点怎么找
(1)如果是完全信息博弈 张三认为李四:左,中,右的策略概率设为p1,p2,1-p1-p2 张三上策略的期望收益为E1=12*p1+42*p2+42*(1-p1-p2) 同理 中:E2=24*p1+12*p2+60*(1-p1-p2) 下:E3=72*p1+36*p2+42*(1-p1-p2) 如果是完全信息博弈,则较优策略为三者相同,即E1=E2=E3 可解得p1=0.0370 p2=0.3700 1-p1-p2=0.5930 同理李四认为张三:上中下的策略概率为q1 q2 (1-q1-q2) 李四的左策略的期望收益为T1=83*q1+12*q2+47*(1-q1-q2) 中策略收益为T2=56*q1+42*q2+95*(1-q1-q2) 右策略的收益为T3=45*q1+76*q2+59*(1-q1-q2) 同理解得q1=0.6276 q2=0.0140 (1-q1-q2)=0.3584 综上所述 在完全信息博弈的情况下张三的混合策略的策略概率为上0.6276 中0.0140 下0.3584 李四的混合策略的策略概率为左0.0370 中0.3700 右0.5930 其中张三的期望收益为40.8900 李四的期望收益为50.4516 (2)如果是不完全信息无限重复博弈,开始时双方都是以0.333的自然混合概率预测,根据两者的信息背叛不同,回归结果也可不同,此题条件不足.但结果是会是纯策略,博弈次数则无法确定 作业2:纯策略纳什均衡的收益为(60,76)混合策略纳什均衡的收益为(40.8900,50.4516) 实际中应该是纯策略占优2023-07-06 22:18:271