纳什平衡(英语:Nash equilibrium),又称为非合作赛局平衡,是在非合作赛局(Non-cooperative game)状况下的一个概念解,在博弈论中有重要地位,以约翰·纳什命名。 如果某情况下无一参与者可以通过独自行动而增加收益,则此策略组合被称为纳什均衡点[1]。
[micxp_threadbk]
[micxp_title]
例子
学术争议和批评
相关链接
注
参考
外部链接
[/micxp_title]
[#]
其经典的例子就是囚徒困境。囚徒困境是一个非零和博弈。大意是:一个案子的两个嫌疑犯被分开审讯,警官分别告诉两个囚犯,如果你招供,而对方不招供,则你将被立即释放,而对方将被判刑十年;如果两人均招供,将均被判刑两年。如果两人均不招供,将最有利,只被判刑半年。于是,两人同时陷入招供还是不招供的两难处境。但两人无法沟通,于是从各自的利益角度出发,都依据各自的理性而选择了招供,这种情况就称为纳什均衡点。这时,个体的理性利益选择是与整体的理性利益选择不一致的。
囚犯的博弈矩阵 |
囚犯甲 |
招供 |
不招供 |
囚犯乙 |
招供 |
各判刑两年 |
甲判刑十年,乙立即释放 |
不招供 |
甲立即释放,乙判刑十年 |
各判刑半年 |
基于经济学中“理性经济人”的前提假设,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被判刑半年就不会出现。事实上,这样两人都选择坦白的策略以及因此被判两年的结局被称作是“纳什均衡”(也叫非合作均衡),换言之,在此情况下,无一参与者可以“独自行动”(即单方面改变决定)而增加收获。
[##]
|
本条目中立性有争议。内容、语调可能带有明显的个人观点或地方色彩。(2007年10月23日)
加上此模板的编辑者需在讨论页说明此文中立性有争议的原因,以便让各编辑者讨论和改善。
在编辑之前请务必察看讨论页。 |
第一,纳什的关于非合作博弈论的平衡不动点解(equilibrium/fixpoint)学术证明是非构造性的(non-constructive),就是说纳什用角谷静夫不动点定理(英语:Kakutani fixed point theorem)证明了平衡不动点解是存在的,但却不能指出以什么构造算法如何去达到这个平衡不动点解。这种非构造性的发现对现实生活里的博弈的作用是有限的,即使知道平衡不动点解存在,在很多情况下却找不到,因此仍不能解决问题。[来源请求]
第二,纳什的非合作博弈论模型仅仅是突破了博弈论中的一个局限。一个更大的局限是,博弈论面对的往往是由几十亿节点的庞大对象构成的社会、经济等复杂行为,但冯·诺伊曼和纳什的研究是针对两三个节点的小规模博弈论(有人称之为tiny-scale toy case)。[来源请求]
这个假设的不完善处,可能比假设大家都是合作的更严重。因为在经济学里,一个庞大社会里的人极不可能全部都是合作的,非合作的情况通常在庞大对象的情形中更普遍,而在两三个节点的小规模经济中倒反而影响较小。既然改了合作前提为非合作前提,却仍然停留在两三个节点的小规模博弈论中,这是一个不可忽视的缺陷。MIT的一位计算机科学博士生的博士论文[2]——获得2008年度美国计算机协会学位论文奖——认为经济学家的推测是错误的,找到纳什均衡点是几乎不可能的事。 目前担任MIT电机工程和计算机科学系助理教授的Constantinos Daskalakis与 UC伯克利的Christos Papadimitriou、英国利物浦大学的Paul Goldberg合作,证明对某些博弈来说,穷全世界所有计算机之力,在整个宇宙寿命的时间内也计算不出纳什均衡点。Daskalakis相信,计算机找不到,人类也不可能找到。纳什均衡属于NP问题,Daskalakis证明它属于NP问题的一个子集,不是通常认为的NP-完全问题,而是PPAD-完全问题。这项研究成果被一些计算机科学家认为是十年来博弈论领域的最大进展。
不过在同一篇论文里,Daskalakis也指出,在参与者匿名的情况下,则仅需多项式时间即可逼近纳什均衡。
[###]
- 囚徒困境
- 帕累托最优
- 博弈论
- P/NP问题
- PPAD(英语:PPAD (complexity))
[####]
- ^ 若 , ,则纳什称 s 为平衡点(Equilibrium point)。----其中 为参与者 i 的收获(payoff),代表所有参与者之策略,代表参与者 i 的 一种可能策略, 指参与者 i 单方面改变策 略成 。 --- P.287, Annals of Mathematics 1951
- ^ Constantinos Daskalakis, The Complexity of Nash Equilibria
[#####]
《Non-Cooperative Games》,约翰 · 纳什 , The Annals of Mathematics 1951
[######]
- 纳什博弈论的原理与应用 北京晚报 (2002年3月21日)
博弈论专题
|
|
定义 |
正则形式的博弈 · 扩展形式的博弈 · 合作博弈 · 信息集 · 偏好
|
|
均衡概念 |
纳什均衡 · 子博弈完美 · 贝叶斯-纳什 · 贝叶斯完美 · 颤抖手完美 · 恰当均衡 · ε-均衡 · 相关均衡 · 序贯均衡 · 准完美均衡 · 进化稳定策略 · 风险占优 · 帕累托最优
|
|
策略 |
优势策略 · 纯策略 · 混合策略 · 投桃报李 · 冷酷触发策略 · 串谋
|
|
博弈类型 |
对称博弈 · 完美信息 · 完全信息 · 序贯博弈 · 重复博弈 · 信号博弈 · 廉价磋商 · 零和博弈 · 机制设计 · 随机博弈 · 非传递博弈 · 全球博弈
|
|
博弈列表 |
囚徒困境 · 旅行者困境 · 协调博弈(英语:Coordination game) · 胆小鬼博弈 · 志愿者困境 · 搭便车问题 · 拍卖美元 · 性别战 · 猎鹿赛局 · 赌便士(英语:Penney's game) · 最后通牒赛局 · 少数派博弈 · 石头、剪子、布 · 海盗博弈 · Dictator game(英语:Dictator game) · Public goods game · Nash bargaining game · 上校赛局 · 摩擦战 · El Farol Bar problem · 公平分配博弈 · 古诺竞争(Cournot competition) · 死结(Deadlock) · 用餐者困境 · 猜均值的2/3 · 库恩扑克游戏 · Screening game · Signaling game · Trust game · Princess and monster game
|
|
定理 |
极值定理 · 纯化定理 · 无名氏定理 · 显示定理 · 阿罗不可能定理
|
|
分类:隐藏分类:- 含有英语的条目
- 自2007年10月中立性有争议的作品
- 自2007年7月有未列明来源语句的条目
- 自2008年10月有未列明来源语句的条目
[/micxp_threadbk] |