关闭 More 保存 重做 撤销 预览

   
关闭   当前为简洁模式,您可以更新模块,修改模块属性和数据,要使用完整的拖拽功能,请点击进入高级模式

重播

上一主題 下一主題
»
太子妃
翻译小组
当前积分:4016
帖子    739
新博币    1 提现
提现    0
     
    2676 0 | 显示全部楼层 |倒序浏览
    纳什平衡(英语:Nash equilibrium),又称为非合作赛局平衡,是在非合作赛局(Non-cooperative game)状况下的一个概念解,在博弈论中有重要地位,以约翰·纳什命名。

    如果某情况下无一参与者可以通过独自行动而增加收益,则此策略组合被称为纳什均衡点[1]。

    [micxp_threadbk] [micxp_title] 例子 学术争议和批评 相关链接 注 参考 外部链接 [/micxp_title] [#] 其经典的例子就是囚徒困境。囚徒困境是一个非零和博弈。大意是:一个案子的两个嫌疑犯被分开审讯,警官分别告诉两个囚犯,如果你招供,而对方不招供,则你将被立即释放,而对方将被判刑十年;如果两人均招供,将均被判刑两年。如果两人均不招供,将最有利,只被判刑半年。于是,两人同时陷入招供还是不招供的两难处境。但两人无法沟通,于是从各自的利益角度出发,都依据各自的理性而选择了招供,这种情况就称为纳什均衡点。这时,个体的理性利益选择是与整体的理性利益选择不一致的。
    囚犯的博弈矩阵 囚犯甲
    招供 不招供
    囚犯乙 招供 各判刑两年 甲判刑十年,乙立即释放
    不招供 甲立即释放,乙判刑十年 各判刑半年
    基于经济学中“理性经济人”的前提假设,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被判刑半年就不会出现。事实上,这样两人都选择坦白的策略以及因此被判两年的结局被称作是“纳什均衡”(也叫非合作均衡),换言之,在此情况下,无一参与者可以“独自行动”(即单方面改变决定)而增加收获。 [##] 第一,纳什的关于非合作博弈论的平衡不动点解(equilibrium/fixpoint)学术证明是非构造性的(non-constructive),就是说纳什用角谷静夫不动点定理(英语:Kakutani fixed point theorem)证明了平衡不动点解是存在的,但却不能指出以什么构造算法如何去达到这个平衡不动点解。这种非构造性的发现对现实生活里的博弈的作用是有限的,即使知道平衡不动点解存在,在很多情况下却找不到,因此仍不能解决问题。[来源请求] 第二,纳什的非合作博弈论模型仅仅是突破了博弈论中的一个局限。一个更大的局限是,博弈论面对的往往是由几十亿节点的庞大对象构成的社会、经济等复杂行为,但冯·诺伊曼和纳什的研究是针对两三个节点的小规模博弈论(有人称之为tiny-scale toy case)。[来源请求] 这个假设的不完善处,可能比假设大家都是合作的更严重。因为在经济学里,一个庞大社会里的人极不可能全部都是合作的,非合作的情况通常在庞大对象的情形中更普遍,而在两三个节点的小规模经济中倒反而影响较小。既然改了合作前提为非合作前提,却仍然停留在两三个节点的小规模博弈论中,这是一个不可忽视的缺陷。MIT的一位计算机科学博士生的博士论文[2]——获得2008年度美国计算机协会学位论文奖——认为经济学家的推测是错误的,找到纳什均衡点是几乎不可能的事。 目前担任MIT电机工程和计算机科学系助理教授的Constantinos Daskalakis与 UC伯克利的Christos Papadimitriou、英国利物浦大学的Paul Goldberg合作,证明对某些博弈来说,穷全世界所有计算机之力,在整个宇宙寿命的时间内也计算不出纳什均衡点。Daskalakis相信,计算机找不到,人类也不可能找到。纳什均衡属于NP问题,Daskalakis证明它属于NP问题的一个子集,不是通常认为的NP-完全问题,而是PPAD-完全问题。这项研究成果被一些计算机科学家认为是十年来博弈论领域的最大进展。 不过在同一篇论文里,Daskalakis也指出,在参与者匿名的情况下,则仅需多项式时间即可逼近纳什均衡。 [###]
    • 囚徒困境
    • 帕累托最优
    • 博弈论
    • P/NP问题
    • PPAD(英语:PPAD (complexity))
    [####]
    1. ^ 若 p i ( s ) = m a x r i [ p i ( s ; r i ) ] {\displaystyle p_{i}(s)=max_{r_{i}}[p_{i}(s;r_{i})]} , ,则纳什称 s 为平衡点(Equilibrium point)。----其中 p i {\displaystyle p_{i}} 为参与者 i 的收获(payoff), s i {\displaystyle s_{i}} 代表所有参与者之策略, r i {\displaystyle r_{i}} 代表参与者 i 的 一种可能策略, ( s ; r i ) {\displaystyle (s;r_{i})} 指参与者 i 单方面改变策 略成 r i {\displaystyle r_{i}} 。 --- P.287, Annals of Mathematics 1951
    2. ^ Constantinos Daskalakis, The Complexity of Nash Equilibria
    [#####] 《Non-Cooperative Games》,约翰 · 纳什 , The Annals of Mathematics 1951 [######]
    • 纳什博弈论的原理与应用 北京晚报 (2002年3月21日)
    分类:
    • 博弈论
    隐藏分类:
    • 含有英语的条目
    • 自2007年10月中立性有争议的作品
    • 自2007年7月有未列明来源语句的条目
    • 自2008年10月有未列明来源语句的条目
    [/micxp_threadbk]
    个人签名

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    快速回复 返回顶部 返回列表