正则形式的博弈-菲律宾论坛，菲律宾华人论坛-博牛门户社区 - 博牛迪拜站，迪拜华人论坛，博牛迪拜华人门户网站

博牛社区 › 产业交流 › 知识百科

电梯直达 »

返回列表

太子妃
翻译小组

当前积分:4016

帖子 739

新博币 1

提现

提现 0 元

发表于 2016-10-8 04:17:41 1.1万 0 | 显示全部楼层 |倒序浏览

楼主

在博弈论中，正则形式是描述博弈的一种方式。与延展形式不同，正则形式不用图形来描述博弈，而是用矩阵来陈述博弈。与延展形式的表述方式相比，这种方式在识别出严格优势策略和纳什均衡上更有用，但会丢失某些信息。博弈的正则形式的表述方式包括如下部分：每个参与者所有显然的和可能的策略，以及和与其相对应的收益。

在非完美信息的完全静态博弈中，正则形式的表述方式详细地说明了参与者策略空间和收益函数。策略空间是某个参与者的所有可能策略的集合。策略是参与者在博弈的每个阶段——不管在博弈中这个阶段实际上是否会出现——将要采取的行动的完整计划。每个参与者的收益函数，是从参与者策略空间的向量积到该参与者收益集合（一般是实数集，数字表示基数效用或序数效用——在正则形式的表述方式中常常是基数效用）的映射。也就是说，参与者的收益函数把策略组合（所有参与者策略的清单）作为它的输入量，然后输出参与者的收益。

[micxp_threadbk] [micxp_title] 一个实例正则形式的使用正则形式的连续博弈一般形式参考文献外部链接 [/micxp_title] [#]

*一个正则形式的博弈*
	乙选择左	乙选择右
甲选择顶	4, 3	-1, -1
甲选择底	0, 0	3, 4

有种博弈是参与者同时（或至少在做出行动前不观察其他参与者的动作）做出行动，并按照上述已做出行动的组合获得收益。右边的矩阵是这种博弈得正则形式的表述方式。例如，如果甲做出行动“顶”，而乙做出行动“左”，则甲得到收收益4，乙得到收益3。在每个回合，第一个数字代表排参与者（此处为甲）的收益，第二个数字代表列参与者（此处为乙）的收益。 [##] [###]

*一个连续博弈*
	左，左	左，右	右，左	右，右
顶	4, 3	4, 3	-1, -1	-1, -1
底	0, 0	3, 4	0, 0	3, 4

这些矩阵只表述同时（或者更一般地，信息是不完美的）做出行动的博弈。上述矩阵不能表述甲先做出行动，被乙观察到，然后乙再做出行动的博弈。因为在这个例子中，无法确定乙每次的策略。为了表述这种连续博弈，我们要列出乙在博弈进行期间所有的行动——尽管根据实际情况，某种行动决不会出现。和前面一样，在这个博弈中乙有两种选择，左和右。与前面不一样的是，视甲的行动不同而定，乙有四种策略。这些策略是：

如果甲选择顶，选择左；否则，选择左
如果甲选择顶，选择左；否则，选择右
如果甲选择顶，选择右；否则，选择左
如果甲选择顶，选择右；否则，选择右

右图是这个博弈的正则形式的表述方式。 [####] 为了用把博弈表述成正则形式，需要提供下列数据：

表示参与者的有限集P，标记为{1,2,…,m}
每个参与者k在P里拥有有限个纯策略

S_{k} = {1, 2, \dots, n_{k}} . {\displaystyle S_{k}=\{1,2,\ldots ,n_{k}\}.}

S_{k}=\{1,2,\ldots ,n_{k}\}.

一个纯策略组合是参与者策略的联合，这是一个m元组

\vec{σ} = (σ_{1}, σ_{2}, \dots, σ_{m}) {\displaystyle {\vec {\sigma }}=(\sigma _{1},\sigma _{2},\ldots ,\sigma _{m})}

{\vec {\sigma }}=(\sigma _{1},\sigma _{2},\ldots ,\sigma _{m})

则有

σ_{1} \in S_{1}, σ_{2} \in S_{2}, \dots, σ_{m} \in S_{m} {\displaystyle \sigma _{1}\in S_{1},\sigma _{2}\in S_{2},\ldots ,\sigma _{m}\in S_{m}}

\sigma _{1}\in S_{1},\sigma _{2}\in S_{2},\ldots ,\sigma _{m}\in S_{m}

我们用Σ来表示策略组合的集合收益函数形如

F : Σ \to R . {\displaystyle F:\Sigma \rightarrow \mathbb {R} .}

F:\Sigma \rightarrow {\mathbb {R}}.

其预期解释是博弈结束时给予单个参与者的奖品。相应地，为了完整地说明一个博弈，收益函数必须在参与者集 P= {1, 2, ..., m}中对每个参与者详细说明。定义：一个正则形式的博弈的结构形如

(P, S, F) {\displaystyle (P,\mathbf {S} ,\mathbf {F} )}

(P,{\mathbf {S}},{\mathbf {F}})

这里 P = {1,2, ...,m}是参与者集合，

S = (S_{1}, S_{2}, \dots, S_{m}) {\displaystyle \mathbf {S} =(S_{1},S_{2},\ldots ,S_{m})}

{\mathbf {S}}=(S_{1},S_{2},\ldots ,S_{m})

是纯策略集合的一个m元组，每个纯策略对应于一个参与者，而

F = (F_{1}, F_{2}, \dots, F_{m}) {\displaystyle \mathbf {F} =(F_{1},F_{2},\ldots ,F_{m})}

{\mathbf {F}}=(F_{1},F_{2},\ldots ,F_{m})

是收益函数的m元组。没有理由在前面的讨论中，把参与者数量有限或每个参与者的策略有限的博弈排除在外。因为要用到泛函分析的技巧，关于有限博弈的研究非常艰深。 [#####]

D. Fudenberg and J. Tirole, Game Theory, MIT Press, 1991.
R. D. Luce and H. Raiffa, Games and Decisions, Dover Publications, 1989.
J. Weibull, Evolutionary Game Theory, MIT Press, 1996
J. von Neumann and O. Morgenstern, Theory of games and Economic Behavior, John Wiley Science Editions, 1964. This book was initially published by Princeton University Press in 1944.

[######]

http://www.whalens.org/Sofia/choice/matrix.htm

查论编博弈论专题

定义	正则形式的博弈 · 扩展形式的博弈 · 合作博弈 · 信息集 · 偏好

均衡概念	纳什均衡 · 子博弈完美 · 贝叶斯-纳什 · 贝叶斯完美 · 颤抖手完美 · 恰当均衡 · ε-均衡 · 相关均衡 · 序贯均衡 · 准完美均衡 · 进化稳定策略 · 风险占优 · 帕累托最优

策略	优势策略 · 纯策略 · 混合策略 · 投桃报李 · 冷酷触发策略 · 串谋

博弈类型	对称博弈 · 完美信息 · 完全信息 · 序贯博弈 · 重复博弈 · 信号博弈 · 廉价磋商 · 零和博弈 · 机制设计 · 随机博弈 · 非传递博弈 · 全球博弈

博弈列表	囚徒困境 · 旅行者困境 · 协调博弈（英语：Coordination game） · 胆小鬼博弈 · 志愿者困境 · 搭便车问题 · 拍卖美元 · 性别战 · 猎鹿赛局 · 赌便士（英语：Penney's game） · 最后通牒赛局 · 少数派博弈 · 石头、剪子、布 · 海盗博弈 · Dictator game（英语：Dictator game） · Public goods game · Nash bargaining game · 上校赛局 · 摩擦战 · El Farol Bar problem · 公平分配博弈 · 古诺竞争（Cournot competition） · 死结(Deadlock) · 用餐者困境 · 猜均值的2/3 · 库恩扑克游戏 · Screening game · Signaling game · Trust game · Princess and monster game

定理	极值定理 · 纯化定理 · 无名氏定理 · 显示定理 · 阿罗不可能定理

分类：

博弈论

[/micxp_threadbk]

个人签名

收藏回复菲律宾最大的华人电报群,点击加入:https://t.me/boniush365

返回列表

加入博牛招聘会员，尽享专属特权>>

赚博币，当钱花>>