在博弈论中,正则形式是描述博弈的一种方式。与延展形式不同,正则形式不用图形来描述博弈,而是用矩阵来陈述博弈。与延展形式的表述方式相比,这种方式在识别出严格优势策略和纳什均衡上更有用,但会丢失某些信息。博弈的正则形式的表述方式包括如下部分:每个参与者所有显然的和可能的策略,以及和与其相对应的收益。 在非完美信息的完全静态博弈中,正则形式的表述方式详细地说明了参与者策略空间和收益函数。策略空间是某个参与者的所有可能策略的集合。策略是参与者在博弈的每个阶段——不管在博弈中这个阶段实际上是否会出现——将要采取的行动的完整计划。每个参与者的收益函数,是从参与者策略空间的向量积到该参与者收益集合(一般是实数集,数字表示基数效用或序数效用——在正则形式的表述方式中常常是基数效用)的映射。也就是说,参与者的收益函数把策略组合(所有参与者策略的清单)作为它的输入量,然后输出参与者的收益。
[micxp_threadbk]
[micxp_title]
一个实例
正则形式的使用
正则形式的连续博弈
一般形式
参考文献
外部链接
[/micxp_title]
[#]
一个正则形式的博弈
|
乙选择左 |
乙选择右 |
甲选择顶 |
4, 3 |
-1, -1 |
甲选择底 |
0, 0 |
3, 4 |
有种博弈是参与者同时(或至少在做出行动前不观察其他参与者的动作)做出行动,并按照上述已做出行动的组合获得收益。右边的矩阵是这种博弈得正则形式的表述方式。例如,如果甲做出行动“顶”,而乙做出行动“左”,则甲得到收收益4,乙得到收益3。在每个回合,第一个数字代表排参与者(此处为甲)的收益,第二个数字代表列参与者(此处为乙)的收益。
[##]
[###]
一个连续博弈
|
左,左 |
左,右 |
右,左 |
右,右 |
顶 |
4, 3 |
4, 3 |
-1, -1 |
-1, -1 |
底 |
0, 0 |
3, 4 |
0, 0 |
3, 4 |
这些矩阵只表述同时(或者更一般地,信息是不完美的)做出行动的博弈。上述矩阵不能表述甲先做出行动,被乙观察到,然后乙再做出行动的博弈。因为在这个例子中,无法确定乙每次的策略。为了表述这种连续博弈,我们要列出乙在博弈进行期间所有的行动——尽管根据实际情况,某种行动决不会出现。和前面一样,在这个博弈中乙有两种选择,左和右。与前面不一样的是,视甲的行动不同而定,乙有四种策略。这些策略是:
- 如果甲选择顶,选择左;否则,选择左
- 如果甲选择顶,选择左;否则,选择右
- 如果甲选择顶,选择右;否则,选择左
- 如果甲选择顶,选择右;否则,选择右
右图是这个博弈的正则形式的表述方式。
[####]
为了用把博弈表述成正则形式,需要提供下列数据:
- 表示参与者的有限集P,标记为{1,2,…,m}
- 每个参与者k在P里拥有有限个纯策略
一个纯策略组合是参与者策略的联合,这是一个m元组
则有
我们用Σ来表示策略组合的集合
收益函数形如
其预期解释是博弈结束时给予单个参与者的奖品。相应地,为了完整地说明一个博弈,收益函数必须在参与者集 P= {1, 2, ..., m}中对每个参与者详细说明。
定义:一个正则形式的博弈的结构形如
这里 P = {1,2, ...,m}是参与者集合,
是纯策略集合的一个m元组,每个纯策略对应于一个参与者,而
是收益函数的m元组。
没有理由在前面的讨论中,把参与者数量有限或每个参与者的策略有限的博弈排除在外。因为要用到泛函分析的技巧,关于有限博弈的研究非常艰深。
[#####]
- D. Fudenberg and J. Tirole, Game Theory, MIT Press, 1991.
- R. D. Luce and H. Raiffa, Games and Decisions, Dover Publications, 1989.
- J. Weibull, Evolutionary Game Theory, MIT Press, 1996
- J. von Neumann and O. Morgenstern, Theory of games and Economic Behavior, John Wiley Science Editions, 1964. This book was initially published by Princeton University Press in 1944.
[######]
- http://www.whalens.org/Sofia/choice/matrix.htm
博弈论专题
|
|
定义 |
正则形式的博弈 · 扩展形式的博弈 · 合作博弈 · 信息集 · 偏好
|
|
均衡概念 |
纳什均衡 · 子博弈完美 · 贝叶斯-纳什 · 贝叶斯完美 · 颤抖手完美 · 恰当均衡 · ε-均衡 · 相关均衡 · 序贯均衡 · 准完美均衡 · 进化稳定策略 · 风险占优 · 帕累托最优
|
|
策略 |
优势策略 · 纯策略 · 混合策略 · 投桃报李 · 冷酷触发策略 · 串谋
|
|
博弈类型 |
对称博弈 · 完美信息 · 完全信息 · 序贯博弈 · 重复博弈 · 信号博弈 · 廉价磋商 · 零和博弈 · 机制设计 · 随机博弈 · 非传递博弈 · 全球博弈
|
|
博弈列表 |
囚徒困境 · 旅行者困境 · 协调博弈(英语:Coordination game) · 胆小鬼博弈 · 志愿者困境 · 搭便车问题 · 拍卖美元 · 性别战 · 猎鹿赛局 · 赌便士(英语:Penney's game) · 最后通牒赛局 · 少数派博弈 · 石头、剪子、布 · 海盗博弈 · Dictator game(英语:Dictator game) · Public goods game · Nash bargaining game · 上校赛局 · 摩擦战 · El Farol Bar problem · 公平分配博弈 · 古诺竞争(Cournot competition) · 死结(Deadlock) · 用餐者困境 · 猜均值的2/3 · 库恩扑克游戏 · Screening game · Signaling game · Trust game · Princess and monster game
|
|
定理 |
极值定理 · 纯化定理 · 无名氏定理 · 显示定理 · 阿罗不可能定理
|
|
分类:
[/micxp_threadbk] |