鞅 (概率论)-菲律宾论坛，菲律宾华人论坛-博牛门户社区 - 博牛迪拜站，迪拜华人论坛，博牛迪拜华人门户网站

博牛社区 › 产业交流 › 知识百科

电梯直达 »

返回列表

太子妃
翻译小组

当前积分:4016

帖子 739

新博币 1

提现

提现 0 元

发表于 2016-10-8 06:08:00 2400 0 | 显示全部楼层 |倒序浏览

楼主

鞅（Martingale）于博弈论中的表示公平博弈的数学模型，在概率论中是满足下述条件的随机过程：已知过去某一时刻s以及之前所有时刻的观测值，若某一时刻t的观测值的条件期望等于过去某一时刻s的观测值，则称这一随机过程是鞅。

[micxp_threadbk] [micxp_title] 历史定义鞅的例子下鞅与上鞅鞅与停时参见参考文献参考书目 [/micxp_title] [#]

三维布朗运动（维纳过程）鞅的原名martingale原指一类于18世纪流行于法国的投注策略，称为加倍赌注法。[1]这类策略中最简单的一种策略是为博弈设计的。在博弈中，赌徒会掷硬币，若硬币正面向上，赌徒会赢得赌本，若硬币反面向上，赌徒会输掉赌本。这一策略使赌徒在输钱后加倍赌金投注，为的是在初次赢钱时赢回之前输掉的所有钱，同时又能另外赢得与最初赌本等值的收益。当赌徒的财产和可用时间同时接近无穷时，他掷硬币后赢得最初赌本的概率会接近1，由此看来，加倍赌注法似乎是一种必然能赢钱的策略。然而，赌金的指数增长最终会导致财产有限的使用这一策略的赌徒破产。概率论中，鞅的概念是由保罗·皮埃尔·莱维（Paul Pierre Lévy）提出。鞅这个词本身，是来源于法国的一个叫马提克（Martique）的小镇，该小镇的居民以小气而著称。据说他们下周要花的一点小钱，估计起来最有可能等于他们今天花的钱。莱维正是从马提克小镇居民的小气习性中受到启发，创立了建立在最小气原理的数学概念之上的鞅方法的最初概念。而这一理论的初期基础理论的发展均是由约瑟夫·利奥·杜布（Joseph Leo Doob）完成。完成这些工作的部分动机是为了表明成功的投注策略不可能存在。伊藤清在分析应用方面作出了重要的贡献。从1970年代开始，鞅论就在纯粹数学和应用数学的很多领域中有广泛的应用，特别是在数学物理和金融数学中。 [##] 离散时间鞅是对于所有n都满足

E (| X_{n} |) < \infty {\displaystyle \mathbf {E} (\vert X_{n}\vert )<\infty }

{\mathbf {E}}(\vert X_{n}\vert )<\infty

E (X_{n + 1} ∣ X_{1}, \dots, X_{n}) = X_{n}, n \in N, {\displaystyle \mathbf {E} (X_{n+1}\mid X_{1},\ldots ,X_{n})=X_{n},\quad n\in \mathbb {N} ,}

{\mathbf {E}}(X_{{n+1}}\mid X_{1},\ldots ,X_{n})=X_{n},\quad n\in {\mathbb N},

的时间离散的随机过程X1，X2，X3，…，也就是说，已知之前所有观测值，若下一次观测值的条件期望等于本次观测值，则称这一随机过程（即随机变量序列）是离散时间鞅。
相对来说更为一般的定义如下：若对于所有n都满足

E (| Y_{n} |) < \infty {\displaystyle \mathbf {E} (\vert Y_{n}\vert )<\infty }

{\mathbf {E}}(\vert Y_{n}\vert )<\infty

E (Y_{n + 1} ∣ X_{1}, \dots, X_{n}) = Y_{n}, n \in N, {\displaystyle \mathbf {E} (Y_{n+1}\mid X_{1},\ldots ,X_{n})=Y_{n},\quad n\in \mathbb {N} ,}

{\mathbf {E}}(Y_{{n+1}}\mid X_{1},\ldots ,X_{n})=Y_{n},\quad n\in {\mathbb N},

则称随机过程Y1，Y2，Y3，…是关于另一随机过程X1，X2，X3，…的鞅。与离散时间鞅的定义相似，连续时间鞅的定义为：若对于所有t都满足

E (| Y_{t} |) < \infty {\displaystyle \mathbf {E} (\vert Y_{t}\vert )<\infty }

{\mathbf {E}}(\vert Y_{t}\vert )<\infty

E (Y_{t} ∣ {X_{τ}, τ \leq s}) = Y_{s}, \forall s \leq t, {\displaystyle \mathbf {E} (Y_{t}\mid \{X_{\tau },\tau \leq s\})=Y_{s},\ \forall \ s\leq t,}

{\mathbf {E}}(Y_{{t}}\mid \{X_{{\tau }},\tau \leq s\})=Y_{s},\ \forall \ s\leq t,

则称关于随机过程Xt的连续时间鞅是随机过程Yt。上述定义表达了鞅的性质，即在s ≤ t的条件下，已知时刻

s {\displaystyle s}

s

以及之前所有时刻的观测值，若时刻t的观测值的条件期望等于时刻s的观测值，则随机过程是鞅。完全一般性的定义如下：若满足如下性质，则随机过程Y : T × Ω → S是关于滤链Σ∗和概率测度P的鞅：

Σ∗是给定概率空间(Ω, Σ, P)的σ域流；
Y是适应于滤链Σ∗的适应过程，即对于指标集T中的每一t，随机变量Yt是一个Σt 可测函数；
对于每一t，Yt存在于Lp空间L1(Ω, Σt, P; S)中，即

E_{P} (| Y_{t} |) < + \infty; {\displaystyle \mathbf {E} _{\mathbf {P} }(|Y_{t}|)<+\infty ;}

{\mathbf {E}}_{{{\mathbf {P}}}}(|Y_{{t}}|)<+\infty ;

对于所有s和t（s < t）和所有F ∈ Σs，

E_{P} ([Y_{t} - Y_{s}] χ_{F}) = 0, {\displaystyle \mathbf {E} _{\mathbf {P} }\left([Y_{t}-Y_{s}]\chi _{F}\right)=0,}

{\mathbf {E}}_{{{\mathbf {P}}}}\left([Y_{t}-Y_{s}]\chi _{F}\right)=0,

其中χF表示事件F的指示函数。在Grimmett和Stirzaker的《Probability and Random Processes》一书中，最后一个条件表示为：

Y_{s} = E_{P} (Y_{t} | Σ_{s}), {\displaystyle Y_{s}=\mathbf {E} _{\mathbf {P} }(Y_{t}|\Sigma _{s}),}

Y_{s}={\mathbf {E}}_{{{\mathbf {P}}}}(Y_{t}|\Sigma _{s}),

上式是条件期望的一般形式。[2]

要注意的重点是鞅成立的性质与滤链以及关于选定期望的概率测度都有关。Y可能是某一测度的鞅，但不是另一测度的鞅；而要说明某一伊藤过程是鞅，则可以利用吉尔萨诺夫定理（英语：Girsanov theorem）找出相关的测度。 [###]

设Xn是一个赌徒n次抛掷公平硬币后的财产，如果硬币正面朝上，则赌徒赢得1美元，硬币反面朝上，则赌徒输掉1美元。已知历史上所拥有的财产，且下一次试验后赌徒财产的条件期望与其现在的财产相等，故这一随机过程是鞅。这个例子称为赌徒谬误。

令Yn = Xn2 − n，其中Xn是上例中赌徒的财产，则随机过程{ Yn : n = 1, 2, 3, ... }是鞅。这一例子可以表明赌徒的全部收益或损失大致在抛掷次数的正负平方根之间变化。

（棣莫弗鞅）设抛掷的是有偏硬币（或称为不公平硬币），正面向上的概率为p，反面向上的概率为q = 1 − p。令

X_{n + 1} = X_{n} \pm 1 {\displaystyle X_{n+1}=X_{n}\pm 1}

X_{{n+1}}=X_{n}\pm 1

正面情况用“+”，反面情况用“−”。令

Y_{n} = (q / p)^{X_{n}}, {\displaystyle Y_{n}=(q/p)^{X_{n}},}

Y_{n}=(q/p)^{{X_{n}}},

则{ Yn : n = 1, 2, 3, ... }是关于{ Xn : n = 1, 2, 3, ... }的鞅。证明如下：

\begin{aligned} E [Y_{n + 1} ∣ X_{1}, \dots, X_{n}] & = p (q / p)^{X_{n} + 1} + q (q / p)^{X_{n} - 1} \\ = p (q / p) (q / p)^{X_{n}} + q (p / q) (q / p)^{X_{n}} \\ = q (q / p)^{X_{n}} + p (q / p)^{X_{n}} = (q / p)^{X_{n}} = Y_{n} . \end{aligned} {\displaystyle {\begin{aligned}E[Y_{n+1}\mid X_{1},\dots ,X_{n}]&=p(q/p)^{X_{n}+1}+q(q/p)^{X_{n}-1}\\&=p(q/p)(q/p)^{X_{n}}+q(p/q)(q/p)^{X_{n}}\\&=q(q/p)^{X_{n}}+p(q/p)^{X_{n}}=(q/p)^{X_{n}}=Y_{n}.\end{aligned}}}

{\begin{aligned}E[Y_{{n+1}}\mid X_{1},\dots ,X_{n}]&=p(q/p)^{{X_{n}+1}}+q(q/p)^{{X_{n}-1}}\\&=p(q/p)(q/p)^{{X_{n}}}+q(p/q)(q/p)^{{X_{n}}}\\&=q(q/p)^{{X_{n}}}+p(q/p)^{{X_{n}}}=(q/p)^{{X_{n}}}=Y_{n}.\end{aligned}}

复合补偿泊松过程的2条轨道，强度分别为2.4（蓝）和0.6（红），服从正态分布

N (0.25, 1) {\displaystyle N(0.25,1)\,}

N(0.25,1)\,

（波利亚罐子模型）一个罐子中最初装有r个红球和b个蓝球。某人随机取出一个球，然后将此球与另一个与此球颜色相同的球放回罐子中。令Xn为重复上述步骤n次后罐子中的红球数，令Yn = Xn / (n r b)。这时随机过程{ Yn : n = 1, 2, 3, ... }是鞅。

（统计学中的似然比检验）某一总体可能是按照概率密度f分布，也可能是按照概率密度g分布。从总体中取出一个随机样本，数据为X1, ..., Xn。令Yn为“似然比”：

Y_{n} = \prod_{i = 1}^{n} \frac{g (X_{i})}{f (X_{i})} {\displaystyle Y_{n}=\prod _{i=1}^{n}{\frac {g(X_{i})}{f(X_{i})}}}

Y_{n}=\prod _{{i=1}}^{n}{\frac {g(X_{i})}{f(X_{i})}}

（上式在应用中用作检验统计量。）若总体实际上是按照概率密度f而不是g分布，则{ Yn : n = 1, 2, 3, ... }是关于{ Xn : n = 1, 2, 3, ... }的鞅。

设每一变形虫不是以概率p分裂成两个变形虫，就是以概率1 − p最终死亡。令Xn为n代后变形虫的存活数目（若种群在某一时刻灭绝，则这一时刻的Xn = 0）。令r为最终灭绝的概率（英语：Galton–Watson process）。（找出r关于p的函数在实际应用中是非常有用的。提示：已知最初的一个变形虫已经分裂了，则这个变形虫的后代最终灭绝的概率等于其分裂直接得到的两个后代中任何一个死亡的概率。）则

{r^{X_{n}} : n = 1, 2, 3, \dots} {\displaystyle \{\,r^{X_{n}}:n=1,2,3,\dots \,\}}

\{\,r^{{X_{n}}}:n=1,2,3,\dots \,\}

是关于{ Xn: n = 1, 2, 3, ... }的鞅。

软件生成的鞅序列

一个大小固定生态系统中，任一特定物种的个体数量都是一个（离散）时间函数，可被视为一个随机过程（随机变量序列）。这一随机过程是生物多样性和生物地理学的统一中性理论（英语：unified neutral theory of biodiversity）下的鞅。

若{ Nt : t ≥ 0 }是强度为λ的泊松过程，则补偿泊松过程{ Nt − λt : t ≥ 0 }是具有右连续且有左极限的样本轨道的连续时间鞅（更确切地说是局部鞅）。

利用计算机软件，鞅序列可以很容易地制作出来：
- Microsoft Excel或类似的电子制表软件：在A1（左上角）单元格中输入0.0，在下方的A2单元格中输入=A1+NORMINV(RAND(),0,1)。这时下拉复制此单元格，得到大约300个单元格，这样就能创建均值为0，标准差为1的鞅序列。在这些单元格仍处于选中状态的情况下，利用图表创建工具创建这些值的图表。这时每次重新计算后（在Excel中可按F9实现），图表都会显示出不同的鞅序列。
- R语言：若要再现上述例子，可运行如下命令。若要显示另一个鞅，重新输入如下命令即可。
  
  plot(cumsum(rnorm(100, mean=0, sd=1)), t="l", col="darkblue", lwd=3)

[####] （离散时间）下鞅（submartingale，又称亚鞅）是满足

E [X_{n + 1} | X_{1}, \dots, X_{n}] \geq X_{n}, n \in N {\displaystyle {}E[X_{n+1}|X_{1},\ldots ,X_{n}]\geq X_{n},\quad n\in \mathbb {N} }

{}E[X_{{n+1}}|X_{1},\ldots ,X_{n}]\geq X_{n},\quad n\in {\mathbb N}

的可积的随机过程X1，X2，X3，…。类似地，（离散时间）上鞅（supermartingale，又称超鞅）是满足

E [X_{n + 1} | X_{1}, \dots, X_{n}] \leq X_{n}, n \in N {\displaystyle {}E[X_{n+1}|X_{1},\ldots ,X_{n}]\leq X_{n},\quad n\in \mathbb {N} }

{}E[X_{{n+1}}|X_{1},\ldots ,X_{n}]\leq X_{n},\quad n\in {\mathbb N}

的可积的随机过程X1，X2，X3，…。下鞅或上鞅的定义都可由前述的离散时间和连续时间鞅的更为一般的定义转换得到，只需将条件期望的等式代换成不等式即可。这里给出一个区分下鞅和上鞅的记忆方法：“生活是一个上鞅：随着时间的推进，期望降低。” [#####] 参见：可选停止定理关于随机过程X1，X2，X3，…的停时是随机变量τ，这一随机变量具有如下性质：对于每一t，事件τ = t的发生与否仅取决于X1，X2，X3，…，Xt的取值。从定义中可以感受到的直觉是在任一特定时刻t，我们都可以知道在这一时刻随机过程是否到了停时。现实生活中停时的例子如赌徒离开赌桌的时刻，这一时刻可能是赌徒以前赢得钱财的函数（例如，仅当他没有钱时，他才可能离开赌桌），但是他不可能根据还未完成的博弈的结果来选择离开还是留下。上述停时定义满足强条件，下面给出一个弱条件的停时定义：若事件τ = t的发生与否统计独立于Xt + 1，Xt + 2，…但并不是完全决定于时刻t以及之前的过程历史，则随机变量τ是停时。虽然这是一个弱条件，但在需要用到停时的证明中的一些情况也算是足够强的条件。鞅的一个基本性质是若

(X_{t})_{t > 0} {\displaystyle (X_{t})_{t>0}}

(X_{t})_{{t>0}}

是下\上鞅且

τ {\displaystyle \tau }

\tau

是停时，由

X_{t}^{τ} := X_{min {τ, t}} {\displaystyle X_{t}^{\tau }:=X_{\min\{\tau ,t\}}}

X_{t}^{\tau }:=X_{{\min\{\tau ,t\}}}

定义的对应停止过程

(X_{t}^{τ})_{t > 0} {\displaystyle (X_{t}^{\tau })_{t>0}}

(X_{t}^{\tau })_{{t>0}}

也是下\上鞅。停时鞅的概念引出了一系列定理，例如可选停止定理（又称可选抽样定理）：在特定条件下，停时的鞅的期望值等于其初始值。利用这一定理，我们可以证明对于一个寿命有限且房产有限的赌徒，成功的投注策略不可能存在。 [######]

Azuma不等式
布朗运动
鞅中心极限定理
鞅表述定理
Doob鞅
Doob鞅收敛定理
局部鞅
半鞅

[#######] [########]

Laboratoire de probabilités et modèles aléatoires. The Splendors and Miseries of Martingales. Electronic Journal for History of Probability and Statistics. June 2009, 5 (1) [2010-09-06]. ISSN 1773-0074.
David Williams. Probability with Martingales. Cambridge University Press. 1991. ISBN 0-521-40605-6.
Hagen Kleinert. Path Integrals in Quantum Mechanics, Statistics, Polymer Physics, and Financial Markets 第4版. 新加坡: 世界科学出版社（英语：World Scientific）. 2004. ISBN 981-238-107-4. 平装
有关鞅的演示文稿讲义

规范控制	NDL: 00567500

分类：

随机过程
鞅论
博弈论

[/micxp_threadbk]

个人签名

收藏回复菲律宾最大的华人电报群,点击加入:https://t.me/boniush365

返回列表

加入博牛招聘会员，尽享专属特权>>

赚博币，当钱花>>

浏览过的版块