鞅与停时定理

发布时间 2023-11-12 02:04:12作者: Fido_Puppy

一、离散时间鞅

定义离散时间鞅为一个时间离散的随机过程 \(X_0, X_1, \ldots\),使得 \(\forall n \in \mathbb{N}\),均满足:

  • \(E(|X_n|) < \infty\)
  • \(E(X_{n + 1} - X_n \mid X_0, X_1, \ldots, X_n) = 0\)

易得:\(E(X_n) = X_0\)

二、停时定理

\(T\) 为鞅过程 \(X_0, X_1, \ldots\) 的停时,则 \(E(X_T) = X_0\),当且仅当以下三个条件之一成立:

  • \(T\) 几乎必然有界。
  • \(|X_{i + 1} - X_i|\) 一致有界,\(E(T)\) 有限。
  • \(X_i\) 一致有界,\(T\) 几乎必然有限。

名词解释:

  • \(X \in \mathbb{R} \cup \infty\) 有限:\(|X| < \infty\)
  • \(X \in \mathbb{R} \cup \infty\) 有界:\(\exist L, R \in \mathbb{R}, X \in [L, R]\)
  • \(X_i \in \mathbb{R} \cup \infty\) 一致有界:\(\forall i, \exist L, R \in \mathbb{R}, X_i \in [L, R]\)
  • 事件 \(A\) 几乎必然发生:\(P(A) = 1\)

三、经典套路:势能函数法

对于随机事件序列 \(A_0, A_1, \ldots\),设 \(T\) 为其停时,终止状态为 \(A_T\),求 \(E(T)\)

构造势能函数 \(\Phi(A)\),满足:

  • \(E(\Phi(A_{n + 1} - A_n) \mid A_0, A_1, \ldots, A_n) = -1\)
  • \(\Phi(A_T)\) 为常数且 \(\Phi(A_i) = \Phi(A_T)\) 当且仅当 \(i = T\)

构造序列 \(X_i = \Phi(A_i) + i\),则 \(E(X_{n + 1} - X_n \mid X_0, X_1, \ldots, X_n) = 0\),即 \(X_0, X_1, \ldots\) 是鞅。

根据停时定理,可得 \(E(X_T) = E(X_0)\),即 \(E(T) = E(\Phi(A_0)) - \Phi(A_T)\)

四、例题

CF1025G Company Acquisitions

设一个活跃的有 \(x\) 个企业跟随的企业的势能函数为 \(f(x)\),一个局面的势能函数 \(\Phi(A)\) 为所有活跃企业的势能函数之和。

一次操作势能变化量只与随出的两个企业有关,设两个企业分别有 \(x\)\(y\) 个企业跟随。

\[f(x) + f(y) - 1 = \dfrac{1}{2} \times (f(x + 1) + y \cdot f(0) + f(y + 1) + x \cdot f(0)) \]

由于需要对任意 \(x, y\) 成立,可得:

\[f(x) - \dfrac{1}{2} x \cdot f(0) - \dfrac{1}{2} \cdot f(x + 1) = \dfrac{1}{2} \]

感觉这个 \(f(0)\) 比较突兀,直接钦定 \(f(0) = 0\),得到:

\[f(x + 1) = 2f(x) - 1 \]

归纳得到 \(f(x) = 1 - 2 ^ x\),并且 \(\Phi(A_T) = 1 - 2 ^ {n - 1}\) 为常量。

最终计算 \(\Phi(A_0) - \Phi(A_T)\) 即可,时间复杂度 \(\Theta(n)\)