526互联

鞅与停时定理

发布时间 2023-11-12 02:04:12作者: Fido_Puppy

一、离散时间鞅

定义离散时间鞅为一个时间离散的随机过程 \(X_0, X_1, \ldots\)，使得 \(\forall n \in \mathbb{N}\)，均满足：

\(E(|X_n|) < \infty\)。
\(E(X_{n + 1} - X_n \mid X_0, X_1, \ldots, X_n) = 0\)。

易得：\(E(X_n) = X_0\)。

二、停时定理

设 \(T\) 为鞅过程 \(X_0, X_1, \ldots\) 的停时，则 \(E(X_T) = X_0\)，当且仅当以下三个条件之一成立：

\(T\) 几乎必然有界。
\(|X_{i + 1} - X_i|\) 一致有界，\(E(T)\) 有限。
\(X_i\) 一致有界，\(T\) 几乎必然有限。

名词解释：

\(X \in \mathbb{R} \cup \infty\) 有限：\(|X| < \infty\)。
\(X \in \mathbb{R} \cup \infty\) 有界：\(\exist L, R \in \mathbb{R}, X \in [L, R]\)。
\(X_i \in \mathbb{R} \cup \infty\) 一致有界：\(\forall i, \exist L, R \in \mathbb{R}, X_i \in [L, R]\)。
事件 \(A\) 几乎必然发生：\(P(A) = 1\)。

三、经典套路：势能函数法

对于随机事件序列 \(A_0, A_1, \ldots\)，设 \(T\) 为其停时，终止状态为 \(A_T\)，求 \(E(T)\)。

构造势能函数 \(\Phi(A)\)，满足：

\(E(\Phi(A_{n + 1} - A_n) \mid A_0, A_1, \ldots, A_n) = -1\)。
\(\Phi(A_T)\) 为常数且 \(\Phi(A_i) = \Phi(A_T)\) 当且仅当 \(i = T\)。

构造序列 \(X_i = \Phi(A_i) + i\)，则 \(E(X_{n + 1} - X_n \mid X_0, X_1, \ldots, X_n) = 0\)，即 \(X_0, X_1, \ldots\) 是鞅。

根据停时定理，可得 \(E(X_T) = E(X_0)\)，即 \(E(T) = E(\Phi(A_0)) - \Phi(A_T)\)。

四、例题

CF1025G Company Acquisitions

设一个活跃的有 \(x\) 个企业跟随的企业的势能函数为 \(f(x)\)，一个局面的势能函数 \(\Phi(A)\) 为所有活跃企业的势能函数之和。

一次操作势能变化量只与随出的两个企业有关，设两个企业分别有 \(x\) 和 \(y\) 个企业跟随。

\[f(x) + f(y) - 1 = \dfrac{1}{2} \times (f(x + 1) + y \cdot f(0) + f(y + 1) + x \cdot f(0)) \]

由于需要对任意 \(x, y\) 成立，可得：

\[f(x) - \dfrac{1}{2} x \cdot f(0) - \dfrac{1}{2} \cdot f(x + 1) = \dfrac{1}{2} \]

感觉这个 \(f(0)\) 比较突兀，直接钦定 \(f(0) = 0\)，得到：

\[f(x + 1) = 2f(x) - 1 \]

归纳得到 \(f(x) = 1 - 2 ^ x\)，并且 \(\Phi(A_T) = 1 - 2 ^ {n - 1}\) 为常量。

最终计算 \(\Phi(A_0) - \Phi(A_T)\) 即可，时间复杂度 \(\Theta(n)\)。

二项式定理