概率空间

发布时间 2023-09-13 15:27:48作者: DennyQi

有关概率的概念通常是难以直观地加以解释地,直观常常会犯错。因此为了看清概率论的全貌,我们首先要了解概率论的基本概念和公理。

概率空间包括三部分:样本空间、事件集和概率测度。我们在离散情形下对此已经有一定了解了。下面我们给出连续情形下概率空间的定义。

algebra与\(\sigma\)-algebra

首先定义二元组\((\Omega,\mathcal{F})\),其中\(\Omega\)是样本集,\(\mathcal{F} \subseteq 2^\Omega\)称为事件集。如果\((\Omega,\mathcal{F})\)满足以下三个条件就称它为一个algebra:①\(\empty \in \mathcal{F}\);②\(A \in \mathcal{F} \Rightarrow A^C \in \mathcal{F}\);③\(A,B \in \mathcal{F} \Rightarrow A \cup B \in \mathcal{F}\)。这正是离散的概率空间需要满足的三条公理,离散概率空间可以用algebra来描述。

如果把第三个条件\(A,B \in \mathcal{F} \Rightarrow A \cup B \in \mathcal{F}\)加强为\(A_1,A_2 \cdots \in \mathcal{F} \Rightarrow \bigcup\limits_{i \geq 1} A_i \in \mathcal{F}\),就称这样的\((\Omega,\mathcal{F})\)\(\sigma\)-algebra。即事件集中可数个事件的并依然在事件集中。取\(\Omega=\R\)\(\mathcal{F}\)\(\R\)中所有的可数集,那么\((\Omega,\mathcal{F})\)构成了一个\(\sigma\)-algebra,因为可数个可数集的并依然是可数集。但如果\(\mathcal{F}\)\(\R\)中所有的有限集,这就不是\(\sigma\)-algebra了,因为可数个有限集的并可能是无限的,它只是一个algebra。

显然\(\sigma\)-algebra满足\(A_1,A_2 \cdots \in \mathcal{F} \Rightarrow \bigcap\limits_{i \geq 1} A_i \in \mathcal{F}\);其次,如果有多个(不一定可数)\(\sigma\)-algebra\(\{\mathcal{F}_\alpha\}\),那么\(\bigcap\limits_{\alpha}\mathcal{F}_\alpha\)一定也是一个\(\sigma\)-algebra(根据定义验证三条性质即可)。根据这两条性质我们可以定义一个新的概念:对于任意集合\(C\subseteq 2^\Omega\),我们可以定义\(\sigma(C)\)表示包含\(C\)的最小\(\sigma\)-algebra,称这是由\(C\)生成的\(\sigma\)-algebra。最小就是指任何其任何真子集的\(\sigma\)-algebra都不能包含\(C\),它其实等价于所有包含\(C\)\(\sigma\)-algebra的交(我们已经证明了\(\sigma\)-algebra的交依然是\(\sigma\)-algebra)。这样的集合一定是存在的,因为\(2^\Omega\)本身就是一个满足条件的\(\sigma\)-algebra。由此再引入一个重要的概念:对于一个区间\(I\),定义Borel Set \(B(I)\)\(I\)上所有的开区间生成的\(\sigma\)-algebra。

概率测度\(P\)就是\(\mathcal{F} \to \R\)的映射,它要满足三条公理:①\(\forall A \in \mathcal{F},P(A) \geq 0\);②\(P(\Omega)=1\);③\(A_1,A_2,\cdots\)无交,则\(P(\bigcup\limits_{i} A_i)=\sum\limits_{i} P(A_i)\)

最终,对于\(\sigma\)-algebra \(\mathcal{F}\),定义三元组\((\Omega,\mathcal{F},P)\)为概率空间。

在这样的定义下,我们可以看到在整个自然数集上uniformly at random选择一个自然数是不可能的。因为如果可能,那么\(\Omega=\N\),其概率测度需要满足\(P(\Omega)=1=\sum\limits_{i \geq 0}P(i)\),既然\(P(i)\)全部相等,又不可能为0,对其求和必然趋向无穷大,因此我们证明了满足条件的概率空间是不存在的。这就是公理化的好处。我们还可以证明在\([0,1]\)上u.a.r.选择一个实数是不可能的:不妨设\(\Omega=[0,1)\),我们对于任意一个实数\(x\)选出所有与它差值为有理数的数放入同一个集合(等价类),这样\([0,1)\)就被分划为了许多等价类,不同等价类中的任意两个元素间隔都是无理数。现在我们从每个等价类里任意挑选一个元素出来,构成集合\(N\)(这样定义的集合是存在的,依据是“选择公理”)。对于\(r \in \Q \cap [0,1]\),定义\(N_r=\{(x+r) \mod 1 \mid x \in N\}\),它是\(N\)“平移”\(r\)之后的集合。我们发现任意整数\(z\)都存在且只存在于某一个\(N_r\)中,因为首先所有的等价类覆盖住了\([0,1)\),一定存在一个有理数使得\(z\)平移那么多距离就落在了选进\(N\)的那个点上,其次如果\(z\)同时存在于两个\(N_r\)中,这两个\(N_r\)之间就有元素差值为有理数,这意味着\(N\)中存在两个数差值为有理数,这是不可能的。于是\(N_r\)可以被看作\([0,1)\)的分划了。这样就有\(P([0,1))=\sum\limits_{r}P(N_r)\),不同的\(P(N_r)\)间没有理由有所差别,而\(r\)又有无穷多个,我们再次用同样的方法证明了这样的概率空间是不存在的。