随机现象域统计规律性
随机现象
-
确定性现象:可以确定在一定条件下某种现象必定发生或者必定不会发生
- 必然事件:一定会发生,例如太阳一定会东升西落
- 不可能事件:一定不会发生,例如家猪会飞上天
-
随机现象:在一定条件下,某种事件可能发生也可能不发生
-
随机试验(random experiment):对于随机现象,在基本相同的条件下,重复进行试验或者观察,可能出现不同的结果(但是结果的所有可能是知道的,不知道出现哪一种可能)
-
随机试验的结果称为随机事件(random event),简称事件
概率的统计定义
相同条件下重复N次试验,各次试验互不影响,事件A出现的次数(频数)n,称
FN(A)=Nn
为 A 在 N 次试验中出现的 频率 (frequency)
N足够大时频率会趋向于一个常数,称为 概率 (probability),记为P(A),概率可以表示事件A在一次试验中发生的可能性的大小
-
非负性:∀A∈F,P(A)⩾0
-
规范性:P(Ω)=1
-
可列可加性:Ai∩Aj=∅,i=j (即 A1,⋯,An,⋯ 为两两不相容的事件)
P(n=1∑∞An)=n=1∑∞P(An)
古典概型
样本空间和样本点
样本空间和样本点是概率论和统计学中的两个基本概念。
样本空间(Sample Space)
样本空间是指在一次试验或随机事件中,所有可能的结果的集合。用符号 S 或 Ω 表示。例如:
- 掷一枚硬币:样本空间是硬币的所有可能结果,记作 S={正面,反面} 或 S={H,T}。
- 掷一颗骰子:样本空间是骰子的所有可能结果,记作 S={1,2,3,4,5,6}。
样本点(Sample Point)
样本点是样本空间中的一个元素,表示一次试验的一个可能结果。样本点是样本空间的一个具体结果。例如:
-
在掷一枚硬币的试验中,样本空间为 S={H,T},其中 H 和 T 就是样本点。
-
在掷一颗骰子的试验中,样本空间为 S={1,2,3,4,5,6},其中 1,2,3,4,5,6 都是样本点。
-
样本空间 是所有可能结果的集合。
-
样本点 是样本空间中的一个单一结果。
古典概型
- 样本空间中样本点有限,Ω={ω1,ω2,⋯,ωn}
- 各基本事件等可能,即 P(ω)=n1
古典概率(classical probability)的计算:
P(A)=nm=样本空间中样本点总数A 包含的样本点数
有 n 个球,N 个格子 (n⩽N),球与格子都是可以区分的。每个球落在各格子的概率相同 (设格子足够大,可以容纳任意多个球)。将这 n 个球随机地放入 N 个格子,求:
- 指定的 n 格各有一球的概率;
- 有 n 格各有一球的概率。
把球编号为 1∼n,n 个球的每一种放法是一个样本点,这属于古典概型。由于一个格子可容纳任意多球,样本点总数应该是从 N 个中取 n 个的重复排列数 Nn。
- 记 A={指定的 n 格各有一球},它包含的样本点数是指定的 n 格中 n 个球的全排列数 n!,故:
P(A)=Nnn!.
- 记 B={有 n 格各有一球},它所包含的样本点数是 N 格中任取 n 格的全排列数 PNn,故:
P(B)=NnPNn=NnN(N−1)⋯(N−n+1)=(1−N1)(1−N2)⋯(1−Nn−1).
注意到 log(1−x)=−x+O(x2),,x→0。我们有:
log(1−N1)+log(1−N2)+⋯+log(1−Nn−1)=k=1∑n−1log(1−Nk)=−k=1∑n−1Nk+O(N2n3).
故当 N 比 n 大得多时,我们可以采用近似计算公式:
P(B)≈exp{−2Nn(n−1)}.
几何概型
- 样本空间中样本点无限
- 样本点落在等测度(长度、面积、体积...)区域的概率相等
几何概型的计算:
P(Ag)=Ω 的测度g 的测度
Ag={任取样本点,位于区域 g∈Ω 的概率}
平面上画很多平行线,间距为 a。向此平面投掷长为 l(l<a) 的针,求此针与任一平行线相交的概率
以针的任一位置为样本点,它可以由两个参数决定:针的中点与最近的平行线之间的距离 x,针与平行线的夹角 φ。
样本空间:
Ω={(φ,x)∣0⩽φ⩽π,0⩽x⩽2a}
为一矩形。针与平行线相交的区域是:
g={(φ,x)∣x⩽2lsinφ}(见图).

所求概率是:
P=Ω的面积g的面积=π(a/2)∫0π2lsinφdφ=aπ2l.
左图:a为平行线间距,l为针长,x为距离,φ为角度
右图:x=2lsinφ
因为概率 P 可以用多次重复试验的频率来近似,所以可以得到它的近似值。方法是重复投针 N 次(或一次投针若干枚,总计 N 枚),统计与平行线相交的枚数 n,则 P≈n/N。
又因为 l⩽a 且可精确测量,故从 2l/aπ≈n/N 可解得 π≈2lN/an。历史上有人不止一次做过这个试验,做得最好的一个投掷了 3408 次,算得 π≈3.1415929,其精确度已经达到小数点后第六位。
设计一个随机试验,通过大量重复试验得到某种结果,以确定我们感兴趣的某个量,由此而发展的蒙特卡洛(Monte-Carlo)方法为这种计算提供了一种途径。随着电子计算机的发展,基于随机试验法的内容,得使这种方法变得非常有效。
概率的公理化定义
把样本空间看做全集,事件看作包含样本点的集合,可以采用集合论的方法来研究事件
有事件之间的中的
- 包含
- 相等
- 并(至少一个发生)
- 交(同时发生)
- 差(A 差 B,A发生但B不发生A差B=AB)
- 互不相容(A∩B=∅)
- 互逆事件(A∩B=∅ 且 A∪B=Ω)
事件的关系与运算满足集合论中有关集合运算的一切性质(交换律,结合律,分配律,De Morgan律)
概率空间
第一个要素为样本空间 Ω,是样本点 ω 的全体,根据问题需要事先取定。
第二个要素为事件域 F,是 Ω 中某些满足下列条件的子集的全体所组成的集类:
- Ω∈F;
- 若 A∈F,则 Ac∈F;
- 若 A1,A2,…,An,…∈F,则 ⋃n=1∞An∈F。
满足这三个条件的 F 称为 Ω 上的 σ-代数或 σ-域。 F 中的元素(Ω 的子集)称为事件。
由这三个条件,可以推得事件域有下列性质:
-
∅∈F (因 ∅=Ωc);
-
若 A1,…,An,…∈F,则 ⋂n=1∞An∈F (因 ⋂n=1∞An=(⋃n=1∞Anc)c);
-
若 A1,…,An∈F,则 ⋃k=1nAk∈F,⋂k=1nAk∈F。
事件域也可以根据问题选择。因为对同一个样本空间 Ω,可以有很多 σ -代数。例如最简单的是
F1={∅,Ω}
复杂的如
F2={Ω的一切子集}+
也是σ-代数,所以要适当选择。特别地,若Ω为有限或可列个样本点组成,则常取Ω的一切子集所成的集类作为
F
像在古典概率中那样。不难验证,F是σ-代数。
若 Ω=R(一维实数全体),此时常取一切左开右闭有界区间和它们的(有限或可列)并、(有限或可列)交、逆所成的集的全体为F(通常记为B),称为一维波雷尔(Borel)σ-代数,其中的集称为一维波雷尔集,它是比全体区间大得多的一个集类。
若Ω=Rnn维实数全体),则常取一切左开右闭有界n维矩形和它们的(有限或可列)并、(有限或可列)交、逆所成的集的全体为F(通常记为Bn),它包含了我们感兴趣的所有情形,称为n维波雷尔σ-代数。
如果我们对Ω的某个子集类C感兴趣,所选的事件域F可以是包含C的最小σ-代数,这种σ-代数是存在的,因为:
- 至少有一个包含C的σ-代数,即上述F2;
- 若有很多包含C的σ-代数,则它们的交也是σ-代数,且就是最小的。
特别地,如果我们只对Ω的一个子集A感兴趣,则包含A的最小σ-代数就是
F={∅,A,Ac,Ω}.
概率是F上的实值集函数 A(∈,F)→P(A),并且满足非负性,规范性,可列可加性三个条件(公理)
满足这些定义的概率测度 P 应满足的基本公式有以下式:
-
P(∅)=0.
-
若 Ai;Aj=∅,i,j=1,2,…,n,i=j, 则
P(i=1∑nAi)=i=1∑nP(Ai).
-
P(A)=1−P(Ac).
-
若 B⊆A, 则 P(A−B)=P(A)−P(B).
-
P(A∪B)=P(A)+P(B)−P(AB).
-
P(A\B)=P(A)−P(AB)
-
(多还少补定理,容斥原理)
P(A1∪A2∪…∪An)=i=1∑nP(Ai)−1⩽i<j⩽n∑P(AiAj)+…+(−1)n−1P(A1A2…An).
P(A1∪A2∪…∪An)=i=1∑nP(Ai)−1⩽i<j⩽n∑P(AiAj)+…+(−1)n−1P(A1A2…An)
- 验证基例 n=1
当 n=1 时,定理变为:
P(A1)=P(A1)
显然这是正确的,所以基例成立。
- 归纳假设
假设对于 n=k 时,定理成立,即:
P(A1∪A2∪…∪Ak)=i=1∑kP(Ai)−1⩽i<j⩽k∑P(AiAj)+…+(−1)k−1P(A1A2…Ak)
- 证明 n=k+1 时的情形
现在我们需要证明,当有 k+1 个事件 A1,A2,…,Ak+1 时,定理同样成立。
首先考虑 P(A1∪A2∪…∪Ak+1):
P(A1∪A2∪…∪Ak+1)=P((A1∪A2∪…∪Ak)∪Ak+1)
利用概率的加法原理,有:
P((A1∪A2∪…∪Ak)∪Ak+1)=P(A1∪A2∪…∪Ak)+P(Ak+1)−P((A1∪A2∪…∪Ak)Ak+1)
根据归纳假设,P(A1∪A2∪…∪Ak) 可以展开为:
P(A1∪A2∪…∪Ak)=i=1∑kP(Ai)−1⩽i<j⩽k∑P(AiAj)+…+(−1)k−1P(A1A2…Ak)
因此,原式变为:
P(A1∪A2∪…∪Ak+1)=i=1∑kP(Ai)−1⩽i<j⩽k∑P(AiAj)+…+(−1)k−1P(A1A2…Ak)+P(Ak+1)−P((A1∪A2∪…∪Ak)Ak+1)
注意,P((A1∪A2∪…∪Ak)Ak+1) 可以展开为:
P((A1∪A2∪…∪Ak)Ak+1)=i=1∑kP(AiAk+1)−1⩽i<j⩽k∑P(AiAjAk+1)+…+(−1)k−1P(A1A2…AkAk+1)
将其代入之前的公式中,得到:
P(A1∪A2∪…∪Ak+1)=i=1∑k+1P(Ai)−1⩽i<j⩽k+1∑P(AiAj)+…+(−1)kP(A1A2…Ak+1)
这正是我们需要证明的 n=k+1 的情形。
P(A1∪A2∪…∪An)⩽i=1∑nP(Ai).
概率测度的连续性
给定一概率空间 (Ω,F,P),假设 A1,A2,… 是一列单调增加的事件序列,即
A1⊂A2⊂⋯⊂An⊂⋯
记 A=⋃n=1∞An,称 A 为 An 的极限。从公理化定义可以看出,A 仍然是一个事件。下面定理给出该事件的概率大小。
如果 A1,A2,… 是一列单调增加的事件序列,具有极限 A,那么,
P(A)=n→∞limP(An).
事件的上极限和下极限
事件是样本点的集合,事件的上级限和下极限是事件的集合的极限。
对于一个集合序列,我们定义其上极限和下极限如下:
设 {An}n=1∞ 是一列事件序列,定义
n→∞limsupAn=n=1⋂∞k=n⋃∞Ak
为事件 An 的上极限,而
n→∞liminfAn=n=1⋃∞k=n⋂∞Ak
为事件 An 的下极限。
其实理解起来也是不困难的,对于上极限
可以设Bn=⋃k=n∞Ak,则B1⊃B2⊃⋯,即Bn是单调递减的(因为参与并的集合越来越少了),我们取这个单调递减的序列的交(也就相当于取极限,从最大的开始不断剔除里面多余的元素),就是上极限
而对于下极限,我们可以设Cn=⋂k=n∞Ak,则C1⊂C2⊂⋯,即Cn是单调递增的(因为参与交的集合越来越少了),我们取这个单调递增的序列的并(也就相当于取极限,从最小的开始不断添加里面缺失的元素),就是下极限
A1A2A3A4Ak={1,2,3}={2,3,4}={3,4}={2,4}={2,3,4}或者{3,4}或者{2,4}k⩾4
则有
上极限:limsupn→∞An={2,3,4}
下极限:liminfn→∞An={4}
条件概率和链式法则
事件 B 发生条件下事件 A 发生的概率,称为事件 A 关于事件 B 的 条件概率 (conditional probability)
有基本公式:
P(A∣B)=P(B)P(AB)
也可以表示为 链式法则(乘法公式) 的形式:
P(AB)=P(A∣B)P(B)
推广到 n 个事件,有链式法则:
P(i=i∏nAi)=i=1∏nP(Aij=1∏i−1Aj)
特别定义 a>b 时,∏i=abAi 为必然事件。
P(A1A2⋯An)=P(A1)⋅P(A2∣A1)⋅P(A3∣A1A2)⋯P(An∣A1A2⋯An−1)
全概率公式
在概率空间 (Ω,F,P) 中,若事件 {A1,A2,⋯,An}(n<∞ 或 n=∞) 满足:
- Ai 两两互不相容(不可能同时发生),且 P(Ai)>0
- ∑i=1∞Ai=Ω
则称 {A1,A2,⋯,An} 构成 Ω 的一个 分割(完备事件组)
在概率空间 (Ω,F,P) 中,若 {A1,A2,⋯,An}(n<∞ 或 n=∞) 构成 Ω 的一个 分割(完备事件组) ,
则有 全概率公式 成立:∀B∈F,有
P(B)=i=1∑nP(Ai)P(B∣Ai)
P(B)=P(BΩ)=P(Bi=1∑nAi)=P(i=1∑nBAi)=i=1∑nP(BAi)=i=1∑nP(Ai)P(B∣Ai)
贝叶斯公式
P(Ai∣B)=∑k=1∞P(Ak)P(B∣Ak)P(Ai)P(B∣Ai)
P(Ai∣B)=P(B)P(AiB),分子用链式法则展开,分母用全概率公式展开。
P(Ai):不知 B 是否发生,称为 先验 (priori) 概率
P(Ai∣B):以 B 发生为已知条件,称为 后验 (posteriori) 概率
事件独立性
两个事件的独立性
称事件 A 与事件 B 相互独立(统计独立,statistical independence),如果满足
P(AB)=P(A)⋅P(B)
因为此时有
P(A∣B)=P(B)P(AB)=P(A)
且
P(B∣A)=P(A)P(AB)=P(B)
如果 A 与 B 不相互独立,也称为 统计相依 (statistical dependence)
多个事件的独立性
对于一组事件 A1,A2,⋯,An,存在两两独立和整体的相互独立两种概念。
不妨先以三个事件 A,B,C 为例进行研究。
同时满足两两独立和整体的相互独立,才能说 A,B,C 相互独立。
且A与BC的并,交,差等也是独立的。
推广到 n 个事件,A1,A2,⋯,An 相互独立需要满足:∀r<n,A1,A2,⋯,An 中任意 r 个事件都相互独立,且
P(i=1∏nAi)=i=1∏nP(Ai)
或者可以直接这么定义:A1,A2,⋯,An 相互独立,如果
P \left( \prod_{i=1}^r A_{n_i} \right) = \prod_{i=1}^r P(A_{n_i}),\;
1 \leqslant n_1 < n_2 < \cdots <n_r \leqslant n$
伯努利试验
伯努利概型(Bernoulli trial)是概率论中的一个基本概念,它描述了只有两个可能结果的随机试验,通常称为“成功”和“失败”。每次试验都是独立的,并且每次成功的概率都是相同的,记作 p,而失败的概率则为 1−p。
伯努利概型的特点包括:
- 只有两个结果:每次试验的结果只能是成功或失败。
- 独立性:每次试验的结果不会影响其他试验。
- 固定的成功概率:每次试验中成功的概率 p 是不变的。
伯努利概型常用于建模各种现实情况,比如抛硬币、调查投票等。在多个伯努利试验的基础上,有二项分布
二项分布(Binomial distribution)是n重伯努利试验成功次数的离散概率分布,记作B(n,p)。
P(X=k)=(kn)pk(1−p)n−k
其中,(kn) 是组合数,表示从 n 次试验中选择 k 次成功的方式总数。二项分布适用于描述在 n 次独立的伯努利试验中,成功发生的次数。
一枚硬币抛 10 次,求恰好 3 次正面朝上的概率。
这是一个二项分布问题,其中 n=10,k=3,p=0.5。代入公式,有:
P(B3)=(310)×0.53×0.510−3=0.1172.
所以恰好 3 次正面朝上的概率是 0.1172。
乘积概率空间
设有两个概率空间 (Ω1,F1,P1) 和 (Ω2,F2,P2),对应试验为 E1 和 E2,独立地做两个试验,记录其结果为 (ω1,ω2),则称 (Ω1×Ω2,F1×F2,P1×P2) 为 (Ω1,F1,P1) 和 (Ω2,F2,P2) 的 乘积概率空间。
其中事件事件 A
A={(ω1,ω2)∣ω1∈A1,ω2∈A2}
其概率
P(A)=P(A1)P(A2)
ad>bc;eh>fg;(a+e)(d+h)<(b+f)(c+g)
约束条件为
a+b+c+d+e+f+g+h=1a,b,c,d,e,f,g,h>0