第十五讲 大数定律和中心极限定理
重点,契比雪夫不等式,贝努里大数定律和契比雪夫大数定律,德莫弗--拉普拉斯中心极限定理。
难点:大数定律和中心极限定理
一、大数定律
我们知道,概率论与数理统计是研究随机现象统计规律性的数学分支。但是,只有对大量随机现象进行观测时,随机现象的统计规律性才会呈现出来。为了考察“大量”的随机现象,就导致了极限定理的研究。概率论中极限定理的内容是很广泛的,其中最主要的是大数定律和中心极限定理.
在引入大数定理之前,我们先证明一个重要的定理.
1.切比雪夫不等式
对于任何具有有限方差的随机变量X都有

其中( 是任一正数。
证 设是的分布函数,则显然有

切比雪夫不等式也可以表示成

由于切比雪夫不等式只利用随机变量的数学期望E(X)及方差D(X)就可对X的概率分布进行估计,因此它在理论研究及实际应用中有价值。从切比雪夫不等式还可以看出,当方差越小时,事件{|X- E(X)|≥ε}发生的概率也越小,从而可知,方差确实是一个描述随机变量与其期望值离散程度的一个量。
2,贝努里大定律
设μn是n重贝奴里试验中事件A出现的次数,而p是事件A在每次试验中出现的概率,则对任意ε>0,都有

贝努里大数定律证明了在大量重复实验时,随机事件的频率在它的概率的附近摆动,若事件A的概率很小,则正如贝努里定律所指出的,事件A的频率也很小,或者说事件A很少发生。
设Y1,Y2,…,Yn…是一个互相独立的随机变量序列,a是一个常数,若对于任意正数(,有

则称序列Y1,Y2,…,Yn…依概率收敛于a。
因此,由贝努里大数定律可得:设μn是n次独立试验中事件A出现的次数,而p是事件A在每次试验中出现的概率,则频率依概率收敛于概率。
人们在事件中还发现,除了频率具有稳定性之外,大量观察值的平均值也具有稳定性。这就是切比雪夫大数定律。
3.切比雪夫大数定律
设随机变量X1,X2,…,Xn…相互独立,每一随机变量都有数学期望E(X1),E(X2),…,E(Xn),…和有限的方差D(X1),D(X2),…,D(Xn),…,并且它们有公共上界c,即D(X1)≤c,D(X2)≤c,…,D(Xn)≤c,…,则对任意的( ((,皆有

证 因X1,X2,…,Xn…相互独立,所以


由切比雪夫不等式可得

所以


由切比雪夫大数定律得到 独立同分布大数定律设独立随机变量X1,X2,…,Xn服从同一分布,并且有数学期望及方差,则X1,X2,…,Xn的算术平均值在时,依概率收敛于数学期望,即对任意正数(,有
.
上述结论,是我们关于算术平均值的法则有了理论上的依据。如我们要测量某一物理量,在不便条件下重复进行次,得个测量值X1,X2,…,Xn,显然它们可以看成是个相互独立的随机变量,具有相同的分布,并且有数学期望。由大数定理可知,当充分大时,次测量值得平均值可作为得近似值:

则由此所因发的误差是很小的。
二、中心极限定理
由前几章的讨论可知,正态分布在随机变量的一切可能分布中占有特殊的地位。在客观世界中我们遇到的许多随机变量都是服从或近似服从正态分布的。为什么大量的随机变量都服从正态分布呢?李雅普诺夫证明了在某些一般的充分条件下,当随机变量的个数无限增加时,独立随机变量的和的分布是趋于正态分布的。在概率论中把研究大量独立随机变量和的分布以正态分布为极限的这一类定理统称为中心极限定理。
1.独立同分布的中心极限定理
设随机变量X1,X2,…,Xn…相互独立,服从同一分布,具有有限的数学期望和方差: 则随机变量

的分布函数Fn(x)对任意的 都有

这个定理告诉我们,当n很大时,近似地服从标准正态分布N(0,1) 随机变量近似地服从正态分布。由于期望,方差,故实际上就是的标准化的随机变量。
中心极限定理可以解释如下:假设被研究的随机变量可以表示为大量独立的随变量的和,其中每一个随机变量对于总和的作用都很微小,则可以认为这个随机变量实际上是服从正态分布的。在实际工作中,只要足够大,便可把独立同分布的随机变量之和近似当作正态变量。
2.德莫弗-拉普拉斯中心极限定理
设随机变量服从参数为的二项分布,则对于任一区间,恒有

证 由于服从二项分布的随机变量可视为个相互独立的、服从同一的参数的(0-1)分布的随机变量X1,X2,…,Xn之和,即,其中。由独立同分布中心极限定理可得

于是对于任意区间有

此定理表明,正态分布是二项分布的极限分布。当充分大时,服从二项分布的随机变量的概率计算可以转化为正态随机变量的概率计算:

例1现有一大批种子,其中良种占1/6,今从其中任意选6000粒,试问在这些种子中,良种所占的比例与1/6之差小于1%的概率是多少?
解 选一粒良种看成是一次随机试验,因此选6000粒种子看作是6000重贝努里试验。若令表示6000粒种子中的良种数,则服从的二项分布,故由中心极限定理可得

本例是中心极限定理的应用之一。
例2设某集成电路出厂时一级品率为0.7,装配一台仪器需要100只一级品集成电路,问购置多少只才能以99.9%的概率保证装该仪器是够用(不能因一级品不够而影响工作)。
解 设购置只,并用随机变量表示只中非一级品的只数;现要求购置的之集成电路中一级数不少于100只,亦即非一级品数的概率。由有题意知,非一级品率为0.3,则

查表得,即,解之得,即至少要购置168只