第二章离散型随机变量连续型随机变量混合型随机变量随机变量及其分布随机变量第一节机动 目录 上页 下页 返回 结束随机变量第二章概率统计是从数量上来研究随机现象统计规律的,为了便于数学上的推导和计算,必须把随机事件数量化,由于随机因素的影响,使试验出现各种不同的结果,因而用来描述随机事件量也随着以偶然的方式取不同的值,当把一个随机试验的不同结果用一个变量来表示时,便得到随机变量。
引入随机变量之后,使我们有可能利用数学分析的方法来研究随机试验。随机变量是研究随机试验的有效工具。
在随机试验完成时,人们常常不是关心试验结果本身,而是对于试验结果联系着的某个数感兴趣。这个数我们称之为随机例 1,在一袋中装有编号分别为 1,2,3的 3只球,在袋中任取一
i
1
j
变量。即随机变量就是“其值随机会而定”的变量,正如随机事件机动 目录 上页 下页 返回 结束是“其发生与否随机会而定”的事件。机会表现为试验结果。
因此又可以说,随机变量就是试验结果的函数。
2 3
4
5
6



1
2
2
3
3
3 4
4 5
球,放回,再取一只球,记录它们的编号,
我们对抽出的两只球的号码之和感兴趣而不关心各只球的号码,试验的样本空间
S={e}={(i,j)},i,j = 1,2,3.这里 i,j 分别表示第一、第二次取到的球的号码。以 X
记两球号码之和,对于每一样本点 e,X 都有一个值与之对应。
例 2,将一枚硬币抛掷 3次观察正面 H﹑ 反面 T出现的情况。
其样本空间 S={HHH,HHT,HTH,THH,HTT,THT,TTH,TTT}。
通常我们感兴趣的是三次投掷中,出现 H的总次数,而对 H,T
在例 1﹑ 例 2中 X是一个实数,它的值依赖于样本点。因而
X是一个函数,它的定义域是样本空间 S。我们有以下定义机动 目录 上页 下页 返回 结束出现的顺序不关心。比如,我们仅关心出现 H的总次数为 2,而不在乎出现的是,HHT”,”HTH”还是,THH”。以 X记三次投掷中出现 H的总次数,那么,对于样本空间 S={e}中的每一个样本点,
X都有一个值与之对应。即有样本点 HHH HHT HTH THH HTT THT TTH TTT
X的值 3 2 2 2 1 1 1 0
由定义知,随机变量的取值既具有 可变性,同时随机变量的定义,设随机试验的样本空间为 S={e},X=X(e)是定义在样本空间 S上的实值单值函数。称 X=X(e)为随机变量。
取值又依赖于试验结果,而试验结果的出现具有一定的概率,
因而随机变量的 取值有一定的概率 。
例如,在例 2中 X取值为 2,
集合 A={HHT,HTH,THH},
A发生时有 {X=2}。我们称概率 P(A)=P{HHT,HTH,THH}
随机变量既有取值的 可变性,又具有取值的 随机性。
记成 {X=2},对应于样本点的这是一个事件,当且仅当事件为 {X=2}的概率,即 P{X=2}=P(A)=3/8。
这种 双重性 正是随机变量与普通变量 (函数 )的本质区别。
机动 目录 上页 下页 返回 结束
1e
2e
3e
4e
1x 2x 3x 4x X
S
第 二 节 第二章随机变量一、超几何分布二、二项分布(两点分布、退化分布)
三、泊松分布四、几何分布五、
六、
常见的随机变量有三种类型,离散型 ﹑ 连续型 与 混合型 。
一,离散型随机变量及其分布律可能取值,1,2,3,4,5,6。在显微镜下观察一张片子上某种细胞个数的随机变量 X(e)的全部可能取值为可列无限多个 (0,1,2,3,…),
随机变量的特点在于它的取值有一定的 概率意义,不是肯定例如,投掷一枚骰子,掷出的点数的随机变量 X(e)只有六个的随机变量,称为离散型随机变量。
定义 1,全部可能取值的数目是有限个或可列无限多个机动 目录 上页 下页 返回 结束它们都是离散型随机变量。人的寿命也是一个随机变量,但是它的取值充满一个区间,无法按一定顺序一一列举出来,故不是离散型随机变量。
地取某一个值,而是以相应的概率取某一个值,所以必须用取值及相应的概率才能完整地表达随机变量。
例如,若出生女性婴儿则 X取值 1,相应的概率约为 0.483,
定义 2,设离散型随机变量 X所有可能取值为分布律也可以用表格的形式来表示:
机动 目录 上页 下页 返回 结束若出生男性婴儿则 X取值 0,相应的概率约为 0.517,
则随机变量 X的取值规律为
X 0 1
P 0.517 0.483
xi ( i = 1,2,…),相应的概率 P {X = xi }= pi
称为离散型随机变量 X的概率函数或分布律。
X x1 x2 … xi …
P p1 p2 … p i …
概率函数具有如下性质:
,2,10)1( ip i,
证明,(1)由概率的非负性即得。
(2) 由于且,,}{}{ jkxXxX
kj
故?


1
}{1
i
ixXP?

1
}{
i
ixXP
1
1
i
ip故机动 目录 上页 下页 返回 结束
.1)2(
1

i
i
p
例 1,给青蛙按每单位体重注射一定剂量的洋地黄。由以往实验知,致死的概率为 0.6,存活的概率为 0.4。今给 2只青蛙注射,求死亡只数的概率函数。
解,死亡只数 X的可能取值为 0,1,2。设 A1,A2 分别表示第一因为 A1,A2 相互独立,根据乘法公式与加法公式有
48.0)()()(}1{ 21212121 AAPAAPAAAAPXP
.36.06.06.0)()()(}2{ 2121 APAPAAPXP
概率函数为所以,
机动 目录 上页 下页 返回 结束第二只青蛙死亡的事件,则样本空间
X 0 1 2
P 0.16 0.48 0.36
说明,由例 1知,要求一个离散型随机变量的分布律,
例 2,一袋中有 4个球,分别标有 1,2,3,4。从中任取取 (3,4)时,X=3。故 X的分布律为:
6/16/26/3
321
P
X
解,X的取值为 1,2,3。每次取 2球,有 C 42 = 6种取法。
机动 目录 上页 下页 返回 结束首先要清楚随机变量 X的取值范围,然后求出概率
P {X = xi }最后写出分布律。
2球,以 X记球上小的号码,求 X的分布律。
取 (1,2),(1,3),(1,4)时,X=1;取 (2,3),(2,4)时,X=2;
例 3.设随机变量 X的所有可能值为整数 1,2,…,10 。
解,设 C 为比例常数,P { X = k }= C k
10
1k
kC,155 C
得,55/1?C
故 X的分布律为,55/}{ kkXP
机动 目录 上页 下页 返回 结束又已知 P { X = k }正比于 k 的值 ( k = 1,2,…,10 ) 。
求 X的分布律。
二,超几何分布超几何分布是一种重要的离散型随机变量分布,常用于其直观背景为,设口袋中有 N个产品,其中 M为废品,从中
n
N
kn
MN
k
M
C
CCkXP }{
例 4 设在人数为 N的人群中做了某种检查,结果有 M例机动 目录 上页 下页 返回 结束药品,疫苗等产品抽查与流行病学的研究。
无放回 抽取 n 个,抽到的废品个数 X 服从超几何分布。
阳性,N-M例阴性。现从该人群中不放回地抽取 n 例,
求 n例中有 k例阳性的概率。
解,自 N例中抽取 n例,共有 CNn 种取法,n例中阳性例数 X=k的情况占 CMk·C N-Mn-k 种,故所求概率为定义 3,若随机变量 X的概率函数为则称 X服从参数为 N,M,n 的超几何分布,
记作 X ~ H ( N,M,n )。
机动 目录 上页 下页 返回 结束三,二项分布二项分布是一种重要的离散型概率分布,在医药学中常用于率 (阳性率,治愈率,有效率 )的研究。
直观背景为,设口袋中有 N个产品,其中 M个为废品,
从中 有放回 抽取 n个,抽到的废品个数 X服从二项分布。
1,Bernoulli试验定义 4,设在同一条件下,单次试验 E只有两种可能结果,
它们的概率将 E独立地重复进行 n次,则称这种独立重复的试验系列为
n 次 Bernoulli 试验 。
机动 目录 上页 下页 返回 结束例 5.已知某药有效率为 0.7,今用该药试治某病 3例。
求无效人数 X的概率函数。
解,X的可能取值为 0,1,2,3。
表示事件,第 i例治疗无效,。
,7.0)()()()(}0{ 3321321 APAPAPAAAPXP
7.03.03)(}2{ 2321321321 AAAAAAAAAPXP
3321321 3.0)()()()(}3{ APAPAPAAAPXP
将上述结果写成表达式为机动 目录 上页 下页 返回 结束类似上例分析,不难得到 n 次 Bernoulli 试验的分布规律。
定理 1,设在一次试验中,事件 A发生的概率为 p (0< p <1),
2,二项分布定义 5,若随机变量 X的概率函数为则称 X服从参数为 n,p的二项分布,记为 X~B(n,p)。
显然,二项分布的概率函数满足,
且机动 目录 上页 下页 返回 结束则在 n次独立重复的试验中,事件 A发生 k次的概率为则称 X服从参数为 p的两点分布 (或 0-1分布 )
3,两点分布注 1:在 Bernoulli试验中,若单次试验,事件 A发生的次数服从二项分布。即若 服从同一两点分布且独立,
nXXXX21 服从二项分布。注 2 二项分布与超几何分布的区别在于,对于有限适用于不放回抽样的情况,但是当 )10(/lim ppNMN
时,可以证明,对于任一正整数 n,有定义 6,如果随机变量 X的概率函数为服从两点分布,则这一试验独立重复 n次,事件 A发生的次数机动 目录 上页 下页 返回 结束总体来说,二项分布适用于有放回抽样的情况,而超几何分布则例 6,据报道,有 10%的人对某药有胃肠道反应。为了考察某厂的产品质量,现任取 5人服用此药。试求 (1)k个人有反应的解,( 1)这里是不放回抽取。但由于大量人群,可以当作有放回抽取来处理。任选 5人服药,每人服药后有反应的概率为
0.1,这相当于独立重复试验 5次。因而有反应的人数 X服从
B(5,0.1)。其概率函数为
( 2)不多于 2人有反应的概率为,P{X≤2}=P 0+P1+P2=0.99144
( 3)有人有反应的概率为说明,二项分布的最可能值概率; (2)不多于 2个人有反应的概率; (3)有人有反应的概率。
机动 目录 上页 下页 返回 结束
X 0 1 2 3 4 5
0.59049 0.32805 0.07290 0.00810 0.00045 0.00001
例 7,某人进行射击,设每次射击的命中率为 0.02,独立射击于是所求的概率为这个概率很接近 1。我们从两方面来讨论这一结果的实际意义尽管在一次试验中发生的概率很小,但只要试验次数很多,而且人们决不能轻视小概率事件。其二,如果射手在 400次射击中击中目标的次数竟不到两次,由于概率 P(X<2) ≈0.003,根据 实际
}2{?XP
399)98.0)(02.0(400?
.400,,1,0,)98.0()02.0(}{ 400400 kCkXP kkk
X ~ B(400,0.02)。 X 的分布律为
1?
.9972.0?
400次,试求至少击中两次的概率。
机动 目录 上页 下页 返回 结束解,将一次射击看成一次试验。设击中的次数为 X,则其一,虽然每次射击的命中率很小 (0.02),但如果射击 400次,则击中目标至少两次是几乎可以肯定的。这一事实说明,一个事件试验是独立的,那么这一事件的发生几乎是肯定的。这也告诉推断原理,我们将怀疑“每次射击的命中率为 0.02”这一假设。
总之,在许多 稀疏现象 中,某事件发生的次数服从或近似定义 7,若随机变量 X的概率函数为
,2,1,0)0(
!
}{ k
k
ekXP k
则称 X服从参数为 λ 的泊松分布,记作,.)(~X
计数结果的分布,放射性物质在单位时间内放射出质点数的四,泊松分布机动 目录 上页 下页 返回 结束泊松分布也是一个典型的离散型分布,由法国数学家泊松
(1837年)提出,常用于单位时间或单位空间内某事件发生次数的分布。例如研究细菌、红细胞、粉尘等在单位面积或容积内分布,在一定人群中生三胞胎数、某少见病数的分布等。
服从泊松分布。
泊松定理,设随机变量 Xn ( n = 1,2,…) 服从二项分布,
其概率函数为这里概率 pn 与 n 有关。若 则有证明略。
由泊松定理知:二项分布的极限分布是泊松分布,
且 因此当 n很大,p很小时,有机动 目录 上页 下页 返回 结束例 7,假如生三胞胎的概率为 10-4,求 105 次分娩中有 0,1,2次生三胞胎的概率。
解,
kkkCkXP 5
5
1044
10 )101()10(}{
,10,,, nppn?且似计算所以可用泊松分布作近很小很大因次生三胞胎的概率为次分娩中有则在 k510
kkkCkXP 5
5
1044
10 )101()10(}{ !
10 10
k
ek

105 次分娩中出现三胞胎次数 X服从二项分布,
机动 目录 上页 下页 返回 结束其中 n = 105,p = 10-4,概率函数五,几何分布例 9,社会上定期发行某种奖券,每券 1元,中奖率为 p 。
定义 8,若随机变量 X的概率函数为则称 X服从几何分布。
解,该人购买次数 X的取值为 1,2,… 。
机动 目录 上页 下页 返回 结束某人每次购买 1张奖券,如果没有中奖下次再继续购买 1张,
直到中奖为止。求该人购买次数 X的分布。
“X=1”表示第一次购买的奖卷中奖,依题意 P{X=1}=p 。
“X=2”表示购买两次奖卷,但第一次未中奖,其概率为 1-p,
而第二次中奖,其概率为 p。由于各期奖卷中奖与否是相互独立的,所以 P{X=2}=(1-p)p。
“X=k”表示购买 k次,前 k-1次都未中奖,而第 k次中奖,
机动 目录 上页 下页 返回 结束