第五章 误差及分析数据的处理第一节 概述
误差客观存在
定量分析数据的归纳和取舍(有效数字)
计算误差,评估和表达结果的可靠性和精密度
了解原因和规律,减小误差,测量结果 →真值第二节 测量误差一,误差分类及产生原因二,误差的表示方法三,误差的传递四,提高分析结果准确度的方法一、误差分类及产生原因
(一)系统误差及其产生原因
(二)偶然误差及其产生原因
(一) 系统误差 (可定误差),
由可定原因产生
1.特点:具单向性(大小、正负一定 )
可消除(原因固定)
重复测定重复出现
2,分类:
( 1) 按来源分
a.方法误差:方法不恰当产生
b.仪器与试剂误差:仪器不精确和试剂中含被测组分或不纯组分产生
c,操作误差,操作方法不当引起
( 2) 按数值变化规律分
a,恒定误差
b,比值误差
(二) 偶然误差 (随机误差,不可定误差):
由不确定原因引起特点:
1)不具单向性 ( 大小,正负不定 )
2)不可消除 ( 原因不定 )
但可减小 ( 测定次数 ↑)
3) 分布服从统计学规律 ( 正态分布 )
二、误差的表示方法
( 一 ) 准确度与误差
( 二 ) 精密度与偏差
( 三 ) 准确度与精密度的关系
(一 )准确度与误差
1,准确度,指测量结果与真值的接近程度
2,误差
( 1) 绝对误差,测量值与真实值之差
( 2) 相对误差,绝对误差占真实值的百分比
x
RE x%100% 100%
RE x% 100%
注,1)测高含量组分,RE可小;测低含量组分,RE可大
2)仪器分析法 —— 测低含量组分,RE大化学分析法 —— 测高含量组分,RE小注,μ 未知,δ 已知,可用 χ 代替 μ
(二)精密度与偏差
1,精密度,平行测量的各测量值间的相互接近程度
2.偏差:
( 1)绝对偏差,单次测量值与平均值之差
( 2) 相对偏差:绝对偏差占平均值的百分比
d x xi
d
x
x x
x
i100% 100%
( 5)标准偏差:
( 6)相对标准偏差(变异系数)
续前 ( 3)平均偏差:各测量值绝对偏差的算术平均值
( 4) 相对平均偏差:平均偏差占平均值的百分比
n
xx
d i?
%1 0 0%1 0 0?
xn
xxi
x
d
n
x
n
i
i
x
1
2)(?
1
)(
1
2
n
xx
S
n
i
i
x
R S D Sxx 100%
μ 未知μ 已知
(三)准确度与精密度的关系
1,准确度高,要求精密度一定高但精密度好,准确度不一定高
2,准确度反映了测量结果的正确性精密度反映了测量结果的重现性练习例:用丁二酮肟重量法测定钢铁中 Ni的百分含量,结果为 10.48%,10.37%,10.47%,10.43%,10.40%;计算单次分析结果的平均偏差,相对平均偏差,标准偏差和相对标准偏差。
解,%43.10?x
%036.05 %18.0 n
d
d i
%35.0%100%43.10 %036.0%100xd
%046.0106.44106.81 4
72
n
d
s i
%44.0%10043.10 %046.0%100xs
三、误差的传递
( 一 ) 系统误差的传递
(二)偶然误差的传递
R f x y z? (,,)R x y z,,,
1,加减法计算
2,乘除法计算
R ax by cz
R x y za b c
R m x y z
R x y zR x y z/
1,加减法计算
2,乘除法计算
R f x y z? (,,) zyx SSS,,
R ax by cz
2222222 zyxR ScSbSaS
R m x y z
22222222 / zSySxSRS zyxR
标准差法练习例:设天平称量时的标准偏差 s = 0.10mg,求称量试样时的标准偏差 sm 。
解,mgssssmmm
m 14.02,2222121
练习例:用移液管移取 NaOH溶液 25.00mL,以 0.1000mol/L的
HCL溶液滴定之,用去 30.00mL,已知用移液管移取溶液的标准差 s1=0.02mL,每次读取滴定管读数的标准差 s2=0.01mL,假设 HCL溶液的浓度是准确的,
计算标定 NaOH溶液的标准偏差?
解:
Lm o lV VCC
N a O H
H C LH C L
N a O H /1200.000.25
00.301000.0
2
2
2
2
2
1
2
1
2
2
2
V
s
V
s
C
s
N a O H
C
44
22
101.1102.912.030 01.0225 02.0
N a O HC Cs
四、提高分析结果准确度的方法
1,选择合适的分析方法例,测全 Fe含量
K2Cr2O7法 40.20% ± 0.2%× 40.20%
比色法 40.20% ± 2.0%× 40.20%
2,减小测量误差
1) 称量例,天平一次的称量误差为 0.0001g,两次的称量误差为
0.0002g,RE% 0.1%,计算最少称样量?
RE w%,,2 0 0001 100% 0 1%
gw 2 0 0 0.0
续前
2) 滴定例,滴定管一次的读数误差为 0.01mL,两次的读数误差为
0.02mL,RE% 0.1%,计算最少移液体积?
3,增加平行测定次数,一般测 3~ 4次以减小偶然误差
4,消除测量过程中的系统误差
1) 校准仪器:消除仪器的误差
2) 空白试验:消除试剂误差
3) 对照实验:消除方法误差
4) 回收实验:加样回收,以检验是否存在方法误差
mLV 20
RE V%,,2 0 01 100% 0 1%
第三节 有效数字及其运算规则一,有效数字二,有效数字的修约规则三,有效数字的运算法则一,有效数字,实际可以测得的数字
1,有效数字位数包括所有准确数字和一位欠准数字例:滴定读数 20.30mL,最多可以读准三位第四位欠准 ( 估计读数 ) ± 1%
2,在 0~9中,只有 0既是有效数字,又是无效数字例,0.06050 四位有效数字定位 有效位数例,3600 → 3.6× 103 两位 → 3.60× 103 三位
3,单位变换不影响有效数字位数例,10.00[mL]→0.001000[L] 均为四位续前
4,pH,pM,pK,lgC,lgK等对数值,其有效数字的位数取决于小数部分(尾数)数字的位数,整数部分只代表该数的方次例,pH = 11.20 → [H+]= 6.3× 10-12[mol/L] 两位
5,结果首位为 8和 9时,有效数字可以多计一位例,90.0%,可示为四位有效数字例,99.87% →99.9% 进位二、有效数字的修约规则
1,四舍六入五留双
2,只能对数字进行一次性修约
3,当对标准偏差修约时,修约后会使标准偏差结果变差,从而提高可信度例,s = 0.134 → 修约至 0.14,可信度 ↑
例,0.37456,0.3745 均修约至三位有效数字例,6.549,2.451 一次修约至两位有效数字
0.3740.375
6.5 2.5
三、有效数字的运算法则
1,加减法:以小数点后位数最少的数为准 ( 即以绝对误差最大的数为准 )
2,乘除法:以有效数字位数最少的数为准 ( 即以相对误差最大的数为准 )
例,50.1 + 1.45 + 0.5812 =?
δ ± 0.1 ± 0.01 ± 0.0001
52.1
例,0.0121× 25.64 × 1.05782 =?
δ ± 0.0001 ± 0.01 ± 0.00001
RE ± 0.8% ± 0.4% ± 0.009%
0.328
保留三位有效数字保留三位有效数字第四节 偶然误差的正态分布一,偶然误差的正态分布和标准正态分布二,偶然误差的区间概率一、偶然误差的正态分布和标准正态分布正态分布的概率密度函数式
1,x 表示测量值,y 为测量值出现的概率密度
2.正态分布的两个重要参数
( 1) μ为无限次测量的总体均值,表示无限个数据的集中趋势 (无系统误差时即为真值)
( 2) σ是总体标准差,表示数据的离散程度
3,x -μ为偶然误差
y f x e
x
( )
( )1
2
2
22
正态分布曲线 —— x ~ N(μ,σ2 )曲线
x =μ时,y 最大 →大部分测量值集中在算术平均值附近
曲线以 x =μ的直线为对称 →正负误差出现的概率相等
当 x →﹣ ∞或 ﹢ ∞时,曲线渐进 x 轴,
小误差出现的几率大,大误差出现的几率小,极大误差出现的几率极小
σ↑,y↓,数据分散,曲线平坦
σ↓,y↑,数据集中,曲线尖锐
测量值都落在- ∞~+ ∞,总概率为 1
y f x e
x
( )
( )1
2
2
22
x
2
1)( xfy
以 x-μ~ y作图特点标准正态分布曲线 —— x ~ N(0,1 )曲线
xu令 2
2
2
1)( uexfy
dudx又 duuduedxxf
u
)(
2
1)( 2
2
2
2
2
1)( ueuy
即以 u ~ y作图
注,u 是以 σ为单位来表示随机误差 x -μ
二、偶然误差的区间概率
从- ∞~+ ∞,所有测量值出现的总概率 P为 1,即
偶然误差的区间概率 P—— 用一定区间的积分面积表示该范围内测量值出现的概率标准正态分布 区间概率 %
1,1 xu %26.68
64.1,64.1 xu %90
96.1,96.1 xu %95
121)( 2
2u
eduu
2,2 xu %5.95
58.2,58.2 xu %0.99
3,3 xu %7.99
uu ~
正态分布概率积分表练习例:已知某试样中 Co的百分含量的标准值为 1.75%,
σ=0.10%,又已知测量时无系统误差,求分析结果落在 (1.75± 0.15)% 范围内的概率。
解:
5.1%10.0 %15.0%75.1 xxu
%64.868664.04332.02 P查表练习例:同上题,求分析结果大于 2.0% 的概率 。
解,5.2
%10.0
)%75.100.2(
xu
%38.494 9 3 8.0,5.2~0,Pu 时从当查表可知
%62.0%38.49%00.50'%0.2 P的概率为分析结果大于第五节 有限数据的统计处理和 t分布一,正态分布与 t 分布区别二,平均值的精密度和平均值的置信区间三,显著性检验一、正态分布与 t 分布区别
1,正态分布 —— 描述无限次测量数据
t 分布 —— 描述有限次测量数据
2,正态分布 —— 横坐标为 u,t 分布 —— 横坐标为 t
3,两者所包含面积均是一定范围内测量值出现的概率 P
正态分布,P 随 u 变化; u 一定,P一定
t 分布,P 随 t 和 f 变化; t 一定,概率 P与 f 有关,
xu
s
xt
1 nf utf注:
为总体均值?
为总体标准差?
差为有限次测量值的标准 s
两个重要概念
置信度 (置信水平) P,某一 t 值时,测量值出现在
μ± t?s范围内的概率
显著性水平 α:落在此范围之外的概率
fttP,下,一定值的,自由度为表示置信度为值的,自由度为表示置信度为
tt
tt
4%99
10%95
4,01.0
10,05.0
P 1?
二、平均值的精密度和平均值的置信区间
1,平均值的精密度 ( 平均值的标准偏差 )
注:通常 3~4次或 5~9次测定足够
nx
x xsn,n抽出样本总体?
例:
n
ss x
x?
n?4 xx ss
2
1? n?25
xx ss 5
1?
总体均值标准差与单次测量值标准差的关系有限次测量均值标准差与单次测量值标准差的关系续前
2,平均值的置信区间
( 1) 由单次测量结果估计 μ的置信区间
( 2) 由多次测量的样本平均值估计 μ的置信区间
( 3) 由少量测定结果均值估计 μ的置信区间
ux
n
uxux x
n
stxstx x
x
n
stxstx x
fxf,,
总体平均值
有限次测量均值?x
续前
置信区间,一定置信度下,以测量结果为中心,包括总体均值的可信范围
平均值的置信区间,一定置信度下,以测量结果的均值为中心,包括总体均值的可信范围
置信限:
结论,
置信度越高,置信区间越大,估计区间包含真值的可能性 ↑
置信区间 —— 反映估计的精密度置信度 —— 说明估计的把握程度
u ux xst
注意:
( 1) 置信区间的概念,μ为定值,无随机性
( 2) 单侧检验和双侧检验单侧 —— 大于或者小于总体均值的范围双侧 —— 同时大于和小于总体均值的范围练习例 1:
%95
%10.0%50.47
在内的概率为包括总体均值的区间内理解为在
解:
%95%10.0%50.47 P置信度?如何理解练习例 2:对某未知试样中 CL-的百分含量进行测定,4次结果为 47.64%,47.69%,47.52%,47.55%,计算置信度为 90%,95%和 99%时的总体均值 μ的置信区间解:
35.2%90 3,10.0 tP %09.0%60.474 %08.035.2%60.47
18.3%95 3,05.0 tP %13.0%60.474 %08.018.3%60.47
84.5%99 3,01.0 tP %23.0%60.474 %08.084.5%60.47
%60.474 %55.47%52.47%69.47%64.47x
%08.0
1
2
n
xx
s
三、显著性检验
(一)总体均值的检验 —— t检验法
(二)方差检验 —— F检验法
(一)总体均值的检验 —— t检验法
1,平均值与标准值比较 —— 已知真值的 t检验
( 准确度显著性检验 )
nstx由 ns
x
t
)1( nftP f 自由度时,查临界值表在一定,?
判断:
,则存在显著性差异如 ftt,
,则不存在显著性差异如 ftt,
续前
2,两组样本平均值的比较 —— 未知真值的 t检验
( 系统误差显著性检验 )
设两组分析数据为:
1n 1s 1x
2n 2s 2x
21 ss?当
11 21
1
2
22
1
2
11
nn
xxxx
s
n
i
i
n
i
i
R
总自由度偏差平方和合并标准差
11
11
21
2
2
21
2
1
nn
nsnss
R
续前
21
2121
nn
nn
s
xx
t
R?
)2( 21 nnftP f 总自由度时,查临界值表在一定,?
判断:
著性差异,则两组平均值存在显如,ftt
显著性差异,则两组平均值不存在如,ftt
(二)方差检验 —— F检验法
(精密度显著性检验)
统计量 F 的定义:两组数据方差的比值
21,,ffFP?一定时,查判断:
不存在显著性差异,则两组数据的精密度如 表FF?
存在显著性差异,则两组数据的精密度如 表FF?
2
2
2
1
s
sF?即
21 ss?
显著性检验注意事项
1,单侧和双侧检验
1)单侧检验 → 检验某结果的精密度是否大于或小于 某值
[F检验常用 ]
2) 双侧检验 → 检验两结果是否存在显著性差异
[ t 检验常用 ]
2.置信水平的选择置信水平过高 —— 以假为真置信水平过低 —— 以真为假四、异常值的检验 —— G检验( Grubbs法)
检验过程:
sxxxxxx nn 和,,,,,1321
s
xx
G
异常判断,保留,则异常值舍弃;否则下,若一定,NGGP
小结
1,比较:
t 检验 —— 检验方法的系统误差
F 检验 —— 检验方法的偶然误差
G 检验 —— 异常值的取舍
2,检验顺序:
G检验 → F 检验 → t检验异常值的取舍精密度显著性检验准确度或系统误差显著性检验练习例:采用某种新方法测定基准明矾中铝的百分含量,
得到以下九个分析结果,10.74%,10.77%,
10.77%,10.77%,10.81%,10.82%,10.73%,
10.86%,10.81%。试问采用新方法后,是否引起系统误差?( P=95%)
8199 fn %042.0%,79.10 Sx
43.19%042.0 %77.10%79.10t
31.28,95.0 8,05.0 tfP 时,当之间无显著性差异与因?xtt 8,05.0
解:
练习例:在吸光光度分析中,用一台旧仪器测定溶液的吸光度 6次,得标准偏差 s1=0.055;用性能稍好的新仪器测定 4次,得到标准偏差 s2=0.022。试问新仪器的精密度是否显著地优于旧仪器?
0 0 0 4 8.0,0 2 2.0,4
0 0 3 0.0,0 5 5.0,6
2
22
2
11
小大
ssn
ssn
25.600048.0 0030.0 F
01.935%,95 表小大,由 FffP
显著性差异两仪器的精密度不存在表 FF
解:
练习例:采用不同方法分析某种试样,用第一种方法测定
11次,得标准偏差 s1=0.21%;第二种方法测定 9次得到标准偏差 s2=0.60%。 试判断两方法的精密度间是否存在显著差异? ( P=90%)
解:
36.0%,60.0,9
0 4 4.0%,21.0,11
2
22
2
11
大小
ssn
ssn
2.80 4 4.0 36.0 F
07.3108%,90 表小大,由 FffP
著性差异两方法的精密度存在显表 FF
练习例:用两种不同方法测定合金中铌的百分含量第一法 1.26% 1.25% 1.22%
第二法 1.35% 1.31% 1.33% 1.34%
试问两种方法是否存在显著性差异 ( 置信度 90%)
%02 1.0%,24.1,3 111 sxn
%017.0%,33.1,4 222 sxn
53.1
)0 1 7.0(
)0 2 1.0(
2
2
2
2
2
1
s
sF
55.932 表小大,,Fff
著性差异两组数据的精密度无显表 FF
解:
续前
019.0
1
)()(
21
2211
nn
xxxx
s iiR
21.6
43
43
019.0
33.124.1
21
2121?
nn
nn
s
xx
t
02.25243%90 5,10.0 tfP 时,,当显著性差异两种分析方法之间存在 5,01.0tt
练习例:测定某药物中钴的含量,得结果如下:
1.25,1.27,1.31,1.40μg/g,试问 1.40这个数据是否应该保留?
36.1066.0 31.140.1066.0,31.1
s
xx
Gsx 异常
46.14,95.0 4,05.0 GnP
这个数应该保留40.14,05.0 GG?
解:
误差客观存在
定量分析数据的归纳和取舍(有效数字)
计算误差,评估和表达结果的可靠性和精密度
了解原因和规律,减小误差,测量结果 →真值第二节 测量误差一,误差分类及产生原因二,误差的表示方法三,误差的传递四,提高分析结果准确度的方法一、误差分类及产生原因
(一)系统误差及其产生原因
(二)偶然误差及其产生原因
(一) 系统误差 (可定误差),
由可定原因产生
1.特点:具单向性(大小、正负一定 )
可消除(原因固定)
重复测定重复出现
2,分类:
( 1) 按来源分
a.方法误差:方法不恰当产生
b.仪器与试剂误差:仪器不精确和试剂中含被测组分或不纯组分产生
c,操作误差,操作方法不当引起
( 2) 按数值变化规律分
a,恒定误差
b,比值误差
(二) 偶然误差 (随机误差,不可定误差):
由不确定原因引起特点:
1)不具单向性 ( 大小,正负不定 )
2)不可消除 ( 原因不定 )
但可减小 ( 测定次数 ↑)
3) 分布服从统计学规律 ( 正态分布 )
二、误差的表示方法
( 一 ) 准确度与误差
( 二 ) 精密度与偏差
( 三 ) 准确度与精密度的关系
(一 )准确度与误差
1,准确度,指测量结果与真值的接近程度
2,误差
( 1) 绝对误差,测量值与真实值之差
( 2) 相对误差,绝对误差占真实值的百分比
x
RE x%100% 100%
RE x% 100%
注,1)测高含量组分,RE可小;测低含量组分,RE可大
2)仪器分析法 —— 测低含量组分,RE大化学分析法 —— 测高含量组分,RE小注,μ 未知,δ 已知,可用 χ 代替 μ
(二)精密度与偏差
1,精密度,平行测量的各测量值间的相互接近程度
2.偏差:
( 1)绝对偏差,单次测量值与平均值之差
( 2) 相对偏差:绝对偏差占平均值的百分比
d x xi
d
x
x x
x
i100% 100%
( 5)标准偏差:
( 6)相对标准偏差(变异系数)
续前 ( 3)平均偏差:各测量值绝对偏差的算术平均值
( 4) 相对平均偏差:平均偏差占平均值的百分比
n
xx
d i?
%1 0 0%1 0 0?
xn
xxi
x
d
n
x
n
i
i
x
1
2)(?
1
)(
1
2
n
xx
S
n
i
i
x
R S D Sxx 100%
μ 未知μ 已知
(三)准确度与精密度的关系
1,准确度高,要求精密度一定高但精密度好,准确度不一定高
2,准确度反映了测量结果的正确性精密度反映了测量结果的重现性练习例:用丁二酮肟重量法测定钢铁中 Ni的百分含量,结果为 10.48%,10.37%,10.47%,10.43%,10.40%;计算单次分析结果的平均偏差,相对平均偏差,标准偏差和相对标准偏差。
解,%43.10?x
%036.05 %18.0 n
d
d i
%35.0%100%43.10 %036.0%100xd
%046.0106.44106.81 4
72
n
d
s i
%44.0%10043.10 %046.0%100xs
三、误差的传递
( 一 ) 系统误差的传递
(二)偶然误差的传递
R f x y z? (,,)R x y z,,,
1,加减法计算
2,乘除法计算
R ax by cz
R x y za b c
R m x y z
R x y zR x y z/
1,加减法计算
2,乘除法计算
R f x y z? (,,) zyx SSS,,
R ax by cz
2222222 zyxR ScSbSaS
R m x y z
22222222 / zSySxSRS zyxR
标准差法练习例:设天平称量时的标准偏差 s = 0.10mg,求称量试样时的标准偏差 sm 。
解,mgssssmmm
m 14.02,2222121
练习例:用移液管移取 NaOH溶液 25.00mL,以 0.1000mol/L的
HCL溶液滴定之,用去 30.00mL,已知用移液管移取溶液的标准差 s1=0.02mL,每次读取滴定管读数的标准差 s2=0.01mL,假设 HCL溶液的浓度是准确的,
计算标定 NaOH溶液的标准偏差?
解:
Lm o lV VCC
N a O H
H C LH C L
N a O H /1200.000.25
00.301000.0
2
2
2
2
2
1
2
1
2
2
2
V
s
V
s
C
s
N a O H
C
44
22
101.1102.912.030 01.0225 02.0
N a O HC Cs
四、提高分析结果准确度的方法
1,选择合适的分析方法例,测全 Fe含量
K2Cr2O7法 40.20% ± 0.2%× 40.20%
比色法 40.20% ± 2.0%× 40.20%
2,减小测量误差
1) 称量例,天平一次的称量误差为 0.0001g,两次的称量误差为
0.0002g,RE% 0.1%,计算最少称样量?
RE w%,,2 0 0001 100% 0 1%
gw 2 0 0 0.0
续前
2) 滴定例,滴定管一次的读数误差为 0.01mL,两次的读数误差为
0.02mL,RE% 0.1%,计算最少移液体积?
3,增加平行测定次数,一般测 3~ 4次以减小偶然误差
4,消除测量过程中的系统误差
1) 校准仪器:消除仪器的误差
2) 空白试验:消除试剂误差
3) 对照实验:消除方法误差
4) 回收实验:加样回收,以检验是否存在方法误差
mLV 20
RE V%,,2 0 01 100% 0 1%
第三节 有效数字及其运算规则一,有效数字二,有效数字的修约规则三,有效数字的运算法则一,有效数字,实际可以测得的数字
1,有效数字位数包括所有准确数字和一位欠准数字例:滴定读数 20.30mL,最多可以读准三位第四位欠准 ( 估计读数 ) ± 1%
2,在 0~9中,只有 0既是有效数字,又是无效数字例,0.06050 四位有效数字定位 有效位数例,3600 → 3.6× 103 两位 → 3.60× 103 三位
3,单位变换不影响有效数字位数例,10.00[mL]→0.001000[L] 均为四位续前
4,pH,pM,pK,lgC,lgK等对数值,其有效数字的位数取决于小数部分(尾数)数字的位数,整数部分只代表该数的方次例,pH = 11.20 → [H+]= 6.3× 10-12[mol/L] 两位
5,结果首位为 8和 9时,有效数字可以多计一位例,90.0%,可示为四位有效数字例,99.87% →99.9% 进位二、有效数字的修约规则
1,四舍六入五留双
2,只能对数字进行一次性修约
3,当对标准偏差修约时,修约后会使标准偏差结果变差,从而提高可信度例,s = 0.134 → 修约至 0.14,可信度 ↑
例,0.37456,0.3745 均修约至三位有效数字例,6.549,2.451 一次修约至两位有效数字
0.3740.375
6.5 2.5
三、有效数字的运算法则
1,加减法:以小数点后位数最少的数为准 ( 即以绝对误差最大的数为准 )
2,乘除法:以有效数字位数最少的数为准 ( 即以相对误差最大的数为准 )
例,50.1 + 1.45 + 0.5812 =?
δ ± 0.1 ± 0.01 ± 0.0001
52.1
例,0.0121× 25.64 × 1.05782 =?
δ ± 0.0001 ± 0.01 ± 0.00001
RE ± 0.8% ± 0.4% ± 0.009%
0.328
保留三位有效数字保留三位有效数字第四节 偶然误差的正态分布一,偶然误差的正态分布和标准正态分布二,偶然误差的区间概率一、偶然误差的正态分布和标准正态分布正态分布的概率密度函数式
1,x 表示测量值,y 为测量值出现的概率密度
2.正态分布的两个重要参数
( 1) μ为无限次测量的总体均值,表示无限个数据的集中趋势 (无系统误差时即为真值)
( 2) σ是总体标准差,表示数据的离散程度
3,x -μ为偶然误差
y f x e
x
( )
( )1
2
2
22
正态分布曲线 —— x ~ N(μ,σ2 )曲线
x =μ时,y 最大 →大部分测量值集中在算术平均值附近
曲线以 x =μ的直线为对称 →正负误差出现的概率相等
当 x →﹣ ∞或 ﹢ ∞时,曲线渐进 x 轴,
小误差出现的几率大,大误差出现的几率小,极大误差出现的几率极小
σ↑,y↓,数据分散,曲线平坦
σ↓,y↑,数据集中,曲线尖锐
测量值都落在- ∞~+ ∞,总概率为 1
y f x e
x
( )
( )1
2
2
22
x
2
1)( xfy
以 x-μ~ y作图特点标准正态分布曲线 —— x ~ N(0,1 )曲线
xu令 2
2
2
1)( uexfy
dudx又 duuduedxxf
u
)(
2
1)( 2
2
2
2
2
1)( ueuy
即以 u ~ y作图
注,u 是以 σ为单位来表示随机误差 x -μ
二、偶然误差的区间概率
从- ∞~+ ∞,所有测量值出现的总概率 P为 1,即
偶然误差的区间概率 P—— 用一定区间的积分面积表示该范围内测量值出现的概率标准正态分布 区间概率 %
1,1 xu %26.68
64.1,64.1 xu %90
96.1,96.1 xu %95
121)( 2
2u
eduu
2,2 xu %5.95
58.2,58.2 xu %0.99
3,3 xu %7.99
uu ~
正态分布概率积分表练习例:已知某试样中 Co的百分含量的标准值为 1.75%,
σ=0.10%,又已知测量时无系统误差,求分析结果落在 (1.75± 0.15)% 范围内的概率。
解:
5.1%10.0 %15.0%75.1 xxu
%64.868664.04332.02 P查表练习例:同上题,求分析结果大于 2.0% 的概率 。
解,5.2
%10.0
)%75.100.2(
xu
%38.494 9 3 8.0,5.2~0,Pu 时从当查表可知
%62.0%38.49%00.50'%0.2 P的概率为分析结果大于第五节 有限数据的统计处理和 t分布一,正态分布与 t 分布区别二,平均值的精密度和平均值的置信区间三,显著性检验一、正态分布与 t 分布区别
1,正态分布 —— 描述无限次测量数据
t 分布 —— 描述有限次测量数据
2,正态分布 —— 横坐标为 u,t 分布 —— 横坐标为 t
3,两者所包含面积均是一定范围内测量值出现的概率 P
正态分布,P 随 u 变化; u 一定,P一定
t 分布,P 随 t 和 f 变化; t 一定,概率 P与 f 有关,
xu
s
xt
1 nf utf注:
为总体均值?
为总体标准差?
差为有限次测量值的标准 s
两个重要概念
置信度 (置信水平) P,某一 t 值时,测量值出现在
μ± t?s范围内的概率
显著性水平 α:落在此范围之外的概率
fttP,下,一定值的,自由度为表示置信度为值的,自由度为表示置信度为
tt
tt
4%99
10%95
4,01.0
10,05.0
P 1?
二、平均值的精密度和平均值的置信区间
1,平均值的精密度 ( 平均值的标准偏差 )
注:通常 3~4次或 5~9次测定足够
nx
x xsn,n抽出样本总体?
例:
n
ss x
x?
n?4 xx ss
2
1? n?25
xx ss 5
1?
总体均值标准差与单次测量值标准差的关系有限次测量均值标准差与单次测量值标准差的关系续前
2,平均值的置信区间
( 1) 由单次测量结果估计 μ的置信区间
( 2) 由多次测量的样本平均值估计 μ的置信区间
( 3) 由少量测定结果均值估计 μ的置信区间
ux
n
uxux x
n
stxstx x
x
n
stxstx x
fxf,,
总体平均值
有限次测量均值?x
续前
置信区间,一定置信度下,以测量结果为中心,包括总体均值的可信范围
平均值的置信区间,一定置信度下,以测量结果的均值为中心,包括总体均值的可信范围
置信限:
结论,
置信度越高,置信区间越大,估计区间包含真值的可能性 ↑
置信区间 —— 反映估计的精密度置信度 —— 说明估计的把握程度
u ux xst
注意:
( 1) 置信区间的概念,μ为定值,无随机性
( 2) 单侧检验和双侧检验单侧 —— 大于或者小于总体均值的范围双侧 —— 同时大于和小于总体均值的范围练习例 1:
%95
%10.0%50.47
在内的概率为包括总体均值的区间内理解为在
解:
%95%10.0%50.47 P置信度?如何理解练习例 2:对某未知试样中 CL-的百分含量进行测定,4次结果为 47.64%,47.69%,47.52%,47.55%,计算置信度为 90%,95%和 99%时的总体均值 μ的置信区间解:
35.2%90 3,10.0 tP %09.0%60.474 %08.035.2%60.47
18.3%95 3,05.0 tP %13.0%60.474 %08.018.3%60.47
84.5%99 3,01.0 tP %23.0%60.474 %08.084.5%60.47
%60.474 %55.47%52.47%69.47%64.47x
%08.0
1
2
n
xx
s
三、显著性检验
(一)总体均值的检验 —— t检验法
(二)方差检验 —— F检验法
(一)总体均值的检验 —— t检验法
1,平均值与标准值比较 —— 已知真值的 t检验
( 准确度显著性检验 )
nstx由 ns
x
t
)1( nftP f 自由度时,查临界值表在一定,?
判断:
,则存在显著性差异如 ftt,
,则不存在显著性差异如 ftt,
续前
2,两组样本平均值的比较 —— 未知真值的 t检验
( 系统误差显著性检验 )
设两组分析数据为:
1n 1s 1x
2n 2s 2x
21 ss?当
11 21
1
2
22
1
2
11
nn
xxxx
s
n
i
i
n
i
i
R
总自由度偏差平方和合并标准差
11
11
21
2
2
21
2
1
nn
nsnss
R
续前
21
2121
nn
nn
s
xx
t
R?
)2( 21 nnftP f 总自由度时,查临界值表在一定,?
判断:
著性差异,则两组平均值存在显如,ftt
显著性差异,则两组平均值不存在如,ftt
(二)方差检验 —— F检验法
(精密度显著性检验)
统计量 F 的定义:两组数据方差的比值
21,,ffFP?一定时,查判断:
不存在显著性差异,则两组数据的精密度如 表FF?
存在显著性差异,则两组数据的精密度如 表FF?
2
2
2
1
s
sF?即
21 ss?
显著性检验注意事项
1,单侧和双侧检验
1)单侧检验 → 检验某结果的精密度是否大于或小于 某值
[F检验常用 ]
2) 双侧检验 → 检验两结果是否存在显著性差异
[ t 检验常用 ]
2.置信水平的选择置信水平过高 —— 以假为真置信水平过低 —— 以真为假四、异常值的检验 —— G检验( Grubbs法)
检验过程:
sxxxxxx nn 和,,,,,1321
s
xx
G
异常判断,保留,则异常值舍弃;否则下,若一定,NGGP
小结
1,比较:
t 检验 —— 检验方法的系统误差
F 检验 —— 检验方法的偶然误差
G 检验 —— 异常值的取舍
2,检验顺序:
G检验 → F 检验 → t检验异常值的取舍精密度显著性检验准确度或系统误差显著性检验练习例:采用某种新方法测定基准明矾中铝的百分含量,
得到以下九个分析结果,10.74%,10.77%,
10.77%,10.77%,10.81%,10.82%,10.73%,
10.86%,10.81%。试问采用新方法后,是否引起系统误差?( P=95%)
8199 fn %042.0%,79.10 Sx
43.19%042.0 %77.10%79.10t
31.28,95.0 8,05.0 tfP 时,当之间无显著性差异与因?xtt 8,05.0
解:
练习例:在吸光光度分析中,用一台旧仪器测定溶液的吸光度 6次,得标准偏差 s1=0.055;用性能稍好的新仪器测定 4次,得到标准偏差 s2=0.022。试问新仪器的精密度是否显著地优于旧仪器?
0 0 0 4 8.0,0 2 2.0,4
0 0 3 0.0,0 5 5.0,6
2
22
2
11
小大
ssn
ssn
25.600048.0 0030.0 F
01.935%,95 表小大,由 FffP
显著性差异两仪器的精密度不存在表 FF
解:
练习例:采用不同方法分析某种试样,用第一种方法测定
11次,得标准偏差 s1=0.21%;第二种方法测定 9次得到标准偏差 s2=0.60%。 试判断两方法的精密度间是否存在显著差异? ( P=90%)
解:
36.0%,60.0,9
0 4 4.0%,21.0,11
2
22
2
11
大小
ssn
ssn
2.80 4 4.0 36.0 F
07.3108%,90 表小大,由 FffP
著性差异两方法的精密度存在显表 FF
练习例:用两种不同方法测定合金中铌的百分含量第一法 1.26% 1.25% 1.22%
第二法 1.35% 1.31% 1.33% 1.34%
试问两种方法是否存在显著性差异 ( 置信度 90%)
%02 1.0%,24.1,3 111 sxn
%017.0%,33.1,4 222 sxn
53.1
)0 1 7.0(
)0 2 1.0(
2
2
2
2
2
1
s
sF
55.932 表小大,,Fff
著性差异两组数据的精密度无显表 FF
解:
续前
019.0
1
)()(
21
2211
nn
xxxx
s iiR
21.6
43
43
019.0
33.124.1
21
2121?
nn
nn
s
xx
t
02.25243%90 5,10.0 tfP 时,,当显著性差异两种分析方法之间存在 5,01.0tt
练习例:测定某药物中钴的含量,得结果如下:
1.25,1.27,1.31,1.40μg/g,试问 1.40这个数据是否应该保留?
36.1066.0 31.140.1066.0,31.1
s
xx
Gsx 异常
46.14,95.0 4,05.0 GnP
这个数应该保留40.14,05.0 GG?
解: