第五节分析化学中的数据处理
本节知识结构
误差的概念、分类与表示法
随机误差的统计规律
少量数据的统计处理
误差的传递
回归分析法
提高分析结果准确度的方法
有效数字本节
误 差
实验数据的统计处理
有效数字准确度误差的表征 两者的关系精密度误差 绝对误差误差的表示误 差 偏差系统误差产生原因误差的分类 随机误差 特征过失误差误差的消除 (或减免 ),提高分析结果准确度的方法随机误差的分布规律正态分布 标准正态分布曲线随机误差的概率
t分布少量数据的统计处理 平均值的置信区间显著性检验实验数据的 异常值的取舍统计处理误差的传递 随机误差的传递极值误差回归分析法 一元线性回归方程及其显著性检验有效数字运算规则一,误差的概念、分类与表示法一,知识要点二,例题解析几个常用术语
1.真值( xT)
某一物理量本身具有的客观存在的真实数值,
即为该量的真值。 (一般说来真值是未知的)
a,理论真值
MCl 35.453如 NaCl中 Cl 的含量 = = =60.663
% M
NaCl 58.443
b,计量学约定真值如 国际计量单位确定的长度、质量、物质的量单位知识要点
c,相对真值 精度高一级的测量值做为低一级的测量值的真值 。
如 分析天平相对于台秤的称量值、移液管相对于量筒的体积,标准试样中组分的含量相对于某人对该标准试样中组分的含量的测量值。
2,平均值( x)
n次测定数据的算术平均值 x 为
x1+x2 +‥ · + xn 1x = ---------------------进制 *----- =
∑xi n n
平均值 x 不是真值,但比单次测定结果更接近于真值。
(一 )
准确度表示分析结果与真实值接近的程度。准确误差指分析结果与真实值间的差值。误差越大分析结果的准确度越低,误差又分为绝对误差和相对误
E = x - xT
相对误差 =(E/xT)× 100%=(E/xT)× 1000‰
绝对误差和相对误差为正值时,表示分析结果偏真实值 ( xT )指理论真值、计量学约定真值和相对真值。
(二 ) 精密度和偏差精密度表示同一条件下几次平行分析结果相互接近的程度。精密度的高低用偏差衡量,偏差越小,
分析结果的精密度越高。常用的几种偏差表示法为:
1,绝对偏差和相对偏差
n 次测量数据的算术平均值 为,
x
00
0ii
ii
n
1i
i
1 0 0 0
x
d
%1 0 0
x
d
xxd
x
n
1
x



相对偏差绝对偏差
2,平均偏差 和相对平均偏差
3,标准偏差 s 及相对标准偏差用表示精密度其缺点是大偏差未充分反映出来,
统计学上引入样本标准偏差 s就能更好地表示一组数据的分散程度。
相对标准偏差(又称变异系数 CV)为,
00
01000
x
d
dn
1x
xn
1d
ii


相对平均偏差平均偏差
d

1
2

n
s xx i
00
01 0 0 0xs相对标准偏差
4,平均值的标准偏差以上偏差的表示方法适于有限次测量的数据处理。在数理统计中,把所研究的对象的全体称为总体;从总体中随机抽出的一组测量值,称为样本。
样本所含测量值的数目称为样本容量。当测量次数无限增多时,其平均值即为总体平均值 μ,用 δ 表示平均偏差显然样本标准偏差 s与总体标准偏差 σ 有区别的,当 n→∞ 时,s→ σ 。
5,极差 R=xmax-xmin

n
x
dxn
x
n
1
x
n
1
l i m
i
2
i
i





为而总体标准偏差
。及时,当
n
ss
x?
sx
0001 0 0 0)xR(相对极差
(三 )
精密度高不一定准确度高,但准确度高一定要以精密度高为前提,精密度是保证准确度的先决条件。
(四 ) 误差的分类根据误差的性质和产生的原因可分为:系统误差、
1.系统误差 由测量过程中某种固定的原因造成,其特点是:误差数值一定,具有重复性、可测性和单向性。根据系统误差产生原因可分为:方法误差、仪器和试剂误差、操作误差和主观误差。系统误差通过校正、减免或消除,显然系统误差的存在对分析结果的
2.随机误差 由随机的偶然因素造成,其误差数值不定,但服从统计规律。可通过增加平行测定次数减小。
随机误差影响分析结果的精密度。
3.过失误差 分析人员差错所致,只要分析工作者增二,例题解析例 1,测定钢铁中铬的含量为 1.13%,若其标准值为 1.15%,
求绝对误差和相对误差。
- 1,7 %1 0 0 %
15.1
02.0
%02.0%15.1%13.1E


相对误差绝对误差解:
例 2,测定钢样中铬的百分含量,得如下结果,1.11,1.16,
1.12,1.15和 1.12。计算此结果的平均偏差及相对平均偏差、标准偏差、相对标准偏差和平均值的标准偏差。

%01.0
n
s
s
00
0
19
00
0
1000
13.1
022.0
%022.0
1-n
x-x
s
00
0
18
00
0
1000
1,1 3
0,0 2
00
0
1000
x
d
%02.0
5
09.0
d
n
1
d
%13.1x
n
1
x
x
2





相对平均偏差相对平均偏差解:
随机误差的统计规律
一,知识要点
二,例题解析一,知识要点
( 一) 频数分布根据测量数据的组值范围与相应的频数 (或相对频数 )绘制成的直方图。由图表明:随机误差的存在,分析数据具有分散性,又有向某个中心值集中的趋势,这种既分散又集中的特性,形象地表示随机误差分布的规律。
(二 ) 正态分布当测量次数为无限时,测量数据一般符合正态分布规律,
其概率密度函数为,
式中,μ 为总体平均值表示测量值的集中趋势; σ 为总体准偏差,它反映测量值的分散程度,σ 越小,测量值的分散程度就越小,即精密度越高。
e 22 2x
2
1xfy


正态分布的概率密度函数的图象就是正态分布
1,对称性 绝对值相等的正负误差出现的概率
2,单峰性 绝对值小的误差出现的概率大,绝对值大的误差出现的概率小。
3,有界性 绝对值很大的误差出现的概率极小。
(四 ) 随机误差概率的计算标准正态分布曲线与横坐标- ∞ 到+ ∞ 之间的所夹的总面积,代表所有数据出现的总概率,其值为 1。因此落在 0到 u范围内的测量值出现的概率,就应为其所包围的上式中,不同 u取值的面积已列在标准正态分布概率积分表中,若要求 ± u间的概率,应乘以 2。
duuu0 面积概率少量数据的统计处理
一,知识要点
二,例题解析一,知识要点
(一 ) t分布曲线在有限次测定中,由于 σ 未知,用样本标准偏差 s代替 σ,定义新的变量 t
以 t值为横坐标,纵坐标仍为概率密度,所得的图象为 t分布曲线。 t分布曲线的形状与正态分布曲线相似,
但 t分布曲线随自由度 f = n-1而变。当 f→∞ 时,t分布曲线就趋近于正态分布曲线。
nsxxt s
x

t分布曲线与横坐标所包围的面积也就是测量值落在该范围的概率。但是该概率不仅与 t 有关,也与 f 有关,可以通过 t分布的概率密度函数积分求出对应 t 与 f时的概率 P。相反,
f 和 P 一定,相对应的 t值也一定,这就是
t 值表。使用 t 值表时,应当注意注脚的 f
和 α,α =1-P,α 称为显著性水准。
(二 ) 平均值的置信区间测量值落在 μ± uσ范围内的概率称为置信度 (置信概率 )。
而测量值所在 μ± uσ的范围称为置信区间。平均值的置信区间,表示在一定置信度下,以平均值 为中心,
包括总体平均值 μ的范围。
当总体标准偏差 σ已知情况下,以样本平均值 估计总体平均值可能出现的区间为:
对有限次测量为:
由于 u 和 t 都随置信度的提高而变大,所以置信度越高,置区间就越大。分析化学中,通常取置信度为 90%或 95%。
nux

n
stxtsx
x
(三 )
分析化学中,常常由于系统误差和随机误差混杂在一起,导致测量值之间的差异难以分辨出是何种因素引起,显著性检验是解决这类问题的一个科学方法。 如果分析结果间的差异是由随机误差引起,就认为它们之间,无显著性差异,;若分析结果间的差异由系统误差所致,就认为存在,显著性差异,。分析化学中,
应用最多的显著性检验方法是 t 检验法和 F
检验法。
1,t
用于检验分析方法或操作过程是否存在系统误差。
先用待检验的分析方法对已知准确含量的标样进行测定,然后用 t 检验法判断测定平均值与标样的标准值之间是否存在显著性差异。
检验步骤:
A.计算 t
B.根据给定 α 和 f tα,f 值;
C.判断:如果 t计 > tα,f,认为平均值与标准值间存在显著性差异,否则认为平均值与标准值间不存在显著性差异。
nsxt计
2.F检验法通过比较两组数据的方差,确定两组数据的精密
A,计算 F F=s2大 / s 2小
B,判断:如果 F计 > F表,则认为两组数据的精密度存在显著性差异,相反,不存在显著性差异。查阅 F值表是单边的,可直接按给定的置信度对单边检验作出判断;
如把单边表用于双边检验,则其显著性水准为单边检验的 2倍,即 2α,置信度为 1-2α 。
(四)异常值得取舍一组测量数据中,个别数据离群较远,
该数据称异常值 (又称可疑值或极端值 )。
检验目的在于判断何种原因引起异常。
若检验认为是随机误差引起,应保留,
如由意外因素 (包括过失 )引起,就可弃去。
1,法检验步骤:
A,;
B.计算异常值与 之差的绝对值;
C.判断:若,则异常值舍弃,否则应保留。
法计算简单,不必查表,只能用于处理一些要求不高的实验数据。
d4
d
x
d4xx异
d4
2,
检验方法:
A,和标准偏差 s;
B.计算 T值:若 x1(最小值 )为异常值,
则 ; 若 xn(最大值 )为异常值,;
C,查 Tα,n值;
D.判断,T计 ≥Tα,n,则异常值应舍弃;否则保留。
格鲁布斯检验法的准确性较高,但计算较麻烦。
sxxT 1n计
sxxT n计
x
3,Q
检验方法:
A.将测量数据从小到大按顺序排列;
B.计算 Q值:当 xn为视为异常值时,则 Q计 =(xn -
xn-1)/(xn - x1); x1为异常值时,Q计 =(x2 - x1)/(xn -
x1) ;
C.根据测定次数 n与置信度,查 Q值表;
D.判断:若 Q计 ≥Q表,则异常值舍弃,相反应保留。
本法计算简便,适用于 3~ 10次的测定。
二,例题解析例 5,某分析结果为 40.02,40.13,40.15,40.16,40.20.
用 Q检验法和格鲁布斯法判断 40.02是否应舍弃?



应保留则应保留则时,
解:
02.40T6 7 2.1T
62.1
0 6 8.0
02.4013.40
T
0 6 8.0
1n
xx
s
13.40x2
02.40Q73.0Q5n
61.0
02.4020.40
02.4013.40
Q1
5,05.0
96.0



例 6,求例 5中结果的平均值的置信区间 (P=0.90和 0.95)。?



置信度区间增大。信度的提高,平均值的计算结果表明,随着置时,
时,
解:
%08.013.40
n
0 6 8.078.2
13.40
78.2t95.0P
%06.013.40
5
0 6 8.013.2
13.40
n
st
x
13.2t90.0P
0 6 8.0s
13.40x
4,05.0
x
4.10,0
1







例 7,一种新方法测得某标样中的 SiO2含量 (%),34.30,
34.33,34.26,34.38,34.38,34.29,34.29,34.23。该标样中标准值为 34.33%,问新分析方法是否存在系统误差
统误差,结果可靠。新的分析方法不存在系检验。值的比较,应用得的样本平均值与标准解:按题意属新方法所
,tt,37.2t
05.18
0 5 4.0
33.3431.34
n
s
x
t
0 5 4.0
1n
xx
s
31.34x
8
1
x
t
7,05.07,05.0
2
8
1i
i
i





例 8,一分析人员分别用新方法和标准方法测定了某试样中的铁含量 (%):
新方法,23.28,23.36,23.43,23.38,23.30;
标准方法,23.44,24.41,23.39,23.35。
问两种方法间有无显著性差异?
解:





显著性差异。新方法与标准方法间无时,当检验
。之间不存在显著性差异两种分析方法的精密度及标准偏差计算两种方法的平均值检验。方法平均值的比较,用解:按题意属两种分析
,t365.2t05.0,72nnf
43.1
54
54
052.0
40.2335.23
t
052.0
2nn
s1ns1n
s
t3
,F12.9F
64.20014.00037.0F2
0014.0s,038.0s,40.24x,4n
0037.0s,061.0s,35.23x,5n
1
t
7,05.021
21
2
22
2
11
3,404.0
2
22
2
2
2
11
2
1








例 10,用 AgBr重量法测定溴含量,称样 0.2100g,经处理得
AgBr沉淀 0.2700g,已知天平称量时的标准偏差 s =0.0001g,求测定结果的相对标准偏差和标准偏差。
次。次和试样称重称重分别指及式中的
:按随机误差传递乘除法解:
试样
24A g B r24
005.071.54%01.0s%,01.0
R
S
100.1
2100.0
001.02
2700.0
001.04
R
s
71.54100
77.187
904.79
2100.0
2700.0
100
A g B r
Br
m
m
%Br
R
R
8
2
2
2
2
2
2
R
A g B r



例 11,如果称量的相对误差与滴定剂体积的相对误差均在
± 0.1%之内,求滴定分析法的极值相对误差。
%2.0%1.0%1.0
MVx
m
V
100
b
a
1 0 0 0
cM
100
m
b
a
1 0 0 0
M
cV
%x
mvx



解:
回归分析法
一,知识要点
二,例题解析变量之间的关系,有的是确定的函数关系,有的没有确定的函数关系,变量 y随着变量 x而变化,但不能由 x的取值精确求出 y的值,变量 y与 x间的这种关系称为相关关系。回归分析就是研究变量间相关关系分析化学中,经常涉及到研究两个变量之间的线性
(一 ) 一元线性回归方程
y=a+bx
a及 b
一、
由实验数据计算出 a和 b,就得到确定的一元线性回归方程和确定的回归直线。









2
i
2
i
iiii
n
1i
2
i
n
1i
ii
n
1i
n
1i
ii
x
n
1
x
yx
n
1
yx
xx
yyxx
b
xby
n
xby
a
(二 ) 相关系数相关系数 γ是表示变量 y与 x间相关程度的一个系数。可用此判断回当 γ> γα,f,变量间相关性较好,回归方程有意义;否则变量间





n
1i
2
i
n
1i
2
i
n
1i
ii
yyxx
yyxx
二,例题解析例 12,用次甲基兰 — 二氯乙烷光度法测定 B,试由下列数据求出回归
cB/(μ g/mL) 0.5 1.0 2.0 3.0 4.0 5.0
吸光度 /A 0.140 0.160 0.280 0.380 0.410 0.540



B
i
6
1i
i
6
1i
2
i
i
i
B
c0 8 7 8.00 9 1 5.0A
0 9 1 5.058.20 8 7 8.03 1 8.0bcAa
0 8 7 8.0
2 0 8 4.15
3 3 5 8 4.1
b
3 3 5 8 4.1AAcc
2 0 8 4.15cc
3 1 8.0
6
91.1
n
A
A
mLg58.2
6
5.15
n
c
c1







故回归方程为:
解:



回归方程有意义。
间的相关性好,与
B4,01.0
i
6
1i
i
2
6
1i
i
6
1i
2
i
cA,917.0
9901.0
119684.02084.15
33584.1
33584.1AAcc
119684.0AA
2084.15cc2





提高分析结果准确度的方法
一,知识要点
二,例题解析一、
为保证分析结果的准确度,就要减小随机误差,消除系统误差。
(一 ) 选择合适的分析方法各种分析方法的准确度和灵敏度不同。对常量分析应选用准确度较高的化学分析法,而微量分析采用灵敏度较高的仪器分析法。
(二 )
分析测量中,经常的操作是称量、测量体积及其它物理量,根据方法准确度控制适当的量 (质量、体积等 ),
并选用相应的测量仪器,以保证测量的准确度。
(三 ) 增加平行测定次数,减小随机误差
(四 ) 消除测量过程中的系统误差
1,对照试验 这是检验系统误差的有效方法。常用的对照方法有:
A,标准试样对照法进行对照试验;
B,可靠的标准分析法对照,待检验的分析方法和标准分析 ;
C,加入回收法,向试样加入已知量被测组分,与试样对照试验,由加入被照,将试样与标样进行对照分析;测组分的回收率作出判断;
D,内检或外检,前者指单位内不同分析人员之间的对照试验;后者指不同单位间的对照分析。
2,空白试验 在不加试样情况下,按照试样分析步骤和条件进行的分析试验,求得结果称空白值。可从试样结果
3,校准仪器
4,分析结果的校正 针对不同的情况,采用适当的方法校正分析结果。
二,例题解析例 13,某样品含有约 4%的 K2O,试样溶解后沉淀 K[B(C6H5)4] 。
若要求在灵敏度为 0.1mg的天平上称量的相对误差不超过 1‰,至少称取多少样品

g7.0g66.0
4
1 0 0
HCBK2
OK
2.0m
OK
g2.0
0 0 1.0
0 0 0 2.0
m
mHCBK
mg2.0,mg1.0
4
56
2
2
4
56


的样品的质量为:换算为含为的最小质量
,称量两次的误差为解:天平的灵敏度有效数字
一,知识要点
二,例题解析
(一 )
有效数字是实际上能测到的数字。记录数据所取的位数与使仪器的准确度有关。有效数字中,只有最后一位是可疑数字。确定有效数字的位数时,对于数字,0”应注意区分。若,0”作定位,
就不是有效数字;只有,0”作数字使用时,才能作为有效数字。此外,
pH,pM,logK 的有效数字位数仅取决于小数部分数字的位数。对
(二 ) 有效数字修约规则 ——
(三 )
1,加减法 有效数字相加或相减时,其和或差的有效数字的位
2,乘除法 积或商的有效数字位数与数据中有效数字位数最少有效数字运算过程中,为避免误差积累,运算中可多保留一位,
一、
例 14,对下列情况作出判断,若不正确,请指出正确答案,并说明
1,1.0100g,20.07%,6.02× 1010和 3.1× 10-2的有效数字位数分别是 5
位,4位,3
2,0.0540g,5000,7682和 1.100mL
3,pH=2.05,pM=10.02 Ksp =5.0× 10-13的有效数字位数各不
4.
4-1,3.45→3.4 3.4501→3.5 3.55→3.6
4-2,11.4565→11.456→11.46→11.5→12
4-3,11.4566→11
5.
5-1,25.1+0.45+0.4812=26.0
二、
5-2,213.64+4.4+0.3244=218.36
答,正确答案是 1,4-1,4-3,5-1和 5-3。
第 2题中的 1.100mL和 7862是四位有效数字; 0.0540g不是四位有效数字,而是三位有效数字,因为小数点后第一个,0”仅起定位作用; 5000位数较含糊,若确实为四位有效数字,应表示为 5.000× 103,若不是四位,根据实际位数表示。
第 3题中的 pH,pM和 Ksp均为两位有效数字。 pH,pM的有效数字位数仅取决于小数点后数字的位数,与整数部分无关。类似地,
的有效数字位数取决于系数,而与该数的方次无关。
4-2.是错误的,它违背了有效数字修约只允许一次修约,不得分次的规定。


6.25100
1 0 0 04 1 8 2.13
206.1628.400.250 9 8 2.0
%x
.45
10.2100
1 0 0 04 1 8 2.13
206.16239.1404.200 9 8 2.0
%x
.35






5-2.正确答案是 218.3。有效数字加减时,应以小数点后位数最少的数据为依据保留,原题中 4.4小数后仅为一位,所以和 218.3与其一致。
5-4.中 x%应为 25.56,即四位有效数字。原题中 0.0982可视为四位有效数字。别的测量数据 0.4182及 25.00与 4.87之差
20.13均为四位有效数字,根据乘除法的 运算规则,保留四位有效数字是正确的