B.3 化工实验数据的处理
工程试验不同于其他科学实验,十分重视实验的经济性,对其准确度应有一个适当的要求:准确度过低当然不可取,对准确度要求过高,对仪器和设备的要求往往会大幅提高,造成对人力和物力的浪费。因此,对测量准确度的恰当要求是极其重要的。
实验数据误差的问题,已在分析化学和物理化学等课程中,陆续学习过一些有关的理论和方法,这里不再系统论述。而在化学工程的研究中经常会遇到数据的回归分析,以及离散数据的解析等数值计算的问题。因此本节将着重介绍化学工程实验中常用的一些数据处理方法。
(一)实验数据的误差及其性质在化工实验中,用各种测量仪器测量的物理量。由于测量仪器、实验方法、人的观察力等原因,使测量值与真值之间总会存在一定差别,测量值也不可能完全一致。测量值与真值之差称为误差。根据误差的性质和产生的原因,误差一般分为系统误差和偶然误差。在同一条件下多次测量同一量时,误差的绝对值和符号保持恒定;或在条件改变时,按某一确定的规律变化的误差成称系统误差。在实际相同条件下多次测量同一量时,误差的绝对值和符号的变化,时大时小,时正时负,没有确定的规律,也不可预测但具有抵偿性的误差称为偶然误差。
系统误差的消除在测量中所测得的数值重现性的大小,称为精确度。测量值与真值之间的符合程度,称为准确度。为说明准确度与精确度的区别,往往用打靶来做比喻。如图B.3-1中所示,A表示精确度与准确度都很好;B表示精确度很好,但准确度却不高;C表示精确度与准确度都不好。
图 B.3-1
准确度主要是由系统误差决定的。当然在科学测量中没有像靶心那样明确的真值,而是设法去测定这个未知的真值,即设法减小和消除系统误差和偶然误差。
替代消除法(校准法)
就是在其它测量条件不变的情况下,用某一已知量替换被测量以达到消除系统误差的目的。也就是常见的标定的方法。
对称法就是将测量中的某些条件改变,使产生系统误差的原因对测量的结果起相反的作用,从而抵消了系统误差。
例如:阿贝折光仪有空行程,即螺旋旋转时,刻度变化而量杆不动,引起系统误差。为消除这一系统误差,可以从两个方向对线,然后取平均值。
初学者在实验过程中,往往满足于实验数据的重现性,而忽略了精确的测量值是否准确。绝对真值是不可知的,只能在计量上订出一些国际标准作为测量仪表准确性的参考标准。随着人类认识运动的推移和发展,可以逐渐迫近它。
偶然误差的统计特征通过大量实验数据发现,多种因素微小变化引起的偶然误差通常都近似地遵守正态分布,其概率分布密度为:
它恰当地体现了偶然误差的统计特征:
(1) 绝对值小的误差出现的次数比绝对值大的误差出现的次数多得多,即单峰性和有界性;
(2)绝对值相等的正误差与负误差出现的次数大致相等,这一特性称之为对称性;
这类误差还有一个极其重要的特性为:
(3)抵偿性,即同条件下对同一量进行测量,其误差的算术平均值,随着测量次数的无限增加而趋于零。 图B.3-2 偶然误差的分布
(二)实验数据的记录及有效数字实验直接测量的数据或计算结果,该用几位有效数字来表示,是件很重要的事情。有人往往容易产生这样两种想法:认为一个数值中小数点后面位数愈多愈精确,或者计算结果保留位数愈多愈精确。其实这两种想法都是错误的。因为其一,小数点的位置不决定精确度,而与所用单位大小有关。例如,用电位差计测热电偶的电动势记为764.9μV或记为0.7649mV,精确度是完全相同的;其二,测量仪器只能做到一定精度(或称灵敏度),还以上面这个例子来说,这种电位差计精度若只能达到0.1μV或0.0001mV,结果的精确度绝不会超过这个仪器所允许的范围。
由此可见,测量值或计算结果的数值用几位有效数字来表示,决定于测量仪器的精度。数值精确度大小,可由有效数字位数来表达。如上面例子中,数值的精度为0.1μV,精确度以四位有效数字表示。
在科学与工程中,为了清楚地表示出数值的精确度,可将有效数字写出,并在第一个有效数字后面加上小数点,而数值的数量级由10的整数幂来确定。这种用10的整数幂来计数的方法称为科学计数法。例如,0.000388可写作3.88,而38800可写作3.88104。科学计数法的好处是不仅便于辨认一个数值的准确度(因为现存的数字无疑都是有效数字),而且便于运算。
有关有效数字的运算法则,大家都已较熟悉,这里不再赘述。
(三)单个物理量数据的处理和精确度的表示实验数据的处理根据误差的统计原理,在无系统误差情况下,当测量次数足够多的情况下,测量值的算术平均值非常接近于真值。因此我们可以用数据的平均值作为结果。但是在我们实验中测量次数总是有限的,用有限测量值求得的平均值,只能是近似真值。
在化工实验中,常用的平均值有下列几种:
算术平均值:设为各次测量值,n代表测量次数,算术平均值为
几何平均值:几何平均值是将一组n个测量值连乘并开n次方求得,即
方均根值:方均根平均值按下式计算
数据精确度的表示实验数据的精确度或重现性是由偶然误差决定的,通常由测量值与其平均值偏差的统计值来表示常用的误差表示法有下列两种:
(1)(算术)平均偏差:算术平均偏差是表示偏差较好的方法,其表示式为
式中:n——测量次数;——为测量值与其平均值之间的差值,i=1,2,3,...,n。
(2) 标准偏差:标准偏差也称为均方根偏差,其表示式为
式中n与表示的意义与上式相同。
错误数据的剔除如果一系列测量值中混有“坏值”,必然会歪曲实验的结果,这时若能将该值剔除不用,就一定会使结果更符合客观情况。另一种方面,一组正确测量值的分散性,本来客观反映了应用某仪器在特定条件下进行测量的随机波动特性,但若为了得到精度更高的结果,而人为的丢掉了一些误差大一点的、但不属于坏值的测量值,则这样得到的所谓分散很小的结果,实质上是虚假的,所以怎样正确剔除“坏值”,是实践中经常碰到的问题.
由误差理论可知:如果某个测量值x的偏差满足下式
则认为该值是含有粗差的坏值,须剔除不要。
(四)由实验数据整理函数关系所谓实验数据的整理,就是把所获得的一系列实验数据用最合适的方式表示出来。在化工实验中,有如下三种表达方式:
实验数据列成表格将实验直接测定的一组数据,或根据测量值计算得到的一组数据,按照其原样,以一定的顺序一一对应列出数据表。例如:热电偶标定实验测得一组数据,以温度为自变量,以热电势为因变量列成数据表。这种列表法最为简便。但在实验测量中,自变量(如上例中的温度)不一定按等间距有规则的分度,这会给使用时带来困难。这就需要根据实验数据重新分度,使表中所列数据有规则地排列起来,而且希望自变量按整数作等间距顺序排列。这样会使查阅更为方便。
数据的分度有多种方法,最为简单的是图解法,将实验原始数据作图,然后再利用图中曲线按需要重新列表。其他方法这里不再介绍,可参阅有关书籍。这里仅对如何列数据表提出如下几点注意事项:
(1) 表格要有简明扼要而又符合内容的标题名称。
(2) 项目应写明名称、符号及单位。化工数据中,有的数量级很大或很小。如二氧化碳的亨利系数,用科学计数法表示,在20℃时,kPa。当列表时,项目名称写为:/ kPa,而表中数字写为:1.44。这种情形在化工数据表中经常遇到,提请大家注意。
(3) 数字写法应注意有效数字的位数,每列之内小数点应对齐。
(4) 若直接记录实验数据作表,则在实验中应注意自变量尽可能取等间距和整数。
实验数据整理成图形根据解析几何原理,可将实验数据的函数关系,整理成图形表示出来。这种表示法形式直观,容易由图线直接看出函数关系的变化规律。在化工实验中,常采用这种方法整理实验数据,因此十分重要。
将实验数据在图上进行标绘时,需注意下列几点:
(1) 对于一般采用的直角坐标,常选横轴为自变量,纵轴为因变量。在两轴侧要标明变量名称、符号和单位。尤其是单位,初学者往往因受纯数学的影响而容易忽略。
(2) 坐标分度的选择,要反映出实验数据的有效数字位数,即与被标数值精度一致,并要求方便易读。坐标分度值不一定从零开始,而使图形占满全幅坐标纸较为合适。
(3)若在同一张坐标纸上,同时标绘几组测量值,则各点要用不同符号(如:(,⊕,(等),以示区别。若几组不同函数同绘在一张坐标纸上,则在曲线上要标明函数关系或名称,或标明读数方向箭头,如图B.3-3所示。
图B.3-3
(4) 实验曲线以直线最易标绘,使用也最为方便。因此在处理数据时,尽量使曲线直线化。为此,根据不同情况将变量加以变换或选用不同坐标纸,如在化工实验数据处理上,经常采用的半对数和双对数坐标纸。并且希望所得值线的斜率力求近于1来进行分度。
关于曲线标绘的方法和要求,大家都比较熟悉,这里无需重述。下面着重介绍一下有关对数坐标的一些基本知识。
在化工实验中,常遇到和的函数关系。前者在普通坐标上可标绘成一条直线;而后者标绘在普通坐标上则为一条曲线。如果将等式的两边取对数,则可得:
若将和标绘在普通坐标上,也就可以得到一条直线。
例如,有一组实验数据如下表所示。现将这些实验数据按y对x和对分别标绘在普通坐标上,可得一条曲线和一条直线,如图B.3-4所示。
实 验 数 据 表
x/ mm
20
40
80
120
160
200
y/ l / min
5.40
7.59
10.76
13.01
15.00
16.73
lgx
1.301
1.602
1.903
2.079
2.204
2.301
lgy
0.732
0.880
1.032
1.114
1.176
1.223
图B.3-4 普通坐标 图B.3-5 双对数坐标
为了避免将每个数据都换算成对数,可以将坐标纸的分度直接按对数值绘制。现将表中的数据直接标绘在对数坐标纸上,如图B.3-5所示。纵坐标和横坐标都用对数值进行绘制,称为双对数坐标。对于某些函数关系,如只需纵坐标用对数值绘制,即谓半对数坐标。
对数坐标有几个特点,在应用时需特别注意:
在对数坐标轴上的数值为真数。坐标轴的原点为1;,而不是0。
由于0.01、0.1、1、10、100等的对数,分别为-2、-1、0、1、2等,所以在坐标纸上,每一数量级的距离是相等的。
在对数坐标上求取斜率的方法,与普通坐标上求法有所不同,这一点需要特别注意。在双对数坐标上求斜率,则不能直接用坐标标度来度量,因为在对数坐标上标度的数值是真数而不是对数。因此,需用对数值来求算,或者直接用尺子在坐标纸上量取线段长度求取,如图B.3-5中所示的直线,其斜率
式中:与的数值,即用尺子测量而得的线段长度。
在双对数坐标上,直线与x=1的纵轴相交处的y值,即为原方程中的a值。若所标绘的直线需延长很远才能与x=1的纵轴相交,则可在求得斜率n之后,在直线上任取一组数据x和y,代入原方程中,也可求得a的值。
由实验数据拟合函数关系在化学工程研究中,在某些场合下,可以根据所研究过程的机理用数学方程来描述该过程的各个参数和变量之间的关系,即所谓建立数学模型。在计算机技术不断取得进展的现今时代来讲,为建立数学模型及其求解提供了可能性。至今虽还不是所有场合都能做到,但它的确是一种新的趋向。 在大多数场合,是把实验中得到的数据绘制成曲线,与已知函数关系式的典型曲线对照,求得经验公式。在化学工程中,把理论上分析困难,影响因素复杂的众多物理量,组合成为无量纲数(又称为准数),把有关准数关联成经验公式,即所谓准数关联式。至今在化学工程学中,准数关联式的应用极广。
关于如何建立数学模型,如何选择经验公式,如何组合准数和建立准数关联式等问题,不是在这里用较短篇幅所能阐述清楚的。在化学工程实验中所常遇到的问题是已知经验公式,如何确定经验公式中的常数,又称回归。经验公式中常数的求法很多,在化工实验中,最常用的是直线图解法和最小二乘法。
(1) 图解法凡属于直角坐标上可直接标绘出一条直线的,可用此法求得直线方程的常数。若已知线性方程为y=ax+b,该直线的斜率,即为方程中a值。直线在y轴上的截距,即为方程中b值。
凡经过适当变换后能标绘成直线时,也可用图解法求已知方程的常数值。如图B.3-5所示,在双对数坐标上标绘的直线,其原始方程应具有这种形式:。这时,也可用图解法求得方程中的n值和a值。图解的方法和注意事项已在前面作过介绍,这里不再重复。
(2) 最小二乘(回归)法利用最小二乘法回归函数关系的依据是,认为各自变量均无误差,而归结为因变量带有测量误差;并且认为测量值与真值(最佳值)之间的误差平方和为最小。现举例说明,利用最小二乘法求关联式的常数:
例:若用标准温度计标定铜-康铜热电偶,可得到一组实验数据:
标准温度计测得温度:t1,t2,…,tn
热电偶相应热电势测定值:e1,e2,…,en
温度在0~100℃范围内,根据实验数据标绘的曲线,选定温度t与热电势e之间符合下列关系式:
若测量值ei与真值(最佳值)之间的偏差为
或写成 , (B.3-1)
按照最小二乘法的原理,测量值与真值之间偏差平方之和为最小(即为最小)。其最小值的必要条件为
(B.3-2)
(B.3-3)
可得
同理将式(B.3-1)式代入式(B.3-3)并求导整理,展开可得:
联立两式求解,得关系式中常数的计算式为
另外,在实验的数据处理中最常用到的是:回归线性方程,若有1-n对数据xi,yi,最小二乘法求得常数值为
用图解法和求函数关系式中的常数值,确为各种方法中较好的方法,尤其用最小二乘法求得常数值,标准偏差确实较其它方法小。最小二乘法计算虽较繁杂,但当今在计算机十分普及的情况下,多数数据处理应用程序均有最小二乘回归,最小二乘法得到了愈来愈广泛地应用。
参考资料温瑞媛等著,化学工程基础,北京:北京大学出版社(2002)
北京大学《化工基础及实验》教学组编,化工实验讲义(2003)
工程试验不同于其他科学实验,十分重视实验的经济性,对其准确度应有一个适当的要求:准确度过低当然不可取,对准确度要求过高,对仪器和设备的要求往往会大幅提高,造成对人力和物力的浪费。因此,对测量准确度的恰当要求是极其重要的。
实验数据误差的问题,已在分析化学和物理化学等课程中,陆续学习过一些有关的理论和方法,这里不再系统论述。而在化学工程的研究中经常会遇到数据的回归分析,以及离散数据的解析等数值计算的问题。因此本节将着重介绍化学工程实验中常用的一些数据处理方法。
(一)实验数据的误差及其性质在化工实验中,用各种测量仪器测量的物理量。由于测量仪器、实验方法、人的观察力等原因,使测量值与真值之间总会存在一定差别,测量值也不可能完全一致。测量值与真值之差称为误差。根据误差的性质和产生的原因,误差一般分为系统误差和偶然误差。在同一条件下多次测量同一量时,误差的绝对值和符号保持恒定;或在条件改变时,按某一确定的规律变化的误差成称系统误差。在实际相同条件下多次测量同一量时,误差的绝对值和符号的变化,时大时小,时正时负,没有确定的规律,也不可预测但具有抵偿性的误差称为偶然误差。
系统误差的消除在测量中所测得的数值重现性的大小,称为精确度。测量值与真值之间的符合程度,称为准确度。为说明准确度与精确度的区别,往往用打靶来做比喻。如图B.3-1中所示,A表示精确度与准确度都很好;B表示精确度很好,但准确度却不高;C表示精确度与准确度都不好。
图 B.3-1
准确度主要是由系统误差决定的。当然在科学测量中没有像靶心那样明确的真值,而是设法去测定这个未知的真值,即设法减小和消除系统误差和偶然误差。
替代消除法(校准法)
就是在其它测量条件不变的情况下,用某一已知量替换被测量以达到消除系统误差的目的。也就是常见的标定的方法。
对称法就是将测量中的某些条件改变,使产生系统误差的原因对测量的结果起相反的作用,从而抵消了系统误差。
例如:阿贝折光仪有空行程,即螺旋旋转时,刻度变化而量杆不动,引起系统误差。为消除这一系统误差,可以从两个方向对线,然后取平均值。
初学者在实验过程中,往往满足于实验数据的重现性,而忽略了精确的测量值是否准确。绝对真值是不可知的,只能在计量上订出一些国际标准作为测量仪表准确性的参考标准。随着人类认识运动的推移和发展,可以逐渐迫近它。
偶然误差的统计特征通过大量实验数据发现,多种因素微小变化引起的偶然误差通常都近似地遵守正态分布,其概率分布密度为:
它恰当地体现了偶然误差的统计特征:
(1) 绝对值小的误差出现的次数比绝对值大的误差出现的次数多得多,即单峰性和有界性;
(2)绝对值相等的正误差与负误差出现的次数大致相等,这一特性称之为对称性;
这类误差还有一个极其重要的特性为:
(3)抵偿性,即同条件下对同一量进行测量,其误差的算术平均值,随着测量次数的无限增加而趋于零。 图B.3-2 偶然误差的分布
(二)实验数据的记录及有效数字实验直接测量的数据或计算结果,该用几位有效数字来表示,是件很重要的事情。有人往往容易产生这样两种想法:认为一个数值中小数点后面位数愈多愈精确,或者计算结果保留位数愈多愈精确。其实这两种想法都是错误的。因为其一,小数点的位置不决定精确度,而与所用单位大小有关。例如,用电位差计测热电偶的电动势记为764.9μV或记为0.7649mV,精确度是完全相同的;其二,测量仪器只能做到一定精度(或称灵敏度),还以上面这个例子来说,这种电位差计精度若只能达到0.1μV或0.0001mV,结果的精确度绝不会超过这个仪器所允许的范围。
由此可见,测量值或计算结果的数值用几位有效数字来表示,决定于测量仪器的精度。数值精确度大小,可由有效数字位数来表达。如上面例子中,数值的精度为0.1μV,精确度以四位有效数字表示。
在科学与工程中,为了清楚地表示出数值的精确度,可将有效数字写出,并在第一个有效数字后面加上小数点,而数值的数量级由10的整数幂来确定。这种用10的整数幂来计数的方法称为科学计数法。例如,0.000388可写作3.88,而38800可写作3.88104。科学计数法的好处是不仅便于辨认一个数值的准确度(因为现存的数字无疑都是有效数字),而且便于运算。
有关有效数字的运算法则,大家都已较熟悉,这里不再赘述。
(三)单个物理量数据的处理和精确度的表示实验数据的处理根据误差的统计原理,在无系统误差情况下,当测量次数足够多的情况下,测量值的算术平均值非常接近于真值。因此我们可以用数据的平均值作为结果。但是在我们实验中测量次数总是有限的,用有限测量值求得的平均值,只能是近似真值。
在化工实验中,常用的平均值有下列几种:
算术平均值:设为各次测量值,n代表测量次数,算术平均值为
几何平均值:几何平均值是将一组n个测量值连乘并开n次方求得,即
方均根值:方均根平均值按下式计算
数据精确度的表示实验数据的精确度或重现性是由偶然误差决定的,通常由测量值与其平均值偏差的统计值来表示常用的误差表示法有下列两种:
(1)(算术)平均偏差:算术平均偏差是表示偏差较好的方法,其表示式为
式中:n——测量次数;——为测量值与其平均值之间的差值,i=1,2,3,...,n。
(2) 标准偏差:标准偏差也称为均方根偏差,其表示式为
式中n与表示的意义与上式相同。
错误数据的剔除如果一系列测量值中混有“坏值”,必然会歪曲实验的结果,这时若能将该值剔除不用,就一定会使结果更符合客观情况。另一种方面,一组正确测量值的分散性,本来客观反映了应用某仪器在特定条件下进行测量的随机波动特性,但若为了得到精度更高的结果,而人为的丢掉了一些误差大一点的、但不属于坏值的测量值,则这样得到的所谓分散很小的结果,实质上是虚假的,所以怎样正确剔除“坏值”,是实践中经常碰到的问题.
由误差理论可知:如果某个测量值x的偏差满足下式
则认为该值是含有粗差的坏值,须剔除不要。
(四)由实验数据整理函数关系所谓实验数据的整理,就是把所获得的一系列实验数据用最合适的方式表示出来。在化工实验中,有如下三种表达方式:
实验数据列成表格将实验直接测定的一组数据,或根据测量值计算得到的一组数据,按照其原样,以一定的顺序一一对应列出数据表。例如:热电偶标定实验测得一组数据,以温度为自变量,以热电势为因变量列成数据表。这种列表法最为简便。但在实验测量中,自变量(如上例中的温度)不一定按等间距有规则的分度,这会给使用时带来困难。这就需要根据实验数据重新分度,使表中所列数据有规则地排列起来,而且希望自变量按整数作等间距顺序排列。这样会使查阅更为方便。
数据的分度有多种方法,最为简单的是图解法,将实验原始数据作图,然后再利用图中曲线按需要重新列表。其他方法这里不再介绍,可参阅有关书籍。这里仅对如何列数据表提出如下几点注意事项:
(1) 表格要有简明扼要而又符合内容的标题名称。
(2) 项目应写明名称、符号及单位。化工数据中,有的数量级很大或很小。如二氧化碳的亨利系数,用科学计数法表示,在20℃时,kPa。当列表时,项目名称写为:/ kPa,而表中数字写为:1.44。这种情形在化工数据表中经常遇到,提请大家注意。
(3) 数字写法应注意有效数字的位数,每列之内小数点应对齐。
(4) 若直接记录实验数据作表,则在实验中应注意自变量尽可能取等间距和整数。
实验数据整理成图形根据解析几何原理,可将实验数据的函数关系,整理成图形表示出来。这种表示法形式直观,容易由图线直接看出函数关系的变化规律。在化工实验中,常采用这种方法整理实验数据,因此十分重要。
将实验数据在图上进行标绘时,需注意下列几点:
(1) 对于一般采用的直角坐标,常选横轴为自变量,纵轴为因变量。在两轴侧要标明变量名称、符号和单位。尤其是单位,初学者往往因受纯数学的影响而容易忽略。
(2) 坐标分度的选择,要反映出实验数据的有效数字位数,即与被标数值精度一致,并要求方便易读。坐标分度值不一定从零开始,而使图形占满全幅坐标纸较为合适。
(3)若在同一张坐标纸上,同时标绘几组测量值,则各点要用不同符号(如:(,⊕,(等),以示区别。若几组不同函数同绘在一张坐标纸上,则在曲线上要标明函数关系或名称,或标明读数方向箭头,如图B.3-3所示。
图B.3-3
(4) 实验曲线以直线最易标绘,使用也最为方便。因此在处理数据时,尽量使曲线直线化。为此,根据不同情况将变量加以变换或选用不同坐标纸,如在化工实验数据处理上,经常采用的半对数和双对数坐标纸。并且希望所得值线的斜率力求近于1来进行分度。
关于曲线标绘的方法和要求,大家都比较熟悉,这里无需重述。下面着重介绍一下有关对数坐标的一些基本知识。
在化工实验中,常遇到和的函数关系。前者在普通坐标上可标绘成一条直线;而后者标绘在普通坐标上则为一条曲线。如果将等式的两边取对数,则可得:
若将和标绘在普通坐标上,也就可以得到一条直线。
例如,有一组实验数据如下表所示。现将这些实验数据按y对x和对分别标绘在普通坐标上,可得一条曲线和一条直线,如图B.3-4所示。
实 验 数 据 表
x/ mm
20
40
80
120
160
200
y/ l / min
5.40
7.59
10.76
13.01
15.00
16.73
lgx
1.301
1.602
1.903
2.079
2.204
2.301
lgy
0.732
0.880
1.032
1.114
1.176
1.223
图B.3-4 普通坐标 图B.3-5 双对数坐标
为了避免将每个数据都换算成对数,可以将坐标纸的分度直接按对数值绘制。现将表中的数据直接标绘在对数坐标纸上,如图B.3-5所示。纵坐标和横坐标都用对数值进行绘制,称为双对数坐标。对于某些函数关系,如只需纵坐标用对数值绘制,即谓半对数坐标。
对数坐标有几个特点,在应用时需特别注意:
在对数坐标轴上的数值为真数。坐标轴的原点为1;,而不是0。
由于0.01、0.1、1、10、100等的对数,分别为-2、-1、0、1、2等,所以在坐标纸上,每一数量级的距离是相等的。
在对数坐标上求取斜率的方法,与普通坐标上求法有所不同,这一点需要特别注意。在双对数坐标上求斜率,则不能直接用坐标标度来度量,因为在对数坐标上标度的数值是真数而不是对数。因此,需用对数值来求算,或者直接用尺子在坐标纸上量取线段长度求取,如图B.3-5中所示的直线,其斜率
式中:与的数值,即用尺子测量而得的线段长度。
在双对数坐标上,直线与x=1的纵轴相交处的y值,即为原方程中的a值。若所标绘的直线需延长很远才能与x=1的纵轴相交,则可在求得斜率n之后,在直线上任取一组数据x和y,代入原方程中,也可求得a的值。
由实验数据拟合函数关系在化学工程研究中,在某些场合下,可以根据所研究过程的机理用数学方程来描述该过程的各个参数和变量之间的关系,即所谓建立数学模型。在计算机技术不断取得进展的现今时代来讲,为建立数学模型及其求解提供了可能性。至今虽还不是所有场合都能做到,但它的确是一种新的趋向。 在大多数场合,是把实验中得到的数据绘制成曲线,与已知函数关系式的典型曲线对照,求得经验公式。在化学工程中,把理论上分析困难,影响因素复杂的众多物理量,组合成为无量纲数(又称为准数),把有关准数关联成经验公式,即所谓准数关联式。至今在化学工程学中,准数关联式的应用极广。
关于如何建立数学模型,如何选择经验公式,如何组合准数和建立准数关联式等问题,不是在这里用较短篇幅所能阐述清楚的。在化学工程实验中所常遇到的问题是已知经验公式,如何确定经验公式中的常数,又称回归。经验公式中常数的求法很多,在化工实验中,最常用的是直线图解法和最小二乘法。
(1) 图解法凡属于直角坐标上可直接标绘出一条直线的,可用此法求得直线方程的常数。若已知线性方程为y=ax+b,该直线的斜率,即为方程中a值。直线在y轴上的截距,即为方程中b值。
凡经过适当变换后能标绘成直线时,也可用图解法求已知方程的常数值。如图B.3-5所示,在双对数坐标上标绘的直线,其原始方程应具有这种形式:。这时,也可用图解法求得方程中的n值和a值。图解的方法和注意事项已在前面作过介绍,这里不再重复。
(2) 最小二乘(回归)法利用最小二乘法回归函数关系的依据是,认为各自变量均无误差,而归结为因变量带有测量误差;并且认为测量值与真值(最佳值)之间的误差平方和为最小。现举例说明,利用最小二乘法求关联式的常数:
例:若用标准温度计标定铜-康铜热电偶,可得到一组实验数据:
标准温度计测得温度:t1,t2,…,tn
热电偶相应热电势测定值:e1,e2,…,en
温度在0~100℃范围内,根据实验数据标绘的曲线,选定温度t与热电势e之间符合下列关系式:
若测量值ei与真值(最佳值)之间的偏差为
或写成 , (B.3-1)
按照最小二乘法的原理,测量值与真值之间偏差平方之和为最小(即为最小)。其最小值的必要条件为
(B.3-2)
(B.3-3)
可得
同理将式(B.3-1)式代入式(B.3-3)并求导整理,展开可得:
联立两式求解,得关系式中常数的计算式为
另外,在实验的数据处理中最常用到的是:回归线性方程,若有1-n对数据xi,yi,最小二乘法求得常数值为
用图解法和求函数关系式中的常数值,确为各种方法中较好的方法,尤其用最小二乘法求得常数值,标准偏差确实较其它方法小。最小二乘法计算虽较繁杂,但当今在计算机十分普及的情况下,多数数据处理应用程序均有最小二乘回归,最小二乘法得到了愈来愈广泛地应用。
参考资料温瑞媛等著,化学工程基础,北京:北京大学出版社(2002)
北京大学《化工基础及实验》教学组编,化工实验讲义(2003)