2.4 分析结果的数据处理

凡是测量就有误差存在。用数字表示测量结果都具有不确定性,即使是一位经验丰富的分析工作者采用最好的分析方法和可靠的分析仪器对同一个样品进行多次测定,其得到的结果也不可能完全一致。于是,相关的一系列问题便提出来了:如何更好地表达结果,使之既能体现测量的精密度,又能够充分显示结果的准确度;如何对测量的可疑值或离群值进行有根据的取舍;如何比较不同人、不同实验室间的结果以及用不同实验方法得到的结果;等等。这些问题需要采用数理统计的方法加以解决。

本节只简要介绍与处理分析实验数据有关的数理统计的最基本问题。

2.4.1 置信度与置信区间

在实际分析工作中,最核心的问题就是如何通过测量来求得真值。一方面,由于随机误差的不可避免,测量值与真值往往不一致(xµ);另一方面,测量值与真值之间的差距又不会很大,即x不但不可能偏离µ 太远(有界性),而且通常就在µ 附近(小误差出现的概率较大)。基于上述两方面因素,在有限次测量中,合理地得到真值的方法应该是估计出测量值与真值的接近程度,即在测量值附近估计出包含有真值的范围。这就提出了置信度与置信区间的问题。

置信度P) 又称置信水平,就是人们对所做判断的有把握程度。置信度的实质仍然归结为某事件出现的概率,可以理解为某一定范围的测定值(或误差值)出现的概率。

置信区间 是指将在一定概率下以测量值为中心包含总体平均值在内的区间。置信区间的意义在于真值在指定概率下,分布在某一个区间。

在分析测试中,测定次数是有限的,一般平行测定3~5次,无法计算总体标准偏差 σ 和总体平均值 µ,而有限次测定的随机误差并不完全服从正态分布,而是服从类似于正态分布的t分布t值的定义为:

image081  (2.14)

若以某样本的测定值的平均值image083表示 µ 的置信区间,根据t分布则可得出以下关系式:

image085  (2.15)

式(2.15)表示在一定置信度下,以平均值image087为中心,包括总体平均值 µ 的范围。这就是平均值的置信区间。该式的意义:在一定置信度下(如95%),真值(总体平均值)将在测定平均值image089附近的一个区间即在image091image093之间存在,有把握程度为95%。因此,式(2.15)常作为分析结果的表达式。

例2.6 测定SiO2的含量,6次平行测定的数据(%)为28.62、28.59、28.51、28.48、28.52和28.63,计算置信度为90%和95%时的平均值的置信区间。

解:image087= 28.56%,s = 0.06%,n = 6。查t值表(表2.4)得

P = 90%,t = 2.015,根据式(2.15),µ = (28.56±0.05)%

P = 95%,t = 2.571,根据式(2.15),µ = (28.56±0.07)%

计算结果表明:若平均值的置信区间取 (28.56±0.05)%,则真值在其中出现的概率为90%;若将真值出现的概率提高到95%,则其平均值的置信区间将扩大为 (28.56±0.07)%。

置信度选择越高,置信区间越宽,其区间包括真值的可能性就越大。在分析化学中,一般将置信度定为95%或90%。

表2.4 t值表

28

29

例2.7 同例2.6,若将测定次数改为4次,4次平行测定的数据(%)分别为28.62、28.59、28.48和28.52,计算置信度为95%时的置信区间。

解:image087= 28.55,s = 0.064%,n = 4,查表2.4:P = 95%,t = 3.182

则: µ = (28.55±0.12)% 

由此可见,在一定测定次数范围内,适当增加测定次数,可使置信区间显著缩小,从而使测定的平均值image087与总体平均值 µ 更接近。

当测定值的精密度越高(s值越小)、测定次数越多(n值越大)时,置信区间越窄,即平均值越接近真值,平均值越可靠。

注意:对于置信区间的概念必须正确理解,如 µ =(47.50±0.10)%(置信度为95%),应当理解为在 (47.50±0.10)% 的区间内包括总体平均值 µ 的概率为95%。因为 µ 是客观存在的,没有随机性,不能说它落在某一区间的概率为多少。

2.4.2 可疑值的取舍

在一组平行测定的数据中,有时个别数据与其他数据相比差距较大,这样的数据就称为可疑值,也叫极端值或离群值。数据中出现个别值离群太远时,首先要仔细检查测定过程是否有操作错误,是否有过失误差存在,不能随意舍弃可疑值以提高精密度,而是需要进行数理统计处理。即判断可疑值是否仍在偶然误差范围内。可疑值取舍的统计方法很多,也各有特点,但基本思路是一致的,即它们都是建立在随机误差服从一定的分布规律的基础上。常用的统计检验方法有image102检验法、Q检验法(Q-test)和格鲁布斯法。

本书主要介绍image102检验法和Q检验法两种方法。

(1)image102检验法

步骤】首先求出除可疑值以外的其余数据的平均值image105和平均偏差image107,然后将可疑值与平均值image105之差的绝对值与image102比较,若差的绝对值大于等于image102,则将可疑值舍弃,否则保留。

该检验法比较简单,但判断有时不够准确。

例2.8 某标准溶液的4次标定值分别为0.1014mol·L−1、0.1012mol·L−1、0.1025mol·L−1和0.1016mol·L−1,问其中0.1025mol·L−1是否应舍弃?

解:除掉0.1025外的其余三个数据的image105=0.1014,image107=0.00013,image102= 0.00052,则:

|0.1014−0.1025| = 0.0011>image102

故可疑值0.1025应该舍弃。

(2)Q检验法

如果测定次数在10次以内,采用Q检验法比较简便。

步骤】将测定值由小到大排列:x1, x2, x3, …, xn。如果其中x1xn为可疑值,算出统计量Q值。

xn可疑时,用:image117  (2.16)

x1可疑时,用:image119  (2.17)

式(2.16)和式(2.17)中xn−x1称为极差。image121值越大,说明x1xn离群越远,远至一定程度时则应将其舍去,故image122值又称为“舍弃商”。

根据测定次数n和所要求的置信度P,查Q值表(表2.5),可得相应n和置信度P下的image124,若image125image127,则应将可疑值舍弃,否则保留。

表2.5 Q值表

30

例2.9 同例2.8,用Q检验法判断0.1025是否应舍弃(置信度0.90)。

解:image129  

查表2.5,n=4时,Q0.90=0.76,因0.69<0.76(image130Q0.90),故0.1025不应舍弃,而应保留。

同一个例子,Q检验法与image132检验法的结论不同,这表明了不同判断方法的相对性。

Q检验法由于不必计算image134s,故使用起来比较方便。Q检验法在统计上有可能保留离群较远的值。置信度常选90%,如选95%,会使判断误差更大。

如果测定数据较少,测定的精密度也不高,因image135值与QP,n值相接近而对可疑值的取舍

难以判断时,最好补测1~2次再进行检验就更有把握。

缺乏经验的人往往喜欢从三次测定数据中挑选两个“好”的数据,这种做法是没有根据的,有时甚至是荒谬的,表面上似乎提高了测定的精密度,但对平均值的置信区间来说,有时得到相反的结果。

例如,有下列三个测定值:40.12、40.16和40.18。表面看起来,取后面两次测定数据的平均值40.17更理想,其实,其置信区间更宽了,真值存在的范围更大了。

① 不舍弃40.12,平均值的置信区间(置信度为95%)为:

image137

即真值范围在40.07~40.23。

② 舍弃40.12后,平均值的置信区间(置信度为95%)为:

image139

即真值存在范围在40.04~40.30。

总之,出现可疑数据时,应着重从技术上查明原因,然后再进行统计检验,切忌任意舍弃。