跳转到内容

误差理论与数据处理

来自還阔以
误差理论与数据处理
application 一切精密测量与数据分析领域
en_title Error Theory and Data Processing
core_concept 误差分类、精度指标、误差传播定律、最小二乘法
definition 研究测量过程中误差的来源、性质、传播规律,并对含有误差的观测数据进行处理以求得未知量最佳估值的理论与方法。



误差理论与数据处理测绘学乃至所有实验科学的理论基础。它旨在解决一个核心问题:如何从带有误差的观测数据中,科学地、客观地获取最可靠的结果,并对其精度进行评定。

任何测量都无法做到绝对精确,测量结果与被测量真值之间的差异称为测量误差。误差理论的研究始于18世纪天文学家和大地测量学家对观测数据的处理,并由高斯等人发展了以最小二乘法为核心的现代误差处理理论。

误差的来源与分类

根据误差的性质和表现规律,通常将其分为三类:

1. 系统误差 (Systematic Error):在相同观测条件下,对某量进行一系列观测时,其大小和符号保持不变,或按一定规律变化的误差。系统误差具有积累性。

   *   来源:仪器本身构造的缺陷(如刻度尺不准)、特定的外部物理环境(如温度变化引起钢尺伸缩)、观测者固有的习惯(如估读时总是偏高或偏低)。
   *   处理:通过改进仪器、改善观测条件、采用特定的观测方法(如盘左盘右观测)或通过公式进行改正来消除或削弱。

2. 偶然误差 (Random Error):在相同观测条件下进行一系列观测时,其大小和符号毫无规律、忽大忽小、正负变化的误差。偶然误差具有抵偿性,即在大量观测中,其总和趋于零。

   *   来源:由许多无法控制的微小因素综合影响所致,如仪器未完全整平、人眼估读的瞬间抖动、大气密度的微小波动等。
   *   特性:单个误差不可预测,但大量误差的集合呈现出统计规律性(如正态分布)。
   *   处理:无法消除,但可以通过增加观测次数、进行数据处理(如取平均值)来减弱其对最终结果的影响。

3. 粗差 (Gross Error / Blunder):明显歪曲观测结果的错误。它既不属于系统误差也不属于偶然误差,是应该避免且必须剔除的错误。

   *   来源:观测者读错、记错、操作失误,或仪器突然发生故障等。
   *   处理:通过重复测量、多余观测和数据检核来发现并剔除含有粗差的观测值。

精度指标

评定观测值或观测成果质量的指标,主要用于衡量偶然误差的大小。

  • 中误差 (Mean Square Error / Standard Deviation):也称标准差,是衡量观测值精度的最常用指标。它反映了观测数据相对于其平均值的离散程度。中误差越小,表示观测精度越高。
  • 方差 (Variance):中误差的平方。
  • 极限误差 (Limit Error):在一定概率下,偶然误差不会超出的界限。通常取2倍或3倍中误差。

误差传播定律

误差传播定律阐述了由多个独立观测值计算的函数,其误差与各独立观测值误差之间的数学关系。这是进行精度设计和评定的重要依据。

假设函数为 `Y = f(X1, X2, ..., Xn)`,且各观测值 `X1, X2, ...` 的中误差分别为 `m1, m2, ...`,则函数的方差 `σ_Y^2` 为:

`σ_Y^2 = (∂f/∂X1)^2 * m1^2 + (∂f/∂X2)^2 * m2^2 + ... + (∂f/∂Xn)^2 * mn^2`

这个公式是协方差传播律的简化形式(当各观测值不相关时)。

测量平差

当观测值数量多于确定未知量所必需的观测数量时(即存在多余观测),由于误差的存在,必然导致计算结果不唯一。测量平差(Adjustment)就是根据一定的准则,处理这些带有误差的多余观测数据,以求得未知量的最可靠估值(最优解)及其精度。

  • 平差准则:最常用的是最小二乘准则,即要求残差(观测值与其估计真值之差)的平方和为最小。
  • 平差模型:根据观测值和未知数的关系,可以分为条件平差、参数平差、附有参数的条件平差等。

参见