残差分析是指在进行统计分析时,对所得到的回归模型的拟合程度进行检验的一种方法。其原理是通过比较实际观测值与回归方程预测值之间的差异,来评估所得到的回归模型的拟合优度,进而判断该模型是否符合样本数据的真实情况。
残差分析的基本步骤包括:
1. 对已建立的回归模型,计算每个样本的残差(实际观测值与回归方程预测值之间的差);
2. 通过绘制残差图、正态概率图等图形,评估残差的分布情况是否满足正态分布假设;
3. 检查残差是否存在异方差性(即残差的方差是否随着自变量的变化而发生变化)和自相关性(即残差之间是否存在相关性)。
如果在残差分析中发现了残差不符合正态分布、存在异方差性或自相关性等问题,就需要进一步优化模型,比如尝试增加新的解释变量、调整模型的函数形式、采用非线性回归方法等等。在进行残差分析时需要注意,残差分析只能作为判断回归模型是否符合数据的一种方法,不能完全代替其他统计方法的应用。
残差分析(residual analysis)就是通过残差所提供的信息,分析出数据的可靠性、周期性或其它干扰 。用于分析模型的假定正确与否的方法。所谓残差是指观测值与预测值(拟合值)之间的差,即是实际观察值与回归估计值的差。
在回归分析中,测定值与按回归方程预测的值之差,以δ表示。残差δ遵从正态分布N(0,σ2)。(δ-残差的均值)/残差的标准差,称为标准化残差,以δ*表示。δ*遵从标准正态分布N(0,1)。
实验点的标准化残差落在(-2,2)区间以外的概率≤0.05。
若某一实验点的标准化残差落在(-2,2)区间以外,可在95%置信度将其判为异常实验点,不参与回归线拟合。显然,有多少对数据,就有多少个残差