您还没有绑定微信,更多功能请点击绑定

标准化残差

标准化残差
有助于检测异常值。标准化残差等于残差值 ei 除以其标准差的估计值。通常将大于 2 和小于 -2 的标准化残差视为较大,Minitab 在异常观测值表以及拟合值与残差表中以 "R" 标记这些观测值。

标准化残差很有用,因为原始残差的方差不恒定,因此无法很好地指示异常值:相应 X 值远离 的残差的方差比相应 X 值接近 的残差的方差要大。将此非恒定方差的对照物标准化,所有标准化残差就具有相同的标准差。

标准化残差也称为内部 t 化残差。

以上是标准化残差的定义,请教:为什么说“因为原始残差的方差不恒定”
请教:怎么理解:相应 X 值远离 的残差的方差 和 相应 X 值接近 的残差的方差 ?

非常感谢各位的帮助!
对“好”的回答一定要点个"赞",回答者需要你的鼓励!
已邀请:

chdonger (威望:1) (上海 ) 汽车制造相关 经理

赞同来自:

本帖最后由 chdonger 于 2010-2-1 10:45 编辑

呵呵, 这就是我非常不喜欢国内教科书/参考书的原因, 概念解释的异常抽象, 还没有解释, 比E文书还难看懂.

相信你应该清楚残值(Residual)是Y预测值-Y实际值,以回归模型为例, 因为回归模型是使用最小二乘法(least square)方法来确定最佳模型的. 其实质就是最小化残值的平方和. 因为每个X对应的Y预测值-Y实际值的残值不同, 残值越大, 对平方和的影响越大, 所以对回归模型的建立影响就大. 所以说 "相应X值远离的残差的方差比相应X 值接近 的残差的方差要大"

好的, 既然我们已经知道了残值对回归模型的建立影响很大, 所以我们会比较关心那些残值比较大的点, 但是如果我告诉你的一个点的原始残值是1.5, 因为没有参照, 你不能知道这点的原始残值对回归模型的影响是很大还是很小, STANDARDIZED可以告诉我们这点的残值的大小和所有残值的标准差的大小的比值, 所以通过Standardized之后, 我告诉你虽然这点的原始残值是1.5, 但你可以知道这点与所有残值的标准差的大小的比较(如2.5倍, 这点影响就比较大) 一般认为, 如果这点的STANDARDIZED RESIDUAL是所有残值的标准差的2倍(或-2倍)以上, 就应当加以注意

7 个回复,游客无法查看回复,更多功能请登录注册

发起人

扫一扫微信订阅<6SQ每周精选>