一元线性回归
为什么要使用回归方程式:
1)为了发现暂定的Vital Few(少数致命缺陷),即寻找潜在的关键少数"X"
2)为了判定Y值并使其最佳化
3)为了决定哪些X因素值上‘Y'成为最佳化
回归模型中的变量:
#因变量或称响应变量y(Dependent Variable or Response):由自变量来解释其变化的变量
#自变量或称影响因素、解释变量 x(IndependentVariable or Predictors):给定的或可以控制的、用来解释、也测应变量的变量。
http://my.6sq.net/batch.download.php?aid=2066
SST(Sum of squares of total):总的平方和
SSR(Sum of Squares of Regression):回归平方和
SSE(Sum of Squares of Errors):误差平方和(残差平方和)
SST=SSR+SSE
MSE(Mean squares of errors):估计的均方误差,是总体误差项的方差(Error of Coefficient)的估计量:
MSE=SSE/fe=SSE/n-2
{Note: 在Minitab中,SE Coef=sqrt(MSE)
SE Coef :应是系数的标准误差: Standard error of coefficient.因为我们计算得到的回归系数是基于有限的样本,是用最小二乘法得到的估计值. 如果有无数组类似的
样本就会得到无数组系数,各不相同.真实的(总体)系数是不可能得到的.SE Coef 用来表征这种离散性,即不同系数的标准偏差.}
Coefficient of determination判定系数(r2):估计的回归方程拟合优度的度量,表明Y的变异性能被估计的回归方程解释的部分所占比例。
r2=SSR/SST=1-SSE/SST
一元线性回归模型预测
1)点估计
前提:回归方程经过检验,证明X和Y的关系在统计上是显著的。
注意:利用点估计得到的Y平均值的点估计值和Y的一个个别值其结果是相同的;
点估计不能提供估计量的精确度
在样本自变量取值之外进行预测,要可别谨慎
2)回归预测的置信区间
Minitab:
Regression-Graphs
Regular:用残差的原始数据Response-fit
Standardized:绝对值大于2时算做比较大,Minitab显示这些值作为不寻常的值并用R来标识。(Residual)/(STD of the residual)
Deleted:计算第i个残差时把第i个观测值去掉(residual).(STD of the residual)
Residual Plot:是回归模式是否适当进行检查的分析工具
1)残差的平均值始终是零
2)残差具有正态分布
3)残差应是随机分布
以上是读《回归分析/Regression Analysis》写的笔记,感觉这个教程不错,在此感谢Steven Li能和大家分享这个教程。
教程地址:http://bbs.6sq.net/viewthread. ... %25F6
附件:
1)为了发现暂定的Vital Few(少数致命缺陷),即寻找潜在的关键少数"X"
2)为了判定Y值并使其最佳化
3)为了决定哪些X因素值上‘Y'成为最佳化
回归模型中的变量:
#因变量或称响应变量y(Dependent Variable or Response):由自变量来解释其变化的变量
#自变量或称影响因素、解释变量 x(IndependentVariable or Predictors):给定的或可以控制的、用来解释、也测应变量的变量。
http://my.6sq.net/batch.download.php?aid=2066
SST(Sum of squares of total):总的平方和
SSR(Sum of Squares of Regression):回归平方和
SSE(Sum of Squares of Errors):误差平方和(残差平方和)
SST=SSR+SSE
MSE(Mean squares of errors):估计的均方误差,是总体误差项的方差(Error of Coefficient)的估计量:
MSE=SSE/fe=SSE/n-2
{Note: 在Minitab中,SE Coef=sqrt(MSE)
SE Coef :应是系数的标准误差: Standard error of coefficient.因为我们计算得到的回归系数是基于有限的样本,是用最小二乘法得到的估计值. 如果有无数组类似的
样本就会得到无数组系数,各不相同.真实的(总体)系数是不可能得到的.SE Coef 用来表征这种离散性,即不同系数的标准偏差.}
Coefficient of determination判定系数(r2):估计的回归方程拟合优度的度量,表明Y的变异性能被估计的回归方程解释的部分所占比例。
r2=SSR/SST=1-SSE/SST
一元线性回归模型预测
1)点估计
前提:回归方程经过检验,证明X和Y的关系在统计上是显著的。
注意:利用点估计得到的Y平均值的点估计值和Y的一个个别值其结果是相同的;
点估计不能提供估计量的精确度
在样本自变量取值之外进行预测,要可别谨慎
2)回归预测的置信区间
Minitab:
Regression-Graphs
Regular:用残差的原始数据Response-fit
Standardized:绝对值大于2时算做比较大,Minitab显示这些值作为不寻常的值并用R来标识。(Residual)/(STD of the residual)
Deleted:计算第i个残差时把第i个观测值去掉(residual).(STD of the residual)
Residual Plot:是回归模式是否适当进行检查的分析工具
1)残差的平均值始终是零
2)残差具有正态分布
3)残差应是随机分布
以上是读《回归分析/Regression Analysis》写的笔记,感觉这个教程不错,在此感谢Steven Li能和大家分享这个教程。
教程地址:http://bbs.6sq.net/viewthread. ... %25F6
附件:
没有找到相关结果
已邀请:
4 个回复
chenhougang1980 (威望:0)
赞同来自: