解读Minitab的正态概率图
本帖最后由 wang168 于 2009-11-6 06:17 编辑
在DOE、Regression、统计检定时常需要用到正态分布的假设,检定一组数据是否取自正态分布,进行常态性检定最简单方法就是采用正态概率图。
最近很多贴文询问Minitab正态概率图的坐标系统、意义与手工绘制等议题,因涉及分配概率图的理解与使用,下图是以一组14个样本数据所画的正态概率图!(http://my.6sq.net/attachment/2 ... 1Z.gif)
图上注解说明:
注解1:Probability Plot of x,表示此图是一组数据,放在名为x的栏位上,
下方有Normal表示本项检定的H0是Normal –正态分布,当然H1就是非正态分布
注解2:Mean 40表示数据平均值,StDev 3.742(计算结果3.74166)表示数据标准差,
N 14表示数据数,这些计算式依据一般基本统计的公式计算而得
注解3:蓝色直线是画在正态分布机率图纸上,是一条参考线,以判断是否H0成立
详细解说如下
1) 鼠标移到Minitab蓝色直线上,就会出现如下图中的黄底的Percent与x数值表
2) Percent与x数值表中,Percent为正态分布累积分配函数(CDF),数值是介于0与1之间,
表上数值为%值,习惯上是以F(x)表式之,而x为F(x)的反函数
3) 若直接以Percent与x( inv F(x))数值表作散布图不会得到依直线,而是S型曲线
4) 在Percent与x( inv F(x))数值表多加一栏z,其值为x( inv F(x))的标准化,
z=( inv F(x)) – 40)/3.74166
5) 以x( inv F(x))为横轴,z为纵轴作散布图+回归线,可得一直线,将每个点以Percent
作为数据卷标
6) 隐藏纵轴z,改用Percent的数据标签,就是一般的正态概率图纸
注解4:红色散布图图点是将样本数据排序后,以median rank估计出该点的CDF值,根据CDF数值
求出标准正态分布的反函数z值,再以x vs z 绘出散布图(参考注解3)
注解5:Anderson-Darling 常态性检定以辅助图型判断
详细作法说明请参考http://my.6sq.net/space.php%3F ... 76288
在DOE、Regression、统计检定时常需要用到正态分布的假设,检定一组数据是否取自正态分布,进行常态性检定最简单方法就是采用正态概率图。
最近很多贴文询问Minitab正态概率图的坐标系统、意义与手工绘制等议题,因涉及分配概率图的理解与使用,下图是以一组14个样本数据所画的正态概率图!(http://my.6sq.net/attachment/2 ... 1Z.gif)
图上注解说明:
注解1:Probability Plot of x,表示此图是一组数据,放在名为x的栏位上,
下方有Normal表示本项检定的H0是Normal –正态分布,当然H1就是非正态分布
注解2:Mean 40表示数据平均值,StDev 3.742(计算结果3.74166)表示数据标准差,
N 14表示数据数,这些计算式依据一般基本统计的公式计算而得
注解3:蓝色直线是画在正态分布机率图纸上,是一条参考线,以判断是否H0成立
详细解说如下
1) 鼠标移到Minitab蓝色直线上,就会出现如下图中的黄底的Percent与x数值表
2) Percent与x数值表中,Percent为正态分布累积分配函数(CDF),数值是介于0与1之间,
表上数值为%值,习惯上是以F(x)表式之,而x为F(x)的反函数
3) 若直接以Percent与x( inv F(x))数值表作散布图不会得到依直线,而是S型曲线
4) 在Percent与x( inv F(x))数值表多加一栏z,其值为x( inv F(x))的标准化,
z=( inv F(x)) – 40)/3.74166
5) 以x( inv F(x))为横轴,z为纵轴作散布图+回归线,可得一直线,将每个点以Percent
作为数据卷标
6) 隐藏纵轴z,改用Percent的数据标签,就是一般的正态概率图纸
注解4:红色散布图图点是将样本数据排序后,以median rank估计出该点的CDF值,根据CDF数值
求出标准正态分布的反函数z值,再以x vs z 绘出散布图(参考注解3)
注解5:Anderson-Darling 常态性检定以辅助图型判断
详细作法说明请参考http://my.6sq.net/space.php%3F ... 76288
没有找到相关结果
已邀请:
20 个回复
Steven8018 (威望:1) (重庆 南岸区) 电子制造 工程师
赞同来自:
http://bbs.6sq.net/redirect.ph ... 27605 _wang168_
hi George,
我是这样理解的, H0代表没有多少变化,正态分布不是双峰型,所以变化不大,P值就是>0.05.