解读Minitab的正态概率图
在DOE、Regression、统计检定时常需要用到正态分布的假设,检定一组数据是否取自正态分布,进行常态性检定最简单方法就是采用正态概率图。
最近很多贴文询问Minitab正态概率图的坐标系统、意义与手工绘制等议题,因涉及分配概率图的理解与使用,因此撰文剖析,如下图是以一组14个样本数据所画的正态概率图
本图原始数据,经排序后如下
34,35,36,37,38,39,40,40,41,42,43,44,45,46
图上有5个注解,依序说明之
注解1:Probability Plot of x,表示此图是一组数据,放在名为x的栏位上,下方有Normal表示本项检定的H0是Normal –正态分布,当然H1就是非正态分布
注解2:Mean 40表示数据平均值,StDev 3.742(计算结果3.74166)表示数据标准差,N 14表示数据数,这些计算式依据一般基本统计的公式计算而得
注解3:蓝色直线是画在正态分布机率图纸上,是一条参考线,以判断是否H0成立
详细解说如下
1) 鼠标移到Minitab蓝色直线上,就会出现如下图中的黄底的Percent与x数值表
2) Percent与x数值表中,Percent为正态分布累积分配函数(CDF),数值是介于0与1之间,表上数值为%值,习惯上是以F(x)表式之,而x为F(x)的反函数
3) 若直接以Percent与x( inv F(x))数值表作散布图不会得到依直线,而是S型曲线
4) 在Percent与x( inv F(x))数值表多加一栏z,其值为x( inv F(x))的标准化,z=( inv F(x)) – 40)/3.74166
5) 以x( inv F(x))为横轴,z为纵轴作散布图+回归线,可得一直线,将每个点以Percent作为数据卷标
6) 隐藏纵轴z,改用Percent的数据标签,就是一般的正态概率图纸
此处须要另文说明 解读正态概率图-正态概率图纸的秘密
注解4:红色散布图图点是将样本数据排序后,以median rank估计出该点的CDF值,根据CDF数值求出标准正态分布的反函数z值,再以x vs z 绘出散布图(参考注解3)
此处须要另文说明解读正态概率图-绘制小样本数据检验常态性
注解5:Anderson-Darling 常态性检定以辅助图型判断
此处须要另文说明 解读正态概率图- Anderson-Darling檢定
延伸阅读:
用Excel做简易的正态概率图(Normal probability plot)例