Minitab中的数据正态性检验选项
本帖最后由 小编H 于 2011-5-25 11:42 编辑
Minitab
统计》基本统计量》正态性检验
图片窗口上面的一项一项都是怎么填的?
然后Anderson-darling
Ryan-Joiner
Kolmogorov-Smirnov
这三种方法有什么区别?
相信应该是不同的数据用不同的方法吧?
Minitab
统计》基本统计量》正态性检验
图片窗口上面的一项一项都是怎么填的?
然后Anderson-darling
Ryan-Joiner
Kolmogorov-Smirnov
这三种方法有什么区别?
相信应该是不同的数据用不同的方法吧?
没有找到相关结果
已邀请:
13 个回复
looksname (威望:0) (广东 深圳) 电信通讯 主管
赞同来自:
Anderson-Darling检验(A-D检验),是一种基于经验累积分布函数(ECDF)的算法,特别适用于小样本(当然也适用于大样本)
,AD值越小,表明分布对数据拟合度越好,A-D检验只适合特定的连续分布如:normal、lognormal、exponential、Weibull、logistic
、extreme-value type 1。
A-D检验是对K-S检验的一种修正,相比K-S检验它加重了对尾部数据的考量,K-S检验具有分布无关性,它的临界值并不依赖被
测的特定分布,而A-D检验使用特定分布去计算临界值,这使得A-D检验具有更灵敏的优势。
Anderson-Darling 检验
选择此项将执行正态性的 Anderson-Darling 检验,此检验是将样本数据的经验累积分布函数与假设数据呈正态分布时期望的分布进
行比较。如果实测差异足够大,该检验将否定总体呈正态分布的原假设。
Ryan-Joiner检验(R-J检验,类似于Shapiro-Wilk检验),是一种基于相关性的算法。R-J检验可得到一个相关系数,它越接近1就越
表明数据和正态分布拟合得越好。
A-D检验和R-J检验在正态性检验中具有相似的功效,而K-S检验的功效较弱。
对于大样本的拟合度测试,通常使用卡方检验(卡方检验是一种基于概率密度函数的算法,不适合于小样本)会更好,因为卡方检
测不需要分布参数的知识,并且卡方检验适用于连续和离散分布。
Ryan-Joiner 正态性检验
选择此项将执行 Ryan-Joiner 检验,此检验通过计算数据与数据的正态分值之间的相关性来评估正态性。如果相关系数接近 1,则总
体就很有可能呈正态分布。Ryan-Joiner 统计量可以评估这种相关性的强度;如果它未达到适当的临界值,您将否定总体呈正态分布
的原假设。此检验类似于 Shapiro-Wilk 正态性检验。
Kolmogorov-Smirnov检验(K-S检验),也是一种基于经验累积分布函数(ECDF)的算法,K-S检验最吸引人的特性是具有分布无
关性,所以适用于任何连续分布,很适合小样本(当然也适合大样本)。
但是由于K-S检验相对尾部而言,往往对分布中心更敏感,并且它的临界值并不依赖被测的特定分布,相对A-D检验而言它的灵敏
度较低,所以很多的分析更愿意使用A-D 拟合度检验。
Kolmogorov-Smirnov 正态性检验
选择此项将执行正态性的 Kolmogorov-Smirnov 检验,此检验是将样本数据的经验累积分布函数与假设数据呈正态分布时期望的分
布进行比较。如果实测差异足够大,该检验将否定总体呈正态分布的原假设。
如果这些检验的 p 值低于你选择的 a 水平,你可以否定原假设,并断定总体呈非正态分布。
有资料上说Anderson-darling、Ryan-Joiner、Kolmogorov-Smirnov三种检验中只要有一种给出否定的结论,就应该判定该分布非正
态。
实际上AD检验即使通不过,但是另外两种能通过的话,也可以当成正态分布的,因为可以把它看成近似正态分布,这个与样本的多
少有关。AD检验更适合小样本数量的检验。因此,有的时候AD通不过正态,其它两种能通过,也能把数据看作近似正态分布的。
样本容量(样本中个体的数目)仅为5~10也可以进行正态性检验。但是样本容量过少时,即使是正态,也会受到置疑。因为那要看抽
样时5个样本的代表性如何。
当样本数据为非正态分布或为小样本或两样本方差不等时要用非参数检验(卡方、符号、秩和等)。
用图形化汇总来验证数据是否正态携带的信息比较多,P值、峰度、偏度都会在图形化汇总中显示出来。