ANOVA分析,输出响应是否需要正态分布?(纯学术讨论)
目前,绿带和黑带的教材都写ANOVA分析,输出响应需要正态分布,很多绿带黑带在用ANOVA分析的时候,每个水平都进行正态分布检验,甚至于就5,6个数据也进行正态分布检验,之后再用ANOVA分析。
我对ANOVA分析是否需要正态分布有如下分析:
1。第一点,因为实际中,我们每一个水平下的重复试验次数都非常少,每个水平下,很少很少有超过15组的数据,个人认为如果样本量太小的话,做正态分布检验基本没什么意义的。如果一定要做正态分布检验的话,对原始数据作正态分布检验更有意义,如果验证了数据本应该符合正态分布的话,那么我们有理由基于正态分布假设分析平均值。
2。对于原始数据,ANOVA分析是否需要正态分布检验?
ANOVA分析,Ho是各组的平均值没有差异,Ha,平均值有一组有差异。用的是F分布检验。对应p-value。它是对平均值的假设检验。
我们可以换一个角度来说,one-way ANOVA是检验每个水平的平均值,与总体(所有水平)的平均值是否有差异,它是对平均值的检验,从假设检验理论,样本平均值符合正态分布(当样本足够大的时候),当每一个水平的样本大小非常大的时候,样本的平均值都符合正态分布,假设检验原理都成立。但在实际中,我们的样本大小很小,这时候,原始数据不应该有很明显的左偏和右偏,或均值分布,否则置信区间外的实际面积与假设有很大的出入,判断结果不可靠。
结论:只要原始图形没有明显的左偏,右偏,均值分布,我们都可以用ANOVA分析问题。
换一个角度,如果图形有一点倒钟扁平,不符合正态分布,我们就用非正态分布工具,用中位值或众数验证显著差异吗?这样更不合理,用ANOVA合理一点,你们认为呢?
这些分析都是我个人观点,都是我自己的语言,有些表述不明白,大家尽量理解,论坛就是提出争论的地方,希望大家提出见解,反驳我的论点!
我对ANOVA分析是否需要正态分布有如下分析:
1。第一点,因为实际中,我们每一个水平下的重复试验次数都非常少,每个水平下,很少很少有超过15组的数据,个人认为如果样本量太小的话,做正态分布检验基本没什么意义的。如果一定要做正态分布检验的话,对原始数据作正态分布检验更有意义,如果验证了数据本应该符合正态分布的话,那么我们有理由基于正态分布假设分析平均值。
2。对于原始数据,ANOVA分析是否需要正态分布检验?
ANOVA分析,Ho是各组的平均值没有差异,Ha,平均值有一组有差异。用的是F分布检验。对应p-value。它是对平均值的假设检验。
我们可以换一个角度来说,one-way ANOVA是检验每个水平的平均值,与总体(所有水平)的平均值是否有差异,它是对平均值的检验,从假设检验理论,样本平均值符合正态分布(当样本足够大的时候),当每一个水平的样本大小非常大的时候,样本的平均值都符合正态分布,假设检验原理都成立。但在实际中,我们的样本大小很小,这时候,原始数据不应该有很明显的左偏和右偏,或均值分布,否则置信区间外的实际面积与假设有很大的出入,判断结果不可靠。
结论:只要原始图形没有明显的左偏,右偏,均值分布,我们都可以用ANOVA分析问题。
换一个角度,如果图形有一点倒钟扁平,不符合正态分布,我们就用非正态分布工具,用中位值或众数验证显著差异吗?这样更不合理,用ANOVA合理一点,你们认为呢?
这些分析都是我个人观点,都是我自己的语言,有些表述不明白,大家尽量理解,论坛就是提出争论的地方,希望大家提出见解,反驳我的论点!
没有找到相关结果
已邀请:
9 个回复
andon2002 (威望:1) (广东 惠州) 咨询业 员工
赞同来自:
只是在做之前先進行noise data分析!
至於是否常態,書上講也只是假定而已,沒說非常態不可以