对于组间/组内变异的计算,请参考如下离差平方和的解释:
其中最后等式的第一项就是组内变异,第二项就是组间变异。
若以相等的样本个数(subgroup size=n),则简化如下:
如果要估计的是组内变异数(方差)与组间的变异数,则必须除以相对的自由度;其中:
总自由度=nk-1
组间变异的自由度=k-1
组内变异的自由度=(nk-1)-(k-1)=k(n-1)
nk-1一定都比k(n-1)大
在此顺便提醒大家一件事:我们在谈的总变异=组内变异+组间变异,这件事指的是离差平方和(就是上面的公式)而不是变异异数。在使用MINITAB计算制程能力分析时,可能会碰到过Stdev(within)比Stdev(overall)大的现象。没有有呢?
这种现象并不是上面红字的叙述有误,而是因为自由度的关系。
变异数(overall)的估算=
变异数(within) 的估算=
如果说组间的差异很小时,就是上述(1)式的第二项几乎等于0;相对的总变异几乎是来自于组内变异的的贡献,除上相对的自由度时,自然会产生变异数(overall)<变异数(within)的结果,所以就会有Stdev(overall)<Stdev(within)的现象。
这样的现象可能来自于两种情况:
1. 分组不恰当
2. 制程本身就是很烂
其中最后等式的第一项就是组内变异,第二项就是组间变异。
若以相等的样本个数(subgroup size=n),则简化如下:
如果要估计的是组内变异数(方差)与组间的变异数,则必须除以相对的自由度;其中:
总自由度=nk-1
组间变异的自由度=k-1
组内变异的自由度=(nk-1)-(k-1)=k(n-1)
nk-1一定都比k(n-1)大
在此顺便提醒大家一件事:我们在谈的总变异=组内变异+组间变异,这件事指的是离差平方和(就是上面的公式)而不是变异异数。在使用MINITAB计算制程能力分析时,可能会碰到过Stdev(within)比Stdev(overall)大的现象。没有有呢?
这种现象并不是上面红字的叙述有误,而是因为自由度的关系。
变异数(overall)的估算=
变异数(within) 的估算=
如果说组间的差异很小时,就是上述(1)式的第二项几乎等于0;相对的总变异几乎是来自于组内变异的的贡献,除上相对的自由度时,自然会产生变异数(overall)<变异数(within)的结果,所以就会有Stdev(overall)<Stdev(within)的现象。
这样的现象可能来自于两种情况:
1. 分组不恰当
2. 制程本身就是很烂