【翻译文章】用方差分析说明什么时候差异有影响
原文作者:Lisa Custer 翻译:ellen_1971,叶木 校稿:忍者
用方差分析说明什么时候差异有影响
大部分六西格玛DMAIC方法关注的问题是找出差异。但通常了解“差异是否有影响”会更重要。方差分析是一种检验工具,它可以回答这个问题。
作者: Lisa Custer
大部分六西格玛DMAIC方法关注的问题是找出差异。人们做事的方式是相同还是不同?特定的改变对结果是否有影响?问题发生的时间和地点是否有差异?
大多情况下,这些问题的回答都是肯定的。人们做事的方式不同。过程改变将会影响输出。问题出现在某些地方,另一些地方则不出现。
这就是为什么问题“这些差异是否有影响”更重要了。(或者,用统计上的语言说,“这些差异是否显著?”)当我们根据不同的过程,地点,操作员等等比较结果时,可以帮助我们回答这些问题的假设检验工具是方法分析(ANOVA)。
ANOVA的理论背景比较复杂,但庆幸的是,经验较少的六西格玛从事者可以用统计软件自动生成分析结果,而不需要害怕大量的数据。而且,一般软件会生成图形很简单,我们可以很清楚的看到比较的项目之间的差异程度——我们向他人解释时也会很简单。
下面时一个简单的ANOVA的例子。
问题:哪一个地点最快?
表 1: 收集数据
地点 A
地点B
地点 C
完成5份贷款申请的时间(单位:分钟)
15
28
26
17
25
23
18
24
20
19
27
17
24
25
21
为了优化三个分支的贷款申请流程,公司想了解三个地点中的哪一个地点处理过程的效率最高。一旦判断了哪个地点最快,公司就计划研究这个地点,并让其他的地点学习到什么。上面的表中收集的数据样本。(在现实生活中,每个点收集的数据很可能大于5个数据,但这里仅是阐述原理的简单案例。)
快速浏览数据,我们将会发现地点B比地点A的速度慢。(当数据点较多时,检测地点之间的差异就会很困难)。但地点B和地点C是否有不同?地点A和地点C是否有不同?
ANOVA分析
如果想了解ANOVA检验是如何计算结果的,我们需要研究一些统计课题,例如“自由度”和“平方和”。但是,如果仅是解释结果,我们仅需要知道三个基本的概念。
均值:一组数值的数学平均值。
标准差:代表一组数值的变异量。(“西格玛”是一种统计符号,用来表示一倍标准差;术语“六西格玛”用来表示过程很好,以致六倍标准差——均值上下各有三倍标准差——都在规格限内)。
P值:假设检验中用来表示被比较的项目相同的可能性的术语。P值较低——通常小于0.05——表示项目相同可能性的程度很低。(或者,非统计人员可能会说,“他们不同。”)
统计软件的结果分为两部分:
图形1:数值输出——单因子方差分析
如上所示,p值是0.007,这个值非常小。这表明三个地点是不同的,但这个值并没有说明他们不同的方式。因此,需要解释方差分析的第二部分(图形2)。
图形2:图形输出——箱线图
一旦理解了统计程序应用的形式,方差分析的图形输出很容易解释。图形2中的例子是箱线图,它是一种典型的统计软件输出结果。
箱线图两个关键的变量一个是圆圈的位置,它表示每个地点的均值;二是阴影灰色箱体的高度,它表示正负一倍标准差的范围。比较项目的圆圈(均值)落在其他项目箱体中的相对位置。如果圆圈和箱体重叠,则表示它们不是“统计上不同。”如果他们不重叠,则可以得出它们不同的结论。
例如,在这个例子中,地点C的圆圈(均值)在落在地点A的灰色箱体之内。根据这个数据,则地点A和地点C并没有显著不同。但是地点B的均值没有落在地点A和地点C的灰色箱体值中,则地点B和地点A以及地点C有显著差异。
方差分析的结果
既然知道目标是优化贷款申请时间,那么根据这些结果,应该采取什么措施呢?和地点A以及地点C相比,地点B处理贷款申请时间存在显著的差异。至少,公司会想让地点B跟上其它地点的处理速度。这样,第一步就是比较三个地点的贷款申请时间,并了解地B的政策或者程序。一旦三个地点以相同的方式操作后,公司就可以全面的寻求其它的改进了。
结论:改进阶段的帮助
在六西格玛项目中,其中一个最大的挑战经常是观测到的差异是否显著,以致需要采取相关的行动。我们经常会忽视帮助项目团队做出最终结论的工具方差分析。在任何时候,来自连续型数据的两个或者两个以上组或者类别的数据需要比较时,都适合使用方差分析。
想更了解生成数据和图形结果的计算方法,可以参见George Box的试验统计这本书。第一次使用ANOVA的从事者可以从有经验的黑带或者黑带大师那里获得设置数据的帮助。
然而,从样例中我们可以看出,ANOVA检验的数据和图形结果都很容易解释。获得的知识可以帮助项目团队计划改进方法。
关于作者:Lisa Custer是George集团的精益六西格玛负责人以及黑带大师。她在定义客户要求到过程工程的基本和高级持续改进技术推行中有15年的经验。她的邮箱是 lcuster@georgegroup.com 。
用方差分析说明什么时候差异有影响
大部分六西格玛DMAIC方法关注的问题是找出差异。但通常了解“差异是否有影响”会更重要。方差分析是一种检验工具,它可以回答这个问题。
作者: Lisa Custer
大部分六西格玛DMAIC方法关注的问题是找出差异。人们做事的方式是相同还是不同?特定的改变对结果是否有影响?问题发生的时间和地点是否有差异?
大多情况下,这些问题的回答都是肯定的。人们做事的方式不同。过程改变将会影响输出。问题出现在某些地方,另一些地方则不出现。
这就是为什么问题“这些差异是否有影响”更重要了。(或者,用统计上的语言说,“这些差异是否显著?”)当我们根据不同的过程,地点,操作员等等比较结果时,可以帮助我们回答这些问题的假设检验工具是方法分析(ANOVA)。
ANOVA的理论背景比较复杂,但庆幸的是,经验较少的六西格玛从事者可以用统计软件自动生成分析结果,而不需要害怕大量的数据。而且,一般软件会生成图形很简单,我们可以很清楚的看到比较的项目之间的差异程度——我们向他人解释时也会很简单。
下面时一个简单的ANOVA的例子。
问题:哪一个地点最快?
表 1: 收集数据
地点 A
地点B
地点 C
完成5份贷款申请的时间(单位:分钟)
15
28
26
17
25
23
18
24
20
19
27
17
24
25
21
为了优化三个分支的贷款申请流程,公司想了解三个地点中的哪一个地点处理过程的效率最高。一旦判断了哪个地点最快,公司就计划研究这个地点,并让其他的地点学习到什么。上面的表中收集的数据样本。(在现实生活中,每个点收集的数据很可能大于5个数据,但这里仅是阐述原理的简单案例。)
快速浏览数据,我们将会发现地点B比地点A的速度慢。(当数据点较多时,检测地点之间的差异就会很困难)。但地点B和地点C是否有不同?地点A和地点C是否有不同?
ANOVA分析
如果想了解ANOVA检验是如何计算结果的,我们需要研究一些统计课题,例如“自由度”和“平方和”。但是,如果仅是解释结果,我们仅需要知道三个基本的概念。
均值:一组数值的数学平均值。
标准差:代表一组数值的变异量。(“西格玛”是一种统计符号,用来表示一倍标准差;术语“六西格玛”用来表示过程很好,以致六倍标准差——均值上下各有三倍标准差——都在规格限内)。
P值:假设检验中用来表示被比较的项目相同的可能性的术语。P值较低——通常小于0.05——表示项目相同可能性的程度很低。(或者,非统计人员可能会说,“他们不同。”)
统计软件的结果分为两部分:
图形1:数值输出——单因子方差分析
如上所示,p值是0.007,这个值非常小。这表明三个地点是不同的,但这个值并没有说明他们不同的方式。因此,需要解释方差分析的第二部分(图形2)。
图形2:图形输出——箱线图
一旦理解了统计程序应用的形式,方差分析的图形输出很容易解释。图形2中的例子是箱线图,它是一种典型的统计软件输出结果。
箱线图两个关键的变量一个是圆圈的位置,它表示每个地点的均值;二是阴影灰色箱体的高度,它表示正负一倍标准差的范围。比较项目的圆圈(均值)落在其他项目箱体中的相对位置。如果圆圈和箱体重叠,则表示它们不是“统计上不同。”如果他们不重叠,则可以得出它们不同的结论。
例如,在这个例子中,地点C的圆圈(均值)在落在地点A的灰色箱体之内。根据这个数据,则地点A和地点C并没有显著不同。但是地点B的均值没有落在地点A和地点C的灰色箱体值中,则地点B和地点A以及地点C有显著差异。
方差分析的结果
既然知道目标是优化贷款申请时间,那么根据这些结果,应该采取什么措施呢?和地点A以及地点C相比,地点B处理贷款申请时间存在显著的差异。至少,公司会想让地点B跟上其它地点的处理速度。这样,第一步就是比较三个地点的贷款申请时间,并了解地B的政策或者程序。一旦三个地点以相同的方式操作后,公司就可以全面的寻求其它的改进了。
结论:改进阶段的帮助
在六西格玛项目中,其中一个最大的挑战经常是观测到的差异是否显著,以致需要采取相关的行动。我们经常会忽视帮助项目团队做出最终结论的工具方差分析。在任何时候,来自连续型数据的两个或者两个以上组或者类别的数据需要比较时,都适合使用方差分析。
想更了解生成数据和图形结果的计算方法,可以参见George Box的试验统计这本书。第一次使用ANOVA的从事者可以从有经验的黑带或者黑带大师那里获得设置数据的帮助。
然而,从样例中我们可以看出,ANOVA检验的数据和图形结果都很容易解释。获得的知识可以帮助项目团队计划改进方法。
关于作者:Lisa Custer是George集团的精益六西格玛负责人以及黑带大师。她在定义客户要求到过程工程的基本和高级持续改进技术推行中有15年的经验。她的邮箱是 lcuster@georgegroup.com 。