【翻译文章】不做量具R&R来测试数据的一个简便方法
翻译者:cecilia4993 校稿:qys0418
不做量具R&R来测试数据的一个简便方法
出于各种各样的原因六西格玛小组有时会假设数据不受测量变差的影响,而省去量具R&R的研究分析(量具重复性和再现性分析)。这里,你可以用一个很简便的不做量具R&R的方法来检查数据。
作者:楚建杰
在六西格玛项目中,一般情况下项目成员希望进行量具R&R的研究来验证所使用的测量系统不受重复性变差和再现性变差问题的影响。通常在DMAIC五步法数据分析阶段“A”之前的测量阶段“M”进行,以使项目小组不会做出用测量系统变差替代过程变差的结论。
特别像大多数制造工厂那样有成熟数据的地方,由于历史数据总是很容易得到,并假设这些数据是可靠的,这样量具R&R有时就省略掉了。或者,由于项目进度紧张,六西格玛小组有时假设他们的数据是不受量具R&R问题的影响的,可以根据这些数据进一步得出结论。采用过程变差的错误测量数据会导致小组无法识别真实的根本起因,甚至更糟糕的是,会得到错误的结论。
虽然这样不对,但不做量具R&R的做法毫无疑问得到了广泛的传播。
针对测量系统可靠性的一个简便测试
还有一种方法可以检查测量系统可靠性,这个方法并不出名,因此很少被用到。六西格玛项目小组可对现有数据进行一个简单的假设检验,不用进行正式的量具R&R分析来检查测量系统的问题。这个方法特别关注重复性变差问题,也可随时应用于因不同的评价人和/或不同类型的测量设备引起的潜在问题中。
有个例子可以很好地对测试的有效性进行阐明:假设一个学校对1000名学生进行相同的数学考试。安排10名数学教师来对这1000份试卷进行评分。这些试卷随机分配,每位教师有100份。假设没必要给他们正确的答案,因为他们都是数学教师。撇开这些实际的考卷和成绩单,只列出他们100份试卷的分数。一下子就可看出有些教师评分始终偏高而有些老师始终偏低。学校如何能发现这些分数正确与否呢?
这个测试的逻辑是:1000个考试分数有一个总体分布。最有可能的是一个正态分布。当这组学生很聪明的情况下,分布会向左偏;或当这组学生相当愚笨时,分布会向右偏。
无论这个总体分布如何,除非教师评分太宽或太严或者是不能胜任,不然教师的样本分布应有相同的形态,有几乎相同的均值/中位数。
使用适当的假设试验
因此,使用适当的假设试验(方差分析、KW非参数性检验、中位数检验),就会发现教师间是否确实存在着差异,如:是教师的原因导致分数的变差吗。如果教师都很优秀的话,这种测试就不重要了。
图1:教师的考卷分数箱线图
图2:教师的考卷分数概率图
例中,通过A-D检验(见概率图)所显示的数据不是正态分布,所以更适合应用非参数性测试方法。
图3:教师的考卷分数KW检验
这个案例中,该检验没有体现出显著性差异(即P值远大于0.05),因此学校就可以断定这个测量系统(教师)是好的。
在企业中应用该方法
大多数企业数据与数学考试的案例相似。例如,六西格玛小组在一个项目中,想知道检验员检出某一产品上一个特定缺陷的能力是否一致。若产量足够大,时间较长(半年),各检验员之间检出的每百单位产品缺陷数分布应该是合理的,并没有多大差异。然而,让小组成员沮丧的是在某些情况下竟然存在着差异。这就意味着有的检验员检出的缺陷太多,有的检验员检出的缺陷太少,那么项目小组也无法判断这段时间内的缺陷变差是由检验员产生的还是过程产生的。因此,小组必须抛开那些数据(有很多这样的)而去收集来自于成熟检验员们的数据,这些数据通过了正式量具R&R研究分析。
作者简介:楚建杰是慧凯管理咨询公司亚洲区的高级咨询师,主要在新加坡、中国服务顾客。他的经历包括组织架构、机构发展、变更管理以及六西格玛咨询方面。他擅长过程再设计、改进和模型。最早将精益方法应用到组织事务处理中。通过了新加坡政府的六西格玛黑带认证。楚建杰是新加坡人,通过信箱jian-chieh.chew@valeocon.com可联系到他。
不做量具R&R来测试数据的一个简便方法
出于各种各样的原因六西格玛小组有时会假设数据不受测量变差的影响,而省去量具R&R的研究分析(量具重复性和再现性分析)。这里,你可以用一个很简便的不做量具R&R的方法来检查数据。
作者:楚建杰
在六西格玛项目中,一般情况下项目成员希望进行量具R&R的研究来验证所使用的测量系统不受重复性变差和再现性变差问题的影响。通常在DMAIC五步法数据分析阶段“A”之前的测量阶段“M”进行,以使项目小组不会做出用测量系统变差替代过程变差的结论。
特别像大多数制造工厂那样有成熟数据的地方,由于历史数据总是很容易得到,并假设这些数据是可靠的,这样量具R&R有时就省略掉了。或者,由于项目进度紧张,六西格玛小组有时假设他们的数据是不受量具R&R问题的影响的,可以根据这些数据进一步得出结论。采用过程变差的错误测量数据会导致小组无法识别真实的根本起因,甚至更糟糕的是,会得到错误的结论。
虽然这样不对,但不做量具R&R的做法毫无疑问得到了广泛的传播。
针对测量系统可靠性的一个简便测试
还有一种方法可以检查测量系统可靠性,这个方法并不出名,因此很少被用到。六西格玛项目小组可对现有数据进行一个简单的假设检验,不用进行正式的量具R&R分析来检查测量系统的问题。这个方法特别关注重复性变差问题,也可随时应用于因不同的评价人和/或不同类型的测量设备引起的潜在问题中。
有个例子可以很好地对测试的有效性进行阐明:假设一个学校对1000名学生进行相同的数学考试。安排10名数学教师来对这1000份试卷进行评分。这些试卷随机分配,每位教师有100份。假设没必要给他们正确的答案,因为他们都是数学教师。撇开这些实际的考卷和成绩单,只列出他们100份试卷的分数。一下子就可看出有些教师评分始终偏高而有些老师始终偏低。学校如何能发现这些分数正确与否呢?
这个测试的逻辑是:1000个考试分数有一个总体分布。最有可能的是一个正态分布。当这组学生很聪明的情况下,分布会向左偏;或当这组学生相当愚笨时,分布会向右偏。
无论这个总体分布如何,除非教师评分太宽或太严或者是不能胜任,不然教师的样本分布应有相同的形态,有几乎相同的均值/中位数。
使用适当的假设试验
因此,使用适当的假设试验(方差分析、KW非参数性检验、中位数检验),就会发现教师间是否确实存在着差异,如:是教师的原因导致分数的变差吗。如果教师都很优秀的话,这种测试就不重要了。
图1:教师的考卷分数箱线图
图2:教师的考卷分数概率图
例中,通过A-D检验(见概率图)所显示的数据不是正态分布,所以更适合应用非参数性测试方法。
图3:教师的考卷分数KW检验
这个案例中,该检验没有体现出显著性差异(即P值远大于0.05),因此学校就可以断定这个测量系统(教师)是好的。
在企业中应用该方法
大多数企业数据与数学考试的案例相似。例如,六西格玛小组在一个项目中,想知道检验员检出某一产品上一个特定缺陷的能力是否一致。若产量足够大,时间较长(半年),各检验员之间检出的每百单位产品缺陷数分布应该是合理的,并没有多大差异。然而,让小组成员沮丧的是在某些情况下竟然存在着差异。这就意味着有的检验员检出的缺陷太多,有的检验员检出的缺陷太少,那么项目小组也无法判断这段时间内的缺陷变差是由检验员产生的还是过程产生的。因此,小组必须抛开那些数据(有很多这样的)而去收集来自于成熟检验员们的数据,这些数据通过了正式量具R&R研究分析。
作者简介:楚建杰是慧凯管理咨询公司亚洲区的高级咨询师,主要在新加坡、中国服务顾客。他的经历包括组织架构、机构发展、变更管理以及六西格玛咨询方面。他擅长过程再设计、改进和模型。最早将精益方法应用到组织事务处理中。通过了新加坡政府的六西格玛黑带认证。楚建杰是新加坡人,通过信箱jian-chieh.chew@valeocon.com可联系到他。