CPK案例分享
来论坛也算有段时间了,光偷偷和大家学习了不少东西觉得怪不好意思的,今天空闲了也拿个案例来和大家一起分享一下。结果呢不一定对,但是希望大家更注重理解其中的统一内涵。
不久前同事让我帮忙计算一下CPK,给了我一组数据,如下:
0.018
0.020
0.017
0.019
0.013
0.014
0.013
0.012
0.011
0.010
-0.006
-0.014
-0.021
-0.019
-0.016
-0.019
-0.012
-0.015
-0.015
-0.016
-0.002
-0.005
0.000
-0.005
0.000
0.000
0.000
-0.003
-0.008
-0.012
-0.007
-0.005
-0.005
-0.007
-0.008
-0.006
-0.006
-0.007
-0.007
-0.009
0.002
0.003
0.003
0.001
-0.001
-0.006
-0.004
-0.004
-0.004
-0.007
-0.012
-0.010
-0.007
-0.006
-0.009
-0.010
-0.010
-0.009
-0.007
-0.004
-0.009
-0.009
-0.007
-0.008
-0.006
-0.004
-0.005
-0.005
-0.005
-0.004
-0.004
-0.003
-0.005
-0.003
-0.007
-0.005
-0.002
-0.004
0.002
0.001
-0.002
-0.003
0.006
0.004
0.001
0.000
-0.003
-0.004
-0.002
-0.001
-0.003
-0.001
0.001
0.002
-0.005
0.003
0.002
-0.004
-0.003
-0.002
有点多哈,呵呵。公差是±0.03
我当时没多想,不就是计算CPK吗,挺容易的。正态性检验发现数据非正态,非正态而且还有正有负,就做了个Johnson变换,变换后的数据符合正态性,直接得出个结果给了她,大概是0.7-0.8之间
但是回头我怎么想怎么觉得哪不对劲,就又重新看了一遍数据,大家也不妨仔细看看,数据没有一个超差,而且最大也就到0.02左右,这个合格率绝对不应该是不到99%。(minitab中的PPK就是单看数据本身的计算结果,不信的话可以手动算算)我的算法应该没错吧(大家也帮忙检验检验),为什么结果和实际不相符合呢?
我又做了个直方图,发现图形非常接近正态性,只是由于存在为数不多的“异常”点导致了整体数据正态性检验P值较低。这时我想起了学习数据转换时的一句话:“当进行数据转换后,需要将结果与实际情况做对比。”因此我认为,数据转换存在一定的不可信因素在里面,只有当数据显示较大程度的偏态时,使用转换才会功效较高。
最后,我还是将这组非正态的数据看成正态数据计算了一下CPK,结果是1.27,也就是4西格玛水平多一点,与实际相差就不那么大了。
我突然想起公司上ERP时oracle公司资深监理老师常说的一句话:是先有的业务还是先有的软件?
同理,是先有的数据还是先有的统计?因此,在运用统计学的时候,一定要以数据为基础,应首先对数据有个宏观的认识,也就是自己先看看数据。具有统计知识的人应该能初步判断出数据表达的信息的,然后再运用工具进行分析,切不可上来就按教科书上的描述随便用统计学分析。实际生产中情况复杂,和理论上的完全是两回事,数据收集的人员只要将数据中的部分进行排序,就会使计算出来的CPK值大大提升。(数据不分组的CPK计算是用移动极差来算的,所以排序对结果影响很大)
谨以此例和大家一同讨论学习统计学在实践中的运用,因为实际才是理论的发源地。
不久前同事让我帮忙计算一下CPK,给了我一组数据,如下:
0.018
0.020
0.017
0.019
0.013
0.014
0.013
0.012
0.011
0.010
-0.006
-0.014
-0.021
-0.019
-0.016
-0.019
-0.012
-0.015
-0.015
-0.016
-0.002
-0.005
0.000
-0.005
0.000
0.000
0.000
-0.003
-0.008
-0.012
-0.007
-0.005
-0.005
-0.007
-0.008
-0.006
-0.006
-0.007
-0.007
-0.009
0.002
0.003
0.003
0.001
-0.001
-0.006
-0.004
-0.004
-0.004
-0.007
-0.012
-0.010
-0.007
-0.006
-0.009
-0.010
-0.010
-0.009
-0.007
-0.004
-0.009
-0.009
-0.007
-0.008
-0.006
-0.004
-0.005
-0.005
-0.005
-0.004
-0.004
-0.003
-0.005
-0.003
-0.007
-0.005
-0.002
-0.004
0.002
0.001
-0.002
-0.003
0.006
0.004
0.001
0.000
-0.003
-0.004
-0.002
-0.001
-0.003
-0.001
0.001
0.002
-0.005
0.003
0.002
-0.004
-0.003
-0.002
有点多哈,呵呵。公差是±0.03
我当时没多想,不就是计算CPK吗,挺容易的。正态性检验发现数据非正态,非正态而且还有正有负,就做了个Johnson变换,变换后的数据符合正态性,直接得出个结果给了她,大概是0.7-0.8之间
但是回头我怎么想怎么觉得哪不对劲,就又重新看了一遍数据,大家也不妨仔细看看,数据没有一个超差,而且最大也就到0.02左右,这个合格率绝对不应该是不到99%。(minitab中的PPK就是单看数据本身的计算结果,不信的话可以手动算算)我的算法应该没错吧(大家也帮忙检验检验),为什么结果和实际不相符合呢?
我又做了个直方图,发现图形非常接近正态性,只是由于存在为数不多的“异常”点导致了整体数据正态性检验P值较低。这时我想起了学习数据转换时的一句话:“当进行数据转换后,需要将结果与实际情况做对比。”因此我认为,数据转换存在一定的不可信因素在里面,只有当数据显示较大程度的偏态时,使用转换才会功效较高。
最后,我还是将这组非正态的数据看成正态数据计算了一下CPK,结果是1.27,也就是4西格玛水平多一点,与实际相差就不那么大了。
我突然想起公司上ERP时oracle公司资深监理老师常说的一句话:是先有的业务还是先有的软件?
同理,是先有的数据还是先有的统计?因此,在运用统计学的时候,一定要以数据为基础,应首先对数据有个宏观的认识,也就是自己先看看数据。具有统计知识的人应该能初步判断出数据表达的信息的,然后再运用工具进行分析,切不可上来就按教科书上的描述随便用统计学分析。实际生产中情况复杂,和理论上的完全是两回事,数据收集的人员只要将数据中的部分进行排序,就会使计算出来的CPK值大大提升。(数据不分组的CPK计算是用移动极差来算的,所以排序对结果影响很大)
谨以此例和大家一同讨论学习统计学在实践中的运用,因为实际才是理论的发源地。
没有找到相关结果
已邀请:
29 个回复
parnell (威望:1) (湖南 长沙) 汽车制造相关 主管
赞同来自: