质量数据
一、数据的分类
在质量管理中的数据,按其性质不同,一般可分为计量值数据和计数值数据两大类。
1、计量值数据
这是指可取任意数值的数据,只要测取数据的精度足够,我们即可取任意小的数值,这些数值属于连续型数据。例如长度、重量、速度、压力、温度等的数据,是属于计量值数据。
2、计数值数据
是指只能用个数、件数或点数等单位来计量的数据。例如废品件数、产品台数、产品表面缺陷斑点数等等,他们只能取整数,这种数据属于离散型数据。
二、数据的收集
1、收集数据的目的
要收集数据就应该有明确的目的,否则所收集到的数据是不符合要求的。收集数据的目的,概括起来有:
①为了分析问题,即是为了分析现场情况而收集,例如为了掌握零件加工尺寸的波动情况而收集数据。
②为了管理工作,即是为了掌握生产的变动情况,以便于管理、控制而收集数据,如工序控制中收集数据。
③为了检验、判断产品好坏而收集数据。
2、收集数据的方法
收集到的数据必须能充分反映实际情况,对于抽查的数据,还应具有充分的代表性,所以收集数据要有科学的方法,这就是随机抽样的方法。所谓随机抽样,即是指被抽查的所有对象中的每一个,都应具有同等的机会被抽取到的方法。最常用的随机抽样法有:
(1)单纯随机抽样法
这种方法适用于被抽对象容易对号的场合。其方法是:
①将待抽检的产品(或工件)编号,使每一单位产品都具有相同位数的编号。例如,待查产品数量是千件以下时,则每件的编号均是三位数。
②确定抽取样本的大小。
③用随机抽号法(抽签法、随机数表法)抽取样品的号码,每个样品一个号码。
④对号取出被查的产品(或工作)。
⑤对每个样品进行测量,并记录所得数据。
(2)机械随机抽样法
如果待抽查的产品难以摆放整齐,即难以对号时,用简单随机抽样法就不合理,需改用其他抽样法,如机械随机抽样法。
机械随机抽样法是按照一定的次序来抽取样品的方法。这个一定的次序可以是每隔一定的时间抽取一次,也可以是每生产若干件产品抽取一次。这种抽样方法简便易行,所以在实际工作中得到广泛的运用。
(3)分层随机抽样法
分层随机抽样法首先按某一特性将产品(或工件)进行分层,然后在各层进行随机抽样,将各层所抽取到的样品合在一起就是我们所要抽取的样本。分层随机抽样法能充分地反映出各层的实际情况,所以,它比机械随机抽样法更能反映真实情况,有利于分析问题。
3、数据的特性
质量数据有两个特性:
(1)波动性
质量数据是有波动性的,即使是相同的机器由相同的工人操作,加工同样规格的零件,所加工出来的零件没有任何两件是完全相同的。这是因为影响零件规格的因素很多,而且同一因素在不同的时间,不同的条件下也是有微少差异的,所以,加工出来的零件其规格要求就存在着各种各样的差别,这就使得其质量特性值呈现出差别,形成数据的波动性。
(2)规律性
虽然数据有波动性,但并不是杂乱无章的,而是呈现出一定规律性的。最常见到的规律性是数据分布的规律性。在质量管理中最常见到分布规律是正态分布、二项分布及泊松分布等。
4、数据的统计分布
质量管理中的计量值数据,是连续分布的数据,其分布规律属于正态分布;而记数值的数据是间断型分布的数据,其分布规律有超几何分布、二项分布及泊松分布等规律,简要介绍如后。
(1)正态分布
正态分布的规律可归纳为:
①正态分布是以其平均值为中心呈左右对称的中央高两边低的钟型;
②正态分布的钟形有高矮肥瘦程度的不同,取决于该数据的平均值和标准偏差。
a.平均值
一般用希腊字母 表示,它代表该数据的分布的中心位置,所以也称为位置参数。其表达式子是:
(1-1)
式中:--表示数据的各个数值;
--表示数据的个数。
b.标准偏差。
标准偏差一般用希腊字母 表示。它代表该批数据的分布分散程度,所以也称其为分散度参数。其表达式为:
(1-2)
式中的各符号表示意思同平均值式子。
③正态分布常用符号 表示。括号内的符号分别代表正态分布的平均值和标准偏差平方。当 时称为标准型正态分布,记为 (0,1)。标准型正态分布的概率是:
a.在( +1 )范围内为68.27%;
b.在( +2 )范围内为95.45%;
c.在( +3 )范围内为99.73%;
(1-3)
式中: --样本中含有x件不合格品的概率;
--从批的不合格品数D=Np中取d件的组合数;
--从批的合格品数(N-D)中取(n-d)件的组合数;
--从批量为N的产品中取几个的组合数。
具体计算在这里不做详细介绍。
★EXCEL应用:
假设在生产过程中,10 件工具是由同样的机器生产的,将其作为随机样本,测试抗拉强度。样本值(1345、1301、1368、1322、1310、1370、1318、1350、1303、1299)分别存放于 A2:E3 单元格里。函数 STDEV 估算所有工具抗拉强度的标准偏差。
STDEV(A2:E3) 等于 27.46
(2)二项分布
我们从不合格品率为p的无限产品批中,随机抽取n件产品,其中含x件不合格品的概率 是随着x的数值变化而变化的,其分布规律称为二项分布。二项分布概率计算公式是:
(1-4)
式中: --二项分布概率;
--随机抽取n件其中含有d件不合格品的组合数
--产品批的不合格品率。
二项分布的形状决定于该分布的平均值和标准偏差。
二项分布的平均值 (1-4-1)
二项分布的标准偏差: (1-4-2)
由这两项公式可见 与 取决于 与 ,所以,二项分布形状归根结蒂决定于 与 。
从统计量分布得知:当 ≥50, ≥5时,二项分布形状呈左右对称的钟形,近似正态分布形状,可以近似地按正态分布进行判断,即 =99.73%
★EXCEL应用:
根据二项分布的概率计算公式进行概率的计算非常麻烦。我们可以应用一元二项分布函数在计算机的EXCEL文档里建立二项分布的概率表,方便日常的计算需要。
1.打开EXCEL新工作簿,在工作表中设置二项分布概率表的构架。
2.把光标点定在A1单元格中,然后点击"fx"函数调用按钮,在粘贴函数菜单的函数分类中选中"统计",调用"BINOMDIST"(返回一元二项分布函数),点击"确定",出现"BINOMDIST"函数公式菜单。
在菜单的选项框里按已知条件输入有关的数据。其中number_s, rrials, probability_s, cumulative分别为关心事件数k,试验总次数n,概率р以及逻辑值TRUE(累积函数)、FALSE(密度函数)。因为A1单元格是k=0的密度函数,所以依次输入A1,n,p,0(0代表密度函数)。输入完成可以点击确定,则在A1单元格中显示出概率值。用填充柄可以在B列的k=1,2,3…的其余单元格中显示出该二项分布的密度函数概率值。
(3)泊松分布
产品的缺陷个数(如电子产品线路上的焊接不良点数、纺织品上的疵点数,机械故障次数等等),从每单位平均含有m个缺陷数的总体中抽取一单位样本时,其中有x个缺陷的概率可由下公式求出:
(1-5)
式中:e--自然对数e=2.71828……
m--每单位内的缺陷点数
x--缺陷点数。
随着x值的改变,概率P(x)也改变,这些概率P(x)的分布规律,就称为泊松分布。上述公式(1-5)为泊松分布公式。泊松分布的特点
2)泊松分布的形状决定于m的大小,随着m值的增大,泊松分布形状渐渐接近左右对称的正态分布。当m≥5时,可近似看作正态分布N (m,m)。
从上述三种间断型分布性质可看到,在一定的条件下,它们都可以近似看成正态分布,因此,都可应用的原理来制订管理图的界限。
上述几种分布的近似条件,可归纳如下:
1)当N>10n时,超几何分布可近似于二项分布;
2)当p≤0.5及 ≥5时,二项分布近似正态分布;
3)当p≤0.1及 ≥5时,二项分布近似泊松分布;
4)当m≥5时,泊松分布近似正态分布。
★EXCEL应用:
可用POISSON函数进行计算。例:某车间5%的产品有缺陷,现随机抽取50件分别求出缺陷产品数属于以下各种情况的概率:(1)至多2件;(2)至少1件;(3)恰好3件;(4)在1件和5件之间(包括1件和5件)
解:设产品的缺陷数为X,由于P=0.05与N=50相比,N很大,P很小,因此可以认为X近似服从参数λ=50×0.05=2.5的泊松分布。
(1)应用POISSON函数进行计算:选择fx中的统计--POISSON,在X栏中输入2,Mean栏中输入2.5,Cumulative栏中输true,计算得结果为P( X≦2)=0.5438。
(2)P(X≥1)=1-P(X≦0)=1-0.0821=0.9179
(3)P(X=3)=P(X≦3)-P(X≦2)=0.7576-0.5438
(4)P(1≦X≦5)=P(X≦5)-P(X≦0)=0.9580-0.0821=0.8759
六、总体与样本
1、总体。被研究(或考查)的对象的全体称为总体或母体。
2、样本。总体的一部分被作为直接研究、分析的对象,这一部分称为样本。也有称为子样的。
3、样品。样本中的每一个称为样品。
例如,有一批布共计100箱,现在抽取10箱进行评比检验。则这100箱布就被称为总体,习惯用大写的N表示;被抽出的10箱则称为样本,习惯用小写的n表示;这抽出来的10箱中的每一箱就称为样品。
由于总体的个体数目是很大的,甚至是无穷的,在一般情况下要对总体进行观察与研究是困难的,甚至有时是不可能的。在这种情况下,必须进行抽样,通过对样本的观察与分析,整理出有关总体的情报,然后对总体作出判断。所以我们抽样取得数据,不是为了得到样本的情报,而是为了得到来自总体的样本所反映的总体情报,根据情报对总体采取行动。可见总体与样本的关系是目的与手段的关系,如图2-1所示。
(2-1)
4、总体参数与样本统计量的关系。
样本统计量主要有:
(1)平均值
是指样本数据经整理后得到的统计量,它是样本数据的算术平均值,用大写的X表示。平均值表示该批数据的代表值,它反映出数据的分布位置,所以也叫位置参数。
设样本数据以Xi表示,则平均值为:
(1-6)
式中,N为样本含量大小。
(2)标准偏差(S)
这个统计量表示样本数据的分散程度,也称为分散度参数。它是用样本的各个数据与它的平均值的均方差来表示的,计算公式是:
(1-7)
对于总体标准偏差的估计,可以采用大样本的标准偏差来代替,按统计学要求样本大小不小于30个即可。但对于质量管理,一般都规定为不小于100个,特殊情况时可取不小于50个。所以只要我们抽样时,样本含量为100个以上,就可以用样本的标准偏差代替总体的标准偏差,用样本的平均值代替总体平均值来推断总体。
在质量管理中的数据,按其性质不同,一般可分为计量值数据和计数值数据两大类。
1、计量值数据
这是指可取任意数值的数据,只要测取数据的精度足够,我们即可取任意小的数值,这些数值属于连续型数据。例如长度、重量、速度、压力、温度等的数据,是属于计量值数据。
2、计数值数据
是指只能用个数、件数或点数等单位来计量的数据。例如废品件数、产品台数、产品表面缺陷斑点数等等,他们只能取整数,这种数据属于离散型数据。
二、数据的收集
1、收集数据的目的
要收集数据就应该有明确的目的,否则所收集到的数据是不符合要求的。收集数据的目的,概括起来有:
①为了分析问题,即是为了分析现场情况而收集,例如为了掌握零件加工尺寸的波动情况而收集数据。
②为了管理工作,即是为了掌握生产的变动情况,以便于管理、控制而收集数据,如工序控制中收集数据。
③为了检验、判断产品好坏而收集数据。
2、收集数据的方法
收集到的数据必须能充分反映实际情况,对于抽查的数据,还应具有充分的代表性,所以收集数据要有科学的方法,这就是随机抽样的方法。所谓随机抽样,即是指被抽查的所有对象中的每一个,都应具有同等的机会被抽取到的方法。最常用的随机抽样法有:
(1)单纯随机抽样法
这种方法适用于被抽对象容易对号的场合。其方法是:
①将待抽检的产品(或工件)编号,使每一单位产品都具有相同位数的编号。例如,待查产品数量是千件以下时,则每件的编号均是三位数。
②确定抽取样本的大小。
③用随机抽号法(抽签法、随机数表法)抽取样品的号码,每个样品一个号码。
④对号取出被查的产品(或工作)。
⑤对每个样品进行测量,并记录所得数据。
(2)机械随机抽样法
如果待抽查的产品难以摆放整齐,即难以对号时,用简单随机抽样法就不合理,需改用其他抽样法,如机械随机抽样法。
机械随机抽样法是按照一定的次序来抽取样品的方法。这个一定的次序可以是每隔一定的时间抽取一次,也可以是每生产若干件产品抽取一次。这种抽样方法简便易行,所以在实际工作中得到广泛的运用。
(3)分层随机抽样法
分层随机抽样法首先按某一特性将产品(或工件)进行分层,然后在各层进行随机抽样,将各层所抽取到的样品合在一起就是我们所要抽取的样本。分层随机抽样法能充分地反映出各层的实际情况,所以,它比机械随机抽样法更能反映真实情况,有利于分析问题。
3、数据的特性
质量数据有两个特性:
(1)波动性
质量数据是有波动性的,即使是相同的机器由相同的工人操作,加工同样规格的零件,所加工出来的零件没有任何两件是完全相同的。这是因为影响零件规格的因素很多,而且同一因素在不同的时间,不同的条件下也是有微少差异的,所以,加工出来的零件其规格要求就存在着各种各样的差别,这就使得其质量特性值呈现出差别,形成数据的波动性。
(2)规律性
虽然数据有波动性,但并不是杂乱无章的,而是呈现出一定规律性的。最常见到的规律性是数据分布的规律性。在质量管理中最常见到分布规律是正态分布、二项分布及泊松分布等。
4、数据的统计分布
质量管理中的计量值数据,是连续分布的数据,其分布规律属于正态分布;而记数值的数据是间断型分布的数据,其分布规律有超几何分布、二项分布及泊松分布等规律,简要介绍如后。
(1)正态分布
正态分布的规律可归纳为:
①正态分布是以其平均值为中心呈左右对称的中央高两边低的钟型;
②正态分布的钟形有高矮肥瘦程度的不同,取决于该数据的平均值和标准偏差。
a.平均值
一般用希腊字母 表示,它代表该数据的分布的中心位置,所以也称为位置参数。其表达式子是:
(1-1)
式中:--表示数据的各个数值;
--表示数据的个数。
b.标准偏差。
标准偏差一般用希腊字母 表示。它代表该批数据的分布分散程度,所以也称其为分散度参数。其表达式为:
(1-2)
式中的各符号表示意思同平均值式子。
③正态分布常用符号 表示。括号内的符号分别代表正态分布的平均值和标准偏差平方。当 时称为标准型正态分布,记为 (0,1)。标准型正态分布的概率是:
a.在( +1 )范围内为68.27%;
b.在( +2 )范围内为95.45%;
c.在( +3 )范围内为99.73%;
(1-3)
式中: --样本中含有x件不合格品的概率;
--从批的不合格品数D=Np中取d件的组合数;
--从批的合格品数(N-D)中取(n-d)件的组合数;
--从批量为N的产品中取几个的组合数。
具体计算在这里不做详细介绍。
★EXCEL应用:
假设在生产过程中,10 件工具是由同样的机器生产的,将其作为随机样本,测试抗拉强度。样本值(1345、1301、1368、1322、1310、1370、1318、1350、1303、1299)分别存放于 A2:E3 单元格里。函数 STDEV 估算所有工具抗拉强度的标准偏差。
STDEV(A2:E3) 等于 27.46
(2)二项分布
我们从不合格品率为p的无限产品批中,随机抽取n件产品,其中含x件不合格品的概率 是随着x的数值变化而变化的,其分布规律称为二项分布。二项分布概率计算公式是:
(1-4)
式中: --二项分布概率;
--随机抽取n件其中含有d件不合格品的组合数
--产品批的不合格品率。
二项分布的形状决定于该分布的平均值和标准偏差。
二项分布的平均值 (1-4-1)
二项分布的标准偏差: (1-4-2)
由这两项公式可见 与 取决于 与 ,所以,二项分布形状归根结蒂决定于 与 。
从统计量分布得知:当 ≥50, ≥5时,二项分布形状呈左右对称的钟形,近似正态分布形状,可以近似地按正态分布进行判断,即 =99.73%
★EXCEL应用:
根据二项分布的概率计算公式进行概率的计算非常麻烦。我们可以应用一元二项分布函数在计算机的EXCEL文档里建立二项分布的概率表,方便日常的计算需要。
1.打开EXCEL新工作簿,在工作表中设置二项分布概率表的构架。
2.把光标点定在A1单元格中,然后点击"fx"函数调用按钮,在粘贴函数菜单的函数分类中选中"统计",调用"BINOMDIST"(返回一元二项分布函数),点击"确定",出现"BINOMDIST"函数公式菜单。
在菜单的选项框里按已知条件输入有关的数据。其中number_s, rrials, probability_s, cumulative分别为关心事件数k,试验总次数n,概率р以及逻辑值TRUE(累积函数)、FALSE(密度函数)。因为A1单元格是k=0的密度函数,所以依次输入A1,n,p,0(0代表密度函数)。输入完成可以点击确定,则在A1单元格中显示出概率值。用填充柄可以在B列的k=1,2,3…的其余单元格中显示出该二项分布的密度函数概率值。
(3)泊松分布
产品的缺陷个数(如电子产品线路上的焊接不良点数、纺织品上的疵点数,机械故障次数等等),从每单位平均含有m个缺陷数的总体中抽取一单位样本时,其中有x个缺陷的概率可由下公式求出:
(1-5)
式中:e--自然对数e=2.71828……
m--每单位内的缺陷点数
x--缺陷点数。
随着x值的改变,概率P(x)也改变,这些概率P(x)的分布规律,就称为泊松分布。上述公式(1-5)为泊松分布公式。泊松分布的特点
2)泊松分布的形状决定于m的大小,随着m值的增大,泊松分布形状渐渐接近左右对称的正态分布。当m≥5时,可近似看作正态分布N (m,m)。
从上述三种间断型分布性质可看到,在一定的条件下,它们都可以近似看成正态分布,因此,都可应用的原理来制订管理图的界限。
上述几种分布的近似条件,可归纳如下:
1)当N>10n时,超几何分布可近似于二项分布;
2)当p≤0.5及 ≥5时,二项分布近似正态分布;
3)当p≤0.1及 ≥5时,二项分布近似泊松分布;
4)当m≥5时,泊松分布近似正态分布。
★EXCEL应用:
可用POISSON函数进行计算。例:某车间5%的产品有缺陷,现随机抽取50件分别求出缺陷产品数属于以下各种情况的概率:(1)至多2件;(2)至少1件;(3)恰好3件;(4)在1件和5件之间(包括1件和5件)
解:设产品的缺陷数为X,由于P=0.05与N=50相比,N很大,P很小,因此可以认为X近似服从参数λ=50×0.05=2.5的泊松分布。
(1)应用POISSON函数进行计算:选择fx中的统计--POISSON,在X栏中输入2,Mean栏中输入2.5,Cumulative栏中输true,计算得结果为P( X≦2)=0.5438。
(2)P(X≥1)=1-P(X≦0)=1-0.0821=0.9179
(3)P(X=3)=P(X≦3)-P(X≦2)=0.7576-0.5438
(4)P(1≦X≦5)=P(X≦5)-P(X≦0)=0.9580-0.0821=0.8759
六、总体与样本
1、总体。被研究(或考查)的对象的全体称为总体或母体。
2、样本。总体的一部分被作为直接研究、分析的对象,这一部分称为样本。也有称为子样的。
3、样品。样本中的每一个称为样品。
例如,有一批布共计100箱,现在抽取10箱进行评比检验。则这100箱布就被称为总体,习惯用大写的N表示;被抽出的10箱则称为样本,习惯用小写的n表示;这抽出来的10箱中的每一箱就称为样品。
由于总体的个体数目是很大的,甚至是无穷的,在一般情况下要对总体进行观察与研究是困难的,甚至有时是不可能的。在这种情况下,必须进行抽样,通过对样本的观察与分析,整理出有关总体的情报,然后对总体作出判断。所以我们抽样取得数据,不是为了得到样本的情报,而是为了得到来自总体的样本所反映的总体情报,根据情报对总体采取行动。可见总体与样本的关系是目的与手段的关系,如图2-1所示。
(2-1)
4、总体参数与样本统计量的关系。
样本统计量主要有:
(1)平均值
是指样本数据经整理后得到的统计量,它是样本数据的算术平均值,用大写的X表示。平均值表示该批数据的代表值,它反映出数据的分布位置,所以也叫位置参数。
设样本数据以Xi表示,则平均值为:
(1-6)
式中,N为样本含量大小。
(2)标准偏差(S)
这个统计量表示样本数据的分散程度,也称为分散度参数。它是用样本的各个数据与它的平均值的均方差来表示的,计算公式是:
(1-7)
对于总体标准偏差的估计,可以采用大样本的标准偏差来代替,按统计学要求样本大小不小于30个即可。但对于质量管理,一般都规定为不小于100个,特殊情况时可取不小于50个。所以只要我们抽样时,样本含量为100个以上,就可以用样本的标准偏差代替总体的标准偏差,用样本的平均值代替总体平均值来推断总体。
没有找到相关结果
已邀请:
0 个回复