您还没有绑定微信,更多功能请点击绑定

质量数据

一、数据的分类
  在质量管理中的数据,按其性质不同,一般可分为计量值数据和计数值数据两大类。
  1、计量值数据
  这是指可取任意数值的数据,只要测取数据的精度足够,我们即可取任意小的数值,这些数值属于连续型数据。例如长度、重量、速度、压力、温度等的数据,是属于计量值数据。
  2、计数值数据
  是指只能用个数、件数或点数等单位来计量的数据。例如废品件数、产品台数、产品表面缺陷斑点数等等,他们只能取整数,这种数据属于离散型数据。
  二、数据的收集
  1、收集数据的目的
  要收集数据就应该有明确的目的,否则所收集到的数据是不符合要求的。收集数据的目的,概括起来有:
  ①为了分析问题,即是为了分析现场情况而收集,例如为了掌握零件加工尺寸的波动情况而收集数据。
  ②为了管理工作,即是为了掌握生产的变动情况,以便于管理、控制而收集数据,如工序控制中收集数据。
  ③为了检验、判断产品好坏而收集数据。
  2、收集数据的方法
  收集到的数据必须能充分反映实际情况,对于抽查的数据,还应具有充分的代表性,所以收集数据要有科学的方法,这就是随机抽样的方法。所谓随机抽样,即是指被抽查的所有对象中的每一个,都应具有同等的机会被抽取到的方法。最常用的随机抽样法有:
  (1)单纯随机抽样法
  这种方法适用于被抽对象容易对号的场合。其方法是:
  ①将待抽检的产品(或工件)编号,使每一单位产品都具有相同位数的编号。例如,待查产品数量是千件以下时,则每件的编号均是三位数。
  ②确定抽取样本的大小。
  ③用随机抽号法(抽签法、随机数表法)抽取样品的号码,每个样品一个号码。
  ④对号取出被查的产品(或工作)。
  ⑤对每个样品进行测量,并记录所得数据。
  (2)机械随机抽样法
  如果待抽查的产品难以摆放整齐,即难以对号时,用简单随机抽样法就不合理,需改用其他抽样法,如机械随机抽样法。
  机械随机抽样法是按照一定的次序来抽取样品的方法。这个一定的次序可以是每隔一定的时间抽取一次,也可以是每生产若干件产品抽取一次。这种抽样方法简便易行,所以在实际工作中得到广泛的运用。
  (3)分层随机抽样法
  分层随机抽样法首先按某一特性将产品(或工件)进行分层,然后在各层进行随机抽样,将各层所抽取到的样品合在一起就是我们所要抽取的样本。分层随机抽样法能充分地反映出各层的实际情况,所以,它比机械随机抽样法更能反映真实情况,有利于分析问题。
  3、数据的特性
  质量数据有两个特性:
  (1)波动性
  质量数据是有波动性的,即使是相同的机器由相同的工人操作,加工同样规格的零件,所加工出来的零件没有任何两件是完全相同的。这是因为影响零件规格的因素很多,而且同一因素在不同的时间,不同的条件下也是有微少差异的,所以,加工出来的零件其规格要求就存在着各种各样的差别,这就使得其质量特性值呈现出差别,形成数据的波动性。
  (2)规律性
  虽然数据有波动性,但并不是杂乱无章的,而是呈现出一定规律性的。最常见到的规律性是数据分布的规律性。在质量管理中最常见到分布规律是正态分布、二项分布及泊松分布等。
  4、数据的统计分布
  质量管理中的计量值数据,是连续分布的数据,其分布规律属于正态分布;而记数值的数据是间断型分布的数据,其分布规律有超几何分布、二项分布及泊松分布等规律,简要介绍如后。
  (1)正态分布
  正态分布的规律可归纳为:
  ①正态分布是以其平均值为中心呈左右对称的中央高两边低的钟型;
  ②正态分布的钟形有高矮肥瘦程度的不同,取决于该数据的平均值和标准偏差。
  a.平均值
  一般用希腊字母 表示,它代表该数据的分布的中心位置,所以也称为位置参数。其表达式子是:

      (1-1)
  式中:--表示数据的各个数值;
     --表示数据的个数。
  b.标准偏差。
  标准偏差一般用希腊字母 表示。它代表该批数据的分布分散程度,所以也称其为分散度参数。其表达式为:
 (1-2)
  式中的各符号表示意思同平均值式子。
  ③正态分布常用符号 表示。括号内的符号分别代表正态分布的平均值和标准偏差平方。当 时称为标准型正态分布,记为 (0,1)。标准型正态分布的概率是:
  a.在( +1 )范围内为68.27%;
  b.在( +2 )范围内为95.45%;
  c.在( +3 )范围内为99.73%;
 (1-3)
  式中: --样本中含有x件不合格品的概率;
  --从批的不合格品数D=Np中取d件的组合数;
  --从批的合格品数(N-D)中取(n-d)件的组合数;
  --从批量为N的产品中取几个的组合数。
  具体计算在这里不做详细介绍。
★EXCEL应用:
  假设在生产过程中,10 件工具是由同样的机器生产的,将其作为随机样本,测试抗拉强度。样本值(1345、1301、1368、1322、1310、1370、1318、1350、1303、1299)分别存放于 A2:E3 单元格里。函数 STDEV 估算所有工具抗拉强度的标准偏差。
  STDEV(A2:E3) 等于 27.46
  (2)二项分布
  我们从不合格品率为p的无限产品批中,随机抽取n件产品,其中含x件不合格品的概率 是随着x的数值变化而变化的,其分布规律称为二项分布。二项分布概率计算公式是:
 (1-4)
  式中: --二项分布概率;
  --随机抽取n件其中含有d件不合格品的组合数
  --产品批的不合格品率。
  二项分布的形状决定于该分布的平均值和标准偏差。
  二项分布的平均值    (1-4-1)
  二项分布的标准偏差:   (1-4-2)
  由这两项公式可见 与 取决于 与 ,所以,二项分布形状归根结蒂决定于 与 。
从统计量分布得知:当 ≥50, ≥5时,二项分布形状呈左右对称的钟形,近似正态分布形状,可以近似地按正态分布进行判断,即 =99.73%
★EXCEL应用:
  根据二项分布的概率计算公式进行概率的计算非常麻烦。我们可以应用一元二项分布函数在计算机的EXCEL文档里建立二项分布的概率表,方便日常的计算需要。
  1.打开EXCEL新工作簿,在工作表中设置二项分布概率表的构架。
  2.把光标点定在A1单元格中,然后点击"fx"函数调用按钮,在粘贴函数菜单的函数分类中选中"统计",调用"BINOMDIST"(返回一元二项分布函数),点击"确定",出现"BINOMDIST"函数公式菜单。
  在菜单的选项框里按已知条件输入有关的数据。其中number_s, rrials, probability_s, cumulative分别为关心事件数k,试验总次数n,概率р以及逻辑值TRUE(累积函数)、FALSE(密度函数)。因为A1单元格是k=0的密度函数,所以依次输入A1,n,p,0(0代表密度函数)。输入完成可以点击确定,则在A1单元格中显示出概率值。用填充柄可以在B列的k=1,2,3…的其余单元格中显示出该二项分布的密度函数概率值。
  (3)泊松分布
产品的缺陷个数(如电子产品线路上的焊接不良点数、纺织品上的疵点数,机械故障次数等等),从每单位平均含有m个缺陷数的总体中抽取一单位样本时,其中有x个缺陷的概率可由下公式求出:
  (1-5)
式中:e--自然对数e=2.71828……
m--每单位内的缺陷点数
x--缺陷点数。
随着x值的改变,概率P(x)也改变,这些概率P(x)的分布规律,就称为泊松分布。上述公式(1-5)为泊松分布公式。泊松分布的特点

2)泊松分布的形状决定于m的大小,随着m值的增大,泊松分布形状渐渐接近左右对称的正态分布。当m≥5时,可近似看作正态分布N (m,m)。
  从上述三种间断型分布性质可看到,在一定的条件下,它们都可以近似看成正态分布,因此,都可应用的原理来制订管理图的界限。
  上述几种分布的近似条件,可归纳如下:
  1)当N>10n时,超几何分布可近似于二项分布;
  2)当p≤0.5及 ≥5时,二项分布近似正态分布;
  3)当p≤0.1及 ≥5时,二项分布近似泊松分布;
  4)当m≥5时,泊松分布近似正态分布。
★EXCEL应用:
  可用POISSON函数进行计算。例:某车间5%的产品有缺陷,现随机抽取50件分别求出缺陷产品数属于以下各种情况的概率:(1)至多2件;(2)至少1件;(3)恰好3件;(4)在1件和5件之间(包括1件和5件) 
解:设产品的缺陷数为X,由于P=0.05与N=50相比,N很大,P很小,因此可以认为X近似服从参数λ=50×0.05=2.5的泊松分布。
  (1)应用POISSON函数进行计算:选择fx中的统计--POISSON,在X栏中输入2,Mean栏中输入2.5,Cumulative栏中输true,计算得结果为P( X≦2)=0.5438。
  (2)P(X≥1)=1-P(X≦0)=1-0.0821=0.9179
  (3)P(X=3)=P(X≦3)-P(X≦2)=0.7576-0.5438
  (4)P(1≦X≦5)=P(X≦5)-P(X≦0)=0.9580-0.0821=0.8759
  六、总体与样本
  1、总体。被研究(或考查)的对象的全体称为总体或母体。
  2、样本。总体的一部分被作为直接研究、分析的对象,这一部分称为样本。也有称为子样的。
  3、样品。样本中的每一个称为样品。
  例如,有一批布共计100箱,现在抽取10箱进行评比检验。则这100箱布就被称为总体,习惯用大写的N表示;被抽出的10箱则称为样本,习惯用小写的n表示;这抽出来的10箱中的每一箱就称为样品。
  由于总体的个体数目是很大的,甚至是无穷的,在一般情况下要对总体进行观察与研究是困难的,甚至有时是不可能的。在这种情况下,必须进行抽样,通过对样本的观察与分析,整理出有关总体的情报,然后对总体作出判断。所以我们抽样取得数据,不是为了得到样本的情报,而是为了得到来自总体的样本所反映的总体情报,根据情报对总体采取行动。可见总体与样本的关系是目的与手段的关系,如图2-1所示。
(2-1)
  4、总体参数与样本统计量的关系。
  样本统计量主要有:
  (1)平均值
  是指样本数据经整理后得到的统计量,它是样本数据的算术平均值,用大写的X表示。平均值表示该批数据的代表值,它反映出数据的分布位置,所以也叫位置参数。
  设样本数据以Xi表示,则平均值为:
 (1-6)
  式中,N为样本含量大小。
  (2)标准偏差(S)
  这个统计量表示样本数据的分散程度,也称为分散度参数。它是用样本的各个数据与它的平均值的均方差来表示的,计算公式是:
 (1-7)

  对于总体标准偏差的估计,可以采用大样本的标准偏差来代替,按统计学要求样本大小不小于30个即可。但对于质量管理,一般都规定为不小于100个,特殊情况时可取不小于50个。所以只要我们抽样时,样本含量为100个以上,就可以用样本的标准偏差代替总体的标准偏差,用样本的平均值代替总体平均值来推断总体。
对“好”的回答一定要点个"赞",回答者需要你的鼓励!
已邀请:

0 个回复,游客无法查看回复,更多功能请登录注册

发起人

扫一扫微信订阅<6SQ每周精选>