质量数据

一、数据的分类
　　在质量管理中的数据，按其性质不同，一般可分为计量值数据和计数值数据两大类。
　　1、计量值数据
　　这是指可取任意数值的数据，只要测取数据的精度足够，我们即可取任意小的数值，这些数值属于连续型数据。例如长度、重量、速度、压力、温度等的数据，是属于计量值数据。
　　2、计数值数据
　　是指只能用个数、件数或点数等单位来计量的数据。例如废品件数、产品台数、产品表面缺陷斑点数等等，他们只能取整数，这种数据属于离散型数据。
　　二、数据的收集
　　1、收集数据的目的
　　要收集数据就应该有明确的目的，否则所收集到的数据是不符合要求的。收集数据的目的，概括起来有：
　　①为了分析问题，即是为了分析现场情况而收集，例如为了掌握零件加工尺寸的波动情况而收集数据。
　　②为了管理工作，即是为了掌握生产的变动情况，以便于管理、控制而收集数据，如工序控制中收集数据。
　　③为了检验、判断产品好坏而收集数据。
　　2、收集数据的方法
　　收集到的数据必须能充分反映实际情况，对于抽查的数据，还应具有充分的代表性，所以收集数据要有科学的方法，这就是随机抽样的方法。所谓随机抽样，即是指被抽查的所有对象中的每一个，都应具有同等的机会被抽取到的方法。最常用的随机抽样法有：
　　(1)单纯随机抽样法
　　这种方法适用于被抽对象容易对号的场合。其方法是：
　　①将待抽检的产品(或工件)编号，使每一单位产品都具有相同位数的编号。例如，待查产品数量是千件以下时，则每件的编号均是三位数。
　　②确定抽取样本的大小。
　　③用随机抽号法(抽签法、随机数表法)抽取样品的号码，每个样品一个号码。
　　④对号取出被查的产品（或工作）。
　　⑤对每个样品进行测量，并记录所得数据。
　　(2)机械随机抽样法
　　如果待抽查的产品难以摆放整齐，即难以对号时，用简单随机抽样法就不合理，需改用其他抽样法，如机械随机抽样法。
　　机械随机抽样法是按照一定的次序来抽取样品的方法。这个一定的次序可以是每隔一定的时间抽取一次，也可以是每生产若干件产品抽取一次。这种抽样方法简便易行，所以在实际工作中得到广泛的运用。
　　(3)分层随机抽样法
　　分层随机抽样法首先按某一特性将产品（或工件）进行分层，然后在各层进行随机抽样，将各层所抽取到的样品合在一起就是我们所要抽取的样本。分层随机抽样法能充分地反映出各层的实际情况，所以，它比机械随机抽样法更能反映真实情况，有利于分析问题。
　　3、数据的特性
　　质量数据有两个特性：
　　(1)波动性
　　质量数据是有波动性的，即使是相同的机器由相同的工人操作，加工同样规格的零件，所加工出来的零件没有任何两件是完全相同的。这是因为影响零件规格的因素很多，而且同一因素在不同的时间，不同的条件下也是有微少差异的，所以，加工出来的零件其规格要求就存在着各种各样的差别，这就使得其质量特性值呈现出差别，形成数据的波动性。
　　(2)规律性
　　虽然数据有波动性，但并不是杂乱无章的，而是呈现出一定规律性的。最常见到的规律性是数据分布的规律性。在质量管理中最常见到分布规律是正态分布、二项分布及泊松分布等。
　　4、数据的统计分布
　　质量管理中的计量值数据，是连续分布的数据，其分布规律属于正态分布；而记数值的数据是间断型分布的数据，其分布规律有超几何分布、二项分布及泊松分布等规律，简要介绍如后。
　　(1)正态分布
　　正态分布的规律可归纳为：
　　①正态分布是以其平均值为中心呈左右对称的中央高两边低的钟型；
　　②正态分布的钟形有高矮肥瘦程度的不同，取决于该数据的平均值和标准偏差。
　　a.平均值
　　一般用希腊字母表示，它代表该数据的分布的中心位置，所以也称为位置参数。其表达式子是：

　　　　　　（1-1）
　　式中：--表示数据的各个数值；
　　　　　--表示数据的个数。
　　b.标准偏差。
　　标准偏差一般用希腊字母表示。它代表该批数据的分布分散程度，所以也称其为分散度参数。其表达式为:
　（1-2）
　　式中的各符号表示意思同平均值式子。
　　③正态分布常用符号表示。括号内的符号分别代表正态分布的平均值和标准偏差平方。当时称为标准型正态分布，记为 (0,1)。标准型正态分布的概率是：
　　a.在( +1 )范围内为68.27%；
　　b.在( +2 )范围内为95.45%；
　　c.在( +3 )范围内为99.73%；
　（1-3）
　　式中： --样本中含有x件不合格品的概率；
　　--从批的不合格品数D=Np中取d件的组合数；
　　--从批的合格品数(N-D)中取(n-d)件的组合数；
　　--从批量为N的产品中取几个的组合数。
　　具体计算在这里不做详细介绍。
★ＥＸＣＥＬ应用：
　　假设在生产过程中，10 件工具是由同样的机器生产的，将其作为随机样本，测试抗拉强度。样本值（1345、1301、1368、1322、1310、1370、1318、1350、1303、1299）分别存放于 A2:E3 单元格里。函数 STDEV 估算所有工具抗拉强度的标准偏差。
　　STDEV(A2:E3) 等于 27.46
　　(2)二项分布
　　我们从不合格品率为p的无限产品批中，随机抽取n件产品，其中含x件不合格品的概率是随着x的数值变化而变化的，其分布规律称为二项分布。二项分布概率计算公式是：
　（1-4）
　　式中： --二项分布概率；
　　--随机抽取n件其中含有d件不合格品的组合数
　　--产品批的不合格品率。
　　二项分布的形状决定于该分布的平均值和标准偏差。
　　二项分布的平均值　　　　（1-4-1）
　　二项分布的标准偏差：　　　（1-4-2）
　　由这两项公式可见与取决于与，所以，二项分布形状归根结蒂决定于与。
从统计量分布得知：当 ≥50， ≥5时，二项分布形状呈左右对称的钟形，近似正态分布形状，可以近似地按正态分布进行判断，即 =99.73%
★ＥＸＣＥＬ应用：
　　根据二项分布的概率计算公式进行概率的计算非常麻烦。我们可以应用一元二项分布函数在计算机的EXCEL文档里建立二项分布的概率表，方便日常的计算需要。
　　1.打开EXCEL新工作簿，在工作表中设置二项分布概率表的构架。
　　2.把光标点定在A１单元格中，然后点击"fx"函数调用按钮，在粘贴函数菜单的函数分类中选中"统计"，调用"BINOMDIST"（返回一元二项分布函数），点击"确定"，出现"BINOMDIST"函数公式菜单。
　　在菜单的选项框里按已知条件输入有关的数据。其中number_s, rrials, probability_s, cumulative分别为关心事件数k，试验总次数n，概率р以及逻辑值TRUE（累积函数）、FALSE（密度函数）。因为A１单元格是k＝0的密度函数，所以依次输入A１，n，p，0（0代表密度函数）。输入完成可以点击确定，则在A１单元格中显示出概率值。用填充柄可以在B列的k=1,2,3…的其余单元格中显示出该二项分布的密度函数概率值。
　　(3)泊松分布
产品的缺陷个数(如电子产品线路上的焊接不良点数、纺织品上的疵点数，机械故障次数等等)，从每单位平均含有m个缺陷数的总体中抽取一单位样本时，其中有x个缺陷的概率可由下公式求出：
　　（1-5）
式中：e--自然对数e=2.71828……
m--每单位内的缺陷点数
x--缺陷点数。
随着x值的改变，概率P(x)也改变，这些概率P(x)的分布规律，就称为泊松分布。上述公式(1-5)为泊松分布公式。泊松分布的特点

2)泊松分布的形状决定于m的大小，随着m值的增大，泊松分布形状渐渐接近左右对称的正态分布。当m≥5时，可近似看作正态分布N (m，m)。
　　从上述三种间断型分布性质可看到，在一定的条件下，它们都可以近似看成正态分布，因此，都可应用的原理来制订管理图的界限。
　　上述几种分布的近似条件，可归纳如下：
　　1)当N>10n时，超几何分布可近似于二项分布；
　　2)当p≤0.5及 ≥5时，二项分布近似正态分布；
　　3)当p≤0.1及 ≥5时，二项分布近似泊松分布；
　　4)当m≥5时，泊松分布近似正态分布。
★ＥＸＣＥＬ应用：
　　可用ＰＯＩＳＳＯＮ函数进行计算。例：某车间５％的产品有缺陷，现随机抽取５０件分别求出缺陷产品数属于以下各种情况的概率：（１）至多２件；（２）至少１件；（３）恰好３件；（４）在１件和５件之间（包括１件和５件）　
解：设产品的缺陷数为Ｘ，由于Ｐ＝０.０５与Ｎ＝５０相比，Ｎ很大，Ｐ很小，因此可以认为Ｘ近似服从参数λ＝５０×０.０５＝２.５的泊松分布。
　　（１）应用ＰＯＩＳＳＯＮ函数进行计算：选择fx中的统计--ＰＯＩＳＳＯＮ，在Ｘ栏中输入２，Ｍean栏中输入２.５，Ｃumulative栏中输true，计算得结果为Ｐ（Ｘ≦２）＝０.５４３８。
　　（２）Ｐ（Ｘ≥１）＝１－Ｐ（Ｘ≦０）＝１－０.０８２１＝０.９１７９
　　（３）Ｐ（Ｘ＝３）＝Ｐ（Ｘ≦３）－Ｐ（Ｘ≦２）＝０.７５７６－０.５４３８
　　（４）Ｐ（１≦Ｘ≦５）＝Ｐ（Ｘ≦５）－Ｐ（Ｘ≦０）＝０.９５８０－０.０８２１＝０.８７５９
　　六、总体与样本
　　1、总体。被研究(或考查)的对象的全体称为总体或母体。
　　2、样本。总体的一部分被作为直接研究、分析的对象，这一部分称为样本。也有称为子样的。
　　3、样品。样本中的每一个称为样品。
　　例如，有一批布共计100箱，现在抽取10箱进行评比检验。则这100箱布就被称为总体，习惯用大写的N表示；被抽出的10箱则称为样本，习惯用小写的n表示；这抽出来的10箱中的每一箱就称为样品。
　　由于总体的个体数目是很大的，甚至是无穷的，在一般情况下要对总体进行观察与研究是困难的，甚至有时是不可能的。在这种情况下，必须进行抽样，通过对样本的观察与分析，整理出有关总体的情报，然后对总体作出判断。所以我们抽样取得数据，不是为了得到样本的情报，而是为了得到来自总体的样本所反映的总体情报，根据情报对总体采取行动。可见总体与样本的关系是目的与手段的关系，如图2-1所示。
（2-1）
　　4、总体参数与样本统计量的关系。
　　样本统计量主要有：
　　(1)平均值
　　是指样本数据经整理后得到的统计量，它是样本数据的算术平均值，用大写的X表示。平均值表示该批数据的代表值，它反映出数据的分布位置，所以也叫位置参数。
　　设样本数据以Ｘi表示，则平均值为：
　（1-6）
　　式中，N为样本含量大小。
　　(2)标准偏差（S）
　　这个统计量表示样本数据的分散程度，也称为分散度参数。它是用样本的各个数据与它的平均值的均方差来表示的，计算公式是：
　（1-7）

　　对于总体标准偏差的估计，可以采用大样本的标准偏差来代替，按统计学要求样本大小不小于30个即可。但对于质量管理，一般都规定为不小于100个，特殊情况时可取不小于50个。所以只要我们抽样时，样本含量为100个以上，就可以用样本的标准偏差代替总体的标准偏差，用样本的平均值代替总体平均值来推断总体。

0 个回复

发起人

问题状态

质量数据

与内容相关的链接

0 个回复

发起人

问题状态