LSS项目灵魂—数据收集是这样实现的
在精益六西格玛项目开展过程中,我们需要不断与数据打交道,不断地依据数据作出决策。在正式的数据收集计划前,我们已经识别了顾客的要求、关键的流程输入、输出变量,识别了我们认为的影响输出变量产生偏差的主要原因,也就是我们常说的关键影响因子,接下来我们需要制定和执行数据采集计划,去找到基线数据,分析流程能力,并使用量化的数据去分析影响流程能力深层次的原因
当然,我们前面提到,在精益六西格玛项目开展的各个阶段,我们都会用到数据,所以数据收集计划也是一个不断更新的过程。
数据采集如何实现
第一步,选择测量变量,对每一个被测变量进行定义, 输入/输出是什么,这个变量是连续还是离散数据,如何表示测量指标,测量的流程步骤是什么,是否关注周期性变化,时间跨度等都需要关注。
第二步,确定数据分层类别,抓住并使用数据的特征把数据分类到不同的类别中,识别潜在的根本原因。
第三步,制定抽样计划,抽样是用样本数据通过统计方法推导出全部数据的结论,既然是采样,我们就需要考虑样本的质量和样本大小。六西格玛通常采用分层随机抽样,对于连续数据,估计“平均值”,一般需要> 30个数据样本,对于属性数据,估计“比例”或“百分比”,一般需要大约100个数据样本。
第四步,设计数据采集表,数据采集表有核对表、频率图核对表、集中图核对表、数据表、“旅行者” 核对表、调查表等。我们通常采用数据表,用来记录连续数据,或连续和属性数据的混合数据。在所有质量工具中数据表是最有用的诊断工具,表中应包括数据来源信息,如时间,批次, 班次, 地点, 数据采集人的名字等,可以在Excel、Minitab、JMP中建立数据表。
第五步,制定填表程序,数据采集方法一经制定,需制定如何填写数据表的指导文件,说明每格填入什么内容,应尽可能直观,包括表样,如果需要可开展数据采集人培训以保证数据采集的质量。
第六步,测试数据采集的方法,评估测量系统的准确性(此内容以后学习中将进一步详细讲解)。
第七步,采集数据,项目组一定要一直按抽样计划行事,随时观察有无异常,根据需要调整采集计划,达到需要的样本数量时可以停止数据采集。
数据采集案例
以某项目数据收集计划为例,由于信用卡申请数据庞大,项目组采取分层抽样的方式进行数据采集。
首先,选取了数据分层抽样所考虑的维度,确定分层抽样的比例,对一年的申请件进行抽样,保证了抽样样本量的激活率、活卡率、收益率等关注要点。
表:数据分层依据及比例分配
然后,项目组确定了样本量,规定95%的置信空间,根据δ周期波动和准确度最终确定了最终样本量。20万笔数据标准差为10,准确度为0.4。
最后,项目组设计了数据采集表头,关注的信息均需列明,根据采集计划最终完成数据采集工作。