每场研讨会的学员在第二天下午一面忙着消化午餐,一面消化“新哲学”的同时,戴明博士总会进行一项他所称的“笨实验”;但他保证,这项实验将令人永远难忘。 他一一拿了实验器材。 首先是一个里头装着许多豌豆般大小红白木珠的塑胶盒;其次,是一支上面有50个凹洞的把杓(每5个凹洞一排,共10排,凹洞大小与木珠相当);然后是另一个塑胶盒;大小恰足以让把杓在里头捞珠子。 接下来的一小时里,实验在一片欢笑中开始了。尽管现场笑声不断,这场木珠实验却深刻。凸显出一项事实:经理人为员工所设下的标准,往往超出他们所能控制的范围。这项实验同时也显示出,如何用统计方法找出问题来源。 会场前端成了生产线,戴明博士自己则扮演可怕的工头。他严厉地宣布:“我们的工作是‘产出’白珠,因为顾客不收红珠子。” 他从听众中招募人员,加入生产线,并开玩笑的说:“女士优先。”他的求才启事如下:“本公司诚征作业员六名,需要高度热忱;检验员2名——因为本分司作业错误百出,冗员充斥;检验长一员——这是本公司唯一没做错的事——检验员独立执行计算,不需寻求共识。另征记录员1名,此乃重要职务……须具备书写及加法能力。因为他要负责登记姓名,并记录产量。"
作业员各就各位
有位男士走出来,到会场前端应征记录员。 戴明博士装出一副严厉的样子质问:“你会写字吗?会写数字吗?加法也懂?好,请就位,我会把你放在薪水单上。”他以类似的方式,录用了两名检验员和一名检验长。(他问的问题之一是:你会数数吗?你能从一数到一二十吗?那好,去拿张纸吧。) 接着他开始招募生产线作业员。“现在我们需要6名有工作热忱的作业员,学历不拘,但必须有工作热忱。好,我现在看到有一个人举手,请到前面来。1个,2个,3个,4个,5个,6个。好,都请到前面来。"
工作人员就位后,戴明博士开始讲解任务。他模仿工头的权威口吻说:“纪录员请准备上工。你随时可以开始登记检验员姓名。”接着对作业员说:“6名有工作热忱的作业员听着:你们不可以和检验员攀谈。你们的位置就在这里(身体往右挪)”又说:“记录员要有笔,我借给你一支,不过要记得还回来。好,先写下自己的名字。检验员、检验长、6名热忱的作业员,请各就各位。” 戴明博士逐一查对员工身份后说:“你们当中哪个人的素质能力是全体成员的平均水准?”他注视着其中一名作业中狄克说:“你是平均水准的那位吗?” 狄克回答:“应该是。” 戴明说:好!站这里,那么另外5人都在水准之上(听众大笑)。就按这个顺序排列。平均水准的那个人,叫狄克是吧?好,帕特、包伯、……不要太快,记录员没办法写太快。好,霍斯特、……等一下,全乱了,擦掉重写。 “顺序对我们来说非常重要。平均水准的人排第一,接下来是帕特、包伯。别急,别太快。再来是史帝夫、霍斯特、戴夫。” 名字依序记下来之后,戴明开始发号施令了:“你们要先经过3天的试用期,这段期间将会照样给薪。我将扮演工头。但既然这里其他人都不了解我们的工作到底该做些什么,我先亲自出马。我们的任务是‘产出’白珠子。”
红珠白珠落满盘
“这个地方是有规则的,在我说出之前,先告诉我,你们愿不愿意全力以赴?”作业员一致点头。戴明接着说:“程序是这样的,它们很明确,必须一步一步来,不可有任何改变。必须完全遵照程序,不准中途辞职。就算你们可能被炒鱿鱼,也不可主动提出。大家都听清了吗?” 戴明博士把两个盒子中较大的那个拿出来;里头混装着800颗红珠、3200颗白珠。他右手抓着大盒子说:“我们总共有两个容器,尺寸不同,一大一小。清楚吗?拿盒子时你们要抓住两个容器较宽的一边,懂吗?你们要把珠子从大容器倒到小容器,从最靠近的角落倒进去,距离保持‘5公分’。他特别强调‘5公分’,引来一阵笑声。他一边倒珠子,一边告诉听众:“我们的程序很严格。"他先把珠子倒到小容器,又倒回大容器,让两种珠子混合均匀。 “5公分!再倒回来。”他提高声调:“抓住两个容器宽的那一边,从最靠近的一角倒进去,这就是你们完成每日工作的方法。我们的一套工作程序是:每天取50颗,不多也不少。任务是‘产出’白珠子——我们的标准是50颗,红珠子白珠子都要算,但记住,顾客不接受红珠。
“你们把珠子倒进大容器后,要拿起把杓,插入珠子堆里。把杓不要晃动,以免红珠子掉了出来。假如红珠子掉在地上,就得停止生产。”他停顿一下说:“你们准备开始胼手胝足的干活吧!” 戴明博士继续示范。他把把杓插进大容器里,让50个洞都装了珠子。虽然实际操作要比表面看起来困难,不过每位“作业员们”最后都学会了。“把杓子往下推,推到底。拿出来,不要晃。”戴明博士在旁提醒。 他问:“你们自认为已经了解了吗?”“作业员”一致肯定地点头。
戴明博士开玩笑说:“我自己故意舀了些红珠子,好让你们知道它们长什么样子。” 他继续解释下一步:“带你的成果到一号检验员那里,他会大声把他算的数念出来。接着到2号检验员那里去,他会记下数字。检验长则比较这些数字。” 戴明告诉检验长:计算工作由你负责。假如发现数字有出入,其中必有一人是错的。你要负责找出来,并大声喊出正确数目。你认为工作交代得够清楚了吗?明白了吗?知道你不能有所背离的吗?我们的程序非常严格,正如我所描述的。假如你对算出来的数字满意,就可以让那位作业员离开。一定要对结果满意,才可以放人。然后,他便可以把当天的成果倒回原来取出的容器去。清楚了吗?现在,那位‘平均水准’的男士可以开始了。” 狄克抓起大容器,将珠子倒进小容器里,戴明博士大声吼着:“5公分!” 狄克把杓子挖进大容器内,努力舀取白珠子。戴明博士问其他作业员:“你们有没有认真看?注意看他是怎么做的。如果他捞到红珠子,看他是怎么捞到的。你们要避免重蹈覆辙。”
戴明转头向听众说明:“这就带来恐惧了……”
红珠挣扎战
狄克装满杓子后,稍微倾斜了一下,让多余的珠子滚出来。戴明博士告诉他:“现在,到1号检验员那边去,静静的把他计算的结果记在纸上。然后,到2号验员那里去。检验长将会确定数目,并宣布出来。” 检验长保罗遵照指示,大声宣布红珠子的数目:“14颗。” 戴明博士故作烦恼:“多达14颗,我要说我们真是出师不利”。(全场爆笑)他把全部“作业员”聚在一起,对他们说:“我得让你们知道。我们的客户只收白珠子。所以我们的职责是:制造白珠子,而不是红珠子。14颗!”他语调哀凄。“这样一来,我们怎么立足。” 接下来轮到第二位帕特小姐。戴明提醒她:“5公分!慢慢来,不要晃。珠子会滚出来。把成果拿给1号检验员计算。” 听众听到数目是“17”时,纷纷发出不满的叹息。工头戴明看来更苦恼。他脸色阴沈沈的的对帕特说:“我要和你谈谈。我们要产出白珠子。你刚刚有没有注意看?为什么还是产出红珠呢?我真不明白。下一位!” 这回,第3位作业员马伯的成绩略有进步,只有11颗红珠。
戴明博士高兴的大叫:“哈!这就是我所说的改善了。不过,改善得还不够。”他转向其他作业员:“你们都看到了是怎么做的了吧?好,我们现在开始努力改善。这就是我们所需要的……持续不断的改善。” 下一位作业员史帝夫的成绩更好,只有8颗红珠。 戴明博士满意的说:“这才叫改善——持续的改善,好极了,这就是我们所需要的。改善之处愈来愈多。一次比一次好。” 但第5名作业员霍斯特的红珠却增为12颗。戴明博士责骂道:“这不叫改善!恐怕你弄错了。”他把注意力移到最后一名作业员戴夫身上说:“好,戴夫,现在你必须表现优异,把平均水准拉回来。”
戴夫的成绩是9颗红珠,是全部人中次少的。但工头戴明并不满意,他对作业员说:“我要告诉你们。我们的程序十分严格,不准有差异。但现在成果很差。我不明白为什么差异程度这么大:史帝夫八颗,帕特17颗。程序相同,进料相同,红珠也都占20%。这么严格的程序,照理说不应有变异才对,为什么却从8颗到17颗都有。不可思议,17是8的两倍多呢。”他以无法置信的声调重复:“不应该有变异才对。我们的程序固定,每个人都在相同的程序下工作,规则完全相同。身为工头,我只能说对你们的表现表示失望。”
鼓励与施压
“现在,我们接下来继续‘第二天’的工作,还是由‘平均水准’的那个人先开始。身为工头,我希望你们能有所进步。” 狄克“第二天”捞到10颗红珠,比前一天的14颗进步。戴明博士恭喜他说:“狄克,这就是我所说的进步。” 下个作业员帕特只捞到5颗红珠,引来一阵欢呼,是目前最好的成绩。戴明博士以帕特为例,激励其它作业员:“假如帕特只捞到5颗,谁都可以只捞到5颗。超过5颗的教人无法理解。我们的程序严格,它们完全相同……只是周而复始。不该变生变异才对。” 巴伯6颗红珠的优异成绩,也受到称赞。接下来霍斯特11颗,得到“合格”的评语:“比昨天进步,既使只有一点点,但也不错了。”他对最后一位戴夫说:“你现在得弥补同伴的不良表现了。”当戴夫捞到11颗时,工头戴明斥骂:“知道吗,戴夫,你要为今天整体的成果欠佳负一部分责任。”他转向所有作业员说:“我们所需要的是更好的成绩。高层主管一直盯着这些数字。他们对我们的低产出非常不满。而你们的工头也无法理解为什么变异那么大,我不明白。继续加油吧。切记,你们的工作全靠你们的表现……不是保有工作,就是流落街头。全看你们了。我们可以让工厂继续开着大门,否则上级就要把工厂给关了。”
“第三天”帕特捞到八颗红珠的时候,工头有点失望。他说:“帕特,我不明白。昨天你只捞到5颗,今天却是8颗。这样的差异令人无法理解。没道理啊。记住——你的职位可能不保。” “第三天”将尽时,戴明把全部作业员召集在一起时,对他们说:“大家听着,上头一直在盯着这些数字,他们无法理解成绩为何如此低落。他们已经决定,除非‘第四天’能有显著的改善,否则就要关厂了。你们的工作能否保住,全看你们的表现。工厂已经入不敷出,一切就全靠你们了。要大大的改善才能继续。现在,我希望你们尽情工作。这也许是你们的最后一天了。”
作业员继续“第四天”的工作。当最后一名作业员戴夫捞到10颗红珠时,戴明博士大叹:“要在这里看到改善,真是太难了!我不了解为什么做不到零缺点。”其他人的数目,分别是5、9、6、10颗红珠。 戴明博士说:“上级一直注视着这些数字,他们非常不满意我们的生产能力的低落,已经决定关厂了。走出大门前,请各位顺道去领工资。谢谢大家。非常感谢你们的热忱。”
检讨满江红
始终认真记录着每位作业员红珠数目的记录员,在第四天结尾加总算出了数目,并计算出每人平均日产量,及全体的平均日产量。 左表是用投影仪放映出来的统计图表(略 ) 工头戴明检讨成果,他说:“你们可以看到上面这些数字,这里有几次高于平均水准,几次低于平均水准。这是什么道理,我不了解。史帝夫是第一天的当日最优人员,帕特则捞到高达17颗红珠,是第一天表现最糟的一位;不过,第二天她只捞到5颗,是第二天的最优人员——虽然她第一天,是所有人麻烦的根源。” 戴明博士继续说的时候,听众开始掌握到若干基本讯息,那就是:既使员工使用一模一样的工具、执行一模一样的任务、才智一模一样,产出的结果仍会因时不同。戴明博士在假扮工头的过程中暗示听众:事实上,经理人不该针对员工无法掌控的结果责备他们。再说,不管员工人数有多少,总有某些员工的表现低于平均,某些高于平均。
计算公式演示
接下来,戴明博士说明如何运用一个简单的统计公式找出变异上下限。“现在我们来稍稍计算一下……目前产出红珠的总数是220,我们假设捞到一颗红珠子不会引来其他红珠,也不会排斥其他红珠;捞到任何一颗白珠子不会引来其他白珠,或排斥其他白珠。也就是说,我们假设珠子完全独立,不受其他同色珠子影响。” 首先,他将所产出的红珠总220,除以捞取珠子总次数(6个作业员做四天工作所捞取的总数)。结果我们得出每人日平均数为9.2。这个日平均数被称为xˉ 。
xˉ=220/(6×4)=9.2
其次,他计算每人每日捞到红珠的平均比例 pˉ——亦即捞到的全部珠子里,红珠子所占的比例:
pˉ=220/(6×4×50)=0.18
根据这些数字,我们再用公式算出“控制上限”(UCL,Upper Control Limit )及“控制下限”(LCL,Lower Control Limit):
UCL/LCL= xˉ ± 3 /
(注:此处为根号)xˉ(1- pˉ) / =9.2 ± 3/ 9.2 × 0.82
“现在,”戴明博士说:“让我们来看看结果:没有人超越上限。虽有人试着这么做,也很接近了,却功败垂成。6个人共试了24次,每次都在控制范围之内。这显示我们的统计控制做得相当不错——可是我从来不使用‘完美’这两个字,因为根本没这回事。”乍看之下,图中( 略 )似乎存在着某个模式;也就是说每次只要连续有7或8个点高或低于平均数,就好像有一个模式出现。但戴明博士说:“我看不到有任何模式存在。眼前所看到的是一个常会遇到的,几乎呈’常态原因系统’(Constant Cause System)的情形。现在让我们来看看变异的程度。所谓的‘常态原因系统’就是,你在计算未来的变异范围里,存在着一定的稳定性。但让我们以最近的未来——我们所拥有的24次为基础视之,理应如此。虽然相关信息的确不足,但24次内确是如此。假如再进行另外48次捞珠,便可以加上资料,重新计算上下限,结果可能还是现在所看到的——虽然我也没有把握;因为没有人可以未卜先知,而实证资料永远不够完整。”
换句话说,如果在这套主导生产线作业的系统中,禁止改变,红珠的数目将会在控制上限下限之间波动,但不会超出界限。
理性的感受
戴明博士说:假如你以理性的态度预测,便能对别人描述你预测的根据在哪里,其他人也能据此批评。假如你说:‘我预测即将下雨’……这只是个人意见,别人无法据此批评,因为他人没有批评的基础。假如我列举出理论,也许你会想要修正我的公式,以求符合你的想法,这是很自然的。你有了这方面的知识,便有权如此做,也应该这么做。你知道什么是理性的预测吗?它是你所能描述、所能解释、人人都可以赞同或反对的方法。我们可以理性的预测:假如我们再进行另一次4天的实验,结果仍将落在上下限内。我们当然不确知是否如此——但再进行‘4天’,就会知道。我必须一再强调:由实验而来的证据永远不够完全。
“我看过凭着粗劣资料做出的精心之作。怎么找都找得出25%的误差,但没有人知道。根本没有人去考虑资料是否确实。”接着,戴明博士故意找碴,要求听众想想假如他们未曾看这场实验,会对结果作出什么预测?假设共有4000颗珠子,其中3200颗(80%)是白珠,800颗(20%) 红珠,则每日平均数 xˉ ,会不会落在某个特定的数字上?部分大胆的人推论:假如日产量为50颗;一段时间下来,红珠的数目应该为平均日产量的20%,也就是10颗。 台下有人稀稀疏疏的喊出“10颗”,回应戴明博士。 “我听到你们说多少?”戴明再问:“10颗?你们错啦。听着,这点很重要。你们没有任何根据就乱下结论。没错,全部珠子里,红珠占了20%——当然50颗里的20%就是10颗。但是,为什么你们会预测平均数 xˉ 会落在某个数字上?我没问你们是‘哪个’数字,只是说‘某个’数字? xˉ会落在某个地方是根据什么基础?为什么你们这么说?” “机率!”台下传出答案。“我们根据‘中央极限理论’( Central Limit Theory)。”
反复推敲求真相
“机率?’戴明博士大吼:“我们不谈机率。至于中央极限理论,我倒希望你告诉我那是什么玩意儿,我已经有55年没用过它了。我不想知道这些东西,但请你告诉我,你到底是什么意思?(台下大笑)‘中央极限理论?’把它丢掉一边去吧!那是我们教授统计时所遇到的问题之一。我们教学生错误的东西,还教得非常好。” 另一位大胆的学员提供了一个答案:“人口数必须平均掉。” “什么叫做‘平均掉’?戴明回问:“什么是‘人口数’?我一辈子都没看过。” 传过来的回答是:“就是宇宙万物、全人类。”
“全人类?”戴明博士提醒他:"告诉我这是什么意思。我认为我们有必要好好想想,不要强不知以为知。现在大家继续告诉我,你们根据什么基础预测 xˉ会落在什某处?为什么?在我们今天早上进行实验之前,你们会预测 xˉ会落在某处吗?不会吧!我不是要大家发表意见。我不是提出某个东西请大家来检验。不是这样。你们不可以、也不应该做出类似的预测。 “现在我们既然具备统计控制的观念,所以我们可以说, xˉ会落在某个数字。我们不知道它会是哪个数字。而我们只有‘4天’,4天看起来似乎也可以找到落点——某处,某个数字。我们再看看资料。11.8;8.5;8.3;8.0……它们似乎有下滑的趋势,也许会朝某个数字靠近吧?我不知道。如果再实验4天,也许可以了解得更多。你们说 xˉ会落在哪个特定数字呢?刚刚听到有人小声说:‘对呀!对呀!’。你说对了。我认为会。现在告诉我,究竟会落在哪里?” “10。”同样的答案再度出现了。
戴明博士继续说:“你们现在说它会落在10这个数字,你们又错了。注意,这正是你们需要学习的地方。当然,我们每个人都在学习。但为什么你们说它会落在10呢?凭什么?你们毫无根据。我们目前为所拥有的证据显示,它不会落在10。数据呈现的是11.8;8.5;8.3;8.0的下滑趋势。你们为什么说是10呢?这是一厢情愿的想法。因为你们学习统计理论时,没有学到它的精髓,不知如何利用。告诉我,为什么会是10?” 一名听众坚称:“盒中有20%是红珠,所以应该是10。” 戴明博士答道:“应该是,实际却不是!你可以很清楚看出它不是。为什么你说是10。因为50的20%是10,而盒中20%的珠子是红的。假如你用这种态度经营事业,你就有麻烦了。” 讲到这晨,重点开始渐渐澄清。因为我们看到的平均数不是10,而是似乎还要低些。既然如此,必定有某些变数影响整个过程。 有位男士问:“变数是否不只一个呢?你只告诉我们珠子的颜色有红,有白。它们大小相同吗?”
戴明博士认真考虑了一下说:“大小不同?它们当然大小不同了。它们个个不同。你知道嘛。这又如何?这是否表示你已得到10以外的解答了呢?” “这么想是没用的!假如珠子与洞口不吻合,它们便无法计入样本中了。” “你说对了”他客气的告诉这位男士,然后转头笑问听众:“我为什么要绕一大圈呢?”
水落石出
"现在,让我换个方式问。你们想为什么红珠与白珠表现不同?为什么比例不是你们所说的那样,而你们却如此肯定?!对错误的事如此肯定,实在太糟了。这么做真的会让你陷入麻烦。告诉我为什么 xˉ可能不会落在10?而且可能离10很远?红珠当然和白珠不同。如果它们之间并无二致,检验员如何计算红珠的数目?红色和白色不同。任何化学家都可以告诉你,这两种色素有什么差异。对那支把杓而言,它可以感觉出红白珠子的不同。用手指去摸,感觉也不同。而且,红珠子比较大。你们中一部分浸在红色颜料中,再铺在桌上晾干。这样就有红珠也有白珠了。红珠较大也较重。然而,你们却想告诉我, xˉ会落在10,因为盒子里有20%是红珠。
"把杓很重要。我已经使用1号杓子30年了;我当年教日本工程师时就是用它。这支杓子每次平均可捞到11.3颗红珠,这是实验100次以上得到的数值。2号杓子平均可能捞得9.6颗。今天用的3号把杓,平均可能捞到9.4颗或9.2颗。
"假如你为工厂采购含灰量为9.6%的煤炭一批,结果抵达的煤炭中,含灰量高达11.3%,恐怕就要辛苦一阵子才能弥补损失了。我们在类似实验中用的机械抽样,永远无法告诉我们进料(在此处是红白珠)的实质内涵。 “假如我们所用的统计控制水准还算过得去, xˉ就会固定在某个位置——这项工作也许要花上一段时间(也许还要再花上另外‘4天’)。我们会建立起一套可信度 的。各位可以针对未来所需在这方面预作规划的。假如我们现在就必须计划未, xˉ数值大约可以说是9.2,但不能确定到底距此有多近。必须有相当大的弹性空间才行。”
结论
如同任何寓言一样,“红珠实验”也有其寓意:
----“变异”乃是过程的一部分。
----进行计划前,必须先预测人事物未来可能的表现。但任何测试(实验)过去的成绩表现既使颇具价值,还是无法准确。
----员工都在某一个自己控制不了的系统下工作
——既使他们努力尝试。决定成绩表现的是“系统”,而非“个人技能”。
----唯有管理阶层才能改变系统。
----某些员工的表现总在水准之上,某些总在水准之下。
戴明博士保证,任何人只要看过一眼,就永远忘不了他这个简单而“愚蠢”的实验。
“无论走到哪里,你都会看见红珠子。”