稳健性设计的逻辑
稳健性设计是正交设计之后的里程碑式的创新,但不能等同于田口方法。
上世纪初农业已有稳健性设计的实践,希望大麦新品种在肥力不同的土地、气候条件不同的地区,仍能有稳产的稳健性。
中国和欧美学者对稳健性设计逻辑的理解与田口方法对稳健性设计逻辑的理解,有共识也有分歧。
国内典型的文献是《正交法与应用数学》(作者张里千),美方文献《试验设计与分布及参数优化》(作者吴建福)。田口方法典型文献是《稳健参数设计》(作者韩之俊)
过去,当产品质量可靠性、稳定性差时,设计产品的工程师认为产品经实验室检验没问题,所以会归罪于批量生产线的质控不严和用户使用不当。
比如在批量生产时,成品各零部件质量特性的变异(噪声)必然使批量成品质量波动变大,
如用公差小的零部件成本高,性价比差。
而零部件组合产生的负面交互效应(噪声),如不做正交试验,可能不知道这种负面交互作用的存在,也不知道正面交互作用的增益。
农村电压忽高忽低的波动(外噪声)会降低电器功能,这种噪声用户无法控制。
而田口先生发现,如在试验中加入模拟噪声的因子,可利用质量特性与参数组合之间的非线性效应,能降低内部干扰因子的影响,利用可控因子抑制噪声因子的交互作用,能减少噪声因子对响应的干扰。只需调整水平组合(即参数设计),基本不增加费用,就能抑制内外噪声对响应的干扰。或者说,对噪声不敏感。而且能确定最合理的公差范围(容差设计,也可理解为价值工程),即是稳健性设计。
田口方法的试验设计和其它DOE方法不同,甚至于相悖。
传统实验室试验时需要排除噪声干扰。而稳健性设计相反,试验时加入模拟干扰响应的内外噪声因子,达到实验室设计的产品质量特性值和受内外噪声干扰下实际使用环境有一致性。
田口方法正交设计用分内表和外表的直积表,把可控因子正交表称内表,噪声因子正交表称外表。
要求可控因子内表的每一个组合,都要和噪声因子外表的每一个组合一起进行试验。用信噪比度量稳健性,评估出均值趋近目标值,方差又小的最佳的组合。
有学者认为直积表本质是“裂区法”或“分割试验法”,但稳健性设计的内在逻辑,常被误解。
部分析因设计的问题。
多因子案例用部分析因设计是经济的方法。
谢宁方法否定部分析因设计,只认可全因子析因设计。但在可控因子远多于4因子案例时,仅挑选出少量显著性因子组成的全因子析因设计可能遗漏掉不少有价值的信息。比如某案例“A和B都是不显著性因子,但AxB交互作用是显著性因子。”(韩文p55)
谢宁方法忽略了不显著性因子潜在的正面效应,而且统计意义上不显著不等于实际意义上无用。
传统DOE常用二分之一或四分之一的全因子析因设计,然后对活跃因子补充试验,凑成活跃因子群的全因子析因设计数据集合。全因子析因设计对建数模是必需的,其缺点是假设最优水平组合在上述活跃因子群框架内。建立的数模是精简的,但试验水平范围不足够,样本量太小,其数模可能仅仅拟合样本,并非反映总体全貌。
田口方法内表常用部分析因设计,但静态稳健性设计以寻找最优水平组合为目的,所以交互作用混淆不是大问题,其软肋是常用L18大正交表为内表的直积法功效低,内表用部分析因设计会漏掉更优可控因子组合。
怎样解决部分析因设计信息不完备弱点呢?国内学者建议尽可能用小正交表和饱和正交表。首次试验后,在好的水平基础上再調整出新的水平,进入下一轮新的水平组合试验。
如同“盲人爬山”,探一步,爬一步,经多轮正交试验,但仍能在混杂的信息中找到最优组合的方向。这是“笨”办公,但新的水平组合,会带来新的信息,能逐步逼近最优水平组合。
新的试验水平框架可能带来质变:当水平变动后,可能原不活跃因子和不显著性交互作用会“变性”。
(三)方差分析工具。
传统正交试验,为了筛去不显著性因子,在部分析因设计前提下用方差分析工具。
张里千认为:“部分实施会造成混杂,不足以施行方差分析。”(张文p19)
BOX认为“很多电脑程序都利用方差分析表来分析2k设计和它的部分设计,但是分析这种特殊的设计时,使用ANOVA会非常令人费解,并且没有什么意义。”(《试验应用统计》p115)
而且理论上实施方差分析,残差需以下假设为前提:正态分布、均值为零、数据相互独立、方差相等。(韩文p23)而在实际应用时,很少会验证上述假设。
在实际案例中“噪声分布并不一定要服从正态分布”、“相同的变异性假设在稳健参数设计中不存在。”(韩文p4)
国内的实践证明:“经过逐批少数正交试验便能绕过处理试验误差的统计方法过程,进入到良好的位级组合区域。”(张文p4)
简言之:既然部分析因设计无法精确量化主效应和交互效应,不用方差分析等精确工具,而用极差法、因子趋势图等近似工具分析,用多轮正交试验逐步找到最佳水平组合。
(四)对直积表的争议。
田口方法的直积表被批判试验次数多,以及内表常用部分析因设计和非正规正交表,造成交互效应混杂被诟病。
直积表的复杂目的是,用试验寻找随机变量噪声因子集合对响应的干扰最小的可控因子组合。这是稳健性设计的核心精髓,可是很少人能理解其科学意义。
实际上在多因子案例,传统方法有的还用6次重复试验,总次数也不少。
对直积表试验次数太多的缺点,有学者提出用一个“复合噪声因子”取代多噪声外表(韩文p72),这样经济上合算,实际不合理。
“如果研究人员知道噪声因子和控制因子是怎样联合地影响变差的,就没必要实施参数设计试验。”(吴文p410)
又有学者提出用“组合表”替代直积表,即噪声因子和可控因子同在一个全因子析因设计的正交表内。
这“近似”符合直积表,说近似符合,这方法把噪声因子视为常量,而实际是随机变量。多噪声外表常用全因子析因设计,为了能显示“噪声X噪声”交互作用,多噪声之间交互作用比单噪声因子对响应的影响更复杂。而“组合表”只能显示单噪声因子和可控因子之间交互作用。
比如电压和频率波动的噪声因子交互作用比单电压波动对电器功能干扰更大,尤其噪声X噪声对响应的干扰,往往只能在试验中显示。
如多因子多噪声因子案例,因子总数过大,“组合表”只能用部分析因设计时,无法得到全因子析因设计的全面数据,这也是直积法内表常用部分析因设计的缺陷之一。
所以直积法能最精确显示噪声因子群对响应的影响,但有可简化和完善的余地。
如可计算案例,直积法的复杂不成问题。
比如电工类有公式,可用计算方法替代试验。多水平、多因子案例,如用全因子析因设计的直积表,因子和水平数再多也不成问题。
国内学者用对参数约束性计算,又能大大减少计算量,有的案例,一轮约束性试验达到三轮非约束性试验的效果。最后用重复试验验证。
(五)对关注点差异。
传统DOE目的是回归建模,在实验设计时尽可能分清因子主效应和交互效应,减少混杂。
而田口方法用逆传统设计:
“任一个含Q(噪声因子)的二因子交互作用是强纯净的”(吴文p132),
传统正交试验, “通常优先考虑的是主效应的估计,而不是两因子交互效应。”(吴文p238)
“将分辨度以及最小低阶混杂准则,应用于参数设计试验是不合适的。”(吴文p407)
吴建福对稳健性设计逻辑的理解:
稳健性设计认为能抑制噪声的“可控X噪声”的交互效应,和主效应同等重要,而且比“可控X可控”交互效应更重要。
能抑制噪声的“可控X可控X噪声 ”的高阶交互效应和“可控X可控”交互效 应同等重要,这颠覆了高阶交互效应可忽略的惯例。(吴文有实例p407)
(六)可控因子之间交互作用定性问题。
传统DOE认为田口方法最大问题是交互作用混杂,其实最大理论问题是对可控因子之间交互作用的解释。
正交设计解决了显示交互作用问题,想不到田口方法认为可控因子之间的交互作用对稳健性设计是“有害的”。而且又武断认为可控因子和噪声因子交互作用“有利的”。(韩文p4)
在没用稳健性设计之前可控因子和噪声因子交互作用也客观存在的,多数对响应有害的,因此才需要调节可控因子水平组合,抑制噪声因子对响应的干扰,所以不能说可控因子和噪声因子之间交互作用都是有利的。
而稳健性设计找出能抑制噪声因子的非线性响应可控因子,和找到各可控因子水平巧妙组合(其中有可控因子之间交互作用)抑制了噪声因子,这时可控因子和噪声因子交互作用才是有利的。
“A有两个水平A1、A2,当另外一个因子B处于B1水平吋,A1水平的结果和A2水平的结果相比有一个量值;当B处于B2水平时,A1水平的结果和A2水平的结果相比量值有了变化。因此,交互作用就是因子影响结果的不一致或不再现。”(韩文p3)
“交互作用会导致结论不一致或不再现,所以必须尽量避免可控因子之间的交互作用…”(韩文p9)
上述交互作用“有害的”原理实际上生产过程中对可控因子水平控制的难度问题。
对于难以控制的水平,稳健性设计可把可控因子视为噪声因子处理,比如难控制的温度问题。
众所周知,正交设计能显示正面交互作用和负面交互作用:
利用正面交互作用获得1+1大于2的额外增益,对负面交互作用,可改变设计组合减弱之。
吴文中案例,“可控X可控X噪声”交互作用,是可控因子之间交互作用起到抑制噪声作用。
韩文p29中案例:钢硬度由时间和温度交互作用占33%,请问能消除交互作用吗?
青铜的硬度是銅和锡的交互效应占主导,怎样解释?
(七)处理交互作用混杂问题。
“交互作用是客观存在的,怎样避免或消除呢?回答是交互作用的存在取决于应用什么样的测量系统进行分析。”、“用信噪比,特别是动态特性的信噪比…”(韩文p5)
田口方法认为用特殊正交表、输出特性连续性计量、信噪比度量,“一般情况下,可控因子之间的交互作用会消除殊尽。”(韩文p17)
“用特殊正交表L12(211), L18(2x37)任意两列的交互作用平均分配在各个列上。”(韩文P6)
L12是飽和设计,交互作用“平均分配在各列上”的说法是自圆其说。实际上各列交互作用混杂、重叠,平均分配说法是难令人信服。
多因子案例用部分析因设计是经济的方法,虽然主效应和交互作用混杂,但其综合的效应,正面或负面效应以及高阶交互效应都反映在响应上,而且是真实数据,仅有试验误差。
笔者猜测,田口方法对可控因子之间交互作用有害的种种解释,为了回应内表用部分析因设计造成交互作用混杂的质疑,但反而令人困惑不解。
历史上工业应用正交设计远晚于农业,由于工业参数远多于农业,用全因子析因设计经济上有困难,而田口先生勇于在工业上用部分析因设计是大功臣。
国内实践证明,如不建数模,交互效应混杂不影响用多轮正交试验逐步找到最优水平组合。
“数学要经得起思维逻辑严密性推敲或者在其他科学领域应用的有效性来检验,而统计学则更多地要得到实际的直接检验。”(《试验应用统计》译者序)
(八)试验设计方法的科学性是源头。
“分贝值表示的SN比,不仅计算方便,而且可使经对数变换的η(信噪比)更接近于正态分布…同时因素效应大多具有可加性,忽略了交互作用的影响。”(《稳健性设计》曾凤章p63)
上述文献讲清楚了田口方法认为用对数变换后的信噪比能“忽略”交互作用的原理。
实际上传统建模方法常用数据变换,把非线性性转换成简单的线性模式。
对均值平方和方差对数转换后成线性化的信噪比,这仅是数学形式变化,客观存在 的交互作用还是存在的。如有负面交互作用,也只能調节水平组合来改善,无法用试验后的数据变换来忽略交互作用的本质。
例如学校为改变学习成绩分数至上状态,改用优、良、中、差评估,仍无法摆脱分数评价体制。
田口方法认为稳健性设计就是用信噪比的正交实验设计。对此议提出异议之前,先澄清一个大前提,噪声因子加入正交试验是稳健性设计关键性的源头,但不是信噪比的功劳。
“试验设计能够用来产生良性数据,甚至可以认为,好的试验设计对科学进步是必不可少的。然而,至今我们更多地注意着数据分析。试验设计具有第一重要性,其原因是,数据的信息内容在进行试验时才确定,任何敏感的分析都不能揭示没有体现在数据中的信息。”(《非线性回归分析及其应用》p134)
比如谢宁方法常用“逐个替换”单因子试验,很难显示交互作用。多因子同时变动的正交设计能显示交互作用。
稳健性设计核心是模拟内外噪声因子参于正交试验,以及怎样调整优化水平组合。用信噪比选优,仅属数据分析的一种方法,而且又有缺陷。
在用信噪比选优方法中,对望大、小型案例选优无难度,争议也少,难度在望目型。
田口方法推荐的2步法:先找出信噪比最大的离散因子。但信噪比大,可能均值相对于方差大,但单均值大对望目型无意义。
望目型信噪比:期望平方/方差。
比如均值(期望)平方10,方差1,但目标值是8。所以必须找到把均值趋向目标值,又不影响方差的独立的位置因子。无这位置因子配套,信噪比大无意义,即望目型信噪比缺少一个目标值参数介入。
而且2步法不是都能实现,运气好的正相关案例:调节后响应方差趋小时,均值趋向目标值。反之,有的案例无位置因子时,方差趋小时,均值远离目标值。这时需方差和“离目差”(均值与目标值差)之间的社会质量经济损失大小,找到一个平衡点,田口创立的质量经济损失公式,能解决这难题:如响应是正态分布,分布对目标值的偏差均方=响应分布方差+均值与目标值差的平方。
田口认为质量特性值偏离目标值就发生质量经济损失,以这定义创立的质量经济损失公式(偏差均方),虽不完美,但因包含响应分布的均值、方差和目标值3个参数,就是优于望目型信噪比的原因。
国内学者把田口方法内表称为选优表,方法是对望目型案例内表组合数据直接用偏差均方选优。
某文献25组试验中只有5组偏差均方靠谱,仅甪这5組和噪声组合一一试验,大大减少了试验次数。而如用田口的直积表,有20组在无噪声因子介入响应时,响应已超合格限,再介入噪声因子做试验是做无用功。
北大学者在实践中证明:“凡偏差均方好(小)时,信噪比也必然好(大),反之不一定成立。”(《正交法和三次设计》P129)在望大望小型案例,偏差均方也适用。
国内有学者认为信噪比适用于动态稳健性设计,用β灵敏度取代均值。静态稳健性设计望目型适用偏差均方。