质量人看大选 | 从美国大选看随机化
四年一次的美国大选上周已落下帷幕。
本次驴象之争确实精彩。
摇摆州佛多里达州拥有29张选举人票,成为历年大选两党必争的摇摆州,流传着“得佛州者得天下”的说法
11.9号开票时我们发现一个现象, 两党在佛州的选票是轮替领先的。票数都开了一大半了,结果还是在变来变去,无法确定。
在其它的州的开票过程中也有这种情况.
为什么会出现这种情况?
说明选票的开票不是随机的。有一定的潜在因素在影响。
假设有1000万张选票,如果我们随机化抽取100万张选票,理论上我们就应该能轻松推论出谁的票数是领先的。
在选举前,很多民调结果都是预测是希拉里获胜, 最后却是特朗普获胜了。
为什么?
说明这些民调机构用了各种数学模型,都无法随机取样。 最后不随机的样本,得出一个不正确的结果。
所以随机化很重要。
我们在做质量数据分析时,随机化同样非常重要。随机化能帮我们排除很多潜在的干扰因素。
抽样时的随机抽样。
测量系统分析时人员和测量部件的随机化
实验设计时,实验顺序的随机化。
下面介绍一个简单的随机化的方法:
假设我们有16次设验要做。
编好号,输入在Excel中.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
打6SQ统计3.0--实用工具--随机数发生器.
选择 正态分布 (或其它任意分布),变量个数输入 1 随机数个数 16.
确定生成 16个随机数。跟刚才的16组实验数分别放在不同的列。
1 88.6
2 100.82
3 105.09
4 93.91
5 94.16
6 99.72
7 91.66
8 107
9 91.65
10 106.99
11 94.94
12 102.34
13 94.43
14 120.64
15 79.93
16 102.33
选择两个列,打开excel数据--排序, 选择主要关键字为随机数列
确认后,数据重新排列, 数据A中就是我们随机化后,真正要做实验的顺序。
当然,如果您觉的随机化还不够,可以再取16个随机数,再随机一次。