数据的独立性验证
请教各位:
在作比较测试时, 我们会有一个前提,数据是独立的, 且数据正态分布。
如何验证数据的独立性,
当数据为非正态分布时, 可以用对数或平方根转化, 可是转化后的数据如何处理与原来的关系呢,
多谢指点。
在作比较测试时, 我们会有一个前提,数据是独立的, 且数据正态分布。
如何验证数据的独立性,
当数据为非正态分布时, 可以用对数或平方根转化, 可是转化后的数据如何处理与原来的关系呢,
多谢指点。
没有找到相关结果
已邀请:
5 个回复
xuling0688 (威望:7) (天津 和平区) 在校学生 员工 - Student
赞同来自: 隔夜茶鸡蛋 、beyond229 、从0到N
独立性检验方法
在单样本Z检验或T检验时都求数据是相互独立的, 2sampleT检验也要求两个样本观测值都必须是独立的。因为数据如果不独立,则下面所有的检验步骤与公式都无意义。
检验独立性方法有两个:
1)样本量大于40,可以用时间序列分析检验。
使用时间序列分析检验方法的原理是,看自相关函数(Auto-Correlation Function)和偏自相关函数(Partial Auto-Correlation Function)中,在Lag10以内,是否有自相关函数项或偏自相关函数项超过临界值。一旦有超过,则应该盘数据不独立。这些在MINITAB的时间序列分析窗(Time Series Analysis)中可以很方便地得到有关结果。图上有条红色界线,如果没有任何一个自相关系数或偏自相关系数超过临界值(红线)则可以判数据独立。
2)样本量大于9,就可以进行“游程检验”。
这里要说明的是MINITAB软件给的方法不全面。在MINITAB中,用
STAT=>Non Parametric Test=>Runs Test
可以得到游程检验的大样本的正态近似法,这里的条件是n>= 22。 游程检验的含义是,游程个数太多或太少,就都可以认为数据不独立。一旦能够判断游程个数不是太多或太少就都可以认为数据是独立的了(化为标准正态后,绝对值在1.96以内即可)。用p-value>0.05,即可同样判断数据是独立的。
其实样本量未达到22时, 用上述方法是不行的。MINIATAB 会给出警告信息,对此不能置之不理。其实,游程检验有精确方法, 在样本量大于9时就可以使用。操作是:
STAT=>Quality Tool=>Run Chart
可以提供出序列对于中位数的总游程数, 再查马林编《六西格玛管理》一书的第560页,附录表10,游程检验表,当游程个数太多或太少时(超过表中双侧拒绝域临界值),判数据不独立。
要注意,样本量未达到22时,不能直接使用MINITAB中Runs Test的结论。
敬请批评指正。
Student-xuling0688