假设检验与功效和样本数量的问题
对minitab15自带数据"炉子.mtw"进行2t检验.结果如下
_气闸内置能量消耗 双样本 T
气闸 N 平均值 标准差 平均值标准误
1 40 9.91 3.02 0.48
2 50 10.14 2.77 0.39
差值 = mu (1) - mu (2)
差值估计: -0.235
差值的 95% 置信区间: (-1.450, 0.980)
差值 = 0 (与 ≠) 的 T 检验: T 值 = -0.38 P 值 = 0.701 自由度 = 88
两者都使用合并标准差 = 2.8818_
从上可知不同气闸对内置能量消耗无显著性差异.
接下来我想使用 Minitab 的功效和样本数量功能在执行试验之后评估功效(Power)和样本数量。得到如下结果:
_功效和样本数量 _
_双样本 t 检验_
_检验平均值 1 = 平均值 2(与 ≠)
计算平均值 1 的功效 = 平均值 2 + 差值
Alpha = 0.05 假定标准差 = 2.8818_
_差值 样本数量 功效
0.2 40 0.0608345
0.2 50 0.0636328_
_样本数量是指每个组的。_
从上面可看到样本数量为40,50时,如果差值为0.2的话,功效是很低的.那是不是说我之前做的2t检验是不成功的,两个不同的总体数据可能是有差异的,但由于取样数量不够,造成"无显著性差异"的结论.
如果我要证明两个总体的差异在0.2,功效在0.95,那我的样本数量如下:
_功效和样本数量 _
_双样本 t 检验_
_检验平均值 1 = 平均值 2(与 ≠)
计算平均值 1 的功效 = 平均值 2 + 差值
Alpha = 0.05 假定标准差 = 2.8818_
_差值 样本数量 目标功效 实际功效
0.1 21585 0.95 0.950004
0.2 5397 0.95 0.950005
0.3 2400 0.95 0.950067
0.4 1350 0.95 0.950009
0.5 865 0.95 0.950149
1.0 217 0.95 0.950171_
就必须要取5397个样本,这样的话才能达到我的目标,但是这样大的样本量是不是又不符合假设检验的"推论",本来假设检验就是以小样本推总体呀??
谁能解释一下呀???
_气闸内置能量消耗 双样本 T
气闸 N 平均值 标准差 平均值标准误
1 40 9.91 3.02 0.48
2 50 10.14 2.77 0.39
差值 = mu (1) - mu (2)
差值估计: -0.235
差值的 95% 置信区间: (-1.450, 0.980)
差值 = 0 (与 ≠) 的 T 检验: T 值 = -0.38 P 值 = 0.701 自由度 = 88
两者都使用合并标准差 = 2.8818_
从上可知不同气闸对内置能量消耗无显著性差异.
接下来我想使用 Minitab 的功效和样本数量功能在执行试验之后评估功效(Power)和样本数量。得到如下结果:
_功效和样本数量 _
_双样本 t 检验_
_检验平均值 1 = 平均值 2(与 ≠)
计算平均值 1 的功效 = 平均值 2 + 差值
Alpha = 0.05 假定标准差 = 2.8818_
_差值 样本数量 功效
0.2 40 0.0608345
0.2 50 0.0636328_
_样本数量是指每个组的。_
从上面可看到样本数量为40,50时,如果差值为0.2的话,功效是很低的.那是不是说我之前做的2t检验是不成功的,两个不同的总体数据可能是有差异的,但由于取样数量不够,造成"无显著性差异"的结论.
如果我要证明两个总体的差异在0.2,功效在0.95,那我的样本数量如下:
_功效和样本数量 _
_双样本 t 检验_
_检验平均值 1 = 平均值 2(与 ≠)
计算平均值 1 的功效 = 平均值 2 + 差值
Alpha = 0.05 假定标准差 = 2.8818_
_差值 样本数量 目标功效 实际功效
0.1 21585 0.95 0.950004
0.2 5397 0.95 0.950005
0.3 2400 0.95 0.950067
0.4 1350 0.95 0.950009
0.5 865 0.95 0.950149
1.0 217 0.95 0.950171_
就必须要取5397个样本,这样的话才能达到我的目标,但是这样大的样本量是不是又不符合假设检验的"推论",本来假设检验就是以小样本推总体呀??
谁能解释一下呀???
没有找到相关结果
已邀请:
11 个回复
风吹柳 (威望:10) (上海 ) 电子制造 总监 - 无
赞同来自: Kennethchow
如果样本量小,我们就没有办法识别两者的差异,就只能认为两个母体是相等的。如果样本数量足够大,我们就可以识别出其差异。
所以,你要明确你抽样的目的是什么?
在你的哪里中,只能这样表述和理解:
在样本数量为50的时候,(由于我们不能证明两个母体存在显著性差异,所以)两个母体没有显著性差异。
当样本数量达到5397以上时,我们有信心认为两个母体存在显著的差异。
至于到底是什么? 一般来说,对于连续数据而言,样本数量达到30就差不多。如果样本数量太大,那只能是为了证明不同而进行证明。按照哲学的思想,可以说,没有任何两个物体是完全一致的。