关于样本量的计算
这两天看到了很朋友在问样本量大小的计算问题,在这里学习下O大师,也把这些问题归纳下,希望能够对大家有点帮助,要是有不详尽的地方我将继续完善,也望各位大师给予补充,谢谢!
1、什么是抽样,为什么要抽样?
1)抽样是:
收集所有数据中的一部分
使用那一部分得出结论(做出推论)
2)为何要抽样?因为观察所有的数据可能:太昂贵、太费时、具破坏性的(如,味道测试)
3)从相对较少数量的数据中往往可以得出可靠的结论
2、样本大小简介
通常人们问的第一个问题就是“我需要多少样本?”问题的答案由以下四个因素决定:
1)数据类型:离散数据与连续数据
2)你希望做什么:在一定的精度内(正负n个单位)为整个群体描述一个特征(平均值或百分
比)
比较群体间的特性(找出群体间平均值或百分比间的区别),这里涉及到检
出力:你希望识别一定差别的可能性大小
3)你猜的标准差(或百分比)有多大 ,可以根据历史数据进行评估
4)你希望的置信度有多高(通常是95%)
3、基于不同目的的样本大小公式
估计平均值(如:确定周期时间基数) n=(2s/d)2 (这里d表示精度)
估计百分比(如:确定缺陷的基数%) n=(2/d)P(1-P)(这里d表示精度)
4、精度(d)
1)精度是指在估计特性的过程中,你所希望范围的宽窄程度
如:估计周期时间为两天之内
估计缺陷百分比小于3%
2)使用符号d代表精度:传统的统计学称它为deita,所以就是d
3)精度是置信区间宽度的一半
针对周期时间(按天算)的95%CI=(48,52)表示我们有95%的自信平均周
期时间在48天到52天之间
CI的宽度=4天
精度d=2天
4)你来确定你想要什么样的精度
5)精度与样本大小的平方根成反比1/n1/2
6)要增加精度,你想要增加样本大小(这也会产生更多成本)
7)对于你到底想要多大的精度没有直接的回答;答案还基于使用这样的估计将会产生的业务
影响
8)每种情况都不尽相同,不能简单跟着别人的模式走
5、使用精度来验证样本量的大小
决定样本大小的公式可以同样被用来帮助你比较确定是否在数量稍大的样本上投入更多的资本以实现更高的精度。在你收集数据前进行确定可以帮助你了解对你的项目和经费来说样本控制在什么程度是合适的
1)确定你能接受多大的样本
2)然后问一下,那些样本能提供什么样的精度?
3)够精确了吗?
4)如果还不够精确:
做一张精度表和不同样本大小的成本表来确定花在样本上的每块钱可以提高多少精度
然后选择一个样本大小,它可以基于精度提高水平或对你的情况来说所需的精度水平进行验
证
6、出自有限总体的样本
样本大小公式假定样本大小n相对于总体N很小
如果n/N是大于0.05,则称该总体为小总体
你的样本数量超过了总体的5%
你可以使用有限总体公式调整样本大小:nfinite=n/(1+n/N)
7、样本大小公式的用途
1)在希望的精度和估计的s或p值以及95%的置信度条件下,确定所需的样本大小来估计整体的
一个特性(平均值或百分比)
2)在收集数据之前为不同的样本大小确定一个估计的精度
3)在估计的精度和持续增长的样本大小间选择其一
4)在你收集收据之后确定估计的精度
8、凭经验得出的样本大小
平均值 n=(2s/d)2
百分比 n=(2/d)P(1-P)
频率图(直方图) 50
柏拉图 50
散点图 24
控制图 24
备注:这里有些上下标没有显示出来,在这里不知道怎么显示不出来,有不清楚的地方望大家多多理解
1、什么是抽样,为什么要抽样?
1)抽样是:
收集所有数据中的一部分
使用那一部分得出结论(做出推论)
2)为何要抽样?因为观察所有的数据可能:太昂贵、太费时、具破坏性的(如,味道测试)
3)从相对较少数量的数据中往往可以得出可靠的结论
2、样本大小简介
通常人们问的第一个问题就是“我需要多少样本?”问题的答案由以下四个因素决定:
1)数据类型:离散数据与连续数据
2)你希望做什么:在一定的精度内(正负n个单位)为整个群体描述一个特征(平均值或百分
比)
比较群体间的特性(找出群体间平均值或百分比间的区别),这里涉及到检
出力:你希望识别一定差别的可能性大小
3)你猜的标准差(或百分比)有多大 ,可以根据历史数据进行评估
4)你希望的置信度有多高(通常是95%)
3、基于不同目的的样本大小公式
估计平均值(如:确定周期时间基数) n=(2s/d)2 (这里d表示精度)
估计百分比(如:确定缺陷的基数%) n=(2/d)P(1-P)(这里d表示精度)
4、精度(d)
1)精度是指在估计特性的过程中,你所希望范围的宽窄程度
如:估计周期时间为两天之内
估计缺陷百分比小于3%
2)使用符号d代表精度:传统的统计学称它为deita,所以就是d
3)精度是置信区间宽度的一半
针对周期时间(按天算)的95%CI=(48,52)表示我们有95%的自信平均周
期时间在48天到52天之间
CI的宽度=4天
精度d=2天
4)你来确定你想要什么样的精度
5)精度与样本大小的平方根成反比1/n1/2
6)要增加精度,你想要增加样本大小(这也会产生更多成本)
7)对于你到底想要多大的精度没有直接的回答;答案还基于使用这样的估计将会产生的业务
影响
8)每种情况都不尽相同,不能简单跟着别人的模式走
5、使用精度来验证样本量的大小
决定样本大小的公式可以同样被用来帮助你比较确定是否在数量稍大的样本上投入更多的资本以实现更高的精度。在你收集数据前进行确定可以帮助你了解对你的项目和经费来说样本控制在什么程度是合适的
1)确定你能接受多大的样本
2)然后问一下,那些样本能提供什么样的精度?
3)够精确了吗?
4)如果还不够精确:
做一张精度表和不同样本大小的成本表来确定花在样本上的每块钱可以提高多少精度
然后选择一个样本大小,它可以基于精度提高水平或对你的情况来说所需的精度水平进行验
证
6、出自有限总体的样本
样本大小公式假定样本大小n相对于总体N很小
如果n/N是大于0.05,则称该总体为小总体
你的样本数量超过了总体的5%
你可以使用有限总体公式调整样本大小:nfinite=n/(1+n/N)
7、样本大小公式的用途
1)在希望的精度和估计的s或p值以及95%的置信度条件下,确定所需的样本大小来估计整体的
一个特性(平均值或百分比)
2)在收集数据之前为不同的样本大小确定一个估计的精度
3)在估计的精度和持续增长的样本大小间选择其一
4)在你收集收据之后确定估计的精度
8、凭经验得出的样本大小
平均值 n=(2s/d)2
百分比 n=(2/d)P(1-P)
频率图(直方图) 50
柏拉图 50
散点图 24
控制图 24
备注:这里有些上下标没有显示出来,在这里不知道怎么显示不出来,有不清楚的地方望大家多多理解
没有找到相关结果
已邀请:
13 个回复
lhx3260153 (威望:0) (广东 惠州) 电气或能源 经理 - Initiative, independent ...
赞同来自:
感觉十分抱歉,其实那里面也就是平方、开方没有显示出来