你的浏览器禁用了JavaScript, 请开启后刷新浏览器获得更好的体验!
输入关键字进行搜索
搜索:
没有找到相关结果
森林唱游 (威望:0)
赞同来自:
10 个回复,游客无法查看回复,更多功能请登录或注册
10 个回复
森林唱游 (威望:0)
赞同来自:
首先感谢H师的精彩讲授 {V
老老实实地学习一遍帖,这次是真的理解一点了(以前是看热闹呢) :lol:
1.为什么母体方差未知时使用t 分布
我们用标准差描述数据的离散程度.样本均值是母体均值的无偏估计,样本方差是总体方差的无偏估计.
对于两个独立的随机变量,X~N(0,1),Y~X^2(df),令:
T=X/(Y/df)^0.5 ===>T分布
因: 样本均值Xbar是正态分布N~(μ,σ^2/n),
故: Z=(Xbar-μ)/ (σ/n^0.5)~N (0,1)
(n-1)S^2/σ^2是自由度为n-1的卡方分布X^2(n-1).
更重要的是(Xbar-μ)/ (σ/n^0.5) 与 (n-1)S^2/σ 是完全独立的统计量.
当母体方差未知,由前述知,用母体方差的无偏估计量S^2替代最为直接.
我们知道,T分布的基本定义式是:
T=/{/(n-1)}
其中:
(Xbar-μ)/σ是标准常态分布
(n-1)S^2/σ^2是卡方分布(n-1)
(n-1)是自由度
故有:
T= (Xbar-μ)/S ~ t (n-1)
这便是当母体方差未知时使用T 分布的原因.
2.为什么小样本时使用T分布
原来,当样本不够大时,数据分布形态的差异主要体现在尾部:尾部较厚重,峰态系数变小.
这种分布状态更接近T分布而非正态分布.这就是为什么小样本采用T分布的道理.