第一题:中位数相对合理,但不可靠,只有一个数;四分位数代表50%的对象的收入范围,更合理。这种方法的好处是不受outliers奇异值的影响。取均值的话,很多人会感叹:拖后腿了。其实“众数(mod)”也是不错的选择,但也需要给出区间才行。
第二题:用方差分析推断三个样本的均值是否存在差异,是根据原假设:三个样本间的均值没有差异,如果没有差异,所有观察值的差异是由随机误差引起的,总的校正平方和的数学期望与误差方差的数学期望是一回事,利用F检验来验证,如果P值大于critical point (判异点),则否定原假设,此时备择假设成立:三个样本中至少有一个与其它样本均值不同。
第三题:用不同方法变换的数据,是不能用基于正态分布的理论进行比较的,别的不说,他们的量纲已经不同。对付非正态分布的问题,非参数法很有用,因为它不考虑数据的正态性。非参数统计学是现在最活跃的统计学分支,可惜我是门外汉。以后要补课的:-)
第四题:又是非参数问题。首先,产品寿命通常是符合指数分布的,用正态分布去分析,即使转换过来的数据是符合正态分布的,其实也没有什么实际意义。这道题我不会,建议查查非参数部分的介绍吧,惭愧!
第二题:用方差分析推断三个样本的均值是否存在差异,是根据原假设:三个样本间的均值没有差异,如果没有差异,所有观察值的差异是由随机误差引起的,总的校正平方和的数学期望与误差方差的数学期望是一回事,利用F检验来验证,如果P值大于critical point (判异点),则否定原假设,此时备择假设成立:三个样本中至少有一个与其它样本均值不同。
第三题:用不同方法变换的数据,是不能用基于正态分布的理论进行比较的,别的不说,他们的量纲已经不同。对付非正态分布的问题,非参数法很有用,因为它不考虑数据的正态性。非参数统计学是现在最活跃的统计学分支,可惜我是门外汉。以后要补课的:-)
第四题:又是非参数问题。首先,产品寿命通常是符合指数分布的,用正态分布去分析,即使转换过来的数据是符合正态分布的,其实也没有什么实际意义。这道题我不会,建议查查非参数部分的介绍吧,惭愧!
mangochueng • 2017-10-19 09:16
谢谢你的用心解答
mangochueng • 2017-10-19 12:45
第二题还是不明白,意思是看P值判断吗?看不懂这些数据,哈哈哈
杨格_Alan • 2017-10-19 18:05
是的,看P值。F=MS班组(29.4)/MSE(误差=0.116)=29.4,和F(2,27)分布上0.05或0.1(你想在多大把握上检验他们有差别,比如95%还是90%)时的分位数比较,此题的P值几乎是零,肯定落在大于拒绝域。