『原创』一个简单通俗的例子,让你轻松知道假设检验的原理
本帖最后由 yindua 于 2010-12-15 14:02 编辑
之前有论坛朋友对假设检验很头疼,因为这个玩意看起来很高深,H0又是个是什么意义,到底是P值大于0.05拒绝H0还是小于0.05拒绝H0,如何才能记得住,拒绝H0假设是个什么意义?我在此举个简单通俗的例子,告诉大家什么是假设检验,绝对本人原创,欢迎大家拍砖。
首先解释下什么是零假设(null hypothesis),通常用H0来表示,H代表假设,下标个0代表是零假设。之所以用“零”来修饰,其原因是假设的内容没有什么差异或改变。所以总看到H0=u1-u2=0这样的公式,而备选假设通常会有不等于、大于或小于三类。
举个通俗例子:
1、我和A君猜硬币玩,猜正反面,按照常理,我们猜硬币正反面应该是有时对有时错,对的概率大约为50%;
2、但是我们一共猜了10次,A君每次都正确;
3、我开始怀疑了,觉得有点不正常,做个假设检验,H0:A君猜硬币水平高,10次猜对就是水平高的表现;备选假设H1:A君水平高现象不正常,他搞假或硬币有假。
4、不知道那个是真的,但是通过计算,可以通过二项分布计算,A君每次都猜中的概率是2的10次方,1/1024,概率小于0.001(小概率事件),即和A君这样玩1024次,出现这种情况的也就能出现1次,太不寻常了。
5、现在这里有两种可能的解释:
>A君猜硬币水平高,出现这种情况的概率非常小大约为0.001
>A君搞假或硬币有假,出现这种情况概率大于0.001
6、我必须在这两种解释里面选择一种,因为我并不知道哪种解释正确,也有挑选到错误的风险,但是第一种的可能性如此之小,所以我要否定原假设H0,选择第二种解释,因为高概率肯定比低概率容易出现,我得出我的最后结论:A君搞假或硬币有假。
看,假设检验的原理就是这么简单。
通常假设检验中,将小概率定为0.05,即Minitab算出的P值小于0.05就是小概率事件。至于0.05是怎么定出来的,也没有什么高深的,英国著名的统计学家Ronald Fisher把1/20作为小概率标准,也就是0.05,从此0.05或者比0.05小就叫做小概率事件。Fisher没有任何高深的理由解释他为什么选择0.05,只是说他忽然想起来的。
看吧,看似复杂的统计学也有它好玩的地方。
之前有论坛朋友对假设检验很头疼,因为这个玩意看起来很高深,H0又是个是什么意义,到底是P值大于0.05拒绝H0还是小于0.05拒绝H0,如何才能记得住,拒绝H0假设是个什么意义?我在此举个简单通俗的例子,告诉大家什么是假设检验,绝对本人原创,欢迎大家拍砖。
首先解释下什么是零假设(null hypothesis),通常用H0来表示,H代表假设,下标个0代表是零假设。之所以用“零”来修饰,其原因是假设的内容没有什么差异或改变。所以总看到H0=u1-u2=0这样的公式,而备选假设通常会有不等于、大于或小于三类。
举个通俗例子:
1、我和A君猜硬币玩,猜正反面,按照常理,我们猜硬币正反面应该是有时对有时错,对的概率大约为50%;
2、但是我们一共猜了10次,A君每次都正确;
3、我开始怀疑了,觉得有点不正常,做个假设检验,H0:A君猜硬币水平高,10次猜对就是水平高的表现;备选假设H1:A君水平高现象不正常,他搞假或硬币有假。
4、不知道那个是真的,但是通过计算,可以通过二项分布计算,A君每次都猜中的概率是2的10次方,1/1024,概率小于0.001(小概率事件),即和A君这样玩1024次,出现这种情况的也就能出现1次,太不寻常了。
5、现在这里有两种可能的解释:
>A君猜硬币水平高,出现这种情况的概率非常小大约为0.001
>A君搞假或硬币有假,出现这种情况概率大于0.001
6、我必须在这两种解释里面选择一种,因为我并不知道哪种解释正确,也有挑选到错误的风险,但是第一种的可能性如此之小,所以我要否定原假设H0,选择第二种解释,因为高概率肯定比低概率容易出现,我得出我的最后结论:A君搞假或硬币有假。
看,假设检验的原理就是这么简单。
通常假设检验中,将小概率定为0.05,即Minitab算出的P值小于0.05就是小概率事件。至于0.05是怎么定出来的,也没有什么高深的,英国著名的统计学家Ronald Fisher把1/20作为小概率标准,也就是0.05,从此0.05或者比0.05小就叫做小概率事件。Fisher没有任何高深的理由解释他为什么选择0.05,只是说他忽然想起来的。
看吧,看似复杂的统计学也有它好玩的地方。
没有找到相关结果
已邀请:
46 个回复
verdy (威望:28) (上海 浦东新区) 汽车制造相关 工程师 - 6sigma群:2806198<b...
赞同来自: Bagbear 、johnsonchzh 、水中央 、Sebtimental
假设检验并非要求是正态分布,这个概念很广的,只是大多数假设检验是基于正态分布的,像很多非参数检验,如正态性检验,他本身就是用于检验正态性的,并不是以正态分布为前提的,当然还有关于其他分布的检验也一样了。
另外,中奖的问题,我们讲小概率事件,是指在一次事件中很难发生的,可以这样理解,你今天去买一张彩票,看你中一等奖的机会有多大?这是一个小概率事件,你要是算所有人的话,那概率就不是小概率事件了,即使中奖率再小,当样本量非常大的时候,也可能是接近于必然事件了,呵呵。