您还没有绑定微信,更多功能请点击绑定

关于数学的联想(二三)


“灰色收入”辩论中的统计数学问题
王小鲁先生课题组和国家统计局官员为5.4万亿灰色收入的推断争辩中,涉及到不少统计数学中的基本概念。
(一) 灰色收入是否要统计。
统计数学本身是用样本数据推断、估计总体数据,所以误差是必然的,但应是随机误差。
王推算2008年全国城镇居民人均可支配收入32154元,统计局是16923元。竞倍数的误差,所以一定要统计,这是系统性误差。
(二) 统计方法。
统计局是分层随机抽样法,6.5万样本量,但自愿为原则,中途被迫更换样本。所以其中不愿告实情的可能就是随机抽中的富人。所以随机原则被破坏。抽样技术中随机性是基本框架,重要性大于,计算中的误差。
王的方法是社会调查法,利用调查人员对周围熟悉人际关系的人调查,再通过被调查人调查周围人际关系的人。这好处是真实性较可信。
(三) 抽样方法的准确性。
王小鲁为准确性,设计问卷用无记名、重点是消费数据、收入只回答收入分类,不需回答具体收入来源。
实际上设计调查问卷,是统计数学中一个分支,比如怎样在调查学生是否作弊,被调查者只需象摸奖一样,自由看问题,然后扔在两个不同的回收箱中。被调查者,不用担心隐私被曝光。
统计局质疑王的样本0.4909万个,只有统计局的7.6%。
统计数学中一般认为小于30的样本为小样本,为何不是成千上万呢?统计数学证明,样本量大于30后,提高样本量对准确度的贡献是递减趋势。
而如是不科学采集的样本,再大也无用。
(四) 统计分析方法的精确度。
前巳论述,抽样方法科学性远比计算上精确度重要。
王用双重保障分析:找出居民家庭恩格尔系数和人均收入水平间的真实的“净”关系,检验居民收入统计数据。笔者理解是:用收入应大于支出的算术逻辑,用支出反推算出收入。
王用统计局公布的居民、总收入储蓄总额、年增加存款佘额、商品房、汽车的巳付总额、出境消费、股市增、减总值、私企权益增值……发现支出远大于收入,所以其中有灰色收入未计入。
恩格尔系数是社会科学的重大贡献。过去两国家生活水平无法比较,但理智的人群消费规律是先满是食。所以食品支出占收入比例,可判断生活水平。比如在沿海地区收入3千元,不一定比在内地收入2千元的人生活得滋润。
(五) 统计数据的重要案例佐证。
(1) 王认为商品房总价国际上是家庭年收入的3到5倍,我国10倍左右。单2009年3.8万亿圆,扣除贷款,远超统计局公布10%高收入户的全部总收入。这说明大量高收入家庭的实际收入被低估了。
(2) 审计署2009年报告:抽查中央部门近3万张发票中,虚假发票总金额1.42亿。
(媒体巳曝光的县、市级贪官上亿元的个案)
王估计漏计的灰色收入中80%在10%的家庭中。

3 个评论

游客无法查看评论和回复, 请先登录注册

发起人

推荐文章

文章状态

  • 发布时间: 2010-08-28 15:54
  • 浏览: 1495
  • 评论: 3
  • 赞: 0