陌生之地 豆瓣:看起来很美的数字是怎样产生的

来源:百度文库 编辑:中财网 时间:2024/05/03 20:31:58
看起来很美的数字是怎样产生的书架上的史诺比 @ 2009-3-27 10:56 评论(1) 推荐值(0) 引用通告 分类: 吃饱没事儿干

      这些天,一些城市陆续公布了2008年职工年平均工资的统计数字:广州城镇职工平均工资45365元,北京市职工平均工资为44715元(最高平均收入与最低平均收入相差上百万);上海市职工平均工资为39502元。消息一公布,引来议论纷纷,总的感觉是公布的平均工资水平偏高。
     据北京市统计局的解释,“2008年全市职工平均工资反映的是国有、集体、各种合资、合作、独资公司以及私营单位职工工资的平均水平,不包括个体工商户。采用的是全面调查与抽样调查相结合的方法。2008年全市共调查了13.8万个法人单位,包括企业、事业、机关和社会团体等组织机构类型。”
      可是这个收入数据的排序似乎与早前的另两组数据打架:2008全国各城市人均收入:上海18645元,广州18287元,北京17653元;2008年中国城市市区居民可支配收入:上海26690元,广州25317元,北京24727元。这两组数据,都是上海第一,广州居中;而第一组数据,却是广州第一,而且广州的平均数比上海高15%,以平均数来说,这是一个非常大的差距,最关键的是,它与我们所了解、所感觉的存在很大差距。每次听到本地的平均收入数据,史诺比就很郁闷,感觉自己是弱势群体,收入永远处于平均线下。
      这让人联想到另一统计事件: 中国社会科学院和政府工作报告先后公布的城镇登记失业率是9.4%和4.6%,引发各方质疑,引起温家宝的关注,要求有关部门澄清。
      这些看起来很美的数据是怎样出炉的?我只说说我知道的两件事。

      有一年,居委会的人来敲门,说要进行“万户居民调查”。我看了一下调查表,是关于收入、财产、就业、出行等情况的,我说我拒绝调查。那个人很惊讶的说:“为什么?这是为政府制定政策进行的统计调查,你们这栋楼的人都接受了,你为什么拒绝?”我说:“是整栋楼都调查吗?”她说是的。我说,这就是我拒绝的理由之一。我们这栋楼是单位宿舍,100多户中的大部分户主在同一单位上班,所产生的数据必然具有同质性。万户调查的本质应该是抽样调查,而抽样调查数据的生命在于“随机性”,结果是不可操纵的;你们现在这样的“调查”,是选择性调查,是有意操控的,如何作为政府决策依据?变形的数据必将引致变形的决策,所以我拒绝。即使往“善意”的方面想,这样的调查也是偷懒的,不负责任的。统计局对于入户调查员是有补贴的,这样挣钱未免太容易了吧?她悻悻地走了。果然,后来的调查结果非常漂亮,漂亮得我完全不认为是广州。以广州市市内6个区29条街道的200个社区居委会计,所谓的“万户居民调查”,每个居委会只需挑选一栋50户以上的楼进行“调查”就可轻松“交货”,只是,是假货。所以,我们每每看到一些匪夷所思的“民生政策”出台,比如引起巨大反感的“公共交通优惠方案”,即是典型。
      还有一年,我因为工作需要,在公布统计数据之前向统计局询问了通货膨胀指数。统计局告诉我,是17.9%,并嘱咐我这是尚未公布的数据,暂时不能公开使用。等到政府工作报告出来,我看到的数据是17%。如果是不按规矩去掉小数点,我也认了,但是,同时发表的GDP增长数据是保留小数点的,而且小数点后是4。
      而之前网络披露的某市只有“很满意”、“满意”“选项”的问卷,就更是很好很强大了。
      其实,至少在30年前,手工统计的年代,统计系统就具备了对全部职工工资收入统计的能力,而且规定是必须上报的数据。计算机时代的今天,就更不是问题了。既然北京市统计局也承认有“全面调查”,何以却使用抽样的结果呢?

      媒体只报道了百姓对于工资统计的疑问,媒体应该进一步做一个简单的随机调查,看看究竟有多少人感觉自己的收入没有达到平均水平,以使自己的质疑更有分量。

© 博友引用,随转任载,出处作者,务必齐备;商业转载,千字千元。