借记卡按功能不同分为:“平均数”,到底掩盖了多少事实真相?

来源:百度文库 编辑:中财网 时间:2024/05/05 00:04:41
本文引用自皈一牛人7MZ《坑爹的“平均数”,到底掩盖了多少事实真相?》前两天去一家公司参观,这家公司位于非常偏远的一个郊区新城,距离市区有近百公里路程。虽然偏远,但公司所在的这个新城却很漂亮,靠近大海,水草丰美,天蓝地秀。我们参观完座谈时,这家公司的负责人不无自豪地跟我们说:我们这里的环境、空气质量可以肯定是这个城市最好的。说完这话,他还跟我们透露说:自从城市的空气质量监测站把我们这里列入五个监测点之一后,媒体每日发布的城市空气质量平均指数一下子就好看了许多。


  真晕啊!我听了都有一点恍然了大悟了的感觉,呵呵,原来我们看到的空气质量指数是这样来的:找一个很偏远的、空气质量好、监测数据好看的监测点,把它纳入平均指数的计算之中,这样我们城市的空气质量就“顿然”好了起来,不过这样的空气质量我们需要跑到一百公里外才能呼吸到。高,实在是高,平均数的妙用,真是有化腐朽为神奇之功。


  不过恍然大悟之余,我对这个事情倒是也没有太多地在意,因为这个城市的空气质量毕竟还没坏到哪里去,平时对这个空气质量指数也没有投入很多的关心,只是觉得这样的“平均数”法儿有点太令人“印象深刻”。


  是啊,空气质量好一点坏一点,我们可以照样呼吸,它基本无碍我们的生计。但是,还有其他一些领域使用的平均数,比如房价,比如收入,比如物价,就会与我们的生计息息相关了,这些平均下来的指标那就会更糊弄人,更坑爹。曾经听说全国人均(或家庭平均,记不清了)用于住房的支出为每月111元,没错,的确是这么低,因为平均的对象还包括农村吧。但这种平均下来的数据能有个鬼的意义,而且农村用于住房的支出似乎也没有这么低。又听说今年上半年很多地方的居民收入平均涨幅超过10%,呵呵,我们咋没感觉到呢,感觉到的只有统计数据上的“被增长”。还有物价,说CPI涨幅只有5%、6%,但我们感觉到的负担增加似乎不只这些,不过数据就是这样的数据,它们可能是已经被剔除了某些样本、增加了某些样本,加工过了的数据。没有办法,为了好看,为了稳定,需要这样的“平均数”,因此这样的“平均数”也就出来了。


  说这些数字坑爹,其实还不光指它忽悠了我们的生计,更重要的它还有其他更大的负面作用。数据是进行预测的基础,是分析经济问题的基础,是进行决策的基础,是学家们进行理论研究并指导经济发展的基础,而这些事情似乎都关于我们这个社会经济的发展。但是在目前很多不准确的数据面前,这些以数据为基础的事情估计也会很容易跑偏了方向。


  当然,我们的平均数有时候还是能有些作用的,比如平均寿命、平均身高、平均体重,也能说明很多问题。但是,在一些关乎人们生活的事情上,简单地进行平均了事,甚至是进行刻意的安排与加工,似乎就很不符合其背后的真相和人们的一些诉求。都说真相不能掩盖,但事实上我们又能够了解到多少真相?(和讯博客 作者:benny6868)


  精心挑选的平均数


  我相信你不是一个势利小人,而我也并不做房地产生意。但请让我们作这样的假定,并且假设,此刻你正在一条我熟知的街上看房子。对你的情况进行了初步判断后,我巧舌如簧、费尽心思地让你相信附近居民的平均年收入大约有10000英镑。也许这坚定了你要在此居住的信心,不管怎样,买卖最终成交了,那美妙的数字也被牢记在你的脑海。而且,既然你已经买下了房子--你有那么一点势利,当与朋友聊天时,你就会不经意地流露出你居住的地点:我住在一个相当棒的高收入小区。


  一年左右过后,我们又见面了。作为某纳税者委员会的成员,我正在四处奔走,为降低税率、降低财产估价,或降低公共交通费用而呼吁。我的理由很简单,我们支付不起各种上涨的费用,毕竟,附近居民的平均年收入只有2000英镑。也许你会加入到我们委员会的工作中来--你不仅势利,而且还挺吝啬。但是,当听到那可怜的2000英镑时,你也禁不住大吃一惊。到底是我现在撒谎了呢?还是一年前撒了谎?


  其实这两次你都无法怪罪于我,利用统计撒谎的妙处被展现得淋漓尽致。无论是10000英镑,还是2000英镑,它们都是正规的平均数,计算方法也完全正确。两个数字都基于相同的数据,来自相同的居民,根据相同的收入。所有都是相同的,但显然其中有一个数据令人误解,足以与弥天大谎相媲美。


  我的花招就是两次分别使用了不同的平均数,"平均数"这个词宽泛的涵义帮了大忙。当一个家伙希望用数据影响公众观点,或者向其他人推销广告版面,平均数便是一个经常被使用的伎俩,虽然偶尔是出于无心,但更多的时候是明知故犯。所以,当你被告知某个数是平均数时,除非能说出它的具体种类--均值,中位数,还是众数,否则你对它的具体涵义仍知之甚少。


  在希望数值较大时,我使用的10000英镑是均值,也就是附近居民收入的算术平均数。你只要将所有家庭的收入加起来并除以家庭总户数便可得到这种算术平均数。数值相对较小的是中位数,它告诉我们一半家庭的年收入超过2000英镑,另一半家庭的年收入不及2000英镑。我还可以利用众数--所有家庭收入序列中出现次数最多的那个收入。例如,附近的居民中年收入为3000英镑的家庭数是最多的,那么收入的众数就是一年3000英镑。


  在这个例子中,不合适的"平均数"实际上是毫无意义的,只要碰到关于收入的数据,这种情况就经常出现。还有一个因素会让我们困惑不已--某种条件下,各种类型平均数的数值十分接近,如果出于一般的目的,根本没有必要区分它们。


  比方说,当你看到某个原始部落男性的平均身高为5英尺时,你对这些人的外形条件就能有很好的了解,根本不需要进一步询问这个平均数是均值、中位数或者众数,因为此时各种平均数的数值大致相等。(当然,如果你正在为非洲人赶制一批制服,那么就需要比平均数更多的信息,你要用到全距和标准差,这些我们将在下一章进行介绍。)


  在处理诸如人类特征的数据时,各种平均数的数值十分接近。这些数据具有我们常说的正态分布的形态特点,在你用曲线绘制正态分布时,将看到一根钟形的曲线,均值、中位数和众数都落在相同的点上。


  在描述人类身高时,用哪种平均数无关紧要,但在描述他们的钱袋时,却并不是那么回事儿了。如果把某个城市所有家庭的年收入都列出来,你会发现,这些数从很小的值变动到很大的数,也许有20000英镑左右,甚至还能看到少数巨额收入。年收入低于5000英镑所占的比例超过了95%,在收入曲线上朝左边拖出了一条长长的尾巴。这种分布不再像钟形一样对称,而是有偏的,它的形状类似于孩子玩的滑梯,梯子一侧是陡斜地升到顶部,而滑道一侧则缓慢向下倾斜。均值与中位数相差甚远,这样一来,比较去年的"平均数"(均值)与今年的"平均数"(中位数),这种比较的有效性就不言而喻了。


  在我卖给你房子所在的居民区里,两个平均数的差距如此之大,因为收入是显著偏斜的。你的邻居中大多数都是小农、在附近村庄上班的工薪阶层或是靠养老金为生的退休老人,但有3户邻居是百万富翁,他们仅仅是来此度周末。就是这3户邻居的收入提高了总收入,相应地抬高了算术平均数。这样一来,均值达到了绝大多数家庭遥不可及的水平,几乎每个人都低于平均数。虽然这听起来像是笑话或者文学修辞,但的确是不争的事实。 当你听到公司执行总裁或企业所有者宣称,在他的企业中员工的平均收入是多少时,你应该好好思考一下其中的原因。如果这个数是中位数,你可以获得一些显而易见的信息:一半员工赚得比它多,一半比它少。但如果是均值(请相信我,没有确切指出它的种类时,多半是均值),它仅仅是所有者25000英镑的高收入与全体工人低水平收入的平均数,根本没有什么意义。"平均年收入为3800英镑"既隐瞒了1400英镑的低收入,又隐瞒了所有者以巨额薪金形式抽取的高额利润。


  这类似于双人拉锯--现实情况越糟,看上去却越好。在一些公司的声明中也会采用这种方法。让我们试着举个简单的例子来说明。假设你是某个小型制造企业的3个合伙人之一。这是丰收的一年,到了年底,你给企业的90个职工共发了99000英镑,他们的工作是生产、运输椅子,或者你所经营的任何东西。你和其他合伙人每人各获得5500英镑的工资;最后还余下21000英镑,作为利润可供你们3个合伙人平分。你将如何说明这种情况呢?为了便于理解,你打算采用平均数的形式。既然所有的职工从事相同的工作,获得同样的收入,对于他们来说用均值还是中位数没有区别。说明如下:


  职工的平均工资……1100英镑


  所有者的平均工资及利润……12500英镑


  看上去太不公平了,不是吗?让我们来试试另一种形式:从利润中拿出15000英镑以奖金的形式平分给3位合伙人。这一次将包括了所有者和职工的工资进行平均,不要忘记还是采用均值,结果变成:


  所有人员的平均工资或薪金……1403英镑


  所有者平均利润……2000英镑


  哈,看上去好多了吧。虽然还能进一步改善,但这已经有了长足的进步,总额中只有低于6%的部分形成了利润。如果乐意,你还可以继续如法炮制。但不管怎样,现在的结果已经足以作为公布的内容张贴在公告栏中,或者作为与职工谈判的依据。


  因为简化,这个例子是十分粗糙的。但和以会计的名义所做的手脚相比,它简直就是小儿科。从薪水微薄的打字员到领取80万美元奖金的总裁,在这样一个等级森严的复杂公司中,所有事情都可用类似的方法进行掩盖。


  因此,当你看到某个平均收入时,首先问问:是什么的平均?包括了哪些人?美国钢铁公司(theUnitedStatesSteelCorporation)曾经指出:10年间,该公司职工的平均周收入攀升了107%。确实如此,但是当你注意到早期的数据包括了兼职员工时,奇妙的增长率会大打折扣。也就是说,如果你某年只工作了半年,而第二年全年都在工作,你的收入毫无疑问会翻番,但这并不意味着工资率发生了变动。


  你也许曾在报纸上看到过,某年美国的家庭平均收入是6940美元。别太在意这个数字,除非你知道这个数字包括了哪些家庭,以及使用了哪种平均数。(甚至这是谁说的,他是如何获得该信息的以及这个数的准确性你都要知道。)


  上述数据来自于普查局(theBureauoftheCensus)。如果手头有普查局的整篇报告,你将不费吹灰之力地弄清楚所需要的其他信息。首先,这是个中位数;其次,"家庭"是指两个或更多具有亲属关系的人住在一起所形成的"家庭"。如果再回过头读一下表中的数据,你还将发现这个数据建立在抽样基础之上,该调查以19/20的概率保证真实的数值会落在估计值加减71美元的范围之内。


  类似的概率和误差范围构成了一个很好的估计。普查工作者掌握了足够的统计知识和足够的财力,如果没有特殊的企图,他们能够将抽样研究结果控制在较好的精度范围之内。但并不是所有的数据都出自这种严谨的环境,也不是所有的数据会附上关于数据精确度的任何说明。在下一章,我们还将展开详细的分析。


  同样,对《时代》杂志"编者的话"栏目中的某些项目,你会表示怀疑。该杂志这样描述他们的新订户:"他们年龄的中位数是34岁,家庭平均年收入为7270美元。"早期关于"旧时代"读者的调查发现,"年龄的中位数是41岁……平均年收入为9535美元……"一目了然的是,为什么两次谈到年龄时都指出采用了中位数,而关于收入却不明确平均数的类型。也许收入使用的是数值较大的均值,以达到利用高收入读者群吸引广告商的目的。


  对1924级耶鲁学生的平均收入,你同样可以提这样一个问题:这里用的是哪种平均数?


  ◆所以,当你被告知某个数是平均数时,除非能说出它的具体种类--均值,中位数,还是众数,否则你对它的具体涵义仍知之甚少。


  ◆在处理诸如人类特征的数据时,各种平均数的数值十分接近。这些数据具有我们常说的正态分布的形态特点,在你用曲线绘制正态分布时,将看到一根钟形的曲线,均值、中位数和众数都落在相同的点上。


  ◆当你看到某个平均收入时,首先问问:是什么的平均?包括了哪些人?


  ◆类似的概率和误差范围构成了一个很好的估计。


  前国家统计局发言人没有说出来的残忍真相


  前几天前国家统计局发言人姚景源说现在的通胀是战胜世界经济危机的代价,说1994年通胀达到24%之多,2011年通胀还不算多,但是,他忘了说1993年人民相对美元一次性实际贬值60%,那前后几年人民币兑美元累计贬值三倍,中国的出口爆发,冲击到亚洲新兴国家的出口,1997年亚洲国家开展贬值竞赛,1998年末,美元升值加大进口力度平息危机。但是长期的出口,持续冲击了美国的制造产业,六年后,美国穷人的房贷危机集体爆发,这就是所谓的世界金融危机:房地美和房利美是美国联邦住房局成立并控股的房贷担保机构,专为提高美国人住房拥有率。美国没有上过大学的工人的偿债出现问题,两房的债权出现了危机,这导致美国拥有两房债权的机构倒了一大批。


  这次又出现了美国政府债务危机,但是,愤青们知道美国政府债务的来源么?简单的说,美国很少印钱造成的。美国政府只要发行货币,财政危机自然解决,亚洲国家的权贵靠着出口剥削劳工的好日子也就过去了。美国国债危机,实质上就是人民币升值压力,明白么?XXXXX现在也很识相,已经主动把人民币汇率提升了。美国政府印钱,相对于亚洲某国印的钱来说,是微不足道的。政府印钱,相当于政府财政,美国政府很少印钱,就只能借钱过日子。这实际上也是对亚洲出口型国家的善意,因为合理的出口总体上是有利于这些亚洲国家的。现在善意到头了!因为大量发行货币推动人民币贬值已经变味了。


  美国政府债务,是标普调低美国信用度的原因。而美国政府缓解财政危机,现在最简单的方法就是印钱充实财政,客观上推动美元贬值(实际上美联储前几天发表基调演讲,没有提到第三次量化宽松,这是因为还有很多其他的努力方式)。这样这样就会逼迫XXXXX通过立法政策执行等等途径给人民加薪提高人民实际权益(被迫促进消费内产品内销,这也会造成中产阶级),给民企公平环境(消耗国企的挖出来的资源),这是XXXXX之前一直避免的:因为这样做会改变社会经济关系,改变社会组织结构,甚至阶级结构。愤青还以为美国困境了,真是可笑,其实是XXXXX的困境,明白么?美国印钱,美元供应量增加,美元就会贬值,不存在什么美元美国剥削世界的说法。至于之前持有的美元,所能做的就是花掉,大量持有美元是愚蠢的,也是毫无实际意义的。美国现在债务出现危机,美联储当然可以大量印钱。但是好像美联储还没有最终做决定,这只是策略问题。人民币被压主动升值,总比美元主动贬值有利于美国政府。


  非常可笑,人民币升值同样对中国人民有利,唯一就是对XXXXX不利。为什么对人民有利?随便说几点。


  1、人民币升值,必须减少货币发行,这样不会让通胀加剧,人民的工资价值不会缩水。


  2、人民币升值,消费品就会内销,就会逼迫当菊通过种种行政法律手段等等方式给人民加工资。因为人民之前生活并不好,自己都舍不得消费。


  3、大量的出口不需要高内需经济,就不要给人民高工资,因为不需要实现生产与消费的内循环。


  4、国企控制了资源类产品和初级产品的生产与销售,出口受阻,必然要给民企公平环境,以消耗消耗国企的产能。


  5、我们知道,目前大部分民企待遇都很糟糕,因为民企的生存环境不好决定了人民工作在民企不会像国企工作的人那样收入好,民企在出口政策主导下,很难提供有质量的就业机会。(其实中国的民企老板大部分都是当年住大院的,这是一个很无奈的事实。)


  6、为什么“国富民穷”,人民没钱,权贵财富堪比欧美。这就是因为,出口经济,不要给劳工高待遇,只要给予最低生存工资就可以,钱几乎全进了权贵的口袋。也是因为超额巨量发行货币造成人民已经不多的钱贬值。


  统计局停止发布房价涨幅平均数


  为什么采用网签数据?


  基础数据来源渠道的调整是这次房价统计改革的重要内容。35个大中城市新建住宅销售价格数据,直接采用当地房地产管理部门的网签数据,不再采用样本数据。


  之所以做这样的调整,主要有三个方面的原因。一是数据齐全,网签数据涵盖了新建商品住宅的全部交易情况;二是信息完整,网签数据包含有地址、楼层、价格和金额等详细信息,有助于价格指数的计算;三是获取方便,经过不断改进和完善,房地产管理部门在网签数据管理与使用方面积累了丰富的经验,数据提取比较容易。


  为什么不再发布全国房价涨幅平均数?


  主要有三方面考虑。首先,用平均数表示一组数据,具有直观简明的特点。但平均数在样本值离散程度较大的情况下有一定的局限性,也就是说在个体差异较大的情况下,往往会削峰填谷,抹平个体间的差异。例如,冬季某日北京的温度是零上9摄氏度,哈尔滨的温度是零下15摄氏度,海口的温度是零上15摄氏度,3个城市的平均温度为零上3摄氏度,计算和发布这样的平均数意义就不大,而且还容易引起不必要的误读。


  其次,不再计算和发布平均数,重点发布各个城市的房价数据,既有助于社会公众及时了解所在城市房价的具体变化,也有利于更好地为地方政府有效调控房价提供服务。


  再次,这也是一些专家学者的建议。如有的专家指出,综合平均价格指数概念过于模糊,无法与某个时点相对应,并且在各季度(或各月份)房价变动比较大的时候,计算出的平均值更是缺乏实际意义。过于强调全国综合的数字容易引起误读,会掩盖各个城市的典型特征。
来源:财识网综合编辑)