焦恩俊微博:“不会这么凑巧吧?”——谈谈统计假设检验

来源:百度文库 编辑:中财网 时间:2024/04/29 06:29:44

南京市统计局 王国钧

看到“统计假设检验”这个名词也许大家觉得很陌生,认为与我们的生活没有任何联系。也许有人望文生义,觉得“检验”应该是专家们或者是专业人员的事情。哈哈,其实,在我们日常生活中,经常用到假设检验这个原理,只不过我们不觉得罢了。

当我们对某项不大可能发生的事件却因为某些因素的存在,居然发生了,常常会发出疑问,“不会这么凑巧吧?”,就是在运用假设检验。如在某公司节日联欢会的抽奖活动中,特等奖——价值五万元的奖品被该公司的总经理抽得;一等奖——价值三万元的奖品被该公司的副总经理抽得,人们就会发出这样的疑问。这是因为在随机抽奖的情况下,每个人被抽中的可能性是一样的,尽管总经理有被抽中的可能,普通员工也有被抽中的可能,但从全体普通员工的群体与总经理一人相比,普通员工由于人多,被抽中的可能性更大。退一步来讲,即使总经理被抽中是正常的,但是,副总经理在本次抽奖活动中也同时被抽中,这种可能性就比较小了,更巧合的是得奖的顺序也依职务高低排列,如此可能性就更小啦。因此,人们有理由怀疑这次抽奖活动的公正性。这实际上就是人们在运用“假设检验”。

所谓假设检验,通俗的说,就是人们先提出一个假设,如“这次抽奖活动是作假的”,然后,根据掌握的证据材料进行判断,最后,作出是接受原假设还是拒绝原假设的过程。当然,这种接受和拒绝不是绝对的,是在对现有证据掌握基础上的接受和拒绝,并且有一定程度的不确定性,用平常的话讲,只能说“可能性很小”,或者“可能性不大”。如在上例中,人们在头脑中首先假定,“这场抽奖是作假的”。这个假设,在统计学中被称为“原假设”,用H0来表示,同时,也提出另外一个假设,“这场抽奖没有作假”,在统计学中称为“备择假设”,用H1来表示。通过日常的经验,人们觉得,抽奖呈现的这种状况,在现实生活中出现的可能性不大,可以说几乎为零,因此,充分接受了原假设(注意不是绝对接受),拒绝了“备择假设”。之所以如此,因为从概率上来讲,只不过这种可能性极小,还是存在着总经理和副总经理同时得奖状况的可能性,人们仍然面临着作出错误判断的可能。

假设检验在日常生活中也经常用于对某人(群体)能力或成绩的检验。如某人说自己篮球的立定投篮命中率是85%,而在某次实际立定投篮时,投20个球,只进8个球,那么,我们肯定会做出判断,“该同志吹牛!”。因为实际的成绩与其宣称的成绩差距甚远。再比如,某班任课老师说自己教的《数学》效果好,班的平均考试成绩达90分,而通过测试,该科全班的平均成绩只有69分,那么,我们有理由认为该任课老师的说法有“水份”。但如果测验的平均成绩为85分,那我们会认为老师的说法“差不多”。之所以大家会做出这样的结论,就在于,在大家的心目中,是用实际的统计量和受检验的数据做比较,差距大,自然人们就产生疑问。当然,在假设检验过程中,测验的数据是要受到一些随机因素影响的,即存在着随机抽样误差。因此,还要考虑到数据的标准差——即每一数据跟平均数之间的差距(不同的标准差,其数据的代表性就不同,标准差越大,代表性越小),以及所抽取的样本量的多少。综合标准差和样本量,才能决定在什么样的显著性水平下,对原假设是拒绝还是接受。

在假设检验中,人们存在着可能犯的两类错误,一类错误为,“拒真”错误,即原假设是真的,而我们拒绝啦,如上述的中奖状况,如果真的那么凑巧,确实是真的,而我们拒绝了就是犯了“拒真”的错误,尽管犯这种错误的可能性比较小。另外一类错误是“取伪”错误,不是这么回事,而我们却采信了,当然这也是在一定的概率条件下,所犯的错误。这种“取伪”错误,在古代戏剧中,时有体现,并被作为一种写作技巧,称为“无巧不成书”。如著名昆剧《十五贯》,说的就是这种情况。无锡屠户尤葫芦,从皋桥亲戚家借得十五贯铜钱回家,哄其继女苏戍娟说是卖她的身价。苏因不愿为婢,深夜私逃投亲。地痞赌棍娄阿鼠闯入尤家,偷盗十五贯铜钱,并用肉斧杀尤灭口;第二天清晨,邻人发现尤被害、钱被盗,其女无下落,议论纷纷,就一面报官,一面追赶凶手。客商陶复朱的伙计熊友兰,带十五贯铜钱往常州办货,途遇戍娟问路,二人因此顺路同行。邻人差役追至,见苏、熊男女同行,又见熊所带之钱正为十五贯,疑为凶手。娄阿鼠乘机诬陷,于是二人被押送无锡县衙门。无锡知县就犯了“取伪”的错误,主观臆断,错将苏、熊二人以通奸谋杀罪判成死刑。造成这起冤案的原因除了知县草菅人命以外,还有上述几个环节,照理碰巧同时发生的概率(可能性)很小却居然发生的原因。

在实际进行“假设检验”的过程中,我们希望力求同时降低“弃真”和“取伪”这两种错误,然而,这是不现实的。降低“弃真”的错误,往往会使“取伪”的错误提高,反之亦然。在这里我们就要从实际出发,以检验结论生效的实际效果为标准,来决定降低哪种错误。如在上述《十五贯》案例中,事关人命,在没有其他证据的前提下,知县绝对不能仅仅根据“巧合”对案件作出判决。再譬如,在对“药品”质量和“病人”是否患病分别进行的假设检验时,就应该遵循不同的价值取向。对于“药品”,我们宁愿犯“弃真”的错误,即使药品可能是真的,但只要有一定的概率是假的,我们宁愿把它作为不合格品来处理,因为万一药品真的不合格将产生严重的涉及人身安全的后果。而对于对“病人”是否患病的假设检验,我们宁愿犯“取伪”错误,认定病人患上某病,这样可以避免有病者得不到及时治疗现象的发生,也即“宁愿信其有,也不信其无”。

值得一提的是,在实际统计工作中,对于假设检验是有一套严格的程序和要求的,比上述要更加量化和精确。有关企业在对产品质量的检验方面,普遍采用假设检验方法。如对于产品包装容量是否合格的检验,等等。这里就不再赘叙,读者如有兴趣可以读一读这方面的书。

 

 

(载《调研世界》2012年第一期)