按照文章作者弗朗茨·梅瑟利的观点,巧克力消费与获得诺奖存在因果关系,其理论机制是:巧克力的主要原料可可富含黄烷醇,而黄烷醇作为强抗氧化剂类黄酮的一个亚类,能提高记忆力、学习能力,改善推理、决策、语言理解和数学逻辑等认知功能。
然而,由于人均巧克力消费量越高并不代表那些诺奖得主就吃了更多的巧克力。亦即,吃巧克力的人与诺奖得主并不一定属于同一群人。因此,该文作者仅为上述理论机制提供了很弱的统计学证据支持。对文章更严重的质疑来自于这样一个事实:虽然黄烷醇在天然可可中含量很高,但在巧克力中含量却很低。哈佛大学医学院黄烷醇专家诺姆·霍伦伯格指出,黄烷醇会使巧克力吃上去发苦,因此巧克力制造商会尽量降低巧克力中黄烷醇的含量。鉴于此事实,可以认为,文章的统计学证据根本没有为上述理论机制提供任何支持。
那么怎样有效地解释文章的统计学证据呢?
一种比较诙谐的解释是,虽然从巧克力消费到获得诺奖并不一定存在因果关系,但反向的因果关系有可能存在:那些有很多诺奖得主的国家或许喜欢用巧克力来庆祝斩获诺奖。更严肃的解释来自2001年诺贝尔物理学奖得主埃里克·科内尔。他认为,一个国家的巧克力消耗量与该国的富裕程度相关联,而越富裕的国家对科研投入更多,从而越可能产生更多的诺奖得主。因此,巧克力消费量和诺奖得主数量正相关所反映的是经济发展对两者的促进作用,而非两者的因果关系。埃里克·科内尔实际上是基于统计学中的“虚假关系”概念来进行解释的。所谓虚假关系,是指两个变量不存在因果关系,但会因为分别与第三个变量相关而具有相关性。不幸的是,这种相关性会误导人们认为两个变量存在因果关系。与本文案例类似的例子有很多,例如,手掌大小与阅读能力没有因果关系,但两者正相关,原因是年龄越大、手掌越大,同时阅读能力提高。再如,冰激凌销量与溺水人数没有因果关系,但两者正相关,原因是气温越高、冰激凌销量越大,同时游泳的人更多,进而会有更多的溺水者。
前文的分析表明,变量A与B相关,并不一定意味着A就是B的原因。B可能是A的原因,或者两者根本不存在因果关系,仅仅因为都与第三个变量C相关而相关。还有一种可能是,两者相关只是一种不必过度解读的巧合。就弗朗茨·梅瑟利所进行的研究而言,他选取了人均产生诺贝尔奖得主数量排名前23位的国家作为研究样本,显然样本量很小,从而很容易出现巧合性结果。
寻求因果规律是人类的本能,然而在此过程中陷阱重重。若要避免这些陷阱,不妨记住哲学家康德的著名论断:“经验的因果归纳没有合法性。”
(本栏长期征集“日知录”三字篆刻,投稿邮箱:rizhilu999@163.com)
版权所有:普门品常识网