通过思考一些建立两个事件之间的因果关系的困难来总结我们的讨论。通常,当总结一个事件去引起另一个事件的时候,必须十分仔细地去思考。因为可能根本不能观察到因果关系,更不能看到在两个事件之间的关联。
让我们假设我们观察两个变量A和B之间的关系。用概率和统计学的语言,我们可以说当在两个变量之间存在线性关系时两个变量就是关联的。这意味着,两个变量趋向于相互靠近或是共变:如果存在正相关,A的更大值可能产生B的更大值,A的更小值可能产生B的更小值;如果存在负相关,A的更大值可能产生B的更小值(反之亦然)。如果A和B是离散变量,这将意味着A的存在或是不存在将会导致B的存在或是不存在。
然而,当我们建立起在A和B之间的关联时,这并不一定意味着因果关系是A→B(关联是必需的,但是是建立在两个事件之间因果关系的不充分条件)。除了A→B,还可以解释为在A和B之间的关联,存在至少4种可能的选择方案。
方案1.关系的方向可能不是在假定的方向。
在前面描述的时间优先权原理能够帮助我们确定两个事件A或者B中哪一个是原因,哪一个是结果。这一原理告诉我们,原因在时间上优先于结果。有时候两个事件中的哪一个先发生是非常明显的。例如,不当的饮食引起了维生素缺乏。在一个人患有维生素缺乏之前,不当的饮食就已经发生了。有些时候,哪个事件先发生不是十分清楚:原因和结果几乎同时发生,你不能够对其确定,这样就很难确定哪个是原因,哪个是结果。例如,在19世纪,良好的商业条件导致了大英帝国的工业化。是良好的商业条件先产生的,还是大英帝国先开始工业化?这可能不是很明显的区分,所以就会纠结于去解决“鸡生蛋,蛋生鸡”的难题。
方案2.关系可能是自增强的。
这种类型可能是A→B和B→A。当很难去确定因果关系的方向时,事实上,可能看到在事件之间不同方向的操作所产生的两个分离的因果关系。例如,假设想揭示在学习和优异成绩之间的因果关系。可能是更多的学习产生更好的成绩,但是也可能是这种情形,就是获得了好成绩成为更加努力学习的原因(取得好成绩的学生受到更多的激励去维持他们的平均成绩,因而反过来使他们更努力地去学习)。
方案3.关系存在隐藏原因。
一些第三方未知的因素(隐藏原因)可能成为A和B的原因。这可以解释为在A和B之间的关联。例如,假设我们观察在夏天的几个月中空调器和冰激凌的销量在增长。我们进一步地观察到,空调器的销量增长要早于冰激凌的销量增长,因而可以确立时间的领先(房主在一开始进入夏天就想购买空调器,以便为后面炎热和潮湿的日子做准备)。因而,我们就有可能错误地推断出:空调器销量的增长引起了冰激凌销量的增长。事实上,变暖的天气是导致空调器销量增长和冰激凌销量增长的共同原因,而在空调器销量增长和冰激凌销量增长之间并没有因果关联。
方案4.关联可能仅仅是巧合。(www.daowen.com)
可能我们看到了两个无缘无故同时发生的两个事件;并且它们的发生仅仅是偶然的。例如,在地球大气中的二氧化碳气体(碳氧化物)的浓度引起了美国人口期望寿命的增加。当然,这是一种不合理的联系,但是这可能是基于现代工业时期中的因素。由于对化石燃料的燃烧、采伐森林和其他人类活动导致温室气体(例如二氧化碳)的排放增加了。同时,在工业化的这段时期,我们也看到了由于更好的营养条件、医疗的进步和能够对自己进行更好照顾的富裕的美国中产阶级数量增长而使得人口的预期寿命史无前例的增长。两个事件,二氧化碳的浓度和美国的人口预期寿命并没有因果关联。
最终,极有可能不能够明确和确信地建立在两个事件之间的因果关系。虽然,我们不能够百分之百地确定事件A引起了事件B的发生,但是我们至少能够收集三种类型的证明,这些证明将增加A是引起B的原因的可能性。
1.建立时间上的优先。如果A是引起B的原因,那么A必须是在时间上优先于B的。
2.建立在A和B之间的共变。原因A必须与结果B共变。如果潜在的原因和结果是无关的,那么一个事件就不能够是另一个事件的原因。例如,统计学上,使用对于相关系数的计算去确定在数据间是否存在共变。
3.排除B的其他可能原因。这可能是需要去满足的最困难的条件,并且通常将需要去寻找可以选择的原因,例如隐藏原因,并且通过说明它们与结果不发生共变而将它们一个一个地排除。
有时候,为了产生一个好的因果关系模型将需要更深一步地挖掘潜在的变量、隐藏原因和更深层次的解释。挖掘得不深入将产生不完全和错误的因果关系模型。加利福尼亚大学伯克利分校对在本科生入学中性别歧视的研究[16]就是我们能够举出的一个很好的例子(用一个因果关系推理的谬误来结束本节的内容是一个很好的方式)。对于数据肤浅的理解显示出伯克利分校的本科学院更情愿去接受男性申请者,而不愿去接受女性申请者。因而,可以由下图给出这一简单的因果关系模型:
然而,对于数据的更进一步的检查说明了一种完全不同的情况。当按照不同的院系去分解数据的时候,可以揭示出女性申请者比男性申请者更可能获准入学[17]。对于这点的解释是,女性申请者更倾向于申请伯克利分校中更具竞争性的院系,而这些院系的录取率比较低。那么,一个更加精确的因果关系模型就将包括院系节点。
因而,性别→院系→录取率的路径可以被解释成为:你的性别将会对你的院系选择产生影响;反过来,你选择的院系将会决定你录取的可能性。当排除了院系这一情况,在性别和录取之间的关系就是非常微弱的了(这与假设的相反)。在这一例子中,“院系”节点被认为是调解者(这个节点调解了在性别与录取之间的关系)。
对于调解者和其他变量的探究确实能够帮助我们更加完整地理解复杂现象。在第8章中,当我们讨论贝叶斯网络时,将会对因果关系建模进行更多论述。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。