公众号从本期开始不定期推送Guido W. Imbens和Donald B. Rubin二位大神的新书Causal Inference for Statistics, Social, and Biomedical Sciences: An Introduction的读书笔记。两月前,南加大的 John Strauss教授来学院讲授微观发展课,在课上强力推荐此书,于是我的第⼀次亚马逊海淘便是为了购买它。我的实证水平不⾼,⼀直因为缺乏⼀个清晰的知识框架而难以内化各种不同的实证策略,所幸遇到了这本讲因果推断的书,使我的思路清晰了不少,所以我决定尽⼒⽽为,整理⼀份读书笔记出来,⼀来可以督促⾃⼰,⼆来让更多的朋友知道这本书。本期推送这⼀系列的第⼀篇“因果分析的基本框架”,内容来⾃于本书的part I: Introduction。
在应⽤统计中,⼈们感兴趣的问题不仅仅是描述性统计和相关关系,还包括因果关系。为了构建因果分析的框架,我们⾸先需要引⼊⼀些基础性的概念:潜在结果(potential outcomes),个体处理稳定性假设(the stable unit treatment value assumption, SUTVA),分配机制 (assignment mechanism)。
因果关系的分析⼀定要有⾏动施加于个体。给定个体和⼀个⾏动集,我们给每个⾏动和个体的搭配赋予一个变量,这个变量叫做潜在结果。事后来看,只有⼀种潜在结果可以被观察到。树林⾥分开两条路,我⾛⼤路或者⼩路,两条路的尽头都是我的潜在结果,但是如果我⾛了⼤路,那么我只能在大路的尽头畅想如果⾛了⼩路会有什么结局,但也只能是畅想,事实如何,没⼈知道。⼀种⾏动或者处理的因果效应可以通过⽐较潜在结果得到。举个例⼦,我头疼,可以吃阿斯匹林或者不吃阿斯匹林,只需⽐较我吃阿斯匹林和不吃阿斯匹林时头疼的程度,就能知道阿斯匹林对我头疼症的因果效应。问题是,吃阿斯匹林与不吃阿斯匹林的结果不能同时被观察到。
关于因果效应的定义有两点需要注意的地⽅。⾸先,这⼀定义依赖于潜在结果,但是不依赖于哪⼀个潜在结果最终实现,⽆论我有没有吃阿斯匹林,阿斯匹林对我头疼症的因果效应都应该是⼀样的。其次,因果效应来⾃于对事后同⼀时间同⼀个体潜在结果的⽐较。特别地,对同⼀个体事前事后的⽐较并不满⾜因果效应的定义。
与因果效应的定义不同,因果效应的估计必须依赖能够被观察到的潜在结果。定义因果效应,只需⼀个个体就够了,⽽由于⼀个个体只能带来⼀个可被观察到的结果,所以因果效应的估计需要多个个体,而且这些个体被施加的⾏动需要有所不同(不能所有⼈都吃阿斯匹林,或者所有⼈都不吃阿斯匹林)。要估计因果效应,我们还需要知道(或者假设)为什么是⼀些潜在结果实现⽽⾮其他的潜在结果。也就是说,我们需要知道或者假设,⾏动在个体之间的分配机制是什么。对分配机制的介绍放到最后,我们先来看个体处理稳定性假设。
个体处理稳定性假设(SUTVA)是指任意⼀个个体的潜在结果不随其他个体是否接受处理⽽改变,⽽且每个个体受到的处理和潜在结果之间是定义良好的函数。
SUTVA包括两个部分。第⼀个部分是说,不同个体间的潜在结果是相互独立的,我的头疼症只应该与我⾃⼰吃不吃阿斯匹林有关,别⼈吃不吃阿斯匹林不应该对我的头疼症产⽣任何影响。这当然只是⼀个假设,如果头疼可以传染,即使我吃了阿斯匹林,如果我室友不吃并⼀直头疼,那么室友的头疼是会传染给我的。假设阿斯匹林是有效的,在室友不吃药的情况下,我吃药与否的潜在结果都是继续头疼;⽽而如果室友吃药的话,我吃药就不头疼,不吃药就会继续头疼。这时,SUTVA的第⼀部分就并未得到满⾜。
上⾯这个吃药不吃药的例⼦听起来有点⼈造,所以考虑⼀个更容易被接受的例⼦。你考虑参加⼀个⼤型职业培训项⽬,但是如果参加这个项⽬的⼈⾜够多,那么你接受培训后在收⼊上获得的好处可能会被更加激烈的竞争所抵消,这在经济学上被称为⼀般均衡效应。当存在个体之间的相互影响时,为了使SUTVA更加可信,我们可以赋予“个体”⼀个更宽泛的定义,⽐如研究教育问题时经常以学校为单位⽽非学⽣。SUTVA的第⼆部分是指,不同强度的处理都应该被清楚明⽩地表现出来。还是阿斯匹林的例⼦,如果我们把处理划为服用阿斯匹林和不服⽤阿斯匹林,那么这⾥的服⽤阿斯匹林就应该是指服⽤同⼀个规格和药性的阿斯匹林,不能存在不同药性的阿斯匹林。如果有两种强度的阿斯匹林,那么对于处理的划分就应该改为服⽤强阿斯匹林、服⽤弱阿斯匹林、不服⽤阿斯匹林。
前⾯已经讲过,潜在结果不能全都被观察到,这是进行因果分所⾯临的最根本的问题。 Rubin(1974)认为这⼀问题实质上就是⼀个缺失数据的问题。因此要进⾏因果分析,就需要把缺失的潜在结果填补上。⼀些个体的背景特征(协变量)往往能够帮助我们进⾏缺失潜在结果的预测。
不是所有变量都可以作为协变量,协变量必须满⾜一个条件:个体是否得到处理被先验地认为不会对协变量造成影响。个体永久性的特征,或者发⽣在处理之前的变量,都可以作为协变量,它们也被称为处理前变量。协变量的有⽤性体现在三个⽅面:使估计更加精确,提供特定族群的因果分析,非混淆性(unconfounded)。其中最重要的就是非混淆性,非混淆性是指分配机制不依赖于潜在结果。能⼒比较低的⼯人更可能接受职业培训,⽽能⼒比较低的⼯人⼯资也相应地较低,因此⼯资这⼀潜在结果与接受职业培训与否相关,这样就不满⾜非混淆性。直接⽐较参加培训⼯人的平均⼯资和不参加培训⼯人的平均⼯资就会低估培训的效果,但是如果⽐较各个⽅⾯特征⽐较相似的⼯人(⽐如性别⼀样,学历⼀样,经验⼀样)中参加培训⼯人的平均⼯资和不参加培训⼯人的平均⼯资,我们会更加愿意相信这两部分⼯人之间的⼯资差距来⾃于职业培训。
分配机制是决定哪些个体得到处理,从⽽哪些潜在结果可以被观察到的过程。正式地来说,分配机制是协变量、潜在结果和分配向量的函数,表⽰在特定协变量和潜在结果下,某⼀分配向量实现的概率。什么是分配向量呢?假设有两个人,分配向量就是表⽰两人是否得到处理的二元数对,如(培训,培训),(培训,不培训),(不培训,培训),(不培训,不培训)。
对于分配机制有三个基本限制:
- (individualistic assignment):任意个体得到处理的概率不依赖于其他个体的协变量与潜在结果。
- (probabilistic assignment):个体得到处理的概率严格大于0,⼩于1。
- (unconfounded assignment):分配机制独⽴于潜在结果。
根据Cochran(1965),书中对试验和观测性研究进行了区分。对于试验,研究者完全了解并可以控制分配机制。对于观测性研究,研究者或者并不知道分配机制是怎样,或者⽆法对分配机制进⾏行控制。
书中讨论了三种分配机制。第⼀种是随机试验(classical randomized experiments),随机试验的分配机制满⾜上⾯提到的三个限制,⽽且研究者对于分配机制完全了解并可以进⾏控制。第⼆种是正规分配机制(regular assignment mechanism),它依然满⾜三个限制,但是研究者对于分配机制并不了解或者没有控制能⼒。第三种分配机制本⾝也是正规的,但是个体被分配到的处理和个体实际接受的处理是不同的,这来⾃于个体实现效⽤用最⼤化的主观能动性。此时,我们需要⼯具变量的⽅法。
本书接下来的部分分别在这三种分配机制下探讨因果关系的推断问题。