新書推薦:
《
人的消逝:从原子弹、互联网到人工智能
》
售價:HK$
103.8
《
想象的共同体--民族主义的起源与散布(增订版)
》
售價:HK$
77.3
《
医学图形图像处理基于Python VTK的实现
》
售價:HK$
166.9
《
山家清供:小楷插图珍藏本 谦德国学文库系列
》
售價:HK$
143.4
《
政略与战略论
》
售價:HK$
140.0
《
百年词史-(1900-2000(全二册))
》
售價:HK$
333.8
《
RDI人际关系发展疗法:修复孤独症核心障碍,让干预回归生活
》
售價:HK$
99.7
《
金融科技监管的目标、原则和实践:全球视野下加密货币的监管
》
售價:HK$
110.9
內容簡介:
两种抗病毒药物中哪种能更好地拯救埃博拉病毒感染者?每天喝一杯葡萄酒会延长还是缩短寿命?中彩票会增加还是减少破产的可能性?如何识别致病基因?有些抗生素有致命的副作用吗?收入所得税抵免是否有助于人们进入劳动力市场?《因果推断入门》这本非技术指南简要地介绍了关于现代因果推断的基本思想,如随机实验、倾向得分、自然实验、工具变量、敏感性分析和准实验装置,并以医学、流行病学、经济学和商业、社会科学以及公共政策中的实例来说明各种观点。
關於作者:
保罗?R.罗森鲍姆(Paul R. Rosenbaum)是世界著名统计学家、费希尔讲席奖和斯尼德克奖双料得主,倾向得分方法提出者,宾夕法尼亚大学沃顿商学院统计与数据科学罗伯特?G.普策尔(Robert G. Putzel)名誉教授。他出版了《观察与实验:因果推断导论》、《观察性性研究的设计》、《观察研究》以及《观察研究中的复制与证据因素》等著作。
目錄 :
第一章 处理引起的效应
什么是因果效应. 因果推断为何如此艰难.
精确问题的标记法
对照组能解决问题吗.
多于两个人的情况也是一样的
用公平的硬币来决定对人们的处理分配
平均处理效应
因果推断入门
第二章 随机实验
随机对照实验
为什么要随机分配处理.
随机化处理分配和因果推断
估计平均处理效应
检验无因果效应假设
硬币投掷的特殊性何在.
给乔治·华盛顿放血和体液说
第三章 观测性研究问题
什么是观测性研究.
吸烟与牙周病
插曲‘ 图基的箱形图
处理组和对照组在箱形图上是否具有可比性.
比较那些不可比较组的结果
第四章 对可测协变量的调整
作为一种调整方法的协变量匹配
倾向得分的不平衡 .
倾向得分匹配如何平衡可测协变量
在控制可测协变量的同时比较结果
其他匹配方法
第五章 对未测量协变量的敏感性
异议、反诉和竞争性假设
吸烟与肺癌
观测性研究的首次敏感性分析
现代敏感性分析’ 吸烟与牙周病
敏感性分析的作用
第六章 观测性研究设计中的准实验装置
可预期到的反诉
两个对照组
两个对照组的逻辑
除了未处理的控制项之外& 还有未处理的对应项
解决可预期的反诉
第七章 自然实验# 断点和工具变量
来自彩票的自然实验
大自然的自然实验;兄弟姐妹的基因
大自然的自然实验:假想的兄弟姐妹
作为自然实验的断点设计
工具变量和顺从者平均因果效应
提供住房券的效应或接受它的效应(
选择处理分配中偏差较小的情形
第八章 复制、解决和证据因素
复制不是重复
没有解决方案的重复
单一目标的不同视角
因果推断入门
证据因素
第九章 因果推断中的不确定性和复杂性
每天少量饮酒有益吗.
肿瘤学家与心脏病专家
来自新策略的反对声音 孟德尔随机化
答案可能很复杂
传统毒素
总死亡率
被认为有益于心脏的部分或全部好处只是一个错误
那么每天少量饮酒有益吗.
附录 每一章的核心思想
术语表
参考文献
延伸阅读
索 引
译后记
內容試閱 :
译后记
这本书是我与我先生李井奎教授(以下称李老师)合作翻译的一本小书。
作为一名心理学专业的教师,我对因果推断的认识和理解,基本上都是来自与李老师的讨论以及他翻译和撰写的著作,尤其是他2020年在哈佛大学访学期间所写的一本经济学科普书。由于疫情的原因,我们原本计划好的一家人暑假在美国相聚的设想化作了泡影,于是,他开始撰写一本名为《大侦探经济学:现代经济学中的因果推断革命》的经济学科普书,聊以打发时光,借以寄托他对孩子们的思念。那个时候,他每写好一章,都会发给我看。那本书写得非常有趣,几乎每一章都很吸引我这个主要从事心理学教学和教育的大学老师,尤其是该书最后一章,通过假想的《西游记》故事,把经济学家因果推断的几种主要工具,非常通俗而且有趣地介绍了一遍,让我这个外行人也能读懂。
从此之后,我对李老师经常讲起的因果推断思想,就有了新的看法,我认为这是一种非常有力的现代思想武器。我那时候想,如果有一本篇幅适当、能精彩地介绍因果推断的基本思想的书,这本书又不局限在经济学领域,那就再好不过了。当中国人民大学出版社的王晗霞编辑把这本小书的英文版发给李老师时,李老师转发给了我,我打开一读,就爱不释手,这本小书正好满足我对因果推断的入门书的全部想象,而且精彩至极!于是就主动请缨,与李老师一起把这本关于因果推断的精彩介绍翻译成中文,感谢中国人民大学出版社王晗霞编辑,她欣然同意,把此书交由我们来翻译。
这本书的作者保罗·R.罗森鲍姆(Paul R.Rosenbaum)是世界著名大学美国宾夕法尼亚大学沃顿学院统计与数据科学系荣休教授,罗森鲍姆教授1980年博士毕业于哈佛大学,在美国环保部等政府部门短暂任职后到宾夕法尼亚大学任教,自1986年一直在该校工作,一直到2021年退休。罗森鲍姆教授的主要研究领域就是观测性研究中的因果推断,他不仅在敏感性分析、最优匹配、证据因素、准实验涉及等方面著述颇丰,而且还与因果推断“潜在结果模型”的提出者、著名统计学家唐纳德·B.鲁宾(Donald B.Rubin)一起对倾向得分方法做出了开拓性贡献。罗森鲍姆教授是最早就因果推断领域的研究成果写出教科书的学者之一。这次,麻省理工学院出版社请他来为自己的这套通识读本写作《因果推断入门》一书,可谓所托得人!麻省理工学院出版社的这套通识读本,国内知道得尚且不多,但它却是一套在美国很受欢迎的通识丛书,对标的是牛津大学出版社的通识读本系列,因此,该丛书所邀请的撰著者都是所在领域的世界第一流学者。
自我拿到了罗森鲍姆这本书之后,我开始认真地在工作之余研读这本简洁明快的小书。读完之后,不禁感叹,罗森鲍姆果然是因果推断领域的一代大家,他入手总是从众人关心的现象说起,但逐层深入,使得读者不禁对科学工作者如此严谨的研究思路心生钦佩之情。同时,也会对在许多领域中我们固有的偏见而有所反思。
这本小书文风简洁,干脆利落,而且结构分明。它主要可以分为以下几个部分:首先是基于随机实验的思想介绍因果效应,这是第一和第二章的内容;其次引入现代社会科学、医学以及其他如心理科学等研究领域常见的观测性研究存在的问题,尤其是对于那些不可测的变量如何面对的问题,该书做了充分的解释,这是第三、四和五章的内容;第三是利用准实验环境进行巧妙的观测性研究,其中还包括断点设计以及工具变量等问题,当然,对于这类研究的反对声音,作者也做了针锋相对的回应,这是第六、七和八章的内容;第四是对因果推断中所存在的不确定性和复杂性的反思,使用的是每日饮酒是否有益这个问题的一系列研究,“每天喝一杯红酒会延长寿命还是缩短寿命?答案是什么?时间会证明一切。也许不会。”作者留了一个开放式的结尾,也意味深长的表明,因果推断是一项非常复杂的工作,它的未来还留给我们无限的发展空间。
关于因果推断的教材和专著,我国市面上已经不少。前不久中国人民大学出版社刚刚出版了由李老师翻译的《因果推断》一书,那本书是一本非常优秀的因果推断教材,适合大学生和研究生以及科研爱好者学习。但是,到目前为止,市面上还没有一本相对通俗易懂的对因果推断这一领域的精要介绍。相信本书的出版,将为市场补上这一缺环,让更多喜欢因果推断的朋友能够以最快速度和最小成本了解它的基本内容。
同时,《因果推断入门》这本书还有一个值得称道的优点,就是它构思精巧的行文。这本书一开篇就像一本侦探小说,确实非常符合李老师对因果推断的概括:像侦探一样的思考。作者罗森鲍姆这样写道:
“1757年,在乔治·华盛顿击败大英帝国之前,在他于美洲大陆大权在握并并于选举后和平移交权力之前——在所有这一切之前——乔治·华盛顿曾生过一场病,他的医生差点要了他的命。他们给他放血,目的是使他的体液恢复健康的平衡。多年以后的1799年12月13日,华盛顿
抱怨喉咙痛……痛到他几乎无法呼吸……这个垂死之人不仅因为喉咙肿胀慢慢窒息而死,而且还要忍受18世纪医学的折磨。他被反复放血,直到血量减少了一半。他被逼着使劲呕吐……皮肤上覆着燃烧的化学物质,使他浑身起泡。
第二天,华盛顿就与世长辞了。”
这样的开头看似非常戏剧性,实际上却蕴含着深刻的因果推断思维,因为它要我们回答的问题是:华盛顿到底是不是死于医生给他放血?要想回答这个问题,就需要了解什么叫做“潜在结果框架”。
大概在12、13年前,因为一些朋友的推荐,李老师开始打算学习因果推断这一计量经济学新领域。大概这个当时被他称为“微观计量经济学”的新方向与传统的计量经济学非常不同,所以李老师一直感到难以入门。其中阻碍他向前挺进的一个重要内容,就是由唐纳德·鲁宾教授提出的潜在结果框架。我看李老师为了这个问题辗转反侧了好多天,甚至对自己能不能学得会这种最新的计量经济学方法都产生了怀疑,就禁不住问他到底遇到了什么样的困难。
李老师通过举例给我讲了他当时遇到的困难。这个例子要回答的是这样一个问题:医院让人们变得更健康吗?为使这个问题更符合实际,假设我们正在研究一个贫穷的老年人群,他们到医院急诊室接受基础的保健服务。其中有些病人被送进了医院接受住院治疗。住院所需的这类护理服务费用昂贵,还会挤占医院的医疗设施,而且可能不是非常有效。事实上,那些本就身体欠佳的人与其他病人接触,对他们的健康产生的负面影响可能要更大。但由于住院患者得到了许多有价值的医疗服务,医院对病人健康是否有效这个问题的答案似乎仍然是肯定的。
但数据会支持这一点吗?对于一个有一定生活经验的人来说,对去过医院的人和没有去过医院的人的健康状况进行比较,是一种很自然的处理。美国的国家健康访谈调查(NHIS)就包含有进行这类比较所需的信息。具体来说,它包括这样一个问题:“在过去12个月里,受访者在医院入院住过夜吗?”这个问题我们可以用来识别最近住过院的人。NHIS还问过这样一个问题:“你认为你的健康状况总体是极好、很好、好、一般还是差呢?”
下面这张表显示了住过院的患者和未住院的人的健康状况均值(健康状况差赋值1,健康状况极好赋值5,资料来自NHIS(2005))
组别 样本规模 健康状况均值 标准误
住过院 7,774 3.21 0.014
未住院 90,049 3.93 0.003
二者均值之差是0.72,说明差异很大,t统计量是58.9,说明这一对比非常显著,该表表明,未住院的人显然比住过院的人更加健康。
从表面上看,这一结果表明住过医院会使人病情加重。由于医院里满是可能感染我们的病人、可能会伤害我们的危险医疗器械和化学药剂,所以这个答案未必不是正确答案。但是,我们还是很容易就可以看出来,为什么这种表面的比较并不合适:那些去过医院的人可能一开始就不太健康。此外,那些寻求医疗而住院的患者平均来说也不如一开始就未住院的人健康,尽管他们比不住院之前的健康状况也许要更好。
在这个问题基础上,李老师开始给我介绍鲁宾教授的潜在结果框架。为了更精确地描述这个问题,我们可以把是否曾住院治疗用一个二元随机变量Di = {0, 1}来描述。健康状况的指标是我们感兴趣的结果,用Yi表示。我们的问题是,Yi是否受住院治疗的影响。为了回答这个问题,假设我们可以设想,一些住过院的患者如果没住院的话会发生什么;同样,我们还可以设想相反的情况。因此,对于任何个人来说,都有两个潜在的健康变量:
换言之,Y0i 是一个人倘若没有住过院的健康状况,不管他实际上到底住没住过院,而Y1i 是一个人倘若住过院的健康状况,也不管他实际上到底住没住过院。我们想知道Y0i和Y1i 之间的差值是多少,这可以被说成是个体i住院治疗的因果效应。如果我们能够回到过去,改变一个人的治疗状态,这就是我们要测量的因果效应。
我们所观察到的结果Yi,按照潜在结果,可以写成下式:
(2.1.1)
这个表示法是很有用的,因为Y1i — Y0i是一个人接受住院治疗的因果效应。一般情况下,总体中可能存在Y1i 和 Y0i的分布,因此处理效应(treatment effect)也许因人而异。但是,由于我们从没有看到过一个人的两种潜在结果,所以,我们必须通过比较住过院的患者和未住院的人的平均健康状况来了解住院治疗的效果。
一个住院情况均值的单纯比较,可以告诉我们一些潜在结果的内容,虽然这并不一定是我们想要知道的部分。以住院情况为条件的健康状况均值的比较,通过下面这个方程,形式上与平均因果效应联系了起来:
其中,下面这一项
是住院治疗对那些住过院的人的平均因果效应。这一项是住过院的人的健康水平(即E[Y1i|Di = 1])与倘若他们没有去住院而会呈现的健康水平(即E[Y0i|Di = 1])之间的平均值之差。不过,所观察到的健康状况之差却为这一因果效应多加上了一项,这就是选择性偏差(selection bias),即那些住过院的人和没有住过院的人之间平均的Y0i值的差。由于生病的人比健康的人更有可能寻求治疗,所以那些住过院的人其Y0i值要更低,这使得本例中的选择性偏差为负。选择性偏差可能非常大(以绝对值表示),以至会完全掩盖积极的治疗效果。大多数实证经济学研究的目标,就是克服选择性偏差,从而对像Di这样的变量的因果效应作出说明。
李老师为介绍潜在结果框架而做的这个举例,给我留下了非常深刻的印象,也是我了解因果推断思想的开始。根据我的理解,潜在结果模型的本意是想说明,要进行真正的因果性比较,必需要让对照组和处理组的被试尽可能地相似才行。所谓的去除选择性偏差,本质上就是要使两个组的被试尽可能在各个方面都相似。
由于我在浙大受过六年心理学教育,随机对照实验的思想早已经深入我们的思维,所以我很快就认识到,所谓的潜在结果,指的就是没有接受处理的对照组被试如果接受了处理所将产生的结果,也是指接受处理的处理组被试假如没有接受处理所将产生的结果。
之所以我能很快地把握住了潜在结果框架的本质,并进而较为迅速地理解了因果推断,从根本上还是得益于我们心理学中对随机对照实验方法的学习和训练。而李老师是学习经济学出身的,十多年之前的经济学教学,似乎并不以实验方法为尚,因为他们一直认为经济学由于其研究对象的性质等原因,无法推行实验方法,或者至少不能大规模地推行实验方法,从而理解宏观经济的表现。正是这样的训练,使他们在转过来理解因果推断这场现代经济学革命时,面临着不小的思维转型上的困难。
李老师通过医院就诊是否提高了人们的健康水平这个例子,在我对随机对照实验思想的解说之下,很快理解了潜在结果模型,然后,他后面对因果推断的学习就变得非常之快了。
我还记得,当时他给我讲经济学家对于性别或种族歧视的研究时,他提到他终于明白了一本很有名的计量经济学教材的这段话:
“在种族和性别研究领域,经济学家最关心的是劳动力市场歧视问题。这类歧视体现在,因为人们认为你是黑人或白人、男性或女性,他们就会有差别地对待你。在一个反事实的世界里,把男人看成是女人,把女人看成是男人,这样的想法由来已久,并不需要道格拉斯·亚当斯式的搞怪来娱乐大众(在莎士比亚的《皆大欢喜》一剧中,罗莎琳假扮成盖尼米德,愚弄了所有人)。改变所属种族的想法也同样近乎不可思议:在电影《人性的污点》中,菲利普·罗斯想象了一个主人公科尔曼·希尔克的世界,希尔克在其职业生涯中是一名冒充白人的黑人文学教授。劳动经济学家一直在想象着同样的事情。有时,为了推动科学进步,我们甚至会构建这样的场景,比如在使用假工作申请和假简历的审计研究(audit studies)中所做的那样。”
后来,李老师还把歧视研究的一些精彩论文写入了他的《大侦探经济学》的第一章“乔治·弗洛伊德之死”中。
这本书的翻译是我和李老师的合作成果,对于正文中的每一段话,李老师都做了认真的校对,而且由于最后一段时间我的工作有些忙,李老师还精心翻译了本书的索引。
当然,对于这篇译后记,他也通读并给出了意见,并且对于在领会因果推断的潜在结果框架上我的心理学背景所带来的优势,李老师也表示非常认可。这对于一向以读书自负的他来说,是值得表扬的。