导语
因果推断本质是消除混杂因素引起的虚假相关关系。其基本任务包括:判断Pearl的三个层级问题、混杂因素的准则,替代指标悖论,因果作用和相关度量的可传递性、因果网络结构的分解学习、主动学习和局部学习方法。在此基础上,因果作用评价与因果网络局部结构学习的结合正在崭露头角。
7月24日(周六)10:00-12:00,我们特别邀请到北京大学数学科学学院的耿直教授开展讲座,介绍因果作用评价与因果学习网络相关研究。集智俱乐部因果社区汇集了超过位因果科学相关领域研究者,组织各类线上线下活动,耿直老师是因果社区成员。本次活动为因果科学社区内部的线下活动,我们同步在线上直播,文末报名即可获得直播地址,欢迎大家参与。
耿直,北京大学数学科学学院教授。年获上海交通大学学士学位,年获日本九州大学博士学位。年至今在北京大学概率统计系任教。主要研究方向为因果推断、数理统计、生物医学统计、因果网络、贝叶斯网络、图模型等。年当选国际统计学会推选会员,年获国家杰出青年基金资助项目。曾任中国数学会概率统计学会理事长、IMS-China主席、国务院学位委员会统计学学科评议组成员等职务。荣获国家教委科技进步奖二等奖、全国统计科学研究优秀成果奖一等奖等多项奖励。因果推断旨在利用试验性研究和观察性研究的数据,评价变量之间的因果作用以及识别因果网络的结构。在评估因果效应时,研究人员应对混杂因素进行识别和调整。基于分配机制的可忽略性假设,例如匹配方法、修剪法、逆概加权和回归方法、双稳健估计方法等可以实现对混杂因素的调整。对于未观测的混杂因素,工具变量方法和阴性对照变量方法可以有效消除估计偏倚。当感兴趣的结局变量难以观测时,研究人员常常选择观测替代指标,替代指标准则的建立可以避免替代指标悖论现象。在因果网络模型中,因果作用的可识别性与因果网络的学习算法已成为该领域的研究热点。
1.混杂因素的识别及调整方法
什么是混杂因素
Yule-Simpson悖论表明,在因果效应评估中有必要对混杂因素进行识别和调整。基于流行病学研究中的实例,Miettinen和Cook认为混杂因素V必须满足以下两个条件:其一,它可以预测未暴露人群的风险;其二,它在暴露人群和未暴露人群中的分布不同。
基于此,后续的文献中使用两类标准对混杂因素进行严格的定义:
1.可比较性准则(The