暑期短课（8.1-8.4）乔星烨因果推断

课程主讲人：乔星烨，纽约州立大学宾汉姆顿分校数学与统计学系教授。

时间：2023.8.1-2023.8.4 每天上午9:00-11:00

地点：维格堂319

课程目录：

8.1：背景，潜在结果的尼曼-鲁宾因果模型，随机实验

8.2：观察研究的设计与分析，子分类、匹配、加权

8.3：倾向得分和双重稳健估计，使用机器学习进行大型观察数据的设计与分析

8.4：机器学习（继续）、工具变量、主要分层、回归不连续设计、差异法

课程简介：尽管大多数统计推断实践关注变量之间的关联关系，但在许多情境下，目标是确定干预或治疗的因果效应。几乎每个领域都存在重要的因果研究问题，这些问题可以推动决策制定（例如劳动经济学、流行病学、市场营销、政治科学等）。什么是因果关系，如何确定观察到的关系是否真正具有因果关系？我们如何从数据中得出因果结论？在本课程中，学生将学习如何理解因果关系并使用实证数据进行因果确定的基本原理。

课程将首先介绍反事实框架（也称为潜在结果的尼曼-鲁宾因果模型）的因果推断，并讨论一系列方法，从最基本的实验设计到更复杂的观察方法，用于从数据中推断出因果关系。针对每种方法，我们将讨论研究人员需要对生成数据的过程做出的必要假设，如何评估这些假设是否合理，以及如何解释所估计的数量。

本课程涵盖的方法和理论具有广泛的应用范围，涉及物理学、生命科学、社会科学、管理科学以及工程学等领域。课程要求并强调对概念的理解，而非方程的记忆或理论推导。案例将涉及政治科学、经济学、社会学、公共卫生学和医学等各个领域。本课程是统计理论和数据分析的结合。学生将接触到与决策和政策制定相关的统计问题。

课程主题包括：潜在结果的尼曼-鲁宾因果模型的基本组成部分、基于费希尔随机化的因果推断、基于尼曼重复抽样的因果推断、从线性回归模型中得出因果推断、观察研究的设计与分析、倾向得分、子分类、匹配、加权、双重稳健估计、非二进制处理、使用机器学习进行大型观察数据的设计与分析、敏感性分析、工具变量、主要分层、回归不连续设计、差异法和贝叶斯因果推断的范式。

主讲人简介：乔教授是宾汉姆顿大学数据科学跨学科卓越领域(The Data Science Transdisciplinary Area of Excellence)的主席，同时也是数学与统计学本科部的主任。乔教授的研究兴趣包括统计学、机器学习、数据挖掘、强化学习、高维推断、大数据以及它们在不同领域中的应用。他于2010年获得美国北卡罗来纳大学教堂山分校的统计学博士学位。

邀请人：马欢飞

威尼斯人