因果K均值聚类：识别异质性因果效应的新方法

发布时间：2026-04-04 04:53

在因果推断研究中，总体层面的效应汇总有时无法充分反映处理效应在不同亚组间的异质性。由于亚组结构通常是未知的，识别和评估亚组效应比评估总体效应更具挑战性。为此，研究者提出了一种名为“因果K均值聚类”的新解决方案。该方法的核心思想是利用经典的K均值聚类算法，来揭示未知的亚组结构。然而，该问题与传统聚类设置存在显著不同，因为需要聚类的变量是未知的反事实函数。研究团队提出了一种插件估计器，该估计器结构简单，可直接利用现有算法实现，并分析了其收敛速度。此外，基于非参数效率理论和双重机器学习，团队还开发了一种新的偏差校正估计器。该估计器能够在大型非参数模型中实现较快的收敛速度，并满足渐近正态性。所提出的方法对于具有多个治疗水平的现代广泛结局研究尤为有用。该框架还可扩展至使用通用伪结局（如部分观测结局或其他未知函数）进行聚类。最后，研究通过模拟探索了其有限样本性质，并在一项关于慢性腰背痛移动支持自我管理的研究中进行了方法演示。

返回快讯列表