双重稳健估计模型及其在R上的实现
时间:2021-06-20 23:03:27 热度:37.1℃ 作者:网络
背景 应用中我们常依赖多因素模型对数据进行分析,但模型的使用要求模型假设与实际数据情况相吻合,当假设与实际偏差较大时,则容易带来错误的结论。在观察性研究者我们对模型的使用更为普遍,尤其是当存在混杂时,我们常依赖多因素模型进行混杂因素调整,此时,如果所用模型能正确反映处理、混杂和结局之间的关系,则效应估计量满足一致性和渐近无偏性,否则可能得到错误的结论。此外除了使用多因素模型进行混杂因素调整外,倾向性评分法(propensity score, PS)的使用也越来越普遍。倾向性评分的估计也依赖于统计模型,比如常用logistic回归或机器学习模型等估计倾向性评分,但是当倾向性评分模型假设错误时,同样会带来最终分析结果的偏差。双重稳健估计(doubly robust estimation)是这对这一问题提出的更为稳健的方法,该模型结合了针对结局的回归模型和针对处理的倾向性评分模型,从而得到一个具有双重稳健性的效应估计量,即只要回归模型和倾向性评分模型中有一个正确,就能保证估计量的一致性和无偏性。 双重稳健模型,主要是由Rubin等人在倾向性评分方法的基础上发展而来。1983年,Rosenba