倾向评分(propensity score matching,PSM)配比是一种可用于在非随机对照研究中涉及较多混杂因素情况下做因果推断的方法[1],在医学、心理学、社会学等领域的应用日趋流行,但目前多需要编程实现,从而限制了该方法的普遍使用。目前非统计专业人员最常使用的软件SPSS中尚无现成的PS配比模块,但是可通过安装有关插件获得点击式分析模块,包含最常用的 logistic回归[2]和最邻近匹配[3]实现倾向评分配比和其他多种选项,如卡钳值、共同支持域、重复匹配、1:n匹配等,且可输出详细的评价匹配效果的均衡性统计量和图表[4],本文拟通过实例展示如何在SPSS软件上实现倾向评分匹配。
1 倾向评分配比原理倾向评分是指在一组混杂因素条件下,一个观察对象接受某种处理的可能性,其大小可以通过将处理因素作为应变量,其他混杂因素作为自变量建立Logistic回归模型来估计[5]。倾向评分配比就是利用倾向评分值从对照组中为处理组中的每个个体寻找一个或多个背景特征相同或相似的个体作为对照,最终两组的混杂因素也趋于均衡可比[6]。目前利用倾向评分进行配比的方法较多,PS最邻近匹配是最常用的一种方法:首先根据协变量计算倾向评分值,PS值在0~1之间,表示研究对象被分配到处理组(或者对照组)的概率[7]。然后,将两组观察对象按照倾向评分值大小排序,从处理组中±次选出1个研究对象,从对照组中寻找倾向评分值与处理组中最相近的一个对象作为配比个体。如果对照组中同时有2个或2个以上倾向评分值相同的个体,则按随机的原则进行选择。配比成功的对象从源人群中移去,然后进入下一个处理对象的配比过程,直到处理组中全部对象完成匹配[6]。为确保匹配效果,可设定卡钳值;当处理组和对照组样本量较大时,可为一个处理组对象匹配多个对照组对象;匹配效果可通过比较处理组和对照组匹配前后的标准化差异或方差比,当标准化差异接近0或方差比接近1时,提示匹效果良好,PSM还可提供单个变量和整体在组间的均衡性检验。
2 SPSS上的PS Matching模块 2.1 在SPSS上安装PS Matching模块(1)用户可以在http://www.ibm.com/developerwo-rks/spssdevcentral 找到SPSS R 插件进行安装,并在 http://sourceforge.net/projects/psmspss/files/下载psmatching3.spe。需注意不同的SPSS版本需要安装对应的SPSS R插件:SPSS 18.0 及之前的版本无法安装,SPSS 19.0对应R 2.10,SPSS 20.0对应R 2.12.0或者R2.12.1,SPSS 21.0 对应R 2.14.2。安装成功后,PS Matching模块成为SPSS菜单的一部分,用户即可通过点击式操作实现倾向评分估计和匹配。
(2)打开SPSS,按如下顺序点击Utilities --> Extension bbundle --> Install Extension bundle然后找到己下载好的.spe文件进行安装,重启SPSS。
2.2 操作方法打开SPSS,点击Analyze 中的PS Matching,弹出如图 1的主对话框。
![]() |
图 1 PS Matching模块的主操作界面 Figure 1 Main Dialog interface of the PS matching module. |
(1)Estimation Algorithm 倾向评分算法[8-9],有 Logistic 回归和GAMlogit 两种选择;Matching Algorithm:匹配算法,有Nearest Neighbor Matching(最邻近匹配),Full matching(完全匹配)[10]和Optimal matching(最优匹配)3种方法[8-9];Discard Units Outside of Common Support:删除在共同支持域以外的观察单位,程序默认none;Smooth Covariate:在广义相加模型中用到的选项。
(2)ID Variable 选入序号;Binary treatment indicator(0=control,1=treatment):选入二分类处理因素,并规定0为对照组,1为处理组,且变量类型须定义为尺度变量;Covariates:选入用于计算评分的协变量;Additional Covariates:选入和处理因素无关的协变量(注:一种较好的变量选择办法是将结局变量与混杂因素构建二分类logistic回归模型,进行逐步回归,进入模型的变量放入Covariates 框内,剔除掉的变量选入Additional Covariates框内[11]);Exact Matching on(only for Nearest Neighbor):根据选入的变量对个体进行精确匹配,仅适用于最邻近匹配方法。
(3)点击Plots and output,出现如图 2 对话框。 Plots下对应的五个选项±次为匹配前后的:评分直方图、个体匹配图、标准化差异直方图、各协变量标准化差异散点图、各协变量匹配前后变化线图;Resolution(PPI):结果窗的显示比例;Output Datasets:输出匹配后的数据集,其中Matched cases和Paired cases分别以长型和宽型格式输出匹配后的数据集;Balance Statistics:均衡性统计量,默认给出基本统计量,Detailed中可选是否按层分析,仅适用于最邻近匹配方法。
![]() |
图 2 图形和结果界面 Figure 2 Dialog of plots and output. |
(4)点击Options,出现如图 3 对话框。Matching order:选择匹配的顺序,默认从最大评分值开始匹配; Allow replacement:选择是否进行重复匹配; Subclassification:选择是否按照评分接近程度分为若干亚分类;Match one to many:选择匹配比例;Caliper:设定卡钳值,默认值为0.2。
![]() |
图 3 选项界面 Figure 3 Dialog of options. |
为了探讨吸烟对冠心病发生的影响,对26例冠心病人和28例对照者进行病例对照研究,各因素的说明见表 1[12]。
![]() |
表 1 冠心病8个可能的危险因素与赋值 Table 1 Possible risk factors and assignment of coronary heart disease |
以“吸烟”为处理因素,除冠心病以外的其余变量为协变量构建估计PS的模型,如图 4。勾选plots中的五个图,勾选Output Datasets 中的paired cases(wide format),点击Detailed;options中设定卡钳值Caliper为0.2,其余默认;然后在主对话框点击OK。
![]() |
图 4 构造倾向评分匹配模型 Figure 4 Construction of propensity score matching model. |
本例中处理组个体数大于对照组(表 2)。
![]() |
表 2 样本匹配结果 Table 2 Sample Size of PS Matching |
输出结果“Overall balance test”中的P=0.999,显示covariates 框以及additional cocariates框中选入的变量在两组整体间均衡性较好。
3.3.3 匹配后的均衡性度量输出结果“Relative multivariate imbalance L1”中的L1 measure[13-14]统计量理论上介于0和1之间。和匹配前相比,匹配后的结果越小提示匹配效果越好,本例,匹配后的L1 统计量为0.769小于匹配前0.878,提示匹配优良。
3.3.4 显示匹配后不均衡的变量输出结果“Relative multivariate imbalance L1”中,若|d|>0.25提示变量存在不均衡性[15],并按|d|大小从上至下排序给出,若在SPSS的PS 自定义对话框选项中勾选including interaction,表格中还会给出这些变量间的交互项及二次项在处理组和对照组中的均数、对照组标准差、标准化均差等值。本例中,没有变量|d|>0.25,从而认为所有的变量在组间都均衡。
3.3.5 各个变量匹配前后的信息给出处理组、对照组匹配前后各变量的均值、对照组各变量的标准差、匹配前后标准化均数差的变化,见表 3。
![]() |
表 3 完整均衡性统计量 Table 3 Detailed blance statistics |
从图中可以大致推断匹配情况的好坏。在倾向评分1:n的情况下,图 5中每个点的大小表示权重[16]。本例,虽然处理组尚有较多未能匹配,但是获得匹配个体的倾向评分比较接近。因而匹配效果较好。
![]() |
图 5 评分分布图 Figure 5 Dotplot of individual young adults in either matched or unmatched groups. Graph was produced using routines from the MatchIt package. |
该图将匹配前后的绝对标准化差异描点,并连线来反映差异是增加还是减小,线段变粗表示差异增大,从图 6可知,大部分个体标准化差异减小,只有一个变量略有增加。
![]() |
图 6 标准化差异变化线图 Figure 6 Lineplot of standardized differences before and after matching. Graph was produced using routines of the MatchIt package. |
默认情况下被核密度函数[16]估计覆盖,可用来比较配比前后评分分布的相似度,并提供共同支撑域面积的估计,若匹配后处理组和对照分布近似,提示匹配良好。由图 7可见,匹配较好。
![]() |
图 7 PS分布直方图 Figure 7 Distribution of propensity scores of smoking(treated) and no smoking (control) before and after matching with overlaid kernel density estimate. Graph was produced using modified routines of the MatchIt package. |
被核密度函数覆盖,可用于比较匹配前后变量、交互项、二次项标准化差异变化大小,若匹配后的标准化差异集中在0 附近,提示不再存在系统差异。由图 8可知,匹配后,本例不再存在系统差异,匹配较好。
![]() |
图 8 SD分布直方图 Figure 8 Histograms with overlaid kernel density estimates of standardized differences before and after matching. |
给出各协变量匹配前后的标准化差异,若匹配后变量对应点落在0.0±0.25之间,则提示变量达到均衡。由图 9,可知匹配良好。
![]() |
图 9 单变量SD散点图 Figure 9 Dotplot of standardized mean differences for all covariates before and after matching. |
观测变量的矫正是数据分析中重要的一部分,因为混杂因素会对处理效应的估计造成影响。倾向评分配比提供了一种有效的解决混杂偏倚的办法,即通过匹配,使处理组和对照组间的不均衡性达到最小化甚至完全消除[4]。目前倾向评分的应用越来越流行,但并未在医学、心理学和社会学以及其他一些领域达到广泛应用,其中一个重要的原因就是缺少研究者都能普遍使用的软件,而SPSS以其点击式的操作和直观的结果一直为大多数研究人员所青睐,本文介绍了倾向评分模块在 SPSS 中的实现,并提供了详细的操作方法和结果解释。虽然该模块尚无法实现一些倾向评分的高级计算方法,但可满足大多数科研工作者的要求。也许在不久的将来,SPSS 新版本将会把PSM模块直接纳入软件中,并提供较为全面的计算方法。
[1] | 王永吉, 蔡宏伟, 夏结来, 等. 倾向指数第一讲倾向指数的基本概念和研究步骤[J]. 中华流行病学杂志,2010, 3 (31) : 3. |
[2] | 王永吉, 蔡宏伟, 夏结来, 等. 倾向指数第二讲倾向指数常用研究方法[J]. 中华流行病学杂志,2010, 5 (3l) : 5. |
[3] | 吴美京, 吴骋, 王睿, 等. 倾向性评分法中评分值的估计方法及比较[J]. 中国卫生统计,2013, 6 (30) : 3. |
[4] | Thoemmes F. Propensity score matching in SPSS[EB/OL]. http://arxiv.org/abs/1201.6385 |
[5] | 杨梅, 肖静, 沈毅, 等. 倾向评分法及其处理共线性数据的模拟研究[J]. 中国卫生统计,2013, 30 (6) : 824-8. |
[6] | 李智文, 任爱国. 倾向评分配比法[J]. 中国生育健康杂志,2010, 21 (2) : 121-3. |
[7] | 李智文, 李宏田, 张乐, 等. 用SPSS宏程序实现观察对象的倾向评分配比[J]. 中国卫生统计,2011, 27 (1) : 89-90. |
[8] | Austina PC. A comparison of 12 algorithms for matching on the propensity score[J]. Statist Med,2014, 33 : 1057-69. DOI: 10.1002/sim.6004. |
[9] | Stuart EA. Matching methods for causal inference: A review and a look forward[J]. Stat Sci,2010, 25 (1) : 1-21. DOI: 10.1214/09-STS313. |
[10] | Hansen BB, Klopfer SO. Optimal full matching and related designs via netowrk flow[J]. J Comp Graph Stat,2006, 15 : 609-27. DOI: 10.1198/106186006X137047. |
[11] | 王永吉, 蔡宏伟, 夏结来, 等. 倾向指数第三讲应用中的关键问题[J]. 中华流行病学杂志,2010, 7 (31) : 7. |
[12] | 孙振球, 徐勇勇. 医学统计学[M]. 北京: 人民卫生出版社, 2004 . |
[13] | Iacus MS, King G, Porro G. CEM: coarsened exact matching software[J]. J Stat Softw,2009, 30 : 1-27. |
[14] | Iacus SM, King G, Porro G. Causal inference without balance checking: coarsened exact matching[J]. Polit Anal,2011, 20 : 1-24. |
[15] | Hansen BB, Bowers J. Covariate balance in s imple, stratified and clustered comparative studie[J]. Stat Sci,2008, 23 : 219-36. DOI: 10.1214/08-STS254. |
[16] | Ho DE, Imai K, King G, et al. Matching as nonparametric preprocessing for reducing model dependence in parametric causal inference[J]. Polit Anal,2007, 15 : 199-236. |