北京字典价格联盟

纵向数据分析难吗?用线性潜发展模型!

只看楼主 收藏 回复
  • - -
楼主

前言 

空格在行为科学、社会学及医学研究中研究者常探讨干预前后某现象的变化情况,关心随着时间变化研究中某些指标的整体发展趋势、个体发展趋势及变化趋势的个体差异。与横断面资料相比,纵向研究可以合理地推断变量间的因果关系而受到研究者的青睐。纵向研究数据是指对研究对象进行长期追踪研究、重复测量个体有关变量所获得的数据,其特征包括但不局限于:(1)具有两类变异来源:研究对象个体内变异和研究对象个体间变异;(2)研究对象个体内观察值之间通常存在相关;(3)个体间变异可能会因时间的变化而变化;(4)纵向数据通常是非完整数据或非平衡数据,即重复测量的次数和测量的间隔时间可因个体而异。常用的方法主要有:重复测量的方差分析、多水平模型、潜发展模型 (Latent growth model, LGM) 等。目前国内对潜发展模型的介绍及应用较少,本文结合线性潜发展模型的原理及应用展开介绍。

 

方法介绍

空格潜发展模型应用中通常分析结局测量发展轨迹特征,例如,潜发展轨迹的形式(线性或非线性)、结局测量的初始水平与变化率的关联等,并能分析什么因素影响结局测量轨迹的变化。图1 是一个简单的线性潜发展模型,其中y0i,..., y5i是6个时间点 (t0,...,t5)的结局测量值,两个潜变量η0i与η1i分别为潜截距发展因子和潜斜率发展因子,代表第i个个体的结局测量发展轨迹信息。潜截距发展因子η0i表示不考虑协变量或协变量被中心化情况下,描述研究变量的初始水平,潜斜率发展因子η1i表示结局测量随时间的变化率,即个体轨迹的斜率。




空格我们将观察结局变量y0i,..., y5i看成两个潜发展因子的观察标识。潜截距发展因子η0i的因子载荷全部固定为1.0,潜斜率发展因子η1i的因子载荷称为时间分值。时间分值有三个作用:(1)时间分值决定结局测量发展过程的形式(如线性或非线性)。如果某线性发展轨迹观察时点的间隔相等,模型在时点t0,...,t5的时间分值可设定为 (0,1,2,3,4,5)。(2)时间分值定义结局测量发展过程的时间定点,即一个时间参照点。如果我们设定时间分值在基线调查点t0为0,则意味着将基线调查点定义为整个发展过程的定点或参照点。(3)时间分值定义发展因子的尺度。时间分值尺度通常与观察时间尺度相匹配。时间分值一般根据假设的发展轨迹模式来设定。当重复测量结局测量的时间间隔不等时,可以根据与观察时间点像匹配的原则来设定时间分值。假设y0,..., y5是基线以及第1,2,3,4个月和第6个月的测量数据,对于线性发展模型,时间分值应设定为 (0,1,2,3,4,6) ,而不是 (0,1,2,3,4,5)。在这样的时间分值设定下,斜率发展因子表示相对于单位观察时间变化(如从时间点tk到tk+1)的结局测量变化量。我们也可以通过模型来估计时间分值,让结局测量的发展轨迹由数据决定。在此情况下,时间分值的量度将有别于观察时间量度。

空格线性潜发展模型可以看作为多层模型在结构方程模型框架中的应用。因此上述模型用方程表示如下:




空格其中,式(1)是研究对象个体内模型,yti是模型第i 个个体在时间点t的观察结局测量;两个潜发展因子η0iη1i是随机系数;λt是时间分值。残差项εti是一个在时点t的复合误差项,表示随机测量误差,和第i个个体的特定时间效应。式(2)和式(3)是研究对象个体间模型,其中η0iη1i因变量。η0代表模型估计的结局测量的平均初始水平;η1代表模型估计的结局测量的平均变化率。ζ0i和ζ1i为误差项,表示有关结局测量发展轨迹的研究对象个体间变异。

空格将式(2)、(3)代入式(1),将研究对象个体内与个体间模型整合成一个混合模型:




空格观察的重复结局测量yti由发展轨迹的固定成分η0+λt·η1和随机成分ζ0i+λt·ζ1i+εti构成。固定成分是在特点时点t的结局测量的预测值。发展轨迹的变异可分为研究对象个体内变异和个体间变异,由变异的3个非观察来源表示:ζ0i表示研究对象个体间的结局测量初始水平变异;λt·ζ1i表示研究对象个体间的结局测量变化率变异;εti表示研究对象个体内的重复结局测量随机变异。发展轨迹的随机成分代表或反映个体内和个体间的随机变异。ζ0i和ζ1i之间的协方差反映结局测量初始水平与结局测量变化率间的关系。

 

实例分析

空格20世纪90年代中期美国俄亥俄州关于吸食者(N=430)的健康研究样本,该项目运用疾病自然史研究设计,研究毒品滥用、健康状况、卫生服务利用情况,以及随时间变化的毒品使用和健康状况变化轨迹的关系。研究中男性262名,女性168名,大部分为黑人(61.9%),60%以上具有高中或大学学历,平均年龄为37.3岁。

空格本例结局变量为抑郁状态,用贝克抑郁问卷(Beck Depression Inventory, BDI) 评估。所有21个BDI条目应答分值总和即为BDI分值。本研究对BDI分值进行了6次测量(y0i,..., y5i),分别为基线测量和每隔6个月进行一个的追踪观察。测量所获得数据用于吸食者30个月观测期内抑郁情况发展轨迹的模型分析。(本例构建的为非条件线性潜发展模型,即不考虑协变量影响的线性潜发展模型)

 

MPLUS程序

TITLE: Unconditional Linear Latent Growth Model (LGM)

DATA: FILE = Crack_BDI.dat; /*读入数据*/

VARIABLE: NAMES = Ethnic Gender Age Educ z0-z5 y0-y5; /*数据集中包含的变量*/

MISSING = ALL (-9); /*缺失值编码为-9*/

USEVAR = y0-y5; /*建模使用的变量*/

ANALYSIS: ESTIMATOR = MLR; /*稳健估计法*/

MODEL: eta0 eta1 | y0@0 y1@1 y2@2 y3@3 y4@4 y5@5; /*eta0 eta1分别为潜截距发展因子η0i和潜斜率发展因子η1i,“|”右边为设定发展模型的重复结局测量值和时间分值*/

OUTPUT: SAMPSTAT TECH1 TECH3; /* SAMPSTAT:输出样本统计量;TECH1:提供参数设置和所有自由估计参数开始值等信息;TECH3:提供估计的协方差和相关*/

PLOT: TYPE = PLOT3; /*绘制线性潜发展模型的发展曲线图*/

Series = y0-y5(*);


结果报告

 

Tabe1. Fit information of latent growth model

Indexes

Results

Chi-Square Test of Model fit


    Values

786.270

    Degrees of Freedom

15

    P-Value

0.0000

RMSEA


    Estimate

0.070

    90% C.I.

(0.049, 0.093)

    Probability RMSEA <=.05

0.058

CFI/TLI


    CFI

0.956

    TLI

0.959

SRMR

0.072


空格模型拟合数据显示,模型拟合良好,CFI、TLI均大于0.95,RMSEA小于0.08,精确拟合检验不显著 (p=0.058),SRMR小于0.08。


Table2. Model results

Indexes

Estimate

S.E.

P-Value

Means




    ETA0

17.524

0.503

<0.001

    ETA1

-1.007

0.099

<0.001

Variance




    ETA0

69.756

6.794

<0.001

    ETA1

1.003

0.348

0.004

Covariance




    ETA1 & ETA0

-1.156

1.217

0.342


空格模型结果显示截距发展因子的估计均值为ETA0=17.52,说明基线调查时吸食者的BDI分值平均为17.52;斜率发展因子的估计均值为ETA1=-1.01 (p<0.001),说明的从到的BDI分值下降统计显著。ETA0与ETA1间的协方差为1.156 (p<0.342),统计不显著,说明结局测量的变化率与结局测量在基线时初始水平无显著相关。但是,ETA0与ETA1的方差均统计显著,说明结局测量初始水平和结局测量随时间的变化率在个体间有显著不同。图2 显示样本结局测量均值及模型估计的结局测量均值随时间变化的轨迹。

  

图2 线性潜发展模型

 

讨论

空格潜发展模型是分析纵向数据的新统计分析技术,它是线性结构方程模型的一个变体,可以从个体和组的水平分析数据,既考虑因子的均值也考虑其方差。潜发展模型可以检验线性、非线性增长函数,选择合适的因子载荷有助于两因子以更好地拟合数据的发展轨迹。与对横断面数据进行建模的结构方程模型类似,潜发展模型可以对不同的发展趋势进行比较,与其他统计模型有相似之处,建模时我们往往先检查数据中缺失值的模式,及可能的异常值,先拟合最简单的模型(如上述非条件线性潜发展模型),随着分析的深入逐步增加模型的复杂性,以构建较优的模型。由于潜发展模型是基于结构方程模型的理论,所以具有结构方程模型的优点,可以分析变量间直接和间接的因果关系,也可以方便分析纵向测量资料中潜变量间的关系,这一点与多水平模型所不具有的。其另一个优点是不仅可以容纳不随时间进展而变化的固定协变量(例如:性别、种族等),还可以分析随时间变化的时变协变量(例如:吸食频率等),以探讨协变量对发展轨迹的影响。但潜发展模型也有其局限性,例如要求相对较大的样本量。

空格目前进行潜变量建模使用的软件主要有EQS、LISREL、AMOS、MPLUS等。MPLUS软件在潜变量建模时同时具备LISREL的原理清晰和AMOS简便易用两个优点,而且MPLUS软件可以通过简洁的语句分别定义测量模型和结构模型,根据不同数据类型,程序自行选择适合的参数估计方法。

空格请大家批评指正!欢迎交流与学习!谢谢!

 

参考文献:

1. 李丽霞, 郜艳晖, 张敏等. 潜变量增长曲线模型及其应用. 中国卫生统计, 2012, 29 (5): 713-716.

2. 王济川, 王小倩, 姜宝法等. 结构方程模型: 方法与应用. 北京: 高等教育出版社, 2011.5

3. 王孟成. 潜变量建模与MPLUS应用.基础篇. 重庆: 重庆大学出版社, 2014.1


感谢曾澄波的撰稿!



欢迎关注【统计咨询】微信公众号!


举报 | 1楼 回复

友情链接