前言
在医学研究领域,有许多随时间变化的变量,它们遵循不同变化过程。传统分析发展轨迹的典型方法有分层建模及潜在曲线分析,它们通过连续分布函数对发展轨迹进行建模,得到变量的总体平均轨迹并揭示预测因素与个体关于平均轨迹变化之间的联系,但它们难以处理总体内包含不同发展轨迹的情形,而基于群组轨迹模型能够识别总体中不同的发展轨迹,研究轨迹与预测因素或结果间的联系。本期博士论坛由梅永霞博士作为主讲人,介绍了群组轨迹模型的基本原理及步骤,并在此基础上对该模型的具体应用进行讲述。
内容
一、背景介绍
梅永霞博士指出随着纵向设计研究越来越多,其分析方法也越来越丰富,以往潜变量增长曲线模型与多层线性模型在关注总体平均发展趋势外,还注重个体发展趋势差异,但仍假设研究样本存在相同的发展轨迹。近年来,研究者们发现个体间的发展轨迹可能存在差异,可将群体划分为不同的轨迹组,亚组间发展轨迹有所不同。
二、模型简介
群组轨迹模型主要用于研究群体异质性,旨在识别群体内遵循不同发展轨迹的亚组,并描绘亚组成员的发展轨迹曲线。该模型最早应用于犯罪学领域。Nagin等应用非参混合泊松模型对犯罪生涯进行建模,并对模型进行了改进,进而成为群组轨迹模型。梅永霞博士进一步讲解到,群组轨迹模型多适用于处理纵向数据,可以用于识别某一变量在不同时间点的亚组轨迹,探讨多变量轨迹之间的关系并且可将干预作为预测变量。此外,梅永霞博士对群组轨迹的成分进行了讲解,其包含每组的预测轨迹及总体中随机选择的成员属于每个组的概率两个基本成分。三、步骤流程
介绍该模型基本原理后,梅永霞博士结合相关高质量文献,对模型的步骤流程进行了详细讲解,主要包括三个步骤,即探索最优组数、选择最优多项式、模型评价。在此基础上,梅永霞博士分别从模型选择、模型分组、模型诊断指标等角度对其应用步骤的注意事项进行了总结,使得论坛中的各位学者对该模型的应用及内涵有了更深入的理解。四、应用举例
近年来,轨迹模型在医学领域的应用不断增多,包括探索总体中可能存在的亚组、按基线指标分层研究分组与结果间的联系、揭示分组与基线协变量及预后结果之间的关联、研究协变量与分组对结果影响的交互作用等,梅永霞博士结合多篇高质量的文献对群组轨迹模型的应用现状进行了细致讲解。五、软件应用
群组轨迹模型的分析可以通过SAS、Stata、R等多种统计软件实现,梅永霞博士以Stata软件为例,介绍了群组轨迹模型的具体操作过程。梅永霞博士进一步讲解到,在探索最优组数时,应从小的组数开始,逐渐增加;可结合专业知识和理论依据指定组数或多项式阶数,最终模型应在充分呈现数据特征的同时兼具简洁性;多项式函数应逐渐降低阶数,得出最优多项式函数。论坛的最后,梅永霞博士对群组轨迹模型的的优势与不足进行了总结。基于群组轨迹模型对纵向数据处理的优势,目前正在医学领域得到广泛的应用,相比传统数据处理方法,它可以从纵向数据中识别出不同的发展轨迹进而为临床诊疗提供参考,因此对模型理论体系及其应用进行深入探索非常有意义。然而,基于群组轨迹模型在应用中仍然存在包括缺乏统一的最优判断标准、模型结果报告的可用指南较少、对缺失数据的处理方法不够成熟等问题。此外,模型扩展形式,如多轨迹模型,在选择组数时操作复杂且缺少客观标准,尚需深入研究。
研讨环节
Q1
在研究中倾向使用那种方法处理缺失值?
A1
首先要明确缺失情况,如果缺失特别严重,达不到四个时间点的情况,我们倾向将不满足四个时间点的数据剔除。
Q2
群组轨迹模型与潜类别增长模型有什么区别?
A2
两个方法之间的差异尚存争议,有学者认为潜类别增长模型是群组轨迹模型的特殊情况。
Q3
应用群组轨迹模型时,样本量有什么要求?
A3
样本量在200例以上模型会更加稳定,当样本量达不到要求时,每组占比大于总样本量的5%也可以尝试。
参考文献
[1] DALRYMPLE K V, VOGEL C, GODFREY K M, et al. Evaluation and interpretation of latent class modelling strategies to characterise dietary trajectories across early life: A longitudinal study from the Southampton Women’s Survey[J]. Br J Nutr, 2022: 1-29.
[2] SERRA ERSON K,et al.Trajectory analyses in insurance medicine studies: Examples and key methodological aspects and pitfalls[J]. PLoS One, 2022,17(2):72-82.
[3] 陈平, 郭怡, 吴一波, 等. 2型糖尿病患者用药依从性轨迹及其影响因素[J]. 中国医院药学杂志, 2022, 42(08): 769-773.
[4] 张晨旭, 谢峰, 林振, 等. 基于组轨迹模型及其研究进展[J]. 中国卫生统计, 2020,37(06): 946-949.
[5] 陈新, 王元银, 孙晓瑜, 等. 基于群组轨迹模型的含糖饮料摄入模式与儿童牙周健康关联的队列研究[J]. 中华流行病学杂志, 2020,41(08):1308-1312.
[6] NAGIN DS, JONES BL, PASSOS VL,et al. Group-based multi-trajectory modeling[J]. Stat Methods Med Res, 2018,27(7): 2015-2023.
[7] 吕浥尘, 赵然. 群组发展模型——干预研究的新方法[J]. 心理学探新, 2018,38(01): 91-96.
[8] KUO L M, HUANG H L, LIANG J, et al.A randomized controlled trial of a home-based training programme to decrease depression in family caregivers of persons with dementia [J]. J Adv Nurs,2017,73 (3): 585-598.
本文荟萃自,只做学术交流学习使用,不做为临床指导,本文观点不代表数字日志立场。