?p=22206

最近我们被客户要求撰写关于潜类别混合效应模型（LCMM）的研究报告，包括一些图形和统计输出。

每一个动态现象都可以用一个潜过程(Λ(t)来描述，这个潜过程在连续的时间t内演化。

模型背景

当对重复测量的标志变量进行建模时，我们通常不会把它看成是一个有误差测量的潜过程。然而，这正是混合模型理论所做的基本假设。潜过程混合模型利用这个框架将线性混合模型理论扩展到任何类型的结果（有序、二元、连续、类别与任何分布）。

潜类别混合模型

潜类别混合模型在Proust-Lima等人中介绍（2006 https://doi.org/10.1111/j.1541-0420.2006.00573.x 和2013 https://doi.org/10.1111/bmsp.12000 ）。

使用线性混合模型根据时间对定义为潜过程感兴趣的变量进行建模：

其中：

X（t）和Z（t）是协变量的向量（Z（t）；
β 是固定效应（即总体均值效应）；
ui 是随机效应（即个体效应）；它们根据具有协方差矩阵B 的零均值多元正态分布进行分布；
（wi（t））是高斯过程，可以添加到模型中以来放宽对象内部相关结构。

同时在观察方程中定义了感兴趣的潜过程标志变量Yij （针对对象i和场合j）的观察之间的关系：

其中

tij 是主题i 和场合j 的测量时间；
ϵij 是一个独立的零均值高斯误差；
H 是链接函数，可将潜过程转换为比例和度量。

使用了不同的参数族。当标志变量为连续时，H-1 是递增单调函数的参数族，其中：

线性变换：这简化为线性混合模型（2个参数）
Beta累积分布族重新调整（4个参数）

当标志变量是离散类别（二元或有序的）时： H是阈值函数，即Y的每个级别对应于要估计Λ（tij）+ ϵij区间的边界。

可识别性

与任何潜变量模型一样，必须定义潜变量的度量。在lcmm中，误差的方差为1，平均截距（在β中）为0。

示例

在本文中，lcmm 通过研究年龄65岁左右男性的抑郁症状（由CES-D量表测量）的线性轨迹来说明潜过程混合模型。包括截距和age65的相关随机效应。

考虑的模型：

，

固定效应部分 是

估计不同连续链接函数的模型H

我们使用65岁左右的年龄变量进行中心化，并以十年为单位。
潜过程混合模型可以用不同的链接函数进行拟合，如下所示。这是用参数链接来完成的。

线性链接函数

定义线性链接函数时，模型将简化为标准线性混合模型。默认情况下具有线性链接函数：

lcmm(CESD ~ age65*male, random=~ age65 #链接=线性

它与hlme安装的模型完全相同。与hlme对象的唯一区别是截距和残差标准误差的参数化。

hlme(CESD ~ age65*male, random=~ age65 #链接=线性

对数似然相同，但估计参数β不在同一范围内

loglik
[1] -7056.652

非线性链接函数1：Beta累积分布函数Beta分布的重标累积分布函数(CDF)提供了标志变量与其基本潜伏过程之间的凹、凸或sigmoïd变换。

lcmm( random=~ age65, link='beta')

非线性链接函数2：二次I样条二次I样条族近似于连续增加的链接函数。它涉及在标志变量范围内分布的节点。默认情况下，使用位于标志变量范围内的5个等距结：

lcmm(random=~ age65, subject='ID', link='splines')

可以指定结的数量及其位置。首先输入节点的数目，接着，再指定位置 equi， quant 或 manual 用于分别等距节点，在标志变量分布分位数或内部结在参数intnodes手动输入。例如， 7-equi-splines 意味着具有7个等距节点，6-quant-splines I样条，意味着具有6个节点的I样条，其位于标志变量分布的分位数处。

例如，在分位数处有5个结：

lcmm(link='5-quant-splines')

选择最佳模型

要选择最合适的链接函数，可以比较这些不同的模型。通常，这可以通过使用AIC 或 UACV等顺着根据拟合优度对模型进行比较来实现。

AIC（每个模型的输出中都有UACV）：

在这种情况下，根据AIC标准，由I-splines和5个分位数结点链接函数的模型提供了最佳拟合度。可以在图中比较不同的估计链接函数：

plot(mli, which="linkfunction",xlab="潜过程")
legend(x="topleft", legend=c("线性", "beta","样条曲线 (5个等距结点)","样条曲线(5个分位数结点)"))

点击标题查阅往期内容

R语言线性混合效应模型（固定效应&随机效应）和交互可视化3案例

左右滑动查看更多

我们看到2个样条曲线转换非常接近。线性模型似乎不合适，如线性曲线和样条曲线之间的差值所示。Beta转换仅在潜过程的高值时才与样条曲线不同。变换的置信带可以通过蒙特卡洛方法获得：

predict(mspl5q,ndraws=2000)
legend(legend=c("95% 置信带","分位数样条"),lty=c(2,NA))

用离散链接函数H估计模型

有时，对于仅具有有限数量级别的标志变量，连续链接函数不合适，并且必须处理标志变量的有序性质。lcmm函数通过考虑阈值链接函数来处理这种情况。然而，我们必须知道，带有阈值链接函数的模型的数值复杂性要重要得多（由于对随机效应分布进行了数值积分）。在拟合这个模型时，必须牢记这一点，随机效应的数量要严谨地选择。

注意，该模型成为累积概率混合模型。这里是一个使用HIER变量(4级)的例子，因为考虑到0-52的范围(例如52个阈值参数)，CESD的阈值链接函数会涉及太多参数。

 lcmm(HIER ~ age65*male, link='thresholds')

拟合后的输出

概要

该模型的摘要包括收敛性，拟合标准的优度和估计的参数。

根据协变量的分布预测的轨迹图，可以根据因变量的比例并根据协变量的分布来计算预测的轨迹：

predict(msp, newdata=datnew, var.time="age"

然后绘制：

plot(women,xlab="年龄")
plot(men, add=TRUE)
legend(legend=c("女性","男性", "95% 置信区间", "95% 置信区间"))

拟合优度1：残差图

特定的残差（右下方面板中的qqplot）应为高斯分布。

拟合优度2：预测与观察图

可以根据年龄绘制平均预测和观察值。请注意，预测和观察是在潜过程的范围内（观察是通过估计的链接函数进行转换的）：

plot( var.time="age65", xlab="(年龄-65)/10", break.times=8, ylab="潜过程")

点击文末 “阅读原文”

获取全文完整代码数据资料。

点击标题查阅往期内容

R语言线性混合效应模型（固定效应&随机效应）和交互可视化3案例
 非线性混合效应 NLME模型对抗哮喘药物茶碱动力学研究
 生态学模拟对广义线性混合模型GLMM进行功率（功效、效能、效力）分析power analysis环境监测数据
 有限混合模型聚类FMM、广义线性回归模型GLM混合应用分析威士忌市场和研究专利申请数据
 如何用潜类别混合效应模型(Latent Class Mixed Model ,LCMM)分析老年痴呆年龄数据
 R语言用lme4多层次（混合效应）广义线性模型（GLM），逻辑回归分析教育留级调查数据 R语言线性混合效应模型实战案例
 R语言混合效应逻辑回归（mixed effects logistic）模型分析肺癌数据
 R语言如何用潜类别混合效应模型（LCMM）分析抑郁症状
 R语言基于copula的贝叶斯分层混合模型的诊断准确性研究
 R语言建立和可视化混合效应模型mixed effect model
R语言LME4混合效应模型研究教师的受欢迎程度
 R语言线性混合效应模型实战案例
 R语言用Rshiny探索lme4广义线性混合模型（GLMM）和线性混合模型（LMM）
R语言基于copula的贝叶斯分层混合模型的诊断准确性研究
 R语言如何解决线性混合模型中畸形拟合(Singular fit)的问题
 基于R语言的lmer混合线性回归模型
 R语言用WinBUGS 软件对学术能力测验建立层次（分层）贝叶斯模型
 R语言分层线性模型案例
 R语言用WinBUGS 软件对学术能力测验（SAT）建立分层模型
 使用SAS，Stata，HLM，R，SPSS和Mplus的分层线性模型HLM
R语言用WinBUGS 软件对学术能力测验建立层次（分层）贝叶斯模型
 SPSS中的多层（等级）线性模型Multilevel linear models研究整容手术数据
 用SPSS估计HLM多层（层次）线性模型模型

526互联

R语言如何用潜类别混合效应模型（LCMM）分析抑郁症状|附代码数据