GLM/MLM/CMLM

发布时间 2023-06-20 23:56:01作者: 黑逍逍

GLM(Generalized Linear Model)、MLM(Mixed Linear Model)和CMLM(Compressed Mixed Linear Model)都是统计模型,常用于基因组关联分析(Genome-Wide Association Study,GWAS)中。

  1. GLM(Generalized Linear Model):广义线性模型是一种常见的线性回归模型扩展,用于分析因变量与一个或多个自变量之间的关系。在GWAS中,GLM常用于进行单一SNP的关联分析,即将每个SNP作为一个独立的解释变量与表型进行关联。

  2. MLM(Mixed Linear Model):混合线性模型是在GWAS中用于控制种族结构和家族关系等潜在的混杂效应的常用方法。MLM通过引入随机效应(例如,基因型矩阵的协方差结构)来捕捉样本之间的相关性,以降低虚假关联(false positives)的产生。MLM适用于复杂的人群结构和家族相关性的GWAS分析。

  3. CMLM(Compressed Mixed Linear Model):压缩混合线性模型是MLM的一种改进方法,旨在降低计算复杂度和内存需求,尤其适用于大规模基因组关联分析。CMLM通过压缩基因型数据和相关矩阵,从而在保持准确性的同时减少计算成本。

这些模型都是用于探索基因型与表型之间的关联,以寻找与表型特征相关的基因变异。选择适当的模型取决于研究的目标、样本设计、数据结构和可能存在的混杂效应等因素。