• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

遗传关联研究中线性混合模型的渐近精确拟合。

Asymptotically exact fit for linear mixed model in genetic association studies.

机构信息

Framingham Heart Study, 73 Mt. Wayte, Framingham, MA 01702, USA.

Population Sciences Branch, National Heart, Lung, and Blood Institute, 31 Center Drive, Bethesda, DC 20892, USA.

出版信息

Genetics. 2024 Oct 7;228(2). doi: 10.1093/genetics/iyae143.

DOI:10.1093/genetics/iyae143
PMID:39212459
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC11639154/
Abstract

The linear mixed model (LMM) has become a standard in genetic association studies to account for population stratification and relatedness in the samples to reduce false positives. Much recent progresses in LMM focused on approximate computations. Exact methods remained computationally demanding and without theoretical assurance. The computation is particularly challenging for multiomics studies where tens of thousands of phenotypes are tested for association with millions of genetic markers. We present IDUL and IDUL† that use iterative dispersion updates to fit LMMs, where IDUL† is a modified version of IDUL that guarantees likelihood increase between updates. Practically, IDUL and IDUL† produced identical results, both are markedly more efficient than the state-of-the-art Newton-Raphson method, and in particular, both are highly efficient for additional phenotypes, making them ideal to study genetic determinants of multiomics phenotypes. Theoretically, the LMM likelihood is asymptotically unimodal, and therefore the gradient ascent algorithm IDUL† is asymptotically exact. A software package implementing IDUL and IDUL† for genetic association studies is freely available at https://github.com/haplotype/IDUL.

摘要

线性混合模型 (LMM) 已成为遗传关联研究中的标准方法,用于解释样本中的群体分层和相关性,以减少假阳性。最近,LMM 的许多进展都集中在近似计算上。精确方法仍然需要大量的计算资源,并且没有理论保证。对于多组学研究,计算特别具有挑战性,因为要测试数以万计的表型与数百万个遗传标记的关联。我们提出了 IDUL 和 IDUL†,它们使用迭代分散更新来拟合 LMM,其中 IDUL†是 IDUL 的修改版本,保证了更新之间的似然增加。实际上,IDUL 和 IDUL†产生了相同的结果,两者都明显比最先进的牛顿-拉普森方法效率更高,特别是对于额外的表型,它们的效率非常高,这使得它们成为研究多组学表型的遗传决定因素的理想方法。从理论上讲,LMM 的似然是渐近单峰的,因此梯度上升算法 IDUL†是渐近精确的。用于遗传关联研究的实现 IDUL 和 IDUL†的软件包可在 https://github.com/haplotype/IDUL 上免费获得。

相似文献

1
Asymptotically exact fit for linear mixed model in genetic association studies.遗传关联研究中线性混合模型的渐近精确拟合。
Genetics. 2024 Oct 7;228(2). doi: 10.1093/genetics/iyae143.
2
Matrix sketching framework for linear mixed models in association studies.矩阵素描框架在关联研究中的线性混合模型。
Genome Res. 2024 Oct 11;34(9):1304-1311. doi: 10.1101/gr.279230.124.
3
Efficient penalized generalized linear mixed models for variable selection and genetic risk prediction in high-dimensional data.高效惩罚广义线性混合模型在高维数据中的变量选择和遗传风险预测。
Bioinformatics. 2023 Feb 3;39(2). doi: 10.1093/bioinformatics/btad063.
4
lme4qtl: linear mixed models with flexible covariance structure for genetic studies of related individuals.lme4qtl:用于相关个体遗传研究的具有灵活协方差结构的线性混合效应模型。
BMC Bioinformatics. 2018 Feb 27;19(1):68. doi: 10.1186/s12859-018-2057-x.
5
Simultaneous SNP selection and adjustment for population structure in high dimensional prediction models.高维预测模型中同时进行 SNP 选择和群体结构调整。
PLoS Genet. 2020 May 4;16(5):e1008766. doi: 10.1371/journal.pgen.1008766. eCollection 2020 May.
6
Multikernel linear mixed models for complex phenotype prediction.用于复杂表型预测的多核线性混合模型。
Genome Res. 2016 Jul;26(7):969-79. doi: 10.1101/gr.201996.115. Epub 2016 Jun 14.
7
Hybrid of Restricted and Penalized Maximum Likelihood Method for Efficient Genome-Wide Association Study.基于受限极大似然和惩罚极大似然法的高效全基因组关联研究混合方法
Genes (Basel). 2020 Oct 29;11(11):1286. doi: 10.3390/genes11111286.
8
Genome-wide efficient mixed-model analysis for association studies.全基因组高效混合模型关联分析。
Nat Genet. 2012 Jun 17;44(7):821-4. doi: 10.1038/ng.2310.
9
Further improvements to linear mixed models for genome-wide association studies.全基因组关联研究线性混合模型的进一步改进。
Sci Rep. 2014 Nov 12;4:6874. doi: 10.1038/srep06874.
10
FlexLMM: a Nextflow linear mixed model framework for GWAS.FlexLMM:一种用于全基因组关联研究的Nextflow线性混合模型框架。
Bioinformatics. 2024 Dec 26;41(1). doi: 10.1093/bioinformatics/btaf021.

引用本文的文献

1
Reflection Knockoffs via Householder Reflection: Applications in Proteomics and Genetic Fine Mapping.通过豪斯霍尔德反射实现的反射仿冒品:在蛋白质组学和基因精细定位中的应用
bioRxiv. 2025 May 29:2025.01.16.633369. doi: 10.1101/2025.01.16.633369.
2
Abundant Parent-of-origin Effect eQTL: The Framingham Heart Study.丰富的亲本来源效应表达数量性状基因座:弗雷明汉心脏研究。
bioRxiv. 2025 Jun 4:2024.06.05.597677. doi: 10.1101/2024.06.05.597677.

本文引用的文献

1
Estimation of inbreeding and kinship coefficients via latent identity-by-descent states.基于潜在的亲缘关系状态估计近亲系数和亲缘系数。
Bioinformatics. 2024 Feb 1;40(2). doi: 10.1093/bioinformatics/btae082.
2
Computationally efficient whole-genome regression for quantitative and binary traits.计算效率高的全基因组回归分析用于定量和二项性状。
Nat Genet. 2021 Jul;53(7):1097-1103. doi: 10.1038/s41588-021-00870-7. Epub 2021 May 20.
3
Sequencing of 53,831 diverse genomes from the NHLBI TOPMed Program.美国国立卫生研究院生物医学高级研究与发展局(NHLBI)TOPMed 项目中对 53831 个不同基因组进行测序。
Nature. 2021 Feb;590(7845):290-299. doi: 10.1038/s41586-021-03205-y. Epub 2021 Feb 10.
4
A resource-efficient tool for mixed model association analysis of large-scale data.一种资源高效的工具,用于大规模数据的混合模型关联分析。
Nat Genet. 2019 Dec;51(12):1749-1755. doi: 10.1038/s41588-019-0530-8. Epub 2019 Nov 25.
5
Fast Model-Fitting of Bayesian Variable Selection Regression Using the Iterative Complex Factorization Algorithm.使用迭代复因子分解算法对贝叶斯变量选择回归进行快速模型拟合
Bayesian Anal. 2019 Jun;14(2):573-594. doi: 10.1214/18-BA1120. Epub 2018 Aug 29.
6
Parent-of-origin effects on quantitative phenotypes in a large Hutterite pedigree.大胡特尔特家族系谱中数量表型的亲本来源效应。
Commun Biol. 2019 Jan 18;2:28. doi: 10.1038/s42003-018-0267-4. eCollection 2019.
7
Protein Biomarkers of Cardiovascular Disease and Mortality in the Community.社区人群中心血管疾病和死亡的蛋白质生物标志物。
J Am Heart Assoc. 2018 Jul 13;7(14):e008108. doi: 10.1161/JAHA.117.008108.
8
Fast and efficient QTL mapper for thousands of molecular phenotypes.适用于数千种分子表型的快速高效QTL定位器。
Bioinformatics. 2016 May 15;32(10):1479-85. doi: 10.1093/bioinformatics/btv722. Epub 2015 Dec 26.
9
A global reference for human genetic variation.人类遗传变异的全球参考。
Nature. 2015 Oct 1;526(7571):68-74. doi: 10.1038/nature15393.
10
UK biobank: an open access resource for identifying the causes of a wide range of complex diseases of middle and old age.英国生物银行:一个用于识别多种中老年复杂疾病病因的开放获取资源。
PLoS Med. 2015 Mar 31;12(3):e1001779. doi: 10.1371/journal.pmed.1001779. eCollection 2015 Mar.