• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

逻辑正态多项模型的可扩展估计与正则化

Scalable estimation and regularization for the logistic normal multinomial model.

作者信息

Zhang Jingru, Lin Wei

机构信息

Center for Statistical Science, School of Mathematical Sciences, Peking University, Beijing, China.

出版信息

Biometrics. 2019 Dec;75(4):1098-1108. doi: 10.1111/biom.13071. Epub 2019 Apr 29.

DOI:10.1111/biom.13071
PMID:31009062
Abstract

Clustered multinomial data are prevalent in a variety of applications such as microbiome studies, where metagenomic sequencing data are summarized as multinomial counts for a large number of bacterial taxa per subject. Count normalization with ad hoc zero adjustment tends to result in poor estimates of abundances for taxa with zero or small counts. To account for heterogeneity and overdispersion in such data, we suggest using the logistic normal multinomial (LNM) model with an arbitrary correlation structure to simultaneously estimate the taxa compositions by borrowing information across subjects. We overcome the computational difficulties in high dimensions by developing a stochastic approximation EM algorithm with Hamiltonian Monte Carlo sampling for scalable parameter estimation in the LNM model. The ill-conditioning problem due to unstructured covariance is further mitigated by a covariance-regularized estimator with a condition number constraint. The advantages of the proposed methods are illustrated through simulations and an application to human gut microbiome data.

摘要

聚类多项数据在多种应用中普遍存在,例如微生物组研究,其中宏基因组测序数据被汇总为每个受试者大量细菌类群的多项计数。采用临时零调整的计数归一化往往会导致对计数为零或较小的类群丰度估计不佳。为了考虑此类数据中的异质性和过度离散,我们建议使用具有任意相关结构的逻辑正态多项(LNM)模型,通过跨受试者借用信息来同时估计类群组成。我们通过开发一种带有哈密顿蒙特卡罗采样的随机近似期望最大化(EM)算法来克服高维计算困难,以在LNM模型中进行可扩展的参数估计。具有条件数约束的协方差正则化估计器进一步缓解了由于无结构协方差导致的病态问题。通过模拟和对人类肠道微生物组数据的应用说明了所提出方法的优点。

相似文献

1
Scalable estimation and regularization for the logistic normal multinomial model.逻辑正态多项模型的可扩展估计与正则化
Biometrics. 2019 Dec;75(4):1098-1108. doi: 10.1111/biom.13071. Epub 2019 Apr 29.
2
A logistic normal multinomial regression model for microbiome compositional data analysis.用于微生物组组成数据分析的逻辑正态多项回归模型。
Biometrics. 2013 Dec;69(4):1053-63. doi: 10.1111/biom.12079. Epub 2013 Oct 15.
3
LOCOM: A logistic regression model for testing differential abundance in compositional microbiome data with false discovery rate control.LOCOM:一种用于检验微生物组数据中丰度差异的逻辑回归模型,具有错误发现率控制。
Proc Natl Acad Sci U S A. 2022 Jul 26;119(30):e2122788119. doi: 10.1073/pnas.2122788119. Epub 2022 Jul 22.
4
Prediction analysis for microbiome sequencing data.微生物组测序数据的预测分析。
Biometrics. 2019 Sep;75(3):875-884. doi: 10.1111/biom.13061. Epub 2019 Apr 17.
5
A model for paired-multinomial data and its application to analysis of data on a taxonomic tree.一种配对多项数据模型及其在分类树数据分析中的应用。
Biometrics. 2017 Dec;73(4):1266-1278. doi: 10.1111/biom.12681. Epub 2017 Mar 30.
6
Clustering microbiome data using mixtures of logistic normal multinomial models.使用逻辑正态多项混合模型对微生物组数据进行聚类。
Sci Rep. 2023 Sep 7;13(1):14758. doi: 10.1038/s41598-023-41318-8.
7
Dirichlet-multinomial modelling outperforms alternatives for analysis of microbiome and other ecological count data.狄利克雷-多项模型在分析微生物组和其他生态计数数据方面优于其他替代方法。
Mol Ecol Resour. 2020 Mar;20(2):481-497. doi: 10.1111/1755-0998.13128. Epub 2020 Jan 29.
8
Bayesian compositional models for ordinal response.贝叶斯有序响应组合模型。
Stat Methods Med Res. 2024 Jun;33(6):1043-1054. doi: 10.1177/09622802241247730. Epub 2024 Apr 23.
9
An empirical Bayes approach to normalization and differential abundance testing for microbiome data.一种针对微生物组数据的标准化和差异丰度检验的经验贝叶斯方法。
BMC Bioinformatics. 2020 Jun 3;21(1):225. doi: 10.1186/s12859-020-03552-z.
10
VARIABLE SELECTION FOR SPARSE DIRICHLET-MULTINOMIAL REGRESSION WITH AN APPLICATION TO MICROBIOME DATA ANALYSIS.用于稀疏狄利克雷-多项回归的变量选择及其在微生物组数据分析中的应用
Ann Appl Stat. 2013 Mar 1;7(1). doi: 10.1214/12-AOAS592.

引用本文的文献

1
A New Dirichlet-Multinomial Mixture Regression Model for the Analysis of Microbiome Data.一种用于微生物组数据分析的新型狄利克雷-多项混合回归模型。
Stat Med. 2025 Aug;44(18-19):e70220. doi: 10.1002/sim.70220.
2
Microbiome subcommunity learning with logistic-tree normal latent Dirichlet allocation.基于逻辑树正态潜在狄利克雷分配的微生物亚群落学习。
Biometrics. 2023 Sep;79(3):2321-2332. doi: 10.1111/biom.13772. Epub 2022 Oct 28.