• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

用于多元组合计数数据的贝叶斯零膨胀狄利克雷多项式回归模型。

A Bayesian zero-inflated Dirichlet-multinomial regression model for multivariate compositional count data.

机构信息

Department of Statistics, Colorado State University, Fort Collins, Colorado, USA.

出版信息

Biometrics. 2023 Dec;79(4):3239-3251. doi: 10.1111/biom.13853. Epub 2023 Apr 3.

DOI:10.1111/biom.13853
PMID:36896642
Abstract

The Dirichlet-multinomial (DM) distribution plays a fundamental role in modern statistical methodology development and application. Recently, the DM distribution and its variants have been used extensively to model multivariate count data generated by high-throughput sequencing technology in omics research due to its ability to accommodate the compositional structure of the data as well as overdispersion. A major limitation of the DM distribution is that it is unable to handle excess zeros typically found in practice which may bias inference. To fill this gap, we propose a novel Bayesian zero-inflated DM model for multivariate compositional count data with excess zeros. We then extend our approach to regression settings and embed sparsity-inducing priors to perform variable selection for high-dimensional covariate spaces. Throughout, modeling decisions are made to boost scalability without sacrificing interpretability or imposing limiting assumptions. Extensive simulations and an application to a human gut microbiome dataset are presented to compare the performance of the proposed method to existing approaches. We provide an accompanying R package with a user-friendly vignette to apply our method to other datasets.

摘要

Dirichlet-multinomial(DM)分布在现代统计方法学的发展和应用中起着至关重要的作用。由于其能够适应数据的组成结构和过离散性,最近,DM 分布及其变体已被广泛用于对组学研究中高通量测序技术生成的多元计数数据进行建模。DM 分布的一个主要局限性是它无法处理实践中通常遇到的超额零值,这可能会导致推断出现偏差。为了弥补这一空白,我们提出了一种用于具有超额零值的多元组合计数数据的新颖的贝叶斯零膨胀 DM 模型。然后,我们将我们的方法扩展到回归设置,并嵌入稀疏诱导先验,以便在高维协变量空间中进行变量选择。整个过程中,我们做出建模决策以提高可扩展性,而不会牺牲可解释性或施加限制假设。我们进行了广泛的模拟,并将其应用于人类肠道微生物组数据集,以比较所提出的方法与现有方法的性能。我们提供了一个附带用户友好教程的 R 包,以将我们的方法应用于其他数据集。

相似文献

1
A Bayesian zero-inflated Dirichlet-multinomial regression model for multivariate compositional count data.用于多元组合计数数据的贝叶斯零膨胀狄利克雷多项式回归模型。
Biometrics. 2023 Dec;79(4):3239-3251. doi: 10.1111/biom.13853. Epub 2023 Apr 3.
2
Bayesian variable selection for multivariate zero-inflated models: Application to microbiome count data.贝叶斯变量选择在多变量零膨胀模型中的应用:在微生物组计数数据中的应用。
Biostatistics. 2020 Jul 1;21(3):499-517. doi: 10.1093/biostatistics/kxy067.
3
Bivariate zero-inflated regression for count data: a Bayesian approach with application to plant counts.计数数据的双变量零膨胀回归:一种贝叶斯方法及其在植物计数中的应用
Int J Biostat. 2010;6(1):Article 27. doi: 10.2202/1557-4679.1229.
4
A Bayesian joint model for compositional mediation effect selection in microbiome data.基于贝叶斯理论的微生物组数据中介效应选择联合模型。
Stat Med. 2023 Jul 30;42(17):2999-3015. doi: 10.1002/sim.9764. Epub 2023 May 12.
5
Bayesian biclustering for microbial metagenomic sequencing data via multinomial matrix factorization.基于多项矩阵分解的微生物宏基因组测序数据的贝叶斯双聚类分析。
Biostatistics. 2022 Jul 18;23(3):891-909. doi: 10.1093/biostatistics/kxab002.
6
Transformation and differential abundance analysis of microbiome data incorporating phylogeny.整合系统发育信息的微生物组数据的转化和差异丰度分析。
Bioinformatics. 2021 Dec 11;37(24):4652-4660. doi: 10.1093/bioinformatics/btab543.
7
Bayesian compositional regression with structured priors for microbiome feature selection.基于结构先验的贝叶斯组合回归在微生物组特征选择中的应用。
Biometrics. 2021 Sep;77(3):824-838. doi: 10.1111/biom.13335. Epub 2020 Jul 31.
8
Zero-inflated generalized Dirichlet multinomial regression model for microbiome compositional data analysis.用于微生物组组成数据分析的零膨胀广义狄利克雷多项回归模型。
Biostatistics. 2019 Oct 1;20(4):698-713. doi: 10.1093/biostatistics/kxy025.
9
An integrative Bayesian Dirichlet-multinomial regression model for the analysis of taxonomic abundances in microbiome data.一种用于分析微生物组数据中分类丰度的综合贝叶斯狄利克雷多项回归模型。
BMC Bioinformatics. 2017 Feb 8;18(1):94. doi: 10.1186/s12859-017-1516-0.
10
Analyzing the overall effects of the microbiome abundance data with a Bayesian predictive value approach.采用贝叶斯预测价值方法分析微生物组丰度数据的总体影响。
Stat Methods Med Res. 2022 Oct;31(10):1992-2003. doi: 10.1177/09622802221107106. Epub 2022 Jun 12.

引用本文的文献

1
A New Dirichlet-Multinomial Mixture Regression Model for the Analysis of Microbiome Data.一种用于微生物组数据分析的新型狄利克雷-多项混合回归模型。
Stat Med. 2025 Aug;44(18-19):e70220. doi: 10.1002/sim.70220.
2
Distributed lag interaction model with index modification.具有指数修正的分布滞后交互模型。
Biostatistics. 2024 Dec 31;26(1). doi: 10.1093/biostatistics/kxaf017.
3
Analyzing microbiome data with taxonomic misclassification using a zero-inflated Dirichlet-multinomial model.使用零膨胀狄利克雷-多项分布模型分析存在分类错误的微生物组数据。
BMC Bioinformatics. 2025 Feb 27;26(1):69. doi: 10.1186/s12859-025-06078-4.
4
Analysis of Microbiome Data.微生物组数据分析
Annu Rev Stat Appl. 2024 Apr;11(1):483-504. doi: 10.1146/annurev-statistics-040522-120734. Epub 2023 Oct 13.