• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

基于结构约束的稀疏典型相关分析及其在微生物组数据分析中的应用。

Structure-constrained sparse canonical correlation analysis with an application to microbiome data analysis.

机构信息

Department of Biostatistics and Epidemiology, University of Pennsylvania Perelman School of Medicine, Philadelphia, PA19104, USA.

出版信息

Biostatistics. 2013 Apr;14(2):244-58. doi: 10.1093/biostatistics/kxs038. Epub 2012 Oct 15.

DOI:10.1093/biostatistics/kxs038
PMID:23074263
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC3590923/
Abstract

Motivated by studying the association between nutrient intake and human gut microbiome composition, we developed a method for structure-constrained sparse canonical correlation analysis (ssCCA) in a high-dimensional setting. ssCCA takes into account the phylogenetic relationships among bacteria, which provides important prior knowledge on evolutionary relationships among bacterial taxa. Our ssCCA formulation utilizes a phylogenetic structure-constrained penalty function to impose certain smoothness on the linear coefficients according to the phylogenetic relationships among the taxa. An efficient coordinate descent algorithm is developed for optimization. A human gut microbiome data set is used to illustrate this method. Both simulations and real data applications show that ssCCA performs better than the standard sparse CCA in identifying meaningful variables when there are structures in the data.

摘要

受研究营养摄入与人类肠道微生物组组成之间关联的启发,我们开发了一种用于高维环境下结构约束稀疏典型相关分析(ssCCA)的方法。ssCCA 考虑了细菌之间的系统发育关系,这为细菌分类群之间的进化关系提供了重要的先验知识。我们的 ssCCA 公式利用了一个系统发育结构约束惩罚函数,根据分类群之间的系统发育关系,对线性系数施加一定的平滑度。开发了一种有效的坐标下降算法来进行优化。利用人类肠道微生物组数据集来说明这种方法。模拟和实际数据应用都表明,当数据中存在结构时,ssCCA 在识别有意义的变量方面比标准稀疏 CCA 表现更好。

相似文献

1
Structure-constrained sparse canonical correlation analysis with an application to microbiome data analysis.基于结构约束的稀疏典型相关分析及其在微生物组数据分析中的应用。
Biostatistics. 2013 Apr;14(2):244-58. doi: 10.1093/biostatistics/kxs038. Epub 2012 Oct 15.
2
A Phylogeny-Regularized Sparse Regression Model for Predictive Modeling of Microbial Community Data.一种用于微生物群落数据预测建模的系统发育正则化稀疏回归模型。
Front Microbiol. 2018 Dec 19;9:3112. doi: 10.3389/fmicb.2018.03112. eCollection 2018.
3
Comparative metagenomic analysis of plasmid encoded functions in the human gut microbiome.比较人类肠道微生物组中质粒编码功能的宏基因组分析。
BMC Genomics. 2010 Jan 19;11:46. doi: 10.1186/1471-2164-11-46.
4
VARIABLE SELECTION FOR SPARSE DIRICHLET-MULTINOMIAL REGRESSION WITH AN APPLICATION TO MICROBIOME DATA ANALYSIS.用于稀疏狄利克雷-多项回归的变量选择及其在微生物组数据分析中的应用
Ann Appl Stat. 2013 Mar 1;7(1). doi: 10.1214/12-AOAS592.
5
A powerful microbiome-based association test and a microbial taxa discovery framework for comprehensive association mapping.基于宏基因组关联测试和微生物分类群发现框架的全面关联图谱分析。
Microbiome. 2017 Apr 24;5(1):45. doi: 10.1186/s40168-017-0262-x.
6
Diet drives convergence in gut microbiome functions across mammalian phylogeny and within humans.饮食驱动哺乳动物系统发育和人类肠道微生物功能趋同。
Science. 2011 May 20;332(6032):970-4. doi: 10.1126/science.1198719.
7
SEPP: SATé-enabled phylogenetic placement.SEPP:基于SATé的系统发育定位
Pac Symp Biocomput. 2012:247-58. doi: 10.1142/9789814366496_0024.
8
A logistic normal multinomial regression model for microbiome compositional data analysis.用于微生物组组成数据分析的逻辑正态多项回归模型。
Biometrics. 2013 Dec;69(4):1053-63. doi: 10.1111/biom.12079. Epub 2013 Oct 15.
9
A Single-Side Neural Network-Aided Canonical Correlation Analysis With Applications to Fault Diagnosis.单侧神经网络辅助典型相关分析及其在故障诊断中的应用。
IEEE Trans Cybern. 2022 Sep;52(9):9454-9466. doi: 10.1109/TCYB.2021.3060766. Epub 2022 Aug 18.
10
Peptide markers of aminoacyl tRNA synthetases facilitate taxa counting in metagenomic data.氨酰-tRNA 合成酶的肽标记物有助于宏基因组数据中的分类计数。
BMC Genomics. 2012 Feb 10;13:65. doi: 10.1186/1471-2164-13-65.

引用本文的文献

1
DeepBiome: A Phylogenetic Tree Informed Deep Neural Network for Microbiome Data Analysis.深度生物群落:一种基于系统发育树的深度神经网络用于微生物组数据分析。
Stat Biosci. 2025 Apr;17(1):191-215. doi: 10.1007/s12561-024-09434-9. Epub 2024 Jun 14.
2
TphPMF: A microbiome data imputation method using hierarchical Bayesian Probabilistic Matrix Factorization.TphPMF:一种使用分层贝叶斯概率矩阵分解的微生物组数据插补方法。
PLoS Comput Biol. 2025 Mar 11;21(3):e1012858. doi: 10.1371/journal.pcbi.1012858. eCollection 2025 Mar.
3
Semisynthetic simulation for microbiome data analysis.用于微生物组数据分析的半合成模拟
Brief Bioinform. 2024 Nov 22;26(1). doi: 10.1093/bib/bbaf051.
4
Structure-adaptive canonical correlation analysis for microbiome multi-omics data.用于微生物组多组学数据的结构自适应典型相关分析
Front Genet. 2024 Nov 20;15:1489694. doi: 10.3389/fgene.2024.1489694. eCollection 2024.
5
Statistical and computational methods for integrating microbiome, host genomics, and metabolomics data.用于整合微生物组、宿主基因组和代谢组学数据的统计和计算方法。
Elife. 2024 Jun 4;13:e88956. doi: 10.7554/eLife.88956.
6
mi-Mic: a novel multi-layer statistical test for microbiota-disease associations.mi-Mic:一种用于微生物组-疾病关联的新型多层统计检验方法。
Genome Biol. 2024 May 1;25(1):113. doi: 10.1186/s13059-024-03256-0.
7
Multi-omic integration of microbiome data for identifying disease-associated modules.多组学整合微生物组数据以识别与疾病相关的模块。
Nat Commun. 2024 Mar 23;15(1):2621. doi: 10.1038/s41467-024-46888-3.
8
Progress on network modeling and analysis of gut microecology: a review.肠道微生物网络建模与分析研究进展:综述
Appl Environ Microbiol. 2024 Mar 20;90(3):e0009224. doi: 10.1128/aem.00092-24. Epub 2024 Feb 28.
9
Identifying important gene signatures of BMI using network structure-aided nonparametric quantile regression.利用网络结构辅助非参数分位数回归鉴定 BMI 的重要基因特征。
Stat Med. 2023 May 10;42(10):1625-1639. doi: 10.1002/sim.9691. Epub 2023 Feb 23.
10
Benchmarking differential abundance analysis methods for correlated microbiome sequencing data.基于相关微生物组测序数据的差异丰度分析方法的基准测试。
Brief Bioinform. 2023 Jan 19;24(1). doi: 10.1093/bib/bbac607.

本文引用的文献

1
Linking long-term dietary patterns with gut microbial enterotypes.将长期饮食模式与肠道微生物肠型联系起来。
Science. 2011 Oct 7;334(6052):105-8. doi: 10.1126/science.1208344. Epub 2011 Sep 1.
2
Association between composition of the human gastrointestinal microbiome and development of fatty liver with choline deficiency.人类胃肠道微生物组的组成与胆碱缺乏性脂肪肝的发展之间的关联。
Gastroenterology. 2011 Mar;140(3):976-86. doi: 10.1053/j.gastro.2010.11.049. Epub 2010 Dec 1.
3
pplacer: linear time maximum-likelihood and Bayesian phylogenetic placement of sequences onto a fixed reference tree.pplacer:将序列线性时间最大似然和贝叶斯系统发生放置到固定参照树上。
BMC Bioinformatics. 2010 Oct 30;11:538. doi: 10.1186/1471-2105-11-538.
4
QIIME allows analysis of high-throughput community sequencing data.QIIME可用于分析高通量群落测序数据。
Nat Methods. 2010 May;7(5):335-6. doi: 10.1038/nmeth.f.303. Epub 2010 Apr 11.
5
High-fat diet determines the composition of the murine gut microbiome independently of obesity.高脂饮食独立于肥胖决定小鼠肠道微生物群的组成。
Gastroenterology. 2009 Nov;137(5):1716-24.e1-2. doi: 10.1053/j.gastro.2009.08.042. Epub 2009 Aug 23.
6
A penalized matrix decomposition, with applications to sparse principal components and canonical correlation analysis.一种惩罚矩阵分解及其在稀疏主成分分析和典型相关分析中的应用。
Biostatistics. 2009 Jul;10(3):515-34. doi: 10.1093/biostatistics/kxp008. Epub 2009 Apr 17.
7
Sparse canonical correlation analysis with application to genomic data integration.应用于基因组数据整合的稀疏典型相关分析。
Stat Appl Genet Mol Biol. 2009;8:Article 1. doi: 10.2202/1544-6115.1406. Epub 2009 Jan 6.
8
Network-constrained regularization and variable selection for analysis of genomic data.用于基因组数据分析的网络约束正则化和变量选择
Bioinformatics. 2008 May 1;24(9):1175-82. doi: 10.1093/bioinformatics/btn081. Epub 2008 Mar 1.
9
Naive Bayesian classifier for rapid assignment of rRNA sequences into the new bacterial taxonomy.用于将rRNA序列快速分类到新细菌分类学中的朴素贝叶斯分类器。
Appl Environ Microbiol. 2007 Aug;73(16):5261-7. doi: 10.1128/AEM.00062-07. Epub 2007 Jun 22.
10
UniFrac: a new phylogenetic method for comparing microbial communities.单样本可变分异分析(UniFrac):一种用于比较微生物群落的新系统发育方法。
Appl Environ Microbiol. 2005 Dec;71(12):8228-35. doi: 10.1128/AEM.71.12.8228-8235.2005.