Suppr超能文献

使用 uDance 生成准确、可扩展的系统发育基因组树。

Generation of accurate, expandable phylogenomic trees with uDance.

机构信息

Bioinformatics and Systems Biology Graduate Program, University of California San Diego, La Jolla, CA, USA.

Department of Electrical and Computer Engineering, University of California San Diego, La Jolla, CA, USA.

出版信息

Nat Biotechnol. 2024 May;42(5):768-777. doi: 10.1038/s41587-023-01868-8. Epub 2023 Jul 27.

Abstract

Phylogenetic trees provide a framework for organizing evolutionary histories across the tree of life and aid downstream comparative analyses such as metagenomic identification. Methods that rely on single-marker genes such as 16S rRNA have produced trees of limited accuracy with hundreds of thousands of organisms, whereas methods that use genome-wide data are not scalable to large numbers of genomes. We introduce updating trees using divide-and-conquer (uDance), a method that enables updatable genome-wide inference using a divide-and-conquer strategy that refines different parts of the tree independently and can build off of existing trees, with high accuracy and scalability. With uDance, we infer a species tree of roughly 200,000 genomes using 387 marker genes, totaling 42.5 billion amino acid residues.

摘要

系统发生树为生命之树的进化历史提供了一个组织框架,并有助于下游的比较分析,如宏基因组鉴定。依赖于 16S rRNA 等单标记基因的方法在处理数十万种生物体时,产生的树的准确性有限,而使用全基因组数据的方法则无法扩展到大量基因组。我们引入了使用分而治之(uDance)更新树的方法,该方法使用分而治之的策略实现可更新的全基因组推断,该策略独立地细化树的不同部分,并可以利用现有树进行构建,具有高精度和可扩展性。使用 uDance,我们使用 387 个标记基因推断出大约 20 万个基因组的种系发生树,总计 425 亿个氨基酸残基。

相似文献

1
Generation of accurate, expandable phylogenomic trees with uDance.使用 uDance 生成准确、可扩展的系统发育基因组树。
Nat Biotechnol. 2024 May;42(5):768-777. doi: 10.1038/s41587-023-01868-8. Epub 2023 Jul 27.
4
A Guide to Phylogenomic Inference.系统发育基因组推断指南。
Methods Mol Biol. 2024;2802:267-345. doi: 10.1007/978-1-0716-3838-5_11.
7
Computational methods for Gene Orthology inference.基因直系同源推断的计算方法。
Brief Bioinform. 2011 Sep;12(5):379-91. doi: 10.1093/bib/bbr030. Epub 2011 Jun 19.
10
Fungal Phylogenomics.真菌系统发育基因组学
Methods Mol Biol. 2018;1775:251-266. doi: 10.1007/978-1-4939-7804-5_20.

引用本文的文献

1
Chance and purpose in the evolution of biospheres.生物圈进化中的机遇与目的。
Philos Trans R Soc Lond B Biol Sci. 2025 Aug 7;380(1931):20240085. doi: 10.1098/rstb.2024.0085.
2
The evolution of the tree of life.生命之树的演化。
Philos Trans R Soc Lond B Biol Sci. 2025 Aug 7;380(1931):20240091. doi: 10.1098/rstb.2024.0091.

本文引用的文献

2
SCAMPP: Scaling Alignment-Based Phylogenetic Placement to Large Trees.SCAMPP:将基于比对的系统发育定位扩展到大型树
IEEE/ACM Trans Comput Biol Bioinform. 2023 Mar-Apr;20(2):1417-1430. doi: 10.1109/TCBB.2022.3170386. Epub 2023 Apr 3.
7
Sustainable data analysis with Snakemake.使用 Snakemake 进行可持续数据分析。
F1000Res. 2021 Jan 18;10:33. doi: 10.12688/f1000research.29032.2. eCollection 2021.
10
A complete domain-to-species taxonomy for Bacteria and Archaea.细菌和古菌的完整域到种分类 taxonomy。
Nat Biotechnol. 2020 Sep;38(9):1079-1086. doi: 10.1038/s41587-020-0501-8. Epub 2020 Apr 27.

文献AI研究员

20分钟写一篇综述,助力文献阅读效率提升50倍。

立即体验

用中文搜PubMed

大模型驱动的PubMed中文搜索引擎

马上搜索

文档翻译

学术文献翻译模型,支持多种主流文档格式。

立即体验