• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

使用 uDance 生成准确、可扩展的系统发育基因组树。

Generation of accurate, expandable phylogenomic trees with uDance.

机构信息

Bioinformatics and Systems Biology Graduate Program, University of California San Diego, La Jolla, CA, USA.

Department of Electrical and Computer Engineering, University of California San Diego, La Jolla, CA, USA.

出版信息

Nat Biotechnol. 2024 May;42(5):768-777. doi: 10.1038/s41587-023-01868-8. Epub 2023 Jul 27.

DOI:10.1038/s41587-023-01868-8
PMID:37500914
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC10818028/
Abstract

Phylogenetic trees provide a framework for organizing evolutionary histories across the tree of life and aid downstream comparative analyses such as metagenomic identification. Methods that rely on single-marker genes such as 16S rRNA have produced trees of limited accuracy with hundreds of thousands of organisms, whereas methods that use genome-wide data are not scalable to large numbers of genomes. We introduce updating trees using divide-and-conquer (uDance), a method that enables updatable genome-wide inference using a divide-and-conquer strategy that refines different parts of the tree independently and can build off of existing trees, with high accuracy and scalability. With uDance, we infer a species tree of roughly 200,000 genomes using 387 marker genes, totaling 42.5 billion amino acid residues.

摘要

系统发生树为生命之树的进化历史提供了一个组织框架,并有助于下游的比较分析,如宏基因组鉴定。依赖于 16S rRNA 等单标记基因的方法在处理数十万种生物体时,产生的树的准确性有限,而使用全基因组数据的方法则无法扩展到大量基因组。我们引入了使用分而治之(uDance)更新树的方法,该方法使用分而治之的策略实现可更新的全基因组推断,该策略独立地细化树的不同部分,并可以利用现有树进行构建,具有高精度和可扩展性。使用 uDance,我们使用 387 个标记基因推断出大约 20 万个基因组的种系发生树,总计 425 亿个氨基酸残基。

相似文献

1
Generation of accurate, expandable phylogenomic trees with uDance.使用 uDance 生成准确、可扩展的系统发育基因组树。
Nat Biotechnol. 2024 May;42(5):768-777. doi: 10.1038/s41587-023-01868-8. Epub 2023 Jul 27.
2
Fast and accurate distance-based phylogenetic placement using divide and conquer.基于划分与征服的快速准确基于距离的系统发育定位方法
Mol Ecol Resour. 2022 Apr;22(3):1213-1227. doi: 10.1111/1755-0998.13527. Epub 2021 Oct 26.
3
Consensus properties for the deep coalescence problem and their application for scalable tree search.深度合并问题的一致性属性及其在可扩展树搜索中的应用。
BMC Bioinformatics. 2012 Jun 25;13 Suppl 10(Suppl 10):S12. doi: 10.1186/1471-2105-13-S10-S12.
4
A Guide to Phylogenomic Inference.系统发育基因组推断指南。
Methods Mol Biol. 2024;2802:267-345. doi: 10.1007/978-1-0716-3838-5_11.
5
iGTP: a software package for large-scale gene tree parsimony analysis.iGTP:用于大规模基因树简约分析的软件包。
BMC Bioinformatics. 2010 Nov 23;11:574. doi: 10.1186/1471-2105-11-574.
6
Assembling a Reference Phylogenomic Tree of Bacteria and Archaea by Summarizing Many Gene Phylogenies.通过汇总多个基因系统发育树来构建细菌和古菌的参考系统发育基因组树。
Methods Mol Biol. 2022;2569:137-165. doi: 10.1007/978-1-0716-2691-7_7.
7
Computational methods for Gene Orthology inference.基因直系同源推断的计算方法。
Brief Bioinform. 2011 Sep;12(5):379-91. doi: 10.1093/bib/bbr030. Epub 2011 Jun 19.
8
A new fast method for inferring multiple consensus trees using k-medoids.一种利用 k -medoids 快速推断多个一致树的新方法。
BMC Evol Biol. 2018 Apr 5;18(1):48. doi: 10.1186/s12862-018-1163-8.
9
Genome-Wide Comparative Analysis of Phylogenetic Trees: The Prokaryotic Forest of Life.系统发育树的全基因组比较分析:原核生物的生命之林。
Methods Mol Biol. 2019;1910:241-269. doi: 10.1007/978-1-4939-9074-0_8.
10
Fungal Phylogenomics.真菌系统发育基因组学
Methods Mol Biol. 2018;1775:251-266. doi: 10.1007/978-1-4939-7804-5_20.

引用本文的文献

1
Chance and purpose in the evolution of biospheres.生物圈进化中的机遇与目的。
Philos Trans R Soc Lond B Biol Sci. 2025 Aug 7;380(1931):20240085. doi: 10.1098/rstb.2024.0085.
2
The evolution of the tree of life.生命之树的演化。
Philos Trans R Soc Lond B Biol Sci. 2025 Aug 7;380(1931):20240091. doi: 10.1098/rstb.2024.0091.
3
Accurate, scalable, and fully automated inference of species trees from raw genome assemblies using ROADIES.使用ROADIES从原始基因组组装中准确、可扩展且完全自动化地推断物种树。
Proc Natl Acad Sci U S A. 2025 May 13;122(19):e2500553122. doi: 10.1073/pnas.2500553122. Epub 2025 May 2.
4
CompactTree: a lightweight header-only C++ library and Python wrapper for ultra-large phylogenetics.CompactTree:一个轻量级的仅包含头文件的C++库以及用于超大型系统发育学的Python包装器。
GigaByte. 2025 Mar 7;2025:gigabyte152. doi: 10.46471/gigabyte.152. eCollection 2025.
5
Memory-bound -mer selection for large and evolutionarily diverse reference libraries.基于记忆限制的大型且进化多样的参考文库的-mer 选择。
Genome Res. 2024 Oct 11;34(9):1455-1467. doi: 10.1101/gr.279339.124.
6
Scaling DEPP phylogenetic placement to ultra-large reference trees: a tree-aware ensemble approach.将 DEPP 系统发育定位扩展到超大规模参考树:一种基于树的集成方法。
Bioinformatics. 2024 Jun 3;40(6). doi: 10.1093/bioinformatics/btae361.
7
Accurate, scalable, and fully automated inference of species trees from raw genome assemblies using ROADIES.使用ROADIES从原始基因组组装中准确、可扩展且完全自动化地推断物种树。
bioRxiv. 2024 Jun 1:2024.05.27.596098. doi: 10.1101/2024.05.27.596098.
8
Microbial Diversity and Open Questions about the Deep Tree of Life.微生物多样性和生命之树深处的未解问题。
Genome Biol Evol. 2024 Apr 2;16(4). doi: 10.1093/gbe/evae053.

本文引用的文献

1
DEPP: Deep Learning Enables Extending Species Trees using Single Genes.DEPP:深度学习可利用单基因拓展物种树。
Syst Biol. 2023 May 19;72(1):17-34. doi: 10.1093/sysbio/syac031.
2
SCAMPP: Scaling Alignment-Based Phylogenetic Placement to Large Trees.SCAMPP:将基于比对的系统发育定位扩展到大型树
IEEE/ACM Trans Comput Biol Bioinform. 2023 Mar-Apr;20(2):1417-1430. doi: 10.1109/TCBB.2022.3170386. Epub 2023 Apr 3.
3
Phylogeny-Aware Analysis of Metagenome Community Ecology Based on Matched Reference Genomes while Bypassing Taxonomy.基于匹配参考基因组绕过分类学的宏基因组群落生态学的系统发育分析。
mSystems. 2022 Apr 26;7(2):e0016722. doi: 10.1128/msystems.00167-22. Epub 2022 Apr 4.
4
Fast and accurate distance-based phylogenetic placement using divide and conquer.基于划分与征服的快速准确基于距离的系统发育定位方法
Mol Ecol Resour. 2022 Apr;22(3):1213-1227. doi: 10.1111/1755-0998.13527. Epub 2021 Oct 26.
5
Species Tree Inference Methods Intended to Deal with Incomplete Lineage Sorting Are Robust to the Presence of Paralogs.旨在处理不完全谱系分类的种系树推断方法对旁系同源基因的存在具有稳健性。
Syst Biol. 2022 Feb 10;71(2):367-381. doi: 10.1093/sysbio/syab056.
6
GUNC: detection of chimerism and contamination in prokaryotic genomes.GUNC:原核基因组嵌合体和污染的检测。
Genome Biol. 2021 Jun 13;22(1):178. doi: 10.1186/s13059-021-02393-0.
7
Sustainable data analysis with Snakemake.使用 Snakemake 进行可持续数据分析。
F1000Res. 2021 Jan 18;10:33. doi: 10.12688/f1000research.29032.2. eCollection 2021.
8
Interactive Tree Of Life (iTOL) v5: an online tool for phylogenetic tree display and annotation.交互式生命树 (iTOL) v5:一个用于显示和注释系统发育树的在线工具。
Nucleic Acids Res. 2021 Jul 2;49(W1):W293-W296. doi: 10.1093/nar/gkab301.
9
Precise phylogenetic analysis of microbial isolates and genomes from metagenomes using PhyloPhlAn 3.0.基于 PhyloPhlAn 3.0 对宏基因组中的微生物分离株和基因组进行精确的系统发育分析。
Nat Commun. 2020 May 19;11(1):2500. doi: 10.1038/s41467-020-16366-7.
10
A complete domain-to-species taxonomy for Bacteria and Archaea.细菌和古菌的完整域到种分类 taxonomy。
Nat Biotechnol. 2020 Sep;38(9):1079-1086. doi: 10.1038/s41587-020-0501-8. Epub 2020 Apr 27.