• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

CompactTree:一个轻量级的仅包含头文件的C++库以及用于超大型系统发育学的Python包装器。

CompactTree: a lightweight header-only C++ library and Python wrapper for ultra-large phylogenetics.

作者信息

Moshiri Niema

机构信息

Department of Computer Science & Engineering, UC San Diego, La Jolla, CA 92093, USA.

出版信息

GigaByte. 2025 Mar 7;2025:gigabyte152. doi: 10.46471/gigabyte.152. eCollection 2025.

DOI:10.46471/gigabyte.152
PMID:40110034
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC11921128/
Abstract

The study of viral and bacterial species requires the ability to load and traverse ultra-large phylogenies with tens of millions of tips, but existing tree libraries struggle to scale to these sizes. We introduce CompactTree, a lightweight header-only C++ library with a user-friendly Python wrapper for traversing ultra-large trees that can be easily incorporated into other tools. We show that CompactTree is orders of magnitude faster and requires orders of magnitude less memory than existing tree packages. CompactTree is freely accessible as an open source project: https://github.com/niemasd/CompactTree.

摘要

对病毒和细菌物种的研究需要具备加载和遍历拥有数千万个末端的超大型系统发育树的能力,但现有的树库在扩展到这些规模时面临困难。我们引入了CompactTree,这是一个轻量级的仅包含头文件的C++库,带有一个用户友好的Python包装器,用于遍历超大型树,并且可以轻松地集成到其他工具中。我们表明,CompactTree比现有的树包快几个数量级,并且所需内存少几个数量级。CompactTree作为一个开源项目可免费获取:https://github.com/niemasd/CompactTree 。

相似文献

1
CompactTree: a lightweight header-only C++ library and Python wrapper for ultra-large phylogenetics.CompactTree:一个轻量级的仅包含头文件的C++库以及用于超大型系统发育学的Python包装器。
GigaByte. 2025 Mar 7;2025:gigabyte152. doi: 10.46471/gigabyte.152. eCollection 2025.
2
TreeSwift: A massively scalable Python tree package.TreeSwift:一个大规模可扩展的Python树包。
SoftwareX. 2020 Jan-Jun;11. doi: 10.1016/j.softx.2020.100436. Epub 2020 Mar 4.
3
PhyloJS: Bridging phylogenetics and web development with a JavaScript utility library.PhyloJS:用一个JavaScript实用工具库连接系统发育学与网页开发。
Ecol Evol. 2024 Jun 26;14(6):e11603. doi: 10.1002/ece3.11603. eCollection 2024 Jun.
4
peptidy: a light-weight Python library for peptide representation in machine learning.Peptidy:一个用于机器学习中肽表示的轻量级Python库。
Bioinform Adv. 2025 Mar 21;5(1):vbaf058. doi: 10.1093/bioadv/vbaf058. eCollection 2025.
5
ViralMSA: massively scalable reference-guided multiple sequence alignment of viral genomes.病毒 MSA:大规模可扩展的基于参考的病毒基因组多重序列比对。
Bioinformatics. 2021 May 5;37(5):714-716. doi: 10.1093/bioinformatics/btaa743.
6
Taxonium, a web-based tool for exploring large phylogenetic trees.Taxonium,一个用于探索大型系统发育树的网络工具。
Elife. 2022 Nov 15;11:e82392. doi: 10.7554/eLife.82392.
7
Trying out a million genes to find the perfect pair with RTIST. 利用 RTIST 尝试百万个基因,找到完美配对。
Bioinformatics. 2022 Jul 11;38(14):3565-3573. doi: 10.1093/bioinformatics/btac349.
8
Two C++ libraries for counting trees on a phylogenetic terrace.两个用于在系统发生阶地上计算树的 C++ 库。
Bioinformatics. 2018 Oct 1;34(19):3399-3401. doi: 10.1093/bioinformatics/bty384.
9
NeuroPycon: An open-source python toolbox for fast multi-modal and reproducible brain connectivity pipelines.NeuroPycon:一个开源的 Python 工具包,用于快速进行多模态和可重复的脑连接管道。
Neuroimage. 2020 Oct 1;219:117020. doi: 10.1016/j.neuroimage.2020.117020. Epub 2020 Jun 6.
10
OpenTree: A Python Package for Accessing and Analyzing Data from the Open Tree of Life.OpenTree:一个用于访问和分析开放生命树数据的 Python 包。
Syst Biol. 2021 Oct 13;70(6):1295-1301. doi: 10.1093/sysbio/syab033.

引用本文的文献

1
Phylo-rs: an extensible phylogenetic analysis library in rust.Phylo-rs:一个用Rust编写的可扩展系统发育分析库。
BMC Bioinformatics. 2025 Jul 29;26(1):197. doi: 10.1186/s12859-025-06234-w.

本文引用的文献

1
Generation of accurate, expandable phylogenomic trees with uDance.使用 uDance 生成准确、可扩展的系统发育基因组树。
Nat Biotechnol. 2024 May;42(5):768-777. doi: 10.1038/s41587-023-01868-8. Epub 2023 Jul 27.
2
Greengenes2 unifies microbial data in a single reference tree.Greengenes2 将微生物数据统一在一个单一的参考树中。
Nat Biotechnol. 2024 May;42(5):715-718. doi: 10.1038/s41587-023-01845-1. Epub 2023 Jul 27.
3
TreeSwift: A massively scalable Python tree package.TreeSwift:一个大规模可扩展的Python树包。
SoftwareX. 2020 Jan-Jun;11. doi: 10.1016/j.softx.2020.100436. Epub 2020 Mar 4.
4
matOptimize: a parallel tree optimization method enables online phylogenetics for SARS-CoV-2.matOptimize:一种并行树优化方法,支持 SARS-CoV-2 的在线系统发生分析。
Bioinformatics. 2022 Aug 2;38(15):3734-3740. doi: 10.1093/bioinformatics/btac401.
5
HIV Care Prioritization Using Phylogenetic Branch Length.基于系统发育分支长度的 HIV 护理优先级排序。
J Acquir Immune Defic Syndr. 2021 Apr 15;86(5):626-637. doi: 10.1097/QAI.0000000000002612.
6
Genesis and Gappa: processing, analyzing and visualizing phylogenetic (placement) data.Genesis 和 Gappa:处理、分析和可视化系统发育(位置)数据。
Bioinformatics. 2020 May 1;36(10):3263-3265. doi: 10.1093/bioinformatics/btaa070.
7
TreeCluster: Clustering biological sequences using phylogenetic trees.TreeCluster:使用系统发生树进行生物序列聚类。
PLoS One. 2019 Aug 22;14(8):e0221068. doi: 10.1371/journal.pone.0221068. eCollection 2019.
8
ape 5.0: an environment for modern phylogenetics and evolutionary analyses in R.ape 5.0:R 中的现代系统发育学和进化分析环境。
Bioinformatics. 2019 Feb 1;35(3):526-528. doi: 10.1093/bioinformatics/bty633.
9
TreeTime: Maximum-likelihood phylodynamic analysis.TreeTime:最大似然系统发育动力学分析。
Virus Evol. 2018 Jan 8;4(1):vex042. doi: 10.1093/ve/vex042. eCollection 2018 Jan.
10
A Two-State Model of Tree Evolution and Its Applications to Alu Retrotransposition.树进化的两状态模型及其在 Alu 反转录转座中的应用。
Syst Biol. 2018 May 1;67(3):475-489. doi: 10.1093/sysbio/syx088.