• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

GTDB-Tk v2:使用基因组分类数据库实现内存友好的分类。

GTDB-Tk v2: memory friendly classification with the genome taxonomy database.

机构信息

Australian Centre for Ecogenomics, School of Chemistry and Molecular Biosciences, The University of Queensland, St Lucia, QLD 4072, Australia.

Research Computing Center, The University of Queensland, St Lucia, QLD 4072, Australia.

出版信息

Bioinformatics. 2022 Nov 30;38(23):5315-5316. doi: 10.1093/bioinformatics/btac672.

DOI:10.1093/bioinformatics/btac672
PMID:36218463
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC9710552/
Abstract

SUMMARY

The Genome Taxonomy Database (GTDB) and associated taxonomic classification toolkit (GTDB-Tk) have been widely adopted by the microbiology community. However, the growing size of the GTDB bacterial reference tree has resulted in GTDB-Tk requiring substantial amounts of memory (∼320 GB) which limits its adoption and ease of use. Here, we present an update to GTDB-Tk that uses a divide-and-conquer approach where user genomes are initially placed into a bacterial reference tree with family-level representatives followed by placement into an appropriate class-level subtree comprising species representatives. This substantially reduces the memory requirements of GTDB-Tk while having minimal impact on classification.

AVAILABILITY AND IMPLEMENTATION

GTDB-Tk is implemented in Python and licenced under the GNU General Public Licence v3.0. Source code and documentation are available at: https://github.com/ecogenomics/gtdbtk.

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

摘要

基因组分类数据库(GTDB)及其相关的分类分类工具包(GTDB-Tk)已被微生物学领域广泛采用。然而,GTDB 细菌参考树的不断增长导致 GTDB-Tk 需要大量的内存(约 320GB),这限制了它的采用和易用性。在这里,我们介绍了 GTDB-Tk 的更新,它使用了一种分而治之的方法,其中用户基因组最初被放置在具有家族代表的细菌参考树中,然后被放置在包含物种代表的适当的类代表子树中。这大大降低了 GTDB-Tk 的内存需求,同时对分类的影响最小。

可用性和实现

GTDB-Tk 是用 Python 实现的,并根据 GNU 通用公共许可证 v3.0 获得许可。源代码和文档可在:https://github.com/ecogenomics/gtdbtk。

补充信息

补充数据可在生物信息学在线获得。

相似文献

1
GTDB-Tk v2: memory friendly classification with the genome taxonomy database.GTDB-Tk v2:使用基因组分类数据库实现内存友好的分类。
Bioinformatics. 2022 Nov 30;38(23):5315-5316. doi: 10.1093/bioinformatics/btac672.
2
GTDB-Tk: a toolkit to classify genomes with the Genome Taxonomy Database.GTDB-Tk:一个使用基因组分类数据库对基因组进行分类的工具包。
Bioinformatics. 2019 Nov 15;36(6):1925-7. doi: 10.1093/bioinformatics/btz848.
3
GTDB: an ongoing census of bacterial and archaeal diversity through a phylogenetically consistent, rank normalized and complete genome-based taxonomy.GTDB:通过系统发生一致、等级归一化和基于完整基因组的分类学,对细菌和古菌多样性进行持续普查。
Nucleic Acids Res. 2022 Jan 7;50(D1):D785-D794. doi: 10.1093/nar/gkab776.
4
Putative genome contamination has minimal impact on the GTDB taxonomy.假定的基因组污染对 GTDB 分类法的影响极小。
Microb Genom. 2024 May;10(5). doi: 10.1099/mgen.0.001256.
5
Beacon v2 Reference Implementation: a toolkit to enable federated sharing of genomic and phenotypic data.Beacon v2 参考实现:一个用于实现基因组和表型数据联合共享的工具包。
Bioinformatics. 2022 Sep 30;38(19):4656-4657. doi: 10.1093/bioinformatics/btac568.
6
expam-high-resolution analysis of metagenomes using distance trees.使用距离树进行宏基因组的高分辨率分析。
Bioinformatics. 2022 Oct 14;38(20):4814-4816. doi: 10.1093/bioinformatics/btac591.
7
Out From the Shadows - Resolution of the Taxonomy of the Family .走出阴影——该科分类法的解析
Front Microbiol. 2020 May 5;11:795. doi: 10.3389/fmicb.2020.00795. eCollection 2020.
8
Proposal of names for 329 higher rank taxa defined in the Genome Taxonomy Database under two prokaryotic codes.提议为基因组分类数据库中两个原核代码定义的 329 个高级分类群的名称。
FEMS Microbiol Lett. 2023 Jan 17;370. doi: 10.1093/femsle/fnad071.
9
Analysing high-throughput sequencing data in Python with HTSeq 2.0.用 HTSeq 2.0 分析 Python 中的高通量测序数据。
Bioinformatics. 2022 May 13;38(10):2943-2945. doi: 10.1093/bioinformatics/btac166.
10
CONSTAX2: improved taxonomic classification of environmental DNA markers.CONSTAX2:改进环境 DNA 标记物的分类学分类。
Bioinformatics. 2021 Nov 5;37(21):3941-3943. doi: 10.1093/bioinformatics/btab347.

引用本文的文献

1
The Earth Hologenome Initiative: Data Release 1.地球全基因组计划:数据发布1
Gigascience. 2025 Jan 6;14. doi: 10.1093/gigascience/giaf102.
2
The chromosomal genome sequence of the giant barrel sponge, Schmidt 1870 and its associated microbial metagenome sequences.巨型桶状海绵(施密特,1870年)的染色体基因组序列及其相关微生物宏基因组序列。
Wellcome Open Res. 2025 Jul 8;10:336. doi: 10.12688/wellcomeopenres.24173.1. eCollection 2025.
3
The scaffold-level genome sequence of an encrusting sponge, Vacelet & Donadey, 1987, and its associated microbial metagenome sequences.一种覆盖型海绵(Vacelet & Donadey,1987)的支架水平基因组序列及其相关的微生物宏基因组序列。
Wellcome Open Res. 2025 Jul 9;10:344. doi: 10.12688/wellcomeopenres.24281.1. eCollection 2025.
4
Temporal dynamics and microbial interactions shaping the gut resistome in early infancy.塑造婴儿早期肠道耐药组的时间动态和微生物相互作用
Nat Commun. 2025 Aug 30;16(1):8139. doi: 10.1038/s41467-025-63401-6.
5
Global biogeography of airborne viruses in public transit systems and their host interactions.公共交通系统中空气传播病毒的全球生物地理学及其宿主相互作用。
Microbiome. 2025 Aug 29;13(1):193. doi: 10.1186/s40168-025-02173-z.
6
Desulfosporosinus sediminicola sp. nov., an acidophilic sulfate-reducing bacterium isolated from acidic sediments of a disused iron mine site.新种嗜酸性沉积物脱硫芽孢杆菌,一种从废弃铁矿酸性沉积物中分离出的硫酸盐还原菌。
Antonie Van Leeuwenhoek. 2025 Aug 28;118(10):142. doi: 10.1007/s10482-025-02152-2.
7
sp. nov., a Novel Nitrate-Reducing Bacterium Isolated from Marine Sediments, and the Evolution of Nitrate-Reducing Genes in the Genus .sp. nov.,一种从海洋沉积物中分离出的新型硝酸盐还原细菌,以及该属中硝酸盐还原基因的进化 。
Microorganisms. 2025 Aug 13;13(8):1888. doi: 10.3390/microorganisms13081888.
8
Discovery of New Everninomicin Analogs from a Marine-Derived sp. by Metabolomics and Genomics Approaches.通过代谢组学和基因组学方法从海洋来源的链霉菌中发现新的埃博霉素类似物
Mar Drugs. 2025 Jul 31;23(8):316. doi: 10.3390/md23080316.
9
A stable 15-member bacterial SynCom promotes growth under drought stress.一个由15个成员组成的稳定细菌合成群落促进干旱胁迫下的生长。
Front Microbiol. 2025 Aug 11;16:1649750. doi: 10.3389/fmicb.2025.1649750. eCollection 2025.
10
Metagenomic analysis of vitamins B and K biosynthesis in chicken gut microbiota across laying periods.产蛋期鸡肠道微生物群中维生素B和K生物合成的宏基因组分析
BMC Microbiol. 2025 Aug 26;25(1):553. doi: 10.1186/s12866-025-04296-7.

本文引用的文献

1
Fast and accurate distance-based phylogenetic placement using divide and conquer.基于划分与征服的快速准确基于距离的系统发育定位方法
Mol Ecol Resour. 2022 Apr;22(3):1213-1227. doi: 10.1111/1755-0998.13527. Epub 2021 Oct 26.
2
GTDB: an ongoing census of bacterial and archaeal diversity through a phylogenetically consistent, rank normalized and complete genome-based taxonomy.GTDB:通过系统发生一致、等级归一化和基于完整基因组的分类学,对细菌和古菌多样性进行持续普查。
Nucleic Acids Res. 2022 Jan 7;50(D1):D785-D794. doi: 10.1093/nar/gkab776.
3
A genomic catalog of Earth's microbiomes.地球微生物组的基因组目录。
Nat Biotechnol. 2021 Apr;39(4):499-509. doi: 10.1038/s41587-020-0718-6. Epub 2020 Nov 9.
4
A unified catalog of 204,938 reference genomes from the human gut microbiome.人类肠道微生物组 204938 个参考基因组的统一目录。
Nat Biotechnol. 2021 Jan;39(1):105-114. doi: 10.1038/s41587-020-0603-3. Epub 2020 Jul 20.
5
A complete domain-to-species taxonomy for Bacteria and Archaea.细菌和古菌的完整域到种分类 taxonomy。
Nat Biotechnol. 2020 Sep;38(9):1079-1086. doi: 10.1038/s41587-020-0501-8. Epub 2020 Apr 27.
6
GTDB-Tk: a toolkit to classify genomes with the Genome Taxonomy Database.GTDB-Tk:一个使用基因组分类数据库对基因组进行分类的工具包。
Bioinformatics. 2019 Nov 15;36(6):1925-7. doi: 10.1093/bioinformatics/btz848.
7
EPA-ng: Massively Parallel Evolutionary Placement of Genetic Sequences.EPA-ng:大规模并行遗传序列布局进化。
Syst Biol. 2019 Mar 1;68(2):365-369. doi: 10.1093/sysbio/syy054.
8
pplacer: linear time maximum-likelihood and Bayesian phylogenetic placement of sequences onto a fixed reference tree.pplacer:将序列线性时间最大似然和贝叶斯系统发生放置到固定参照树上。
BMC Bioinformatics. 2010 Oct 30;11:538. doi: 10.1186/1471-2105-11-538.