• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

GToTree:一个用户友好的系统发育基因组学工作流程。

GToTree: a user-friendly workflow for phylogenomics.

机构信息

Exobiology Branch, NASA Ames Research Center, Moffett Field, CA, USA.

出版信息

Bioinformatics. 2019 Oct 15;35(20):4162-4164. doi: 10.1093/bioinformatics/btz188.

DOI:10.1093/bioinformatics/btz188
PMID:30865266
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC6792077/
Abstract

SUMMARY

Genome-level evolutionary inference (i.e. phylogenomics) is becoming an increasingly essential step in many biologists' work. Accordingly, there are several tools available for the major steps in a phylogenomics workflow. But for the biologist whose main focus is not bioinformatics, much of the computational work required-such as accessing genomic data on large scales, integrating genomes from different file formats, performing required filtering, stitching different tools together etc.-can be prohibitive. Here I introduce GToTree, a command-line tool that can take any combination of fasta files, GenBank files and/or NCBI assembly accessions as input and outputs an alignment file, estimates of genome completeness and redundancy, and a phylogenomic tree based on a specified single-copy gene (SCG) set. Although GToTree can work with any custom hidden Markov Models (HMMs), also included are 13 newly generated SCG-set HMMs for different lineages and levels of resolution, built based on searches of ∼12 000 bacterial and archaeal high-quality genomes. GToTree aims to give more researchers the capability to make phylogenomic trees.

AVAILABILITY AND IMPLEMENTATION

GToTree is open-source and freely available for download from: github.com/AstrobioMike/GToTree. It is implemented primarily in bash with helper scripts written in python.

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

摘要

基因组水平的进化推断(即系统基因组学)在许多生物学家的工作中变得越来越重要。因此,有几个工具可用于系统基因组学工作流程的主要步骤。但是,对于主要关注点不是生物信息学的生物学家来说,许多计算工作(例如大规模访问基因组数据、整合来自不同文件格式的基因组、执行所需的过滤、将不同的工具拼接在一起等)可能是不可行的。在这里,我介绍了 GToTree,这是一个命令行工具,可以接受任何组合的 fasta 文件、GenBank 文件和/或 NCBI 组装访问号作为输入,并输出一个对齐文件、基因组完整性和冗余度的估计值,以及基于指定的单拷贝基因 (SCG) 集的系统发育树。虽然 GToTree 可以与任何自定义隐马尔可夫模型 (HMM) 一起使用,但也包括 13 个新生成的 SCG 集 HMM,用于不同的谱系和分辨率级别,这些 HMM 是基于对大约 12000 个细菌和古细菌高质量基因组的搜索构建的。GToTree 的目标是让更多的研究人员能够构建系统发育树。

可用性和实现

GToTree 是开源的,可从 github.com/AstrobioMike/GToTree 免费下载。它主要用 bash 编写,并使用 python 编写辅助脚本实现。

补充信息

补充数据可在 Bioinformatics 在线获取。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/dc59/6792077/7faf50dd0ba1/btz188f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/dc59/6792077/7faf50dd0ba1/btz188f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/dc59/6792077/7faf50dd0ba1/btz188f1.jpg

相似文献

1
GToTree: a user-friendly workflow for phylogenomics.GToTree:一个用户友好的系统发育基因组学工作流程。
Bioinformatics. 2019 Oct 15;35(20):4162-4164. doi: 10.1093/bioinformatics/btz188.
2
Applications and Considerations of GToTree: A User-Friendly Workflow for Phylogenomics.GToTree的应用与考量:一种用于系统发育基因组学的用户友好型工作流程
Evol Bioinform Online. 2019 Jul 25;15:1176934319862245. doi: 10.1177/1176934319862245. eCollection 2019.
3
Sequence database versioning for command line and Galaxy bioinformatics servers.用于命令行和Galaxy生物信息学服务器的序列数据库版本控制。
Bioinformatics. 2016 Apr 15;32(8):1275-7. doi: 10.1093/bioinformatics/btv724. Epub 2015 Dec 12.
4
TREEasy: An automated workflow to infer gene trees, species trees, and phylogenetic networks from multilocus data.TREEasy:一种从多位点数据推断基因树、物种树和系统发育网络的自动化工作流程。
Mol Ecol Resour. 2020 May;20(3). doi: 10.1111/1755-0998.13149. Epub 2020 Mar 24.
5
BuddySuite: Command-Line Toolkits for Manipulating Sequences, Alignments, and Phylogenetic Trees.BuddySuite:用于操作序列、比对和系统发育树的命令行工具包。
Mol Biol Evol. 2017 Jun 1;34(6):1543-1546. doi: 10.1093/molbev/msx089.
6
LMAP_S: Lightweight Multigene Alignment and Phylogeny eStimation.LMAP_S:轻量级多基因对齐与系统发育估算。
BMC Bioinformatics. 2019 Dec 30;20(1):739. doi: 10.1186/s12859-019-3292-5.
7
JustOrthologs: a fast, accurate and user-friendly ortholog identification algorithm.JustOrthologs:一种快速、准确且用户友好的直系同源基因识别算法。
Bioinformatics. 2019 Feb 15;35(4):546-552. doi: 10.1093/bioinformatics/bty669.
8
GEnView: a gene-centric, phylogeny-based comparative genomics pipeline for bacterial genomes and plasmids.GEnView:一种基于基因和系统发育的细菌基因组和质粒比较基因组学分析工具。
Bioinformatics. 2022 Mar 4;38(6):1727-1728. doi: 10.1093/bioinformatics/btab855.
9
ACES: Analysis of Conservation with an Extensive list of Species.ACES:使用广泛的物种列表进行保护分析。
Bioinformatics. 2021 Nov 5;37(21):3920-3922. doi: 10.1093/bioinformatics/btab684.
10
geneCo: a visualized comparative genomic method to analyze multiple genome structures.基因共:一种可视化的比较基因组方法,用于分析多个基因组结构。
Bioinformatics. 2019 Dec 15;35(24):5303-5305. doi: 10.1093/bioinformatics/btz596.

引用本文的文献

1
A Bradyrhizobium isolate from a marine diatom induces nitrogen-fixing nodules in a terrestrial legume.从一种海洋硅藻中分离出的慢生根瘤菌能在一种陆生豆科植物中诱导形成固氮根瘤。
Nat Microbiol. 2025 Sep 5. doi: 10.1038/s41564-025-02105-5.
2
Conservation of sporulation genes and a transmembrane-containing Spo0B variant in .芽孢形成基因及含跨膜结构域的Spo0B变体在……中的保守性
bioRxiv. 2025 Aug 24:2025.08.24.672004. doi: 10.1101/2025.08.24.672004.
3
Investigating microbial population structure and function in the chicken caeca and large intestine over time using metagenomics.

本文引用的文献

1
The Pfam protein families database in 2019.2019 年 Pfam 蛋白质家族数据库。
Nucleic Acids Res. 2019 Jan 8;47(D1):D427-D432. doi: 10.1093/nar/gky995.
2
Single cell genomes of Prochlorococcus, Synechococcus, and sympatric microbes from diverse marine environments.来自不同海洋环境的聚球藻、聚球藻和共生微生物的单细胞基因组。
Sci Data. 2018 Sep 4;5:180154. doi: 10.1038/sdata.2018.154.
3
Recovery of nearly 8,000 metagenome-assembled genomes substantially expands the tree of life.近 8000 个宏基因组组装基因组的恢复极大地扩展了生命之树。
利用宏基因组学研究鸡盲肠和大肠中微生物种群结构和功能随时间的变化。
BMC Res Notes. 2025 Aug 15;18(1):355. doi: 10.1186/s13104-025-07441-7.
4
Microbial dark matter spearheading the biogeochemical cycle in the Solar Lake of Taba, Egypt.微生物暗物质引领着埃及塔巴太阳湖的生物地球化学循环。
Curr Res Microb Sci. 2025 Jul 1;9:100433. doi: 10.1016/j.crmicr.2025.100433. eCollection 2025.
5
Metagenomes and 1,313 metagenome-assembled genomes from a northern Gulf of Mexico coastal time series.来自墨西哥湾北部沿海时间序列的宏基因组和1313个宏基因组组装基因组。
Sci Data. 2025 Aug 8;12(1):1388. doi: 10.1038/s41597-025-05736-9.
6
Phyling: phylogenetic inference from annotated genomes.系统发育分析:从注释基因组进行系统发育推断。
bioRxiv. 2025 Aug 1:2025.07.30.666921. doi: 10.1101/2025.07.30.666921.
7
Metabolites derived from bacterial isolates of the human skin microbiome inhibit biofilm formation.源自人类皮肤微生物群细菌分离株的代谢物可抑制生物膜形成。
Microbiol Spectr. 2025 Aug 5:e0130625. doi: 10.1128/spectrum.01306-25.
8
Evidence for Divergence of the Genus '' Within the Bacterial Family .细菌科内“属”的分化证据。
Microorganisms. 2025 Jul 4;13(7):1576. doi: 10.3390/microorganisms13071576.
9
Strain-resolved comparison of beef and draft cattle rumen microbiomes using single-microbe genomics.利用单微生物基因组学对肉牛和役用牛瘤胃微生物群进行菌株解析比较。
Anim Microbiome. 2025 Jul 25;7(1):80. doi: 10.1186/s42523-025-00442-8.
10
Metagenome-assembled genome of sp. "Tanasi" from the Tellico Reservoir, Tennessee, USA.来自美国田纳西州泰利科水库的“塔纳西”菌的宏基因组组装基因组。
Microbiol Resour Announc. 2025 Aug 14;14(8):e0041725. doi: 10.1128/mra.00417-25. Epub 2025 Jul 23.
Nat Microbiol. 2017 Nov;2(11):1533-1542. doi: 10.1038/s41564-017-0012-7. Epub 2017 Sep 11.
4
Metabolic evolution and the self-organization of ecosystems.代谢进化与生态系统的自组织。
Proc Natl Acad Sci U S A. 2017 Apr 11;114(15):E3091-E3100. doi: 10.1073/pnas.1619573114. Epub 2017 Mar 27.
5
A new view of the tree of life.生命之树的新视角。
Nat Microbiol. 2016 Apr 11;1:16048. doi: 10.1038/nmicrobiol.2016.48.
6
Interactive tree of life (iTOL) v3: an online tool for the display and annotation of phylogenetic and other trees.交互式生命树(iTOL)v3:用于展示和注释系统发育树及其他树状图的在线工具。
Nucleic Acids Res. 2016 Jul 8;44(W1):W242-5. doi: 10.1093/nar/gkw290. Epub 2016 Apr 19.
7
Anvi'o: an advanced analysis and visualization platform for 'omics data.Anvi'o:一个用于“组学”数据的高级分析和可视化平台。
PeerJ. 2015 Oct 8;3:e1319. doi: 10.7717/peerj.1319. eCollection 2015.
8
IQ-TREE: a fast and effective stochastic algorithm for estimating maximum-likelihood phylogenies.IQ-TREE:一种用于估计最大似然系统发育树的快速且有效的随机算法。
Mol Biol Evol. 2015 Jan;32(1):268-74. doi: 10.1093/molbev/msu300. Epub 2014 Nov 3.
9
Single-cell genomics reveals hundreds of coexisting subpopulations in wild Prochlorococcus.单细胞基因组学揭示了野生聚球藻中数百个共存的亚群。
Science. 2014 Apr 25;344(6182):416-20. doi: 10.1126/science.1248575.
10
Gene and translation initiation site prediction in metagenomic sequences.元基因组序列中的基因和翻译起始位点预测。
Bioinformatics. 2012 Sep 1;28(17):2223-30. doi: 10.1093/bioinformatics/bts429. Epub 2012 Jul 12.