• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

GEN-ERA 工具包:用于微生物基因组学研究的统一且可重复的工作流程。

The GEN-ERA toolbox: unified and reproducible workflows for research in microbial genomics.

机构信息

BCCM/IHEM, Mycology and Aerobiology, Sciensano, 1050, Brussels, Belgium.

InBioS, Physiology and Bacterial Genetics, University of Liège, 4000, Liège, Belgium.

出版信息

Gigascience. 2022 Dec 28;12. doi: 10.1093/gigascience/giad022. Epub 2023 Apr 10.

DOI:10.1093/gigascience/giad022
PMID:37036103
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC10084500/
Abstract

BACKGROUND

Microbial culture collections play a key role in taxonomy by studying the diversity of their strains and providing well-characterized biological material to the scientific community for fundamental and applied research. These microbial resource centers thus need to implement new standards in species delineation, including whole-genome sequencing and phylogenomics. In this context, the genomic needs of the Belgian Coordinated Collections of Microorganisms were studied, resulting in the GEN-ERA toolbox. The latter is a unified cluster of bioinformatic workflows dedicated to both bacteria and small eukaryotes (e.g., yeasts).

FINDINGS

This public toolbox allows researchers without a specific training in bioinformatics to perform robust phylogenomic analyses. Hence, it facilitates all steps from genome downloading and quality assessment, including genomic contamination estimation, to tree reconstruction. It also offers workflows for average nucleotide identity comparisons and metabolic modeling.

TECHNICAL DETAILS

Nextflow workflows are launched by a single command and are available on the GEN-ERA GitHub repository (https://github.com/Lcornet/GENERA). All the workflows are based on Singularity containers to increase reproducibility.

TESTING

The toolbox was developed for a diversity of microorganisms, including bacteria and fungi. It was further tested on an empirical dataset of 18 (meta)genomes of early branching Cyanobacteria, providing the most up-to-date phylogenomic analysis of the Gloeobacterales order, the first group to diverge in the evolutionary tree of Cyanobacteria.

CONCLUSION

The GEN-ERA toolbox can be used to infer completely reproducible comparative genomic and metabolic analyses on prokaryotes and small eukaryotes. Although designed for routine bioinformatics of culture collections, it can also be used by all researchers interested in microbial taxonomy, as exemplified by our case study on Gloeobacterales.

摘要

背景

微生物培养物收藏通过研究其菌株的多样性并为科学界提供经过良好表征的生物材料,在分类学中发挥着关键作用,用于基础和应用研究。因此,这些微生物资源中心需要在物种划分方面实施新标准,包括全基因组测序和系统发育基因组学。在此背景下,研究了比利时协调微生物收藏的基因组需求,从而产生了 GEN-ERA 工具箱。后者是一个统一的生物信息学工作流程簇,专门用于细菌和小型真核生物(例如酵母)。

发现

这个公共工具箱允许没有生物信息学专业培训的研究人员进行稳健的系统发育基因组分析。因此,它简化了从基因组下载和质量评估到树重建的所有步骤。它还提供了平均核苷酸同一性比较和代谢建模的工作流程。

技术细节

通过单个命令启动 Nextflow 工作流程,并可在 GEN-ERA GitHub 存储库(https://github.com/Lcornet/GENERA)上使用。所有工作流程都基于 Singularity 容器,以提高可重复性。

测试

该工具箱针对包括细菌和真菌在内的各种微生物进行了开发。进一步在 18 个早期分支蓝细菌的(宏)基因组的实证数据集上进行了测试,提供了 Gloeobacterales 目(蓝细菌进化树中第一个分支的第一个群体)的最新系统发育基因组分析。

结论

GEN-ERA 工具箱可用于对原核生物和小型真核生物进行完全可重现的比较基因组和代谢分析。尽管专为培养物收藏的常规生物信息学设计,但对所有对微生物分类学感兴趣的研究人员也可以使用,例如我们对 Gloeobacterales 的案例研究。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/fb0b/10084500/8e26b89ad267/giad022fig2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/fb0b/10084500/3f18cb802c2b/giad022fig1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/fb0b/10084500/8e26b89ad267/giad022fig2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/fb0b/10084500/3f18cb802c2b/giad022fig1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/fb0b/10084500/8e26b89ad267/giad022fig2.jpg

相似文献

1
The GEN-ERA toolbox: unified and reproducible workflows for research in microbial genomics.GEN-ERA 工具包:用于微生物基因组学研究的统一且可重复的工作流程。
Gigascience. 2022 Dec 28;12. doi: 10.1093/gigascience/giad022. Epub 2023 Apr 10.
2
Developing reproducible bioinformatics analysis workflows for heterogeneous computing environments to support African genomics.为异构计算环境开发可重现的生物信息学分析工作流程,以支持非洲基因组学。
BMC Bioinformatics. 2018 Nov 29;19(1):457. doi: 10.1186/s12859-018-2446-1.
3
SNVPhyl: a single nucleotide variant phylogenomics pipeline for microbial genomic epidemiology.SNVPhyl:一种用于微生物基因组流行病学的单核苷酸变异系统发育基因组学分析流程。
Microb Genom. 2017 Jun 8;3(6):e000116. doi: 10.1099/mgen.0.000116. eCollection 2017 Jun 30.
4
AMRomics: a scalable workflow to analyze large microbial genome collections.AMRomics:一种可扩展的工作流程,用于分析大型微生物基因组数据集。
BMC Genomics. 2024 Jul 22;25(1):709. doi: 10.1186/s12864-024-10620-8.
5
CAMITAX: Taxon labels for microbial genomes.CAMITAX:微生物基因组的分类标签。
Gigascience. 2020 Jan 1;9(1). doi: 10.1093/gigascience/giz154.
6
scalepopgen: Bioinformatic Workflow Resources Implemented in Nextflow for Comprehensive Population Genomic Analyses.scalepopgen:在 Nextflow 中实现的用于全面群体基因组分析的生物信息学工作流程资源。
Mol Biol Evol. 2024 Apr 2;41(4). doi: 10.1093/molbev/msae057.
7
pipesnake: generalized software for the assembly and analysis of phylogenomic datasets from conserved genomic loci.pipeSnake:用于从保守基因组座组装和分析系统发育基因组数据集的通用软件。
Bioinformatics. 2024 May 2;40(5). doi: 10.1093/bioinformatics/btae195.
8
Scalable Workflows and Reproducible Data Analysis for Genomics.基因组学的可扩展工作流程和可重复数据分析
Methods Mol Biol. 2019;1910:723-745. doi: 10.1007/978-1-4939-9074-0_24.
9
ILIAD: a suite of automated Snakemake workflows for processing genomic data for downstream applications.ILIAD:一套用于处理基因组数据以用于下游应用的自动化 Snakemake 工作流程套件。
BMC Bioinformatics. 2023 Nov 8;24(1):424. doi: 10.1186/s12859-023-05548-x.
10
Phylogenomic analyses and reclassification of the Mesorhizobium complex: proposal for 9 novel genera and reclassification of 15 species.系统发育基因组分析与中慢生根瘤菌复合体的重新分类:建议设立 9 个新属和重新分类 15 个种。
BMC Genomics. 2024 Apr 29;25(1):419. doi: 10.1186/s12864-024-10333-y.

引用本文的文献

1
Metagenome quality metrics and taxonomical annotation visualization through the integration of MAGFlow and BIgMAG.通过 MAGFlow 和 BigMAG 的集成实现宏基因组质量指标和分类注释可视化。
F1000Res. 2024 Sep 23;13:640. doi: 10.12688/f1000research.152290.2. eCollection 2024.
2
TADA: taxonomy-aware dataset aggregator.TADA:基于分类法的数据集合器。
Bioinformatics. 2023 Dec 1;39(12). doi: 10.1093/bioinformatics/btad742.

本文引用的文献

1
GTDB-Tk v2: memory friendly classification with the genome taxonomy database.GTDB-Tk v2:使用基因组分类数据库实现内存友好的分类。
Bioinformatics. 2022 Nov 30;38(23):5315-5316. doi: 10.1093/bioinformatics/btac672.
2
Phylogenomic Analyses of Isolates from Honeybees and Bumblebees Reveal Taxonomic and Functional Diversity.对来自蜜蜂和熊蜂的分离株的系统基因组分析揭示了分类和功能多样性。
mSystems. 2022 Jun 28;7(3):e0150021. doi: 10.1128/msystems.01500-21. Epub 2022 May 23.
3
Contamination detection in genomic data: more is not enough.
基因组数据中的污染检测:更多并不一定更好。
Genome Biol. 2022 Feb 21;23(1):60. doi: 10.1186/s13059-022-02619-9.
4
GenBank.GenBank
Nucleic Acids Res. 2022 Jan 7;50(D1):D161-D164. doi: 10.1093/nar/gkab1135.
5
Complete Genome Sequencing of a Novel Gloeobacter Species from a Waterfall Cave in Mexico.墨西哥一个瀑布洞穴中新型 Gloeobacter 物种的全基因组测序。
Genome Biol Evol. 2021 Dec 1;13(12). doi: 10.1093/gbe/evab264.
6
ORPER: A Workflow for Constrained SSU rRNA Phylogenies.ORPER:一种有约束的 SSURNA 系统发育的工作流程。
Genes (Basel). 2021 Oct 29;12(11):1741. doi: 10.3390/genes12111741.
7
Contamination in Reference Sequence Databases: Time for Divide-and-Rule Tactics.参考序列数据库中的污染:是时候采取分而治之的策略了。
Front Microbiol. 2021 Oct 22;12:755101. doi: 10.3389/fmicb.2021.755101. eCollection 2021.
8
The taxonomy of the complex: a phylogenomic approach.复合体的分类学:一种系统发生基因组学方法。
Microb Genom. 2021 Nov;7(11). doi: 10.1099/mgen.0.000707.
9
Phylogenomics of a new fungal phylum reveals multiple waves of reductive evolution across Holomycota.真核生物新门的系统发生基因组学研究揭示了 Holomycota 中多次的精简演化。
Nat Commun. 2021 Aug 17;12(1):4973. doi: 10.1038/s41467-021-25308-w.
10
BUSCO Update: Novel and Streamlined Workflows along with Broader and Deeper Phylogenetic Coverage for Scoring of Eukaryotic, Prokaryotic, and Viral Genomes.BUSCO 更新:用于真核生物、原核生物和病毒基因组评分的新颖且简化的工作流程以及更广泛和更深的系统发育覆盖范围。
Mol Biol Evol. 2021 Sep 27;38(10):4647-4654. doi: 10.1093/molbev/msab199.