• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

MeSS和assembly_finder:一个用于计算机模拟宏基因组样本生成的工具包。

MeSS and assembly_finder: a toolkit for in silico metagenomic sample generation.

作者信息

Chaabane Farid, Pillonel Trestan, Bertelli Claire

机构信息

Institute of Microbiology, Lausanne University Hospital and University of Lausanne, Lausanne, 1011, Switzerland.

出版信息

Bioinformatics. 2024 Dec 26;41(1). doi: 10.1093/bioinformatics/btae760.

DOI:10.1093/bioinformatics/btae760
PMID:39739308
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC11755095/
Abstract

SUMMARY

The intrinsic complexity of the microbiota combined with technical variability render shotgun metagenomics challenging to analyze for routine clinical or research applications. In silico data generation offers a controlled environment allowing for example to benchmark bioinformatics tools, to optimize study design, statistical power, or to validate targeted applications. Here, we propose assembly_finder and the Metagenomic Sequence Simulator (MeSS), two easy-to-use Bioconda packages, as part of a benchmarking toolkit to download genomes and simulate shotgun metagenomics samples, respectively. Outperforming existing tools in speed while requiring less memory, MeSS reproducibly generates accurate complex communities based on a list of taxonomic ranks and their abundance.

AVAILABILITY AND IMPLEMENTATION

All code is released under MIT License and is available on https://github.com/metagenlab/MeSS and https://github.com/metagenlab/assembly_finder.

摘要

摘要

微生物群的内在复杂性加上技术变异性,使得鸟枪法宏基因组学在常规临床或研究应用中的分析具有挑战性。计算机模拟数据生成提供了一个可控环境,例如可用于对生物信息学工具进行基准测试、优化研究设计、统计功效,或验证靶向应用。在这里,我们提出了assembly_finder和宏基因组序列模拟器(MeSS)这两个易于使用的Bioconda软件包,作为基准测试工具包的一部分,分别用于下载基因组和模拟鸟枪法宏基因组学样本。MeSS在速度上优于现有工具,同时所需内存更少,它能根据分类等级及其丰度列表可重复地生成准确的复杂群落。

可用性和实现方式

所有代码均根据麻省理工学院许可发布,可在https://github.com/metagenlab/MeSS和https://github.com/metagenlab/assembly_finder上获取。

相似文献

1
MeSS and assembly_finder: a toolkit for in silico metagenomic sample generation.MeSS和assembly_finder:一个用于计算机模拟宏基因组样本生成的工具包。
Bioinformatics. 2024 Dec 26;41(1). doi: 10.1093/bioinformatics/btae760.
2
CAMISIM: simulating metagenomes and microbial communities.CAMISIM:模拟宏基因组和微生物群落。
Microbiome. 2019 Feb 8;7(1):17. doi: 10.1186/s40168-019-0633-6.
3
Tamock: simulation of habitat-specific benchmark data in metagenomics.Tamock:宏基因组学中栖息地特异性基准数据的模拟。
BMC Bioinformatics. 2021 May 1;22(1):227. doi: 10.1186/s12859-021-04154-z.
4
kMetaShot: a fast and reliable taxonomy classifier for metagenome-assembled genomes.kMetaShot:一种用于宏基因组组装基因组的快速且可靠的分类学分类器。
Brief Bioinform. 2024 Nov 22;26(1). doi: 10.1093/bib/bbae680.
5
CViewer: a Java-based statistical framework for integration of shotgun metagenomics with other omics datasets.CViewer:一个基于 Java 的统计框架,用于将鸟枪法宏基因组学与其他组学数据集进行整合。
Microbiome. 2024 Jun 29;12(1):117. doi: 10.1186/s40168-024-01834-9.
6
ViroProfiler: a containerized bioinformatics pipeline for viral metagenomic data analysis.ViroProfiler:用于病毒宏基因组数据分析的集装箱化生物信息学管道。
Gut Microbes. 2023 Jan-Dec;15(1):2192522. doi: 10.1080/19490976.2023.2192522.
7
Simulating Illumina metagenomic data with InSilicoSeq.用 InSilicoSeq 模拟 Illumina 宏基因组数据。
Bioinformatics. 2019 Feb 1;35(3):521-522. doi: 10.1093/bioinformatics/bty630.
8
expam-high-resolution analysis of metagenomes using distance trees.使用距离树进行宏基因组的高分辨率分析。
Bioinformatics. 2022 Oct 14;38(20):4814-4816. doi: 10.1093/bioinformatics/btac591.
9
[A review on the bioinformatics pipelines for metagenomic research].[宏基因组学研究的生物信息学流程综述]
Dongwuxue Yanjiu. 2012 Dec;33(6):574-85. doi: 10.3724/SP.J.1141.2012.06574.
10
Metagenomics Bioinformatic Pipeline.宏基因组生物信息学分析流程。
Methods Mol Biol. 2022;2512:153-179. doi: 10.1007/978-1-0716-2429-6_10.

本文引用的文献

1
Exploring and retrieving sequence and metadata for species across the tree of life with NCBI Datasets.利用 NCBI Datasets 探索和获取跨生命之树的物种的序列和元数据。
Sci Data. 2024 Jul 5;11(1):732. doi: 10.1038/s41597-024-03571-y.
2
BioConvert: a comprehensive format converter for life sciences.BioConvert:一款用于生命科学的综合格式转换器。
NAR Genom Bioinform. 2023 Aug 21;5(3):lqad074. doi: 10.1093/nargab/lqad074. eCollection 2023 Sep.
3
Ten simple rules and a template for creating workflows-as-applications.创建工作流即应用程序的十条简单规则及一个模板。
PLoS Comput Biol. 2022 Dec 15;18(12):e1010705. doi: 10.1371/journal.pcbi.1010705. eCollection 2022 Dec.
4
Performance evaluation of six popular short-read simulators.六种流行的短读序列模拟程序的性能评估。
Heredity (Edinb). 2023 Feb;130(2):55-63. doi: 10.1038/s41437-022-00577-3. Epub 2022 Dec 10.
5
PBSIM3: a simulator for all types of PacBio and ONT long reads.PBSIM3:一款适用于所有类型的PacBio和ONT长读长的模拟器。
NAR Genom Bioinform. 2022 Dec 1;4(4):lqac092. doi: 10.1093/nargab/lqac092. eCollection 2022 Dec.
6
SEQ2MGS: an effective tool for generating realistic artificial metagenomes from the existing sequencing data.SEQ2MGS:一种从现有测序数据生成逼真的人工宏基因组的有效工具。
NAR Genom Bioinform. 2022 Jul 25;4(3):lqac050. doi: 10.1093/nargab/lqac050. eCollection 2022 Sep.
7
Critical Assessment of Metagenome Interpretation: the second round of challenges.宏基因组解读的关键评估:第二轮挑战。
Nat Methods. 2022 Apr;19(4):429-440. doi: 10.1038/s41592-022-01431-4. Epub 2022 Apr 8.
8
Systematic benchmark of state-of-the-art variant calling pipelines identifies major factors affecting accuracy of coding sequence variant discovery.系统基准测试最先进的变异调用管道,确定影响编码序列变异发现准确性的主要因素。
BMC Genomics. 2022 Feb 22;23(1):155. doi: 10.1186/s12864-022-08365-3.
9
BUSCO: Assessing Genomic Data Quality and Beyond.BUSCO:评估基因组数据质量及其他。
Curr Protoc. 2021 Dec;1(12):e323. doi: 10.1002/cpz1.323.
10
Building up a clinical microbiota profiling: a quality framework proposal.建立临床微生物组特征分析:质量框架方案。
Crit Rev Microbiol. 2022 May;48(3):356-375. doi: 10.1080/1040841X.2021.1975642. Epub 2021 Nov 9.