• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

grenepipe:一个灵活、可扩展且可重复的管道,用于从序列读取中自动进行变体调用。

grenepipe: a flexible, scalable and reproducible pipeline to automate variant calling from sequence reads.

机构信息

Department of Plant Biology, Carnegie Institution for Science, Stanford, CA 94305, USA.

Department of Global Ecology, Carnegie Institution for Science, Stanford, CA 94305, USA.

出版信息

Bioinformatics. 2022 Oct 14;38(20):4809-4811. doi: 10.1093/bioinformatics/btac600.

DOI:10.1093/bioinformatics/btac600
PMID:36053180
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC10424805/
Abstract

SUMMARY

We developed grenepipe, an all-in-one Snakemake workflow to streamline the data processing from raw high-throughput sequencing data of individuals or populations to genotype variant calls. Our pipeline offers a range of popular software tools within a single configuration file, automatically installs software dependencies, is highly optimized for scalability in cluster environments and runs with a single command.

AVAILABILITY AND IMPLEMENTATION

grenepipe is published under the GPLv3 and freely available at github.com/moiexpositoalonsolab/grenepipe.

摘要

摘要

我们开发了 grenepipe,这是一个一体化的 Snakemake 工作流程,用于简化从个体或群体的原始高通量测序数据到基因型变异呼叫的数据处理。我们的管道在单个配置文件中提供了一系列流行的软件工具,自动安装软件依赖项,针对集群环境中的可扩展性进行了高度优化,并可以使用单个命令运行。

可用性和实现

grenepipe 根据 GPLv3 发布,可在 github.com/moiexpositoalonsolab/grenepipe 上免费获得。

相似文献

1
grenepipe: a flexible, scalable and reproducible pipeline to automate variant calling from sequence reads. grenepipe:一个灵活、可扩展且可重复的管道,用于从序列读取中自动进行变体调用。
Bioinformatics. 2022 Oct 14;38(20):4809-4811. doi: 10.1093/bioinformatics/btac600.
2
Natrix: a Snakemake-based workflow for processing, clustering, and taxonomically assigning amplicon sequencing reads.Natrix:一个基于 SnakeMake 的工作流程,用于处理、聚类和分类分配扩增子测序reads。
BMC Bioinformatics. 2020 Nov 16;21(1):526. doi: 10.1186/s12859-020-03852-4.
3
ILIAD: a suite of automated Snakemake workflows for processing genomic data for downstream applications.ILIAD:一套用于处理基因组数据以用于下游应用的自动化 Snakemake 工作流程套件。
BMC Bioinformatics. 2023 Nov 8;24(1):424. doi: 10.1186/s12859-023-05548-x.
4
DNAscan2: a versatile, scalable, and user-friendly analysis pipeline for human next-generation sequencing data.DNAscan2:一种功能多样、可扩展且易于使用的人类下一代测序数据分析管道。
Bioinformatics. 2023 Apr 3;39(4). doi: 10.1093/bioinformatics/btad152.
5
CDSnake: Snakemake pipeline for retrieval of annotated OTUs from paired-end reads using CD-HIT utilities.CDSnake:使用 CD-HIT 工具从配对末端读取中检索带注释的 OTU 的 Snakemake 管道。
BMC Bioinformatics. 2020 Jul 24;21(Suppl 12):303. doi: 10.1186/s12859-020-03591-6.
6
VC@Scale: Scalable and high-performance variant calling on cluster environments.VC@Scale:在集群环境中进行可扩展且高性能的变体调用。
Gigascience. 2021 Sep 7;10(9). doi: 10.1093/gigascience/giab057.
7
TransFlow: a Snakemake workflow for transmission analysis of Mycobacterium tuberculosis whole-genome sequencing data.TransFlow:一种用于结核分枝杆菌全基因组测序数据分析的 Snakemake 工作流程。
Bioinformatics. 2023 Jan 1;39(1). doi: 10.1093/bioinformatics/btac785.
8
Mapache: a flexible pipeline to map ancient DNA.Mapache:一个灵活的古 DNA 映射管道。
Bioinformatics. 2023 Feb 3;39(2). doi: 10.1093/bioinformatics/btad028.
9
The GenoPred pipeline: a comprehensive and scalable pipeline for polygenic scoring.GenoPred 管道:一种全面且可扩展的多基因评分管道。
Bioinformatics. 2024 Oct 1;40(10). doi: 10.1093/bioinformatics/btae551.
10
VIPER: Visualization Pipeline for RNA-seq, a Snakemake workflow for efficient and complete RNA-seq analysis.VIPER:RNA-seq 可视化管道,一个 Snakemake 工作流程,用于高效完整的 RNA-seq 分析。
BMC Bioinformatics. 2018 Apr 12;19(1):135. doi: 10.1186/s12859-018-2139-9.

引用本文的文献

1
Baboons at a Crossroads: Hybridisation Events and Genomic Links of Central Mozambique's Baboons With Papio Neighbors.处于十字路口的狒狒:莫桑比克中部狒狒与豚尾狒狒邻居的杂交事件及基因组联系
Am J Biol Anthropol. 2025 Jul;187(3):e70082. doi: 10.1002/ajpa.70082.
2
Rapid adaptation and extinction across climates in synchronized outdoor evolution experiments of .在……的同步户外进化实验中跨气候的快速适应与灭绝
bioRxiv. 2025 May 28:2025.05.28.654549. doi: 10.1101/2025.05.28.654549.
3
Mitochondrial genomes of the European sardine (Sardina pilchardus) reveal Pliocene diversification, extensive gene flow and pervasive purifying selection.欧洲沙丁鱼(Sardina pilchardus)的线粒体基因组揭示了上新世的多样化、广泛的基因流动和普遍存在的纯化选择。
Sci Rep. 2024 Dec 28;14(1):30977. doi: 10.1038/s41598-024-82054-x.
4
Maroon Rice Genomic Diversity Reflects 350 Years of Colonial History.红糙米的基因组多样性反映了 350 年的殖民历史。
Mol Biol Evol. 2024 Oct 4;41(10). doi: 10.1093/molbev/msae204.
5
grenedalf: population genetic statistics for the next generation of pool sequencing.格伦代尔:下一代池测序的群体遗传统计。
Bioinformatics. 2024 Aug 2;40(8). doi: 10.1093/bioinformatics/btae508.
6
loco-pipe: an automated pipeline for population genomics with low-coverage whole-genome sequencing.局部管道:一种用于低覆盖度全基因组测序群体基因组学的自动化管道。
Bioinform Adv. 2024 Jul 11;4(1):vbae098. doi: 10.1093/bioadv/vbae098. eCollection 2024.
7
A Fast, Reproducible, High-throughput Variant Calling Workflow for Population Genomics.一种用于群体基因组学的快速、可重现、高通量的变异calling 工作流程。
Mol Biol Evol. 2024 Jan 3;41(1). doi: 10.1093/molbev/msad270.
8
ARA: a flexible pipeline for automated exploration of NCBI SRA datasets.ARA:一个用于自动探索 NCBI SRA 数据集的灵活管道。
Gigascience. 2022 Dec 28;12. doi: 10.1093/gigascience/giad067. Epub 2023 Aug 17.
9
Wide-ranging consequences of priority effects governed by an overarching factor.由一个总括因素控制的优先效应的广泛后果。
Elife. 2022 Oct 27;11:e79647. doi: 10.7554/eLife.79647.

本文引用的文献

1
Sustainable data analysis with Snakemake.使用 Snakemake 进行可持续数据分析。
F1000Res. 2021 Jan 18;10:33. doi: 10.12688/f1000research.29032.2. eCollection 2021.
2
DamageProfiler: fast damage pattern calculation for ancient DNA.DamageProfiler:用于古代DNA的快速损伤模式计算
Bioinformatics. 2021 Oct 25;37(20):3652-3653. doi: 10.1093/bioinformatics/btab190.
3
Reproducible, portable, and efficient ancient genome reconstruction with nf-core/eager.利用nf-core/eager进行可重复、便携且高效的古代基因组重建。
PeerJ. 2021 Mar 16;9:e10947. doi: 10.7717/peerj.10947. eCollection 2021.
4
RNAflow: An Effective and Simple RNA-Seq Differential Gene Expression Pipeline Using Nextflow.RNAflow:一种使用 Nextflow 的高效、简单的 RNA-Seq 差异基因表达分析流程。
Genes (Basel). 2020 Dec 10;11(12):1487. doi: 10.3390/genes11121487.
5
Accurate Allele Frequencies from Ultra-low Coverage Pool-Seq Samples in Evolve-and-Resequence Experiments.从进化重测序实验的超低覆盖度池测序样本中获得准确的等位基因频率。
G3 (Bethesda). 2019 Dec 3;9(12):4159-4168. doi: 10.1534/g3.119.400755.
6
fastp: an ultra-fast all-in-one FASTQ preprocessor.fastp:一个超快速的一体化 FASTQ 预处理程序。
Bioinformatics. 2018 Sep 1;34(17):i884-i890. doi: 10.1093/bioinformatics/bty560.
7
Bioconda: sustainable and comprehensive software distribution for the life sciences.生物conda:面向生命科学的可持续且全面的软件发行平台。
Nat Methods. 2018 Jul;15(7):475-476. doi: 10.1038/s41592-018-0046-7.
8
A review of somatic single nucleotide variant calling algorithms for next-generation sequencing data.用于下一代测序数据的体细胞单核苷酸变异检测算法综述。
Comput Struct Biotechnol J. 2018 Feb 6;16:15-24. doi: 10.1016/j.csbj.2018.01.003. eCollection 2018.
9
NGS-pipe: a flexible, easily extendable and highly configurable framework for NGS analysis.NGS-pipe:一个灵活、易于扩展且高度可配置的 NGS 分析框架。
Bioinformatics. 2018 Jan 1;34(1):107-108. doi: 10.1093/bioinformatics/btx540.
10
SeqKit: A Cross-Platform and Ultrafast Toolkit for FASTA/Q File Manipulation.SeqKit:一个用于FASTA/Q文件操作的跨平台超快速工具包。
PLoS One. 2016 Oct 5;11(10):e0163962. doi: 10.1371/journal.pone.0163962. eCollection 2016.