Suppr超能文献

BioMake:一个与 GNU make 兼容的用于声明式工作流管理的实用程序。

BioMake: a GNU make-compatible utility for declarative workflow management.

机构信息

Department of Bioengineering, University of California, Berkeley, CA 94720, USA.

Molecular Biophysics and Integrated Bioimaging Division, Lawrence Berkeley National Laboratory, Berkeley, CA 94720, USA.

出版信息

Bioinformatics. 2017 Nov 1;33(21):3502-3504. doi: 10.1093/bioinformatics/btx306.

Abstract

MOTIVATION

The Unix 'make' program is widely used in bioinformatics pipelines, but suffers from problems that limit its application to large analysis datasets. These include reliance on file modification times to determine whether a target is stale, lack of support for parallel execution on clusters, and restricted flexibility to extend the underlying logic program.

RESULTS

We present BioMake, a make-like utility that is compatible with most features of GNU Make and adds support for popular cluster-based job-queue engines, MD5 signatures as an alternative to timestamps, and logic programming extensions in Prolog.

AVAILABILITY AND IMPLEMENTATION

BioMake is available for MacOSX and Linux systems from https://github.com/evoldoers/biomake under the BSD3 license. The only dependency is SWI-Prolog (version 7), available from http://www.swi-prolog.org/.

CONTACT

ihholmes + biomake@gmail.com or cmungall + biomake@gmail.com.

SUPPLEMENTARY INFORMATION

Feature table comparing BioMake to similar tools. Supplementary data are available at Bioinformatics online.

摘要

动机

Unix 'make' 程序在生物信息学管道中被广泛使用,但存在一些限制其在大型分析数据集上应用的问题。这些问题包括依赖文件修改时间来确定目标是否过时、缺乏对集群上并行执行的支持,以及对底层逻辑程序的扩展的限制。

结果

我们提出了 BioMake,这是一个类似于 make 的实用程序,与大多数 GNU Make 的功能兼容,并添加了对流行的基于集群的作业队列引擎的支持、将 MD5 签名作为时间戳的替代,以及 Prolog 中的逻辑编程扩展。

可用性和实现

BioMake 可从 https://github.com/evoldoers/biomake 获得 MacOSX 和 Linux 系统,许可证为 BSD3。唯一的依赖项是 SWI-Prolog(版本 7),可从 http://www.swi-prolog.org/ 获取。

联系方式

ihholmes+biomake@gmail.comcmungall+biomake@gmail.com

补充信息

比较 BioMake 和类似工具的功能表。补充数据可在 Bioinformatics 在线获得。

相似文献

2
GlyGen data model and processing workflow.GlyGen 数据模型和处理工作流程。
Bioinformatics. 2020 Jun 1;36(12):3941-3943. doi: 10.1093/bioinformatics/btaa238.
4
Phyx: phylogenetic tools for unix.Phyx:适用于Unix的系统发育工具。
Bioinformatics. 2017 Jun 15;33(12):1886-1888. doi: 10.1093/bioinformatics/btx063.
6
BigDataScript: a scripting language for data pipelines.大数据脚本语言:一种用于数据管道的脚本语言。
Bioinformatics. 2015 Jan 1;31(1):10-6. doi: 10.1093/bioinformatics/btu595. Epub 2014 Sep 3.
7
Nozzle: a report generation toolkit for data analysis pipelines.喷嘴:数据分析管道的报告生成工具包。
Bioinformatics. 2013 Apr 15;29(8):1089-91. doi: 10.1093/bioinformatics/btt085. Epub 2013 Feb 17.
9
A graph-based approach for designing extensible pipelines.基于图的可扩展流水线设计方法。
BMC Bioinformatics. 2012 Jul 12;13:163. doi: 10.1186/1471-2105-13-163.
10
BDTcomparator: a program for comparing binary classifiers.BDTcomparator:用于比较二分类器的程序。
Bioinformatics. 2011 Dec 15;27(24):3439-40. doi: 10.1093/bioinformatics/btr574. Epub 2011 Oct 13.

本文引用的文献

1
Gene Ontology Consortium: going forward.基因本体论联盟:展望未来。
Nucleic Acids Res. 2015 Jan;43(Database issue):D1049-56. doi: 10.1093/nar/gku1179. Epub 2014 Nov 26.

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验