• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

生物信息学中复杂工作流程的管理:具有 GPU 加速的交互式工具包。

Managing Complex Workflows in Bioinformatics: An Interactive Toolkit With GPU Acceleration.

出版信息

IEEE Trans Nanobioscience. 2018 Jul;17(3):199-208. doi: 10.1109/TNB.2018.2837122. Epub 2018 May 16.

DOI:10.1109/TNB.2018.2837122
PMID:29994533
Abstract

Bioinformatics research continues to advance at an increasing scale with the help of techniques such as next-generation sequencing and the availability of tool support to automate bioinformatics processes. With this growth, a large amount of biological data gets accumulated at an unprecedented rate, demanding high-performance and high-throughput computing technologies for processing such datasets. Use of hardware accelerators, such as graphics processing units (GPUs) and distributed computing, accelerates the processing of big data in high-performance computing environments. They enable higher degrees of parallelism to be achieved, thereby increasing the throughput. In this paper, we introduce BioWorkflow, an interactive workflow management system to automate the bioinformatics analyses with the capability of scheduling parallel tasks with the use of GPU-accelerated and distributed computing. This paper describes a case study carried out to evaluate the performance of a complex workflow with branching executed by BioWorkflow. The results indicate the gains of $\times 2.89$ magnitude by utilizing GPUs and gains in speed by average $\times 2.832$ magnitude (over $n = 5$ scenarios) by parallel execution of graph nodes during multiple sequence alignment calculations. Combined speed-ups are achieved $\times 1.71$ times for complex workflows. This confirms the expected higher speed-ups when having parallelism through GPU-acceleration and concurrent execution of workflow nodes than the mainstream sequential workflow execution. The tool also provides a comprehensive user interface with better interactivity for managing complex workflows; a system usability scale score of 82.9 is confirmed high usability for the system.

摘要

生物信息学研究在下一代测序技术和自动化生物信息学流程工具支持的帮助下,继续以越来越大的规模推进。随着这种增长,大量的生物数据以前所未有的速度积累,需要高性能和高通量计算技术来处理这些数据集。硬件加速器的使用,如图形处理单元 (GPU) 和分布式计算,加速了高性能计算环境中大数据的处理。它们能够实现更高程度的并行性,从而提高吞吐量。在本文中,我们介绍了 BioWorkflow,这是一个交互式工作流管理系统,具有使用 GPU 加速和分布式计算调度并行任务的能力,可实现生物信息学分析的自动化。本文描述了一个案例研究,评估了通过 BioWorkflow 执行具有分支的复杂工作流的性能。结果表明,利用 GPU 可获得 2.89 倍的增益,通过在多个序列比对计算中并行执行图节点,平均可获得 2.832 倍的速度增益(在 5 个场景中)。对于复杂的工作流程,实现了 1.71 倍的综合加速。这证实了当通过 GPU 加速和工作流程节点的并发执行具有并行性时,比主流的顺序工作流程执行具有更高的速度提升预期。该工具还提供了一个具有更好交互性的综合用户界面,用于管理复杂的工作流程;系统可用性量表的分数为 82.9,证实了系统的高可用性。

相似文献

1
Managing Complex Workflows in Bioinformatics: An Interactive Toolkit With GPU Acceleration.生物信息学中复杂工作流程的管理:具有 GPU 加速的交互式工具包。
IEEE Trans Nanobioscience. 2018 Jul;17(3):199-208. doi: 10.1109/TNB.2018.2837122. Epub 2018 May 16.
2
Watchdog - a workflow management system for the distributed analysis of large-scale experimental data.Watchdog - 一种用于大规模实验数据分析的分布式工作流管理系统。
BMC Bioinformatics. 2018 Mar 13;19(1):97. doi: 10.1186/s12859-018-2107-4.
3
Biowep: a workflow enactment portal for bioinformatics applications.生物工作流引擎(Biowep):一个用于生物信息学应用的工作流制定门户。
BMC Bioinformatics. 2007 Mar 8;8 Suppl 1(Suppl 1):S19. doi: 10.1186/1471-2105-8-S1-S19.
4
Experiences with workflows for automating data-intensive bioinformatics.自动化数据密集型生物信息学工作流程的经验。
Biol Direct. 2015 Aug 19;10:43. doi: 10.1186/s13062-015-0071-8.
5
A graphical, interactive and GPU-enabled workflow to process long-read sequencing data.一种图形化、交互式且支持 GPU 的工作流程,用于处理长读测序数据。
BMC Genomics. 2021 Aug 23;22(1):626. doi: 10.1186/s12864-021-07927-1.
6
Workflows in bioinformatics: meta-analysis and prototype implementation of a workflow generator.生物信息学中的工作流程:工作流程生成器的元分析与原型实现
BMC Bioinformatics. 2005 Apr 7;6:87. doi: 10.1186/1471-2105-6-87.
7
Wildfire: distributed, Grid-enabled workflow construction and execution.野火:分布式、支持网格的工作流构建与执行。
BMC Bioinformatics. 2005 Mar 24;6:69. doi: 10.1186/1471-2105-6-69.
8
Windows .NET Network Distributed Basic Local Alignment Search Toolkit (W.ND-BLAST).Windows .NET网络分布式基本局部比对搜索工具包(W.ND-BLAST)。
BMC Bioinformatics. 2005 Apr 8;6:93. doi: 10.1186/1471-2105-6-93.
9
NMF-mGPU: non-negative matrix factorization on multi-GPU systems.NMF-mGPU:多GPU系统上的非负矩阵分解
BMC Bioinformatics. 2015 Feb 13;16:43. doi: 10.1186/s12859-015-0485-4.
10
BioWMS: a web-based Workflow Management System for bioinformatics.BioWMS:一种用于生物信息学的基于网络的工作流管理系统。
BMC Bioinformatics. 2007 Mar 8;8 Suppl 1(Suppl 1):S2. doi: 10.1186/1471-2105-8-S1-S2.

引用本文的文献

1
Sphae: an automated toolkit for predicting phage therapy candidates from sequencing data.Sphae:一个用于从测序数据中预测噬菌体治疗候选物的自动化工具包。
Bioinform Adv. 2025 Jan 17;5(1):vbaf004. doi: 10.1093/bioadv/vbaf004. eCollection 2025.
2
phage therapy candidates from Sphae: An automated toolkit for predicting sequencing data.来自Sphae的噬菌体治疗候选物:一个用于预测测序数据的自动化工具包。
bioRxiv. 2024 Nov 18:2024.11.18.624194. doi: 10.1101/2024.11.18.624194.
3
Ten simple rules and a template for creating workflows-as-applications.
创建工作流即应用程序的十条简单规则及一个模板。
PLoS Comput Biol. 2022 Dec 15;18(12):e1010705. doi: 10.1371/journal.pcbi.1010705. eCollection 2022 Dec.
4
Provenance-and machine learning-based recommendation of parameter values in scientific workflows.科学工作流程中基于来源和机器学习的参数值推荐。
PeerJ Comput Sci. 2021 Jul 5;7:e606. doi: 10.7717/peerj-cs.606. eCollection 2021.
5
Bioinformatics Workflows With NoSQL Database in Cloud Computing.云计算中使用非关系型数据库的生物信息学工作流程。
Evol Bioinform Online. 2019 Dec 5;15:1176934319889974. doi: 10.1177/1176934319889974. eCollection 2019.
6
MCtandem: an efficient tool for large-scale peptide identification on many integrated core (MIC) architecture.MCtandem:一种在许多集成核心 (MIC) 架构上进行大规模肽鉴定的高效工具。
BMC Bioinformatics. 2019 Jul 17;20(1):397. doi: 10.1186/s12859-019-2980-5.