• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

H-BLAST:一种用于具有图形处理器的异构计算机的快速蛋白质序列比对工具包。

H-BLAST: a fast protein sequence alignment toolkit on heterogeneous computers with GPUs.

作者信息

Ye Weicai, Chen Ying, Zhang Yongdong, Xu Yuesheng

机构信息

School of Data and Computer Science, and Guangdong Province Key Laboratory of Computational Science, Sun Yat-sen University, Guangzhou 510275, People's Republic of China.

Professor Emeritus of Department of Mathematics, Syracuse University, Syracuse, NY 13244, USA.

出版信息

Bioinformatics. 2017 Apr 15;33(8):1130-1138. doi: 10.1093/bioinformatics/btw769.

DOI:10.1093/bioinformatics/btw769
PMID:28087515
Abstract

MOTIVATION

The sequence alignment is a fundamental problem in bioinformatics. BLAST is a routinely used tool for this purpose with over 118 000 citations in the past two decades. As the size of bio-sequence databases grows exponentially, the computational speed of alignment softwares must be improved.

RESULTS

We develop the heterogeneous BLAST (H-BLAST), a fast parallel search tool for a heterogeneous computer that couples CPUs and GPUs, to accelerate BLASTX and BLASTP-basic tools of NCBI-BLAST. H-BLAST employs a locally decoupled seed-extension algorithm for better performance on GPUs, and offers a performance tuning mechanism for better efficiency among various CPUs and GPUs combinations. H-BLAST produces identical alignment results as NCBI-BLAST and its computational speed is much faster than that of NCBI-BLAST. Speedups achieved by H-BLAST over sequential NCBI-BLASTP (resp. NCBI-BLASTX) range mostly from 4 to 10 (resp. 5 to 7.2). With 2 CPU threads and 2 GPUs, H-BLAST can be faster than 16-threaded NCBI-BLASTX. Furthermore, H-BLAST is 1.5-4 times faster than GPU-BLAST.

AVAILABILITY AND IMPLEMENTATION

https://github.com/Yeyke/H-BLAST.git.

CONTACT

yux06@syr.edu.

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

动机

序列比对是生物信息学中的一个基本问题。BLAST是为此目的经常使用的工具,在过去二十年中有超过118000次引用。随着生物序列数据库规模呈指数级增长,比对软件的计算速度必须提高。

结果

我们开发了异构BLAST(H-BLAST),这是一种用于异构计算机的快速并行搜索工具,它结合了CPU和GPU,以加速NCBI-BLAST的BLASTX和BLASTP基本工具。H-BLAST采用局部解耦的种子扩展算法以在GPU上获得更好的性能,并提供性能调优机制以在各种CPU和GPU组合中提高效率。H-BLAST产生与NCBI-BLAST相同的比对结果,并且其计算速度比NCBI-BLAST快得多。H-BLAST相对于顺序NCBI-BLASTP(分别为NCBI-BLASTX)实现的加速比大多在4到10(分别为5到7.2)之间。使用2个CPU线程和2个GPU时,H-BLAST可以比16线程的NCBI-BLASTX更快。此外,H-BLAST比GPU-BLAST快1.5到4倍。

可用性和实现方式

https://github.com/Yeyke/H-BLAST.git。

联系方式

yux06@syr.edu。

补充信息

补充数据可在《生物信息学》在线获取。

相似文献

1
H-BLAST: a fast protein sequence alignment toolkit on heterogeneous computers with GPUs.H-BLAST:一种用于具有图形处理器的异构计算机的快速蛋白质序列比对工具包。
Bioinformatics. 2017 Apr 15;33(8):1130-1138. doi: 10.1093/bioinformatics/btw769.
2
G-BLASTN: accelerating nucleotide alignment by graphics processors.G-BLASTN:通过图形处理器加速核苷酸比对。
Bioinformatics. 2014 May 15;30(10):1384-91. doi: 10.1093/bioinformatics/btu047. Epub 2014 Jan 24.
3
GPU-BLAST: using graphics processors to accelerate protein sequence alignment.GPU-BLAST:利用图形处理器加速蛋白质序列比对。
Bioinformatics. 2011 Jan 15;27(2):182-8. doi: 10.1093/bioinformatics/btq644. Epub 2010 Nov 18.
4
muBLASTP: database-indexed protein sequence search on multicore CPUs.muBLASTP:基于多核CPU的数据库索引蛋白质序列搜索。
BMC Bioinformatics. 2016 Nov 4;17(1):443. doi: 10.1186/s12859-016-1302-4.
5
High speed BLASTN: an accelerated MegaBLAST search tool.高速BLASTN:一种加速的MegaBLAST搜索工具。
Nucleic Acids Res. 2015 Sep 18;43(16):7762-8. doi: 10.1093/nar/gkv784. Epub 2015 Aug 6.
6
CUDA-BLASTP: accelerating BLASTP on CUDA-enabled graphics hardware.CUDA-BLASTP:在支持 CUDA 的图形硬件上加速 BLASTP。
IEEE/ACM Trans Comput Biol Bioinform. 2011 Nov-Dec;8(6):1678-84. doi: 10.1109/TCBB.2011.33.
7
Arioc: High-concurrency short-read alignment on multiple GPUs.Arioc:在多个 GPU 上进行高并发性短读对齐。
PLoS Comput Biol. 2020 Nov 9;16(11):e1008383. doi: 10.1371/journal.pcbi.1008383. eCollection 2020 Nov.
8
BLAST: improvements for better sequence analysis.BLAST:用于更好序列分析的改进方法。
Nucleic Acids Res. 2006 Jul 1;34(Web Server issue):W6-9. doi: 10.1093/nar/gkl164.
9
CUDASW++ 3.0: accelerating Smith-Waterman protein database search by coupling CPU and GPU SIMD instructions.CUDASW++ 3.0:通过结合 CPU 和 GPU 的 SIMD 指令来加速 Smith-Waterman 蛋白质数据库搜索。
BMC Bioinformatics. 2013 Apr 4;14:117. doi: 10.1186/1471-2105-14-117.
10
Windows .NET Network Distributed Basic Local Alignment Search Toolkit (W.ND-BLAST).Windows .NET网络分布式基本局部比对搜索工具包(W.ND-BLAST)。
BMC Bioinformatics. 2005 Apr 8;6:93. doi: 10.1186/1471-2105-6-93.

引用本文的文献

1
Rapid multiple protein sequence search by parallel and heterogeneous computation.通过并行和异构计算进行快速的多蛋白质序列搜索。
Bioinformatics. 2024 Mar 29;40(4). doi: 10.1093/bioinformatics/btae151.
2
Genomic Analyses of Species Have Revealed Patulin and Citrinin Gene Clusters and Novel Loci Involved in Oxylipin Production.物种的基因组分析揭示了展青霉素和桔霉素基因簇以及参与氧脂素产生的新位点。
J Fungi (Basel). 2021 Sep 9;7(9):743. doi: 10.3390/jof7090743.
3
GPrimer: a fast GPU-based pipeline for primer design for qPCR experiments.
GPrimer:一种用于 qPCR 实验的基于 GPU 的引物设计的快速流水线。
BMC Bioinformatics. 2021 Apr 29;22(1):220. doi: 10.1186/s12859-021-04133-4.
4
Transcriptome sequencing and screening of genes related to sex determination of Trichosanthes kirilowii Maxim.转录组测序及与苦瓜性别决定相关基因的筛选
PLoS One. 2020 Oct 15;15(10):e0239230. doi: 10.1371/journal.pone.0239230. eCollection 2020.
5
HipMCL: a high-performance parallel implementation of the Markov clustering algorithm for large-scale networks.HipMCL:一种用于大规模网络的马尔可夫聚类算法的高性能并行实现。
Nucleic Acids Res. 2018 Apr 6;46(6):e33. doi: 10.1093/nar/gkx1313.