• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

NBLAST:一种用于NxN比较的BLAST聚类变体。

NBLAST: a cluster variant of BLAST for NxN comparisons.

作者信息

Dumontier Michel, Hogue Christopher W V

机构信息

Department of Biochemistry, University of Toronto, Toronto, Ontario, Canada M5S 1A8.

出版信息

BMC Bioinformatics. 2002 May 8;3:13. doi: 10.1186/1471-2105-3-13.

DOI:10.1186/1471-2105-3-13
PMID:12019022
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC113272/
Abstract

BACKGROUND

The BLAST algorithm compares biological sequences to one another in order to determine shared motifs and common ancestry. However, the comparison of all non-redundant (NR) sequences against all other NR sequences is a computationally intensive task. We developed NBLAST as a cluster computer implementation of the BLAST family of sequence comparison programs for the purpose of generating pre-computed BLAST alignments and neighbour lists of NR sequences.

RESULTS

NBLAST performs the heuristic BLAST algorithm and generates an exhaustive database of alignments, but it only computes alignments (i.e. the upper triangle) of a possible N2 alignments, where N is the set of all sequences to be compared. A task-partitioning algorithm allows for cluster computing across all cluster nodes and the NBLAST master process produces a BLAST sequence alignment database and a list of sequence neighbours for each sequence record. The resulting sequence alignment and neighbour databases are used to serve the SeqHound query system through a C/C++ and PERL Application Programming Interface (API).

CONCLUSIONS

NBLAST offers a local alternative to the NCBI's remote Entrez system for pre-computed BLAST alignments and neighbour queries. On our 216-processor 450 MHz PIII cluster, NBLAST requires ~24 hrs to compute neighbours for 850000 proteins currently in the non-redundant protein database.

摘要

背景

BLAST算法通过相互比较生物序列来确定共享基序和共同祖先。然而,将所有非冗余(NR)序列与所有其他NR序列进行比较是一项计算量很大的任务。我们开发了NBLAST,作为BLAST序列比较程序家族的一种集群计算机实现方式,目的是生成预计算的BLAST比对结果和NR序列的邻居列表。

结果

NBLAST执行启发式BLAST算法并生成一个详尽的比对数据库,但它只计算可能的N²个比对结果中的比对(即上三角部分),其中N是所有要比较的序列集合。一种任务划分算法允许在所有集群节点上进行集群计算,并且NBLAST主进程会为每个序列记录生成一个BLAST序列比对数据库和一个序列邻居列表。生成的序列比对和邻居数据库通过C/C++和PERL应用程序编程接口(API)为SeqHound查询系统提供服务。

结论

NBLAST为预计算的BLAST比对和邻居查询提供了一种替代NCBI远程Entrez系统的本地方法。在我们拥有216个处理器的450 MHz PIII集群上,NBLAST需要约24小时来为非冗余蛋白质数据库中目前的850000种蛋白质计算邻居。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/db42/113272/72bf2c91c3bb/1471-2105-3-13-1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/db42/113272/72bf2c91c3bb/1471-2105-3-13-1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/db42/113272/72bf2c91c3bb/1471-2105-3-13-1.jpg

相似文献

1
NBLAST: a cluster variant of BLAST for NxN comparisons.NBLAST:一种用于NxN比较的BLAST聚类变体。
BMC Bioinformatics. 2002 May 8;3:13. doi: 10.1186/1471-2105-3-13.
2
Large-scale comparison of protein sequence alignment algorithms with structure alignments.蛋白质序列比对算法与结构比对的大规模比较。
Proteins. 2000 Jul 1;40(1):6-22. doi: 10.1002/(sici)1097-0134(20000701)40:1<6::aid-prot30>3.0.co;2-7.
3
Parallelisation of the blast algorithm.布鲁氏菌病算法的并行化
Cell Mol Biol Lett. 2005;10(2):281-5.
4
Profiling the BLAST bioinformatics application for load balancing on high-performance computing clusters.剖析 BLAST 生物信息学应用在高性能计算集群中的负载均衡。
BMC Bioinformatics. 2022 Dec 16;23(1):544. doi: 10.1186/s12859-022-05029-7.
5
NBLAST: a graphical user interface-based two-way BLAST software with a dot plot viewer.NBLAST:一款基于图形用户界面的双向BLAST软件,带有点阵图查看器。
Genomics Inform. 2022 Sep;20(3):e40. doi: 10.5808/gi.21075. Epub 2022 Sep 30.
6
SS-Wrapper: a package of wrapper applications for similarity searches on Linux clusters.SS-Wrapper:用于在Linux集群上进行相似性搜索的一组包装应用程序。
BMC Bioinformatics. 2004 Oct 28;5:171. doi: 10.1186/1471-2105-5-171.
7
Making sense of EST sequences by CLOBBing them.通过CLOBBing法理解EST序列。
BMC Bioinformatics. 2002 Oct 25;3:31. doi: 10.1186/1471-2105-3-31.
8
Evolutionary relationships among proteins probed by an iterative neighborhood cluster analysis (INCA). Alignment of bacteriorhodopsins with the yeast sequence YRO2.通过迭代邻域聚类分析(INCA)探究蛋白质之间的进化关系。细菌视紫红质与酵母序列YRO2的比对。
Pharm Res. 1997 Nov;14(11):1533-41. doi: 10.1023/a:1012166015402.
9
Evaluation of BLAST-based edge-weighting metrics used for homology inference with the Markov Clustering algorithm.用于通过马尔可夫聚类算法进行同源性推断的基于BLAST的边加权指标评估。
BMC Bioinformatics. 2015 Jul 10;16:218. doi: 10.1186/s12859-015-0625-x.
10
NBLAST: Rapid, Sensitive Comparison of Neuronal Structure and Construction of Neuron Family Databases.NBLAST:神经元结构的快速、灵敏比较及神经元家族数据库构建
Neuron. 2016 Jul 20;91(2):293-311. doi: 10.1016/j.neuron.2016.06.012. Epub 2016 Jun 30.

引用本文的文献

1
Pathogen detection using short-RNA deep sequencing subtraction and assembly.使用短 RNA 深度测序消减和组装进行病原体检测。
Bioinformatics. 2011 Aug 1;27(15):2027-30. doi: 10.1093/bioinformatics/btr349. Epub 2011 Jun 11.
2
Detection of Spironucleus muris in unpreserved mouse tissue and fecal samples by using a PCR assay.通过聚合酶链反应(PCR)检测未保存的小鼠组织和粪便样本中的鼠螺旋体。
J Am Assoc Lab Anim Sci. 2008 Sep;47(5):39-43.
3
PLAN: a web platform for automating high-throughput BLAST searches and for managing and mining results.

本文引用的文献

1
SeqHound: biological sequence and structure database as a platform for bioinformatics research.SeqHound:作为生物信息学研究平台的生物序列与结构数据库
BMC Bioinformatics. 2002 Oct 25;3:32. doi: 10.1186/1471-2105-3-32.
2
The NCBI data model.美国国立医学图书馆国家生物技术信息中心的数据模型。
Methods Biochem Anal. 2001;43:19-43. doi: 10.1002/0471223921.ch2.
3
BIND--The Biomolecular Interaction Network Database.BIND——生物分子相互作用网络数据库。
PLAN:一个用于自动化高通量BLAST搜索以及管理和挖掘结果的网络平台。
BMC Bioinformatics. 2007 Feb 9;8:53. doi: 10.1186/1471-2105-8-53.
4
SIMAP: the similarity matrix of proteins.SIMAP:蛋白质相似性矩阵。
Nucleic Acids Res. 2006 Jan 1;34(Database issue):D252-6. doi: 10.1093/nar/gkj106.
5
Species-specific protein sequence and fold optimizations.物种特异性蛋白质序列和折叠优化。
BMC Bioinformatics. 2002 Dec 17;3:39. doi: 10.1186/1471-2105-3-39.
6
SeqHound: biological sequence and structure database as a platform for bioinformatics research.SeqHound:作为生物信息学研究平台的生物序列与结构数据库
BMC Bioinformatics. 2002 Oct 25;3:32. doi: 10.1186/1471-2105-3-32.
Nucleic Acids Res. 2001 Jan 1;29(1):242-5. doi: 10.1093/nar/29.1.242.
4
Gapped BLAST and PSI-BLAST: a new generation of protein database search programs.空位BLAST和位置特异性迭代BLAST:新一代蛋白质数据库搜索程序。
Nucleic Acids Res. 1997 Sep 1;25(17):3389-402. doi: 10.1093/nar/25.17.3389.