• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

将网格技术应用于计算密集型的应用生物信息学分析。

Using Grid technology for computationally intensive applied bioinformatics analyses.

作者信息

Andrade Jorge, Berglund Lisa, Uhlén Mathias, Odeberg Jacob

机构信息

Department of Biotechnology, Royal Institute of Technology (KTH), Stockholm, Sweden.

出版信息

In Silico Biol. 2006;6(6):495-504.

PMID:17518760
Abstract

For several applications and algorithms used in applied bioinformatics, a bottle neck in terms of computational time may arise when scaled up to facilitate analyses of large datasets and databases. Re-codification, algorithm modification or sacrifices in sensitivity and accuracy may be necessary to accommodate for limited computational capacity of single work stations. Grid computing offers an alternative model for solving massive computational problems by parallel execution of existing algorithms and software implementations. We present the implementation of a Grid-aware model for solving computationally intensive bioinformatic analyses exemplified by a blastp sliding window algorithm for whole proteome sequence similarity analysis, and evaluate the performance in comparison with a local cluster and a single workstation. Our strategy involves temporary installations of the BLAST executable and databases on remote nodes at submission, accommodating for dynamic Grid environments as it avoids the need of predefined runtime environments (preinstalled software and databases at specific Grid-nodes). Importantly, the implementation is generic where the BLAST executable can be replaced by other software tools to facilitate analyses suitable for parallelisation. This model should be of general interest in applied bioinformatics. Scripts and procedures are freely available from the authors.

摘要

对于应用生物信息学中使用的多种应用程序和算法而言,当扩大规模以促进对大型数据集和数据库进行分析时,可能会出现计算时间方面的瓶颈。为了适应单个工作站有限的计算能力,可能需要重新编码、修改算法或在灵敏度和准确性方面做出牺牲。网格计算提供了一种替代模型,通过并行执行现有算法和软件实现来解决大规模计算问题。我们展示了一种用于解决计算密集型生物信息学分析的网格感知模型的实现,以全蛋白质组序列相似性分析的blastp滑动窗口算法为例,并与本地集群和单个工作站进行性能比较评估。我们的策略包括在提交时在远程节点上临时安装BLAST可执行文件和数据库,以适应动态网格环境,因为它避免了对预定义运行时环境(特定网格节点上预先安装的软件和数据库)的需求。重要的是,该实现具有通用性,其中BLAST可执行文件可以被其他软件工具替换,以促进适合并行化的分析。这种模型在应用生物信息学中应具有普遍的意义。作者可免费提供脚本和程序。

相似文献

1
Using Grid technology for computationally intensive applied bioinformatics analyses.将网格技术应用于计算密集型的应用生物信息学分析。
In Silico Biol. 2006;6(6):495-504.
2
The use of grid computing to drive data-intensive genetic research.利用网格计算推动数据密集型基因研究。
Eur J Hum Genet. 2007 Jun;15(6):694-702. doi: 10.1038/sj.ejhg.5201815. Epub 2007 Mar 21.
3
Distributed sequence alignment applications for the public computing architecture.面向公共计算架构的分布式序列比对应用程序。
IEEE Trans Nanobioscience. 2008 Mar;7(1):35-43. doi: 10.1109/TNB.2008.2000148.
4
Squid - a simple bioinformatics grid.鱿鱼——一个简单的生物信息学网格。
BMC Bioinformatics. 2005 Aug 3;6:197. doi: 10.1186/1471-2105-6-197.
5
PARALIGN: rapid and sensitive sequence similarity searches powered by parallel computing technology.PARALIGN:由并行计算技术驱动的快速且灵敏的序列相似性搜索。
Nucleic Acids Res. 2005 Jul 1;33(Web Server issue):W535-9. doi: 10.1093/nar/gki423.
6
High performance GRID based implementation for genomics and protein analysis.用于基因组学和蛋白质分析的基于高性能网格的实现。
Stud Health Technol Inform. 2006;120:374-80.
7
PCHM: A bioinformatic resource for high-throughput human mitochondrial proteome searching and comparison.PCHM:用于高通量人类线粒体蛋白质组搜索和比较的生物信息资源。
Comput Biol Med. 2009 Aug;39(8):689-96. doi: 10.1016/j.compbiomed.2009.05.006. Epub 2009 Jun 21.
8
A services oriented system for bioinformatics applications on the grid.一种用于网格上生物信息学应用的面向服务的系统。
Stud Health Technol Inform. 2007;126:174-83.
9
ProGenGrid: a grid-enabled platform for bioinformatics.ProGenGrid:一个支持网格计算的生物信息学平台。
Stud Health Technol Inform. 2005;112:113-26.
10
Parallelisation of the blast algorithm.布鲁氏菌病算法的并行化
Cell Mol Biol Lett. 2005;10(2):281-5.

引用本文的文献

1
The epitope space of the human proteome.人类蛋白质组的表位空间。
Protein Sci. 2008 Apr;17(4):606-13. doi: 10.1110/ps.073347208.