• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

使用 GPU 上的大规模并行计算和 CUDA 以及 ELLPACK-R 稀疏格式进行生物信息学中的快速并行马尔可夫聚类。

Fast parallel Markov clustering in bioinformatics using massively parallel computing on GPU with CUDA and ELLPACK-R sparse format.

机构信息

Department of Mathematics, University of Indonesia, Depok 16424, Indonesia.

出版信息

IEEE/ACM Trans Comput Biol Bioinform. 2012 May-Jun;9(3):679-92. doi: 10.1109/TCBB.2011.68.

DOI:10.1109/TCBB.2011.68
PMID:21483031
Abstract

Markov clustering (MCL) is becoming a key algorithm within bioinformatics for determining clusters in networks. However,with increasing vast amount of data on biological networks, performance and scalability issues are becoming a critical limiting factor in applications. Meanwhile, GPU computing, which uses CUDA tool for implementing a massively parallel computing environment in the GPU card, is becoming a very powerful, efficient, and low-cost option to achieve substantial performance gains over CPU approaches. The use of on-chip memory on the GPU is efficiently lowering the latency time, thus, circumventing a major issue in other parallel computing environments, such as MPI. We introduce a very fast Markov clustering algorithm using CUDA (CUDA-MCL) to perform parallel sparse matrix-matrix computations and parallel sparse Markov matrix normalizations, which are at the heart of MCL. We utilized ELLPACK-R sparse format to allow the effective and fine-grain massively parallel processing to cope with the sparse nature of interaction networks data sets in bioinformatics applications. As the results show, CUDA-MCL is significantly faster than the original MCL running on CPU. Thus, large-scale parallel computation on off-the-shelf desktop-machines, that were previously only possible on supercomputing architectures, can significantly change the way bioinformaticians and biologists deal with their data.

摘要

马尔可夫聚类 (MCL) 算法在生物信息学中已成为确定网络中聚类的关键算法。然而,随着生物网络上不断增加的大量数据,性能和可扩展性问题成为应用中的关键限制因素。同时,GPU 计算(利用 CUDA 工具在 GPU 卡上实现大规模并行计算环境)正成为一种非常强大、高效且低成本的选择,可以实现相对于 CPU 方法的显著性能提升。GPU 上的片上内存的使用有效地降低了延迟时间,从而避免了其他并行计算环境(如 MPI)中的一个主要问题。我们引入了一种非常快速的使用 CUDA 的马尔可夫聚类算法 (CUDA-MCL),用于执行并行稀疏矩阵-矩阵计算和并行稀疏马尔可夫矩阵归一化,这是 MCL 的核心。我们利用 ELLPACK-R 稀疏格式来实现有效的细粒度大规模并行处理,以适应生物信息学应用中交互网络数据集的稀疏性质。正如结果所示,CUDA-MCL 比在 CPU 上运行的原始 MCL 快得多。因此,以前仅在超级计算架构上才能实现的基于现成台式机的大规模并行计算,可以极大地改变生物信息学家和生物学家处理数据的方式。

相似文献

1
Fast parallel Markov clustering in bioinformatics using massively parallel computing on GPU with CUDA and ELLPACK-R sparse format.使用 GPU 上的大规模并行计算和 CUDA 以及 ELLPACK-R 稀疏格式进行生物信息学中的快速并行马尔可夫聚类。
IEEE/ACM Trans Comput Biol Bioinform. 2012 May-Jun;9(3):679-92. doi: 10.1109/TCBB.2011.68.
2
NMF-mGPU: non-negative matrix factorization on multi-GPU systems.NMF-mGPU:多GPU系统上的非负矩阵分解
BMC Bioinformatics. 2015 Feb 13;16:43. doi: 10.1186/s12859-015-0485-4.
3
GAMUT: GPU accelerated microRNA analysis to uncover target genes through CUDA-miRanda.GAMUT:通过CUDA-miRanda实现GPU加速的微小RNA分析以揭示靶基因
BMC Med Genomics. 2014;7 Suppl 1(Suppl 1):S9. doi: 10.1186/1755-8794-7-S1-S9. Epub 2014 May 8.
4
HipMCL: a high-performance parallel implementation of the Markov clustering algorithm for large-scale networks.HipMCL:一种用于大规模网络的马尔可夫聚类算法的高性能并行实现。
Nucleic Acids Res. 2018 Apr 6;46(6):e33. doi: 10.1093/nar/gkx1313.
5
DecGPU: distributed error correction on massively parallel graphics processing units using CUDA and MPI.DecGPU:使用 CUDA 和 MPI 在大规模并行图形处理单元上进行分布式错误纠正。
BMC Bioinformatics. 2011 Mar 29;12:85. doi: 10.1186/1471-2105-12-85.
6
cuRnet: an R package for graph traversing on GPU.cuRnet:一个在 GPU 上进行图遍历的 R 包。
BMC Bioinformatics. 2018 Oct 15;19(Suppl 10):356. doi: 10.1186/s12859-018-2310-3.
7
Exploiting graphics processing units for computational biology and bioinformatics.利用图形处理单元进行计算生物学和生物信息学。
Interdiscip Sci. 2010 Sep;2(3):213-20. doi: 10.1007/s12539-010-0002-4. Epub 2010 Jul 25.
8
GPU accelerated dynamic functional connectivity analysis for functional MRI data.GPU 加速的功能磁共振成像数据动态功能连接分析。
Comput Med Imaging Graph. 2015 Jul;43:53-63. doi: 10.1016/j.compmedimag.2015.02.009. Epub 2015 Mar 7.
9
A fast hierarchical clustering algorithm for large-scale protein sequence data sets.一种用于大规模蛋白质序列数据集的快速分层聚类算法。
Comput Biol Med. 2014 May;48:94-101. doi: 10.1016/j.compbiomed.2014.02.016. Epub 2014 Mar 4.
10
GPU-FS-kNN: a software tool for fast and scalable kNN computation using GPUs.GPU-FS-kNN:一种使用 GPU 实现快速可扩展 kNN 计算的软件工具。
PLoS One. 2012;7(8):e44000. doi: 10.1371/journal.pone.0044000. Epub 2012 Aug 28.

引用本文的文献

1
Performance of rotation forest ensemble classifier and feature extractor in predicting protein interactions using amino acid sequences.旋转森林集成分类器和特征提取器在使用氨基酸序列预测蛋白质相互作用方面的性能。
BMC Genomics. 2019 Dec 24;20(Suppl 9):950. doi: 10.1186/s12864-019-6304-y.
2
HipMCL: a high-performance parallel implementation of the Markov clustering algorithm for large-scale networks.HipMCL:一种用于大规模网络的马尔可夫聚类算法的高性能并行实现。
Nucleic Acids Res. 2018 Apr 6;46(6):e33. doi: 10.1093/nar/gkx1313.
3
Parallel clustering algorithm for large-scale biological data sets.
用于大规模生物数据集的并行聚类算法。
PLoS One. 2014 Apr 4;9(4):e91315. doi: 10.1371/journal.pone.0091315. eCollection 2014.
4
Systems biology, bioinformatics, and biomarkers in neuropsychiatry.系统生物学、生物信息学和神经精神医学中的生物标志物。
Front Neurosci. 2012 Dec 24;6:187. doi: 10.3389/fnins.2012.00187. eCollection 2012.