• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

CL-Dash:用于云环境中生物信息学研究的Hadoop集群的快速配置与部署

cl-dash: rapid configuration and deployment of Hadoop clusters for bioinformatics research in the cloud.

作者信息

Hodor Paul, Chawla Amandeep, Clark Andrew, Neal Lauren

机构信息

Booz Allen Hamilton, Rockville, MD 20852, USA.

出版信息

Bioinformatics. 2016 Jan 15;32(2):301-3. doi: 10.1093/bioinformatics/btv553. Epub 2015 Oct 1.

DOI:10.1093/bioinformatics/btv553
PMID:26428290
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC4708102/
Abstract

UNLABELLED

: One of the solutions proposed for addressing the challenge of the overwhelming abundance of genomic sequence and other biological data is the use of the Hadoop computing framework. Appropriate tools are needed to set up computational environments that facilitate research of novel bioinformatics methodology using Hadoop. Here, we present cl-dash, a complete starter kit for setting up such an environment. Configuring and deploying new Hadoop clusters can be done in minutes. Use of Amazon Web Services ensures no initial investment and minimal operation costs. Two sample bioinformatics applications help the researcher understand and learn the principles of implementing an algorithm using the MapReduce programming pattern.

AVAILABILITY AND IMPLEMENTATION

Source code is available at https://bitbucket.org/booz-allen-sci-comp-team/cl-dash.git.

CONTACT

hodor_paul@bah.com.

摘要

未标注

为应对基因组序列和其他生物数据海量丰富带来的挑战而提出的解决方案之一是使用Hadoop计算框架。需要合适的工具来搭建便于利用Hadoop研究新型生物信息学方法的计算环境。在此,我们展示了cl-dash,这是一个用于搭建此类环境的完整入门套件。配置和部署新的Hadoop集群只需几分钟。使用亚马逊网络服务可确保无需初始投资且运营成本最低。两个生物信息学示例应用程序可帮助研究人员理解和学习使用MapReduce编程模式实现算法的原理。

可用性与实现

源代码可在https://bitbucket.org/booz-allen-sci-comp-team/cl-dash.git获取。

联系方式

hodor_paul@bah.com。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/cd67/4708102/b9fa903d2746/btv553f1p.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/cd67/4708102/b9fa903d2746/btv553f1p.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/cd67/4708102/b9fa903d2746/btv553f1p.jpg

相似文献

1
cl-dash: rapid configuration and deployment of Hadoop clusters for bioinformatics research in the cloud.CL-Dash:用于云环境中生物信息学研究的Hadoop集群的快速配置与部署
Bioinformatics. 2016 Jan 15;32(2):301-3. doi: 10.1093/bioinformatics/btv553. Epub 2015 Oct 1.
2
CloudDOE: a user-friendly tool for deploying Hadoop clouds and analyzing high-throughput sequencing data with MapReduce.CloudDOE:一款用于部署Hadoop云并使用MapReduce分析高通量测序数据的用户友好型工具。
PLoS One. 2014 Jun 4;9(6):e98146. doi: 10.1371/journal.pone.0098146. eCollection 2014.
3
Gene set analysis in the cloud.基因集分析在云端。
Bioinformatics. 2012 Jan 15;28(2):294-5. doi: 10.1093/bioinformatics/btr630. Epub 2011 Nov 13.
4
An overview of the Hadoop/MapReduce/HBase framework and its current applications in bioinformatics.Hadoop/MapReduce/HBase 框架概述及其在生物信息学中的当前应用。
BMC Bioinformatics. 2010 Dec 21;11 Suppl 12(Suppl 12):S1. doi: 10.1186/1471-2105-11-S12-S1.
5
Eoulsan: a cloud computing-based framework facilitating high throughput sequencing analyses.Eoulsan:一个基于云计算的框架,可实现高通量测序分析。
Bioinformatics. 2012 Jun 1;28(11):1542-3. doi: 10.1093/bioinformatics/bts165. Epub 2012 Apr 5.
6
Survey of MapReduce frame operation in bioinformatics.生物信息学中MapReduce框架操作的调查。
Brief Bioinform. 2014 Jul;15(4):637-47. doi: 10.1093/bib/bbs088. Epub 2013 Feb 7.
7
SparkSeq: fast, scalable and cloud-ready tool for the interactive genomic data analysis with nucleotide precision.SparkSeq:一种快速、可扩展且适用于云环境的工具,可实现具有核苷酸精度的交互式基因组数据分析。
Bioinformatics. 2014 Sep 15;30(18):2652-3. doi: 10.1093/bioinformatics/btu343. Epub 2014 May 19.
8
BioPig: a Hadoop-based analytic toolkit for large-scale sequence data.BioPig:一个基于 Hadoop 的大规模序列数据分析工具包。
Bioinformatics. 2013 Dec 1;29(23):3014-9. doi: 10.1093/bioinformatics/btt528. Epub 2013 Sep 10.
9
MR-Tandem: parallel X!Tandem using Hadoop MapReduce on Amazon Web Services.MR-Tandem:在亚马逊网络服务(Amazon Web Services)上使用 Hadoop MapReduce 的并行 X!Tandem。
Bioinformatics. 2012 Jan 1;28(1):136-7. doi: 10.1093/bioinformatics/btr615. Epub 2011 Nov 8.
10
HBLAST: Parallelised sequence similarity--A Hadoop MapReducable basic local alignment search tool.HBLAST:并行化序列相似性——一种可通过Hadoop进行MapReduce的基本局部比对搜索工具。
J Biomed Inform. 2015 Apr;54:58-64. doi: 10.1016/j.jbi.2015.01.008. Epub 2015 Jan 24.

引用本文的文献

1
Load Balancing Algorithms for Hadoop Cluster in Unbalanced Environment.非均衡环境下的 Hadoop 集群负载均衡算法。
Comput Intell Neurosci. 2022 Oct 7;2022:1545024. doi: 10.1155/2022/1545024. eCollection 2022.
2
A Genocentric Approach to Discovery of Mendelian Disorders.从种族中心主义角度探究孟德尔遗传病
Am J Hum Genet. 2019 Nov 7;105(5):974-986. doi: 10.1016/j.ajhg.2019.09.027. Epub 2019 Oct 24.
3
Recognizing millions of consistently unidentified spectra across hundreds of shotgun proteomics datasets.在数百个鸟枪法蛋白质组学数据集中识别出数百万个一直无法识别的光谱。

本文引用的文献

1
CloudDOE: a user-friendly tool for deploying Hadoop clouds and analyzing high-throughput sequencing data with MapReduce.CloudDOE:一款用于部署Hadoop云并使用MapReduce分析高通量测序数据的用户友好型工具。
PLoS One. 2014 Jun 4;9(6):e98146. doi: 10.1371/journal.pone.0098146. eCollection 2014.
2
When cloud computing meets bioinformatics: a review.当云计算遇上生物信息学:综述
J Bioinform Comput Biol. 2013 Oct;11(5):1330002. doi: 10.1142/S0219720013300025. Epub 2013 Oct 10.
3
'Big data', Hadoop and cloud computing in genomics.
Nat Methods. 2016 Aug;13(8):651-656. doi: 10.1038/nmeth.3902. Epub 2016 Jun 27.
基因组学中的“大数据”、Hadoop 和云计算。
J Biomed Inform. 2013 Oct;46(5):774-81. doi: 10.1016/j.jbi.2013.07.001. Epub 2013 Jul 18.
4
Survey of MapReduce frame operation in bioinformatics.生物信息学中MapReduce框架操作的调查。
Brief Bioinform. 2014 Jul;15(4):637-47. doi: 10.1093/bib/bbs088. Epub 2013 Feb 7.
5
Cloudgene: a graphical execution platform for MapReduce programs on private and public clouds.Cloudgene:一个在私有云和公有云上运行 MapReduce 程序的图形化执行平台。
BMC Bioinformatics. 2012 Aug 13;13:200. doi: 10.1186/1471-2105-13-200.
6
Biomedical cloud computing with Amazon Web Services.基于亚马逊网络服务的生物医学云计算。
PLoS Comput Biol. 2011 Aug;7(8):e1002147. doi: 10.1371/journal.pcbi.1002147. Epub 2011 Aug 25.