• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

相似文献

1
MR-Tandem: parallel X!Tandem using Hadoop MapReduce on Amazon Web Services.MR-Tandem:在亚马逊网络服务(Amazon Web Services)上使用 Hadoop MapReduce 的并行 X!Tandem。
Bioinformatics. 2012 Jan 1;28(1):136-7. doi: 10.1093/bioinformatics/btr615. Epub 2011 Nov 8.
2
cl-dash: rapid configuration and deployment of Hadoop clusters for bioinformatics research in the cloud.CL-Dash:用于云环境中生物信息学研究的Hadoop集群的快速配置与部署
Bioinformatics. 2016 Jan 15;32(2):301-3. doi: 10.1093/bioinformatics/btv553. Epub 2015 Oct 1.
3
CloudDOE: a user-friendly tool for deploying Hadoop clouds and analyzing high-throughput sequencing data with MapReduce.CloudDOE:一款用于部署Hadoop云并使用MapReduce分析高通量测序数据的用户友好型工具。
PLoS One. 2014 Jun 4;9(6):e98146. doi: 10.1371/journal.pone.0098146. eCollection 2014.
4
An overview of the Hadoop/MapReduce/HBase framework and its current applications in bioinformatics.Hadoop/MapReduce/HBase 框架概述及其在生物信息学中的当前应用。
BMC Bioinformatics. 2010 Dec 21;11 Suppl 12(Suppl 12):S1. doi: 10.1186/1471-2105-11-S12-S1.
5
Processing shotgun proteomics data on the Amazon cloud with the trans-proteomic pipeline.使用跨蛋白质组学管道在亚马逊云中处理鸟枪法蛋白质组学数据。
Mol Cell Proteomics. 2015 Feb;14(2):399-404. doi: 10.1074/mcp.O114.043380. Epub 2014 Nov 23.
6
Hydra: a scalable proteomic search engine which utilizes the Hadoop distributed computing framework.Hydra:一种可扩展的蛋白质组学搜索引擎,它利用了 Hadoop 分布式计算框架。
BMC Bioinformatics. 2012 Dec 5;13:324. doi: 10.1186/1471-2105-13-324.
7
Applications of the MapReduce programming framework to clinical big data analysis: current landscape and future trends.MapReduce 编程框架在临床大数据分析中的应用:现状与未来趋势。
BioData Min. 2014 Oct 29;7:22. doi: 10.1186/1756-0381-7-22. eCollection 2014.
8
STDADS: An Efficient Slow Task Detection Algorithm for Deadline Schedulers.STDADS:一种用于截止期调度器的高效慢速任务检测算法。
Big Data. 2020 Feb;8(1):62-69. doi: 10.1089/big.2019.0039. Epub 2020 Jan 29.
9
MarDRe: efficient MapReduce-based removal of duplicate DNA reads in the cloud.MarDRe:基于MapReduce在云端高效去除重复DNA读数。
Bioinformatics. 2017 Sep 1;33(17):2762-2764. doi: 10.1093/bioinformatics/btx307.
10
Hadoop-GIS: A High Performance Spatial Data Warehousing System over MapReduce.Hadoop-GIS:一种基于MapReduce的高性能空间数据仓库系统。
Proceedings VLDB Endowment. 2013 Aug;6(11).

引用本文的文献

1
Communication Lower-Bounds for Distributed-Memory Computations for Mass Spectrometry based Omics Data.基于质谱的组学数据的分布式内存计算的通信下限
J Parallel Distrib Comput. 2022 Mar;161:37-47. doi: 10.1016/j.jpdc.2021.11.001. Epub 2021 Nov 17.
2
High Performance Computing Framework for Tera-Scale Database Search of Mass Spectrometry Data.用于质谱数据太字节规模数据库搜索的高性能计算框架
Nat Comput Sci. 2021 Aug;1(8):550-561. doi: 10.1038/s43588-021-00113-z. Epub 2021 Aug 20.
3
Deep Learning-based MSMS Spectra Reduction in Support of Running Multiple Protein Search Engines on Cloud.基于深度学习的串联质谱(MSMS)谱图简化,以支持在云端运行多个蛋白质搜索引擎
Proceedings (IEEE Int Conf Bioinformatics Biomed). 2017 Nov;2017:1909-1914. doi: 10.1109/bibm.2017.8217951. Epub 2017 Dec 18.
4
Methods for Proteogenomics Data Analysis, Challenges, and Scalability Bottlenecks: A Survey.蛋白质基因组学数据分析方法、挑战及可扩展性瓶颈:一项综述。
IEEE Access. 2021;9:5497-5516. doi: 10.1109/ACCESS.2020.3047588. Epub 2020 Dec 25.
5
MCtandem: an efficient tool for large-scale peptide identification on many integrated core (MIC) architecture.MCtandem:一种在许多集成核心 (MIC) 架构上进行大规模肽鉴定的高效工具。
BMC Bioinformatics. 2019 Jul 17;20(1):397. doi: 10.1186/s12859-019-2980-5.
6
Processing shotgun proteomics data on the Amazon cloud with the trans-proteomic pipeline.使用跨蛋白质组学管道在亚马逊云中处理鸟枪法蛋白质组学数据。
Mol Cell Proteomics. 2015 Feb;14(2):399-404. doi: 10.1074/mcp.O114.043380. Epub 2014 Nov 23.
7
Designing a parallel evolutionary algorithm for inferring gene networks on the cloud computing environment.设计一种用于在云计算环境中推断基因网络的并行进化算法。
BMC Syst Biol. 2014 Jan 16;8:5. doi: 10.1186/1752-0509-8-5.
8
Method for rapid protein identification in a large database.在大型数据库中快速进行蛋白质鉴定的方法。
Biomed Res Int. 2013;2013:414069. doi: 10.1155/2013/414069. Epub 2013 Aug 13.
9
Hydra: a scalable proteomic search engine which utilizes the Hadoop distributed computing framework.Hydra:一种可扩展的蛋白质组学搜索引擎,它利用了 Hadoop 分布式计算框架。
BMC Bioinformatics. 2012 Dec 5;13:324. doi: 10.1186/1471-2105-13-324.
10
Current algorithmic solutions for peptide-based proteomics data generation and identification.当前基于肽段的蛋白质组学数据生成和鉴定的算法解决方案。
Curr Opin Biotechnol. 2013 Feb;24(1):31-8. doi: 10.1016/j.copbio.2012.10.013. Epub 2012 Nov 8.

本文引用的文献

1
X!!Tandem, an improved method for running X!tandem in parallel on collections of commodity computers.X!!串联,一种在商用计算机集群上并行运行X!串联的改进方法。
J Proteome Res. 2008 Jan;7(1):293-9. doi: 10.1021/pr0701198. Epub 2007 Sep 29.
2
Parallel tandem: a program for parallel processing of tandem mass spectra using PVM or MPI and X!Tandem.并行串联:一种使用并行虚拟机(PVM)或消息传递接口(MPI)以及X!Tandem对串联质谱进行并行处理的程序。
J Proteome Res. 2005 Sep-Oct;4(5):1842-7. doi: 10.1021/pr050058i.
3
TANDEM: matching proteins with tandem mass spectra.串联:将蛋白质与串联质谱进行匹配。
Bioinformatics. 2004 Jun 12;20(9):1466-7. doi: 10.1093/bioinformatics/bth092. Epub 2004 Feb 19.

MR-Tandem:在亚马逊网络服务(Amazon Web Services)上使用 Hadoop MapReduce 的并行 X!Tandem。

MR-Tandem: parallel X!Tandem using Hadoop MapReduce on Amazon Web Services.

机构信息

Insilicos LLC, Seattle WA, USA.

出版信息

Bioinformatics. 2012 Jan 1;28(1):136-7. doi: 10.1093/bioinformatics/btr615. Epub 2011 Nov 8.

DOI:10.1093/bioinformatics/btr615
PMID:22072385
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC3244769/
Abstract

SUMMARY

MR-Tandem adapts the popular X!Tandem peptide search engine to work with Hadoop MapReduce for reliable parallel execution of large searches. MR-Tandem runs on any Hadoop cluster but offers special support for Amazon Web Services for creating inexpensive on-demand Hadoop clusters, enabling search volumes that might not otherwise be feasible with the compute resources a researcher has at hand. MR-Tandem is designed to drop in wherever X!Tandem is already in use and requires no modification to existing X!Tandem parameter files, and only minimal modification to X!Tandem-based workflows.

AVAILABILITY AND IMPLEMENTATION

MR-Tandem is implemented as a lightly modified X!Tandem C++ executable and a Python script that drives Hadoop clusters including Amazon Web Services (AWS) Elastic Map Reduce (EMR), using the modified X!Tandem program as a Hadoop Streaming mapper and reducer. The modified X!Tandem C++ source code is Artistic licensed, supports pluggable scoring, and is available as part of the Sashimi project at http://sashimi.svn.sourceforge.net/viewvc/sashimi/trunk/trans_proteomic_pipeline/extern/xtandem/. The MR-Tandem Python script is Apache licensed and available as part of the Insilicos Cloud Army project at http://ica.svn.sourceforge.net/viewvc/ica/trunk/mr-tandem/. Full documentation and a windows installer that configures MR-Tandem, Python and all necessary packages are available at this same URL.

CONTACT

brian.pratt@insilicos.com

摘要

摘要

MR-Tandem 对流行的 X!Tandem 肽搜索引擎进行了改编,使其能够与 Hadoop MapReduce 配合使用,以可靠地并行执行大型搜索。MR-Tandem 可以在任何 Hadoop 集群上运行,但为创建廉价按需 Hadoop 集群提供了对 Amazon Web Services 的特殊支持,从而能够进行可能无法使用手头研究人员计算资源完成的搜索量。MR-Tandem 旨在随时替代 X!Tandem 的使用,并且不需要对现有的 X!Tandem 参数文件进行任何修改,并且只需对基于 X!Tandem 的工作流程进行最小的修改。

可用性和实现

MR-Tandem 作为一个经过轻微修改的 X!Tandem C++可执行文件和一个 Python 脚本实现,该脚本驱动包括 Amazon Web Services (AWS) Elastic Map Reduce (EMR)在内的 Hadoop 集群,使用修改后的 X!Tandem 程序作为 Hadoop Streaming 的映射器和归约器。修改后的 X!Tandem C++源代码采用艺术许可证,支持可插拔评分,并作为 Sashimi 项目的一部分,可在 http://sashimi.svn.sourceforge.net/viewvc/sashimi/trunk/trans_proteomic_pipeline/extern/xtandem/ 上获得。MR-Tandem Python 脚本采用 Apache 许可证,可作为 Insilicos Cloud Army 项目的一部分在 http://ica.svn.sourceforge.net/viewvc/ica/trunk/mr-tandem/ 上获得。完整的文档和配置 MR-Tandem、Python 和所有必要包的 Windows 安装程序都可在同一 URL 上获得。

联系方式

brian.pratt@insilicos.com