• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

SciApps:一个基于云的可重复生物信息学工作流平台。

SciApps: a cloud-based platform for reproducible bioinformatics workflows.

机构信息

Cold Spring Harbor Laboratories, Cold Spring Harbor, Ithaca, NY, USA.

USDA ARS NEA Robert W. Holley Center for Agriculture and Health, Cornell University, Ithaca, New York, USA.

出版信息

Bioinformatics. 2018 Nov 15;34(22):3917-3920. doi: 10.1093/bioinformatics/bty439.

DOI:10.1093/bioinformatics/bty439
PMID:29897418
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC6223375/
Abstract

MOTIVATION

The rapid accumulation of both sequence and phenotype data generated by high-throughput methods has increased the need to store and analyze data on distributed storage and computing systems. Efficient data management across these heterogeneous systems requires a workflow management system to simplify the task of analysis through automation and make large-scale bioinformatics analyses accessible and reproducible.

RESULTS

We developed SciApps, a web-based platform for reproducible bioinformatics workflows. The platform is designed to automate the execution of modular Agave apps and support execution of workflows on local clusters or in a cloud. Two workflows, one for association and one for annotation, are provided as exemplar scientific use cases.

AVAILABILITY AND IMPLEMENTATION

https://www.sciapps.org.

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

动机

高通量方法产生的序列和表型数据的快速积累增加了对分布式存储和计算系统上的数据存储和分析的需求。要在这些异构系统中实现高效的数据管理,需要一个工作流管理系统,通过自动化来简化分析任务,并使大规模生物信息学分析具有可访问性和可重复性。

结果

我们开发了 SciApps,这是一个基于网络的可重复生物信息学工作流程平台。该平台旨在自动执行模块化的 Agave 应用程序,并支持在本地集群或云中执行工作流程。提供了两个工作流程,一个用于关联,一个用于注释,作为示范科学用例。

可用性和实现

https://www.sciapps.org。

补充信息

补充数据可在《Bioinformatics》在线获得。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/fcfb/6223375/8d03f53037b9/bty439f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/fcfb/6223375/8d03f53037b9/bty439f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/fcfb/6223375/8d03f53037b9/bty439f1.jpg

相似文献

1
SciApps: a cloud-based platform for reproducible bioinformatics workflows.SciApps:一个基于云的可重复生物信息学工作流平台。
Bioinformatics. 2018 Nov 15;34(22):3917-3920. doi: 10.1093/bioinformatics/bty439.
2
SciApps: An Automated Platform for Processing and Distribution of Plant Genomics Data.SciApps:一个用于处理和分发植物基因组学数据的自动化平台。
Methods Mol Biol. 2022;2443:197-209. doi: 10.1007/978-1-0716-2067-0_10.
3
Support for Taverna workflows in the VPH-Share cloud platform.在 VPH-Share 云平台中支持 Taverna 工作流。
Comput Methods Programs Biomed. 2017 Jul;146:37-46. doi: 10.1016/j.cmpb.2017.05.006. Epub 2017 May 20.
4
Tavaxy: integrating Taverna and Galaxy workflows with cloud computing support.Tavaxy:集成 Taverna 和 Galaxy 工作流并提供云计算支持。
BMC Bioinformatics. 2012 May 4;13:77. doi: 10.1186/1471-2105-13-77.
5
Biowep: a workflow enactment portal for bioinformatics applications.生物工作流引擎(Biowep):一个用于生物信息学应用的工作流制定门户。
BMC Bioinformatics. 2007 Mar 8;8 Suppl 1(Suppl 1):S19. doi: 10.1186/1471-2105-8-S1-S19.
6
Management, Analyses, and Distribution of the MaizeCODE Data on the Cloud.云端上玉米编码数据的管理、分析与分发
Front Plant Sci. 2020 Mar 31;11:289. doi: 10.3389/fpls.2020.00289. eCollection 2020.
7
Ergatis: a web interface and scalable software system for bioinformatics workflows.Ergatis:一个用于生物信息学工作流程的网络界面和可扩展软件系统。
Bioinformatics. 2010 Jun 15;26(12):1488-92. doi: 10.1093/bioinformatics/btq167. Epub 2010 Apr 22.
8
The Dockstore: enhancing a community platform for sharing reproducible and accessible computational protocols.Dockstore:增强了一个用于共享可重复和可访问的计算协议的社区平台。
Nucleic Acids Res. 2021 Jul 2;49(W1):W624-W632. doi: 10.1093/nar/gkab346.
9
Watchdog - a workflow management system for the distributed analysis of large-scale experimental data.Watchdog - 一种用于大规模实验数据分析的分布式工作流管理系统。
BMC Bioinformatics. 2018 Mar 13;19(1):97. doi: 10.1186/s12859-018-2107-4.
10
Genomics Virtual Laboratory: A Practical Bioinformatics Workbench for the Cloud.基因组学虚拟实验室:面向云端的实用生物信息学工作台。
PLoS One. 2015 Oct 26;10(10):e0140829. doi: 10.1371/journal.pone.0140829. eCollection 2015.

引用本文的文献

1
High-quality chromosome scale genome assemblies of two important Sorghum inbred lines, Tx2783 and RTx436.两个重要高粱自交系Tx2783和RTx436的高质量染色体水平基因组组装。
NAR Genom Bioinform. 2024 Aug 9;6(3):lqae097. doi: 10.1093/nargab/lqae097. eCollection 2024 Sep.
2
BioViz : Web Application Linking CyVerse Cloud Resources to Genomic Visualization in the Integrated Genome Browser.生物可视化工具(BioViz):将CyVerse云资源与集成基因组浏览器中的基因组可视化相连接的网络应用程序。
Front Bioinform. 2022 May 23;2:764619. doi: 10.3389/fbinf.2022.764619. eCollection 2022.
3
Data Integration Challenges for Machine Learning in Precision Medicine.

本文引用的文献

1
Singularity: Scientific containers for mobility of compute.奇点:用于计算移动性的科学容器。
PLoS One. 2017 May 11;12(5):e0177459. doi: 10.1371/journal.pone.0177459. eCollection 2017.
2
EDAM: an ontology of bioinformatics operations, types of data and identifiers, topics and formats.EDAM:生物信息学操作、数据和标识符类型、主题和格式的本体论。
Bioinformatics. 2013 May 15;29(10):1325-32. doi: 10.1093/bioinformatics/btt113. Epub 2013 Mar 11.
3
An efficient multi-locus mixed-model approach for genome-wide association studies in structured populations.
精准医学中机器学习的数据整合挑战
Front Med (Lausanne). 2022 Jan 25;8:784455. doi: 10.3389/fmed.2021.784455. eCollection 2021.
4
SciApps: An Automated Platform for Processing and Distribution of Plant Genomics Data.SciApps:一个用于处理和分发植物基因组学数据的自动化平台。
Methods Mol Biol. 2022;2443:197-209. doi: 10.1007/978-1-0716-2067-0_10.
5
Foster thy young: enhanced prediction of orphan genes in assembled genomes.培育你的年轻人:在组装的基因组中增强预测孤儿基因。
Nucleic Acids Res. 2022 Apr 22;50(7):e37. doi: 10.1093/nar/gkab1238.
6
fRNAkenseq: a fully powered-by-CyVerse cloud integrated RNA-sequencing analysis tool.fRNAkenseq:一款完全由CyVerse云驱动的集成RNA测序分析工具。
PeerJ. 2020 May 14;8:e8592. doi: 10.7717/peerj.8592. eCollection 2020.
7
Management, Analyses, and Distribution of the MaizeCODE Data on the Cloud.云端上玉米编码数据的管理、分析与分发
Front Plant Sci. 2020 Mar 31;11:289. doi: 10.3389/fpls.2020.00289. eCollection 2020.
8
Variant phasing and haplotypic expression from long-read sequencing in maize.长读测序揭示玉米中的变异相位和单倍型表达。
Commun Biol. 2020 Feb 18;3(1):78. doi: 10.1038/s42003-020-0805-8.
9
Cyberinfrastructure and resources to enable an integrative approach to studying forest trees.支持采用综合方法研究林木的网络基础设施和资源。
Evol Appl. 2019 Nov 3;13(1):228-241. doi: 10.1111/eva.12860. eCollection 2020 Jan.
10
Comprehensive Outline of Whole Exome Sequencing Data Analysis Tools Available in Clinical Oncology.临床肿瘤学中可用的全外显子组测序数据分析工具综合概述。
Cancers (Basel). 2019 Nov 4;11(11):1725. doi: 10.3390/cancers11111725.
一种在结构群体中进行全基因组关联研究的高效多基因混合模型方法。
Nat Genet. 2012 Jun 17;44(7):825-30. doi: 10.1038/ng.2314.
4
Genome-wide efficient mixed-model analysis for association studies.全基因组高效混合模型关联分析。
Nat Genet. 2012 Jun 17;44(7):821-4. doi: 10.1038/ng.2310.
5
The iPlant Collaborative: Cyberinfrastructure for Plant Biology.i 植物协作组:植物生物学的网络基础设施。
Front Plant Sci. 2011 Jul 25;2:34. doi: 10.3389/fpls.2011.00034. eCollection 2011.
6
MAKER2: an annotation pipeline and genome-database management tool for second-generation genome projects.MAKER2:用于第二代基因组项目的注释流水线和基因组数据库管理工具。
BMC Bioinformatics. 2011 Dec 22;12:491. doi: 10.1186/1471-2105-12-491.
7
Mixed linear model approach adapted for genome-wide association studies.混合线性模型方法适用于全基因组关联研究。
Nat Genet. 2010 Apr;42(4):355-60. doi: 10.1038/ng.546. Epub 2010 Mar 7.
8
JBrowse: a next-generation genome browser.JBrowse:新一代基因组浏览器。
Genome Res. 2009 Sep;19(9):1630-8. doi: 10.1101/gr.094607.109. Epub 2009 Jul 1.
9
Inferring missing genotypes in large SNP panels using fast nearest-neighbor searches over sliding windows.通过在滑动窗口上进行快速最近邻搜索来推断大型单核苷酸多态性(SNP)面板中缺失的基因型。
Bioinformatics. 2007 Jul 1;23(13):i401-7. doi: 10.1093/bioinformatics/btm220.
10
GenePattern 2.0.基因模式2.0
Nat Genet. 2006 May;38(5):500-1. doi: 10.1038/ng0506-500.