• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

相似文献

1
Big Data Smart Socket (BDSS): a system that abstracts data transfer habits from end users.大数据智能插座(BDSS):一种从终端用户提取数据传输习惯的系统。
Bioinformatics. 2017 Feb 15;33(4):627-628. doi: 10.1093/bioinformatics/btw679.
2
qPortal: A platform for data-driven biomedical research.qPortal:一个用于数据驱动型生物医学研究的平台。
PLoS One. 2018 Jan 19;13(1):e0191603. doi: 10.1371/journal.pone.0191603. eCollection 2018.
3
Phylesystem: a git-based data store for community-curated phylogenetic estimates.系统发育体系:一个基于Git的用于社区策划系统发育估计的数据存储库。
Bioinformatics. 2015 Sep 1;31(17):2794-800. doi: 10.1093/bioinformatics/btv276. Epub 2015 May 4.
4
Tavaxy: integrating Taverna and Galaxy workflows with cloud computing support.Tavaxy:集成 Taverna 和 Galaxy 工作流并提供云计算支持。
BMC Bioinformatics. 2012 May 4;13:77. doi: 10.1186/1471-2105-13-77.
5
Cloud bursting galaxy: federated identity and access management.云爆发星系:联合身份与访问管理。
Bioinformatics. 2020 Jan 1;36(1):1-9. doi: 10.1093/bioinformatics/btz472.
6
Integrated querying and version control of context-specific biological networks.上下文特定生物网络的集成查询和版本控制。
Database (Oxford). 2020 Jan 1;2020. doi: 10.1093/database/baaa018.
7
Sequence database versioning for command line and Galaxy bioinformatics servers.用于命令行和Galaxy生物信息学服务器的序列数据库版本控制。
Bioinformatics. 2016 Apr 15;32(8):1275-7. doi: 10.1093/bioinformatics/btv724. Epub 2015 Dec 12.
8
wft4galaxy: a workflow testing tool for galaxy.wft4galaxy:用于 Galaxy 的工作流测试工具。
Bioinformatics. 2017 Dec 1;33(23):3805-3807. doi: 10.1093/bioinformatics/btx461.
9
Mobyle: a new full web bioinformatics framework.Mobyle:一个全新的全网络生物信息学框架。
Bioinformatics. 2009 Nov 15;25(22):3005-11. doi: 10.1093/bioinformatics/btp493. Epub 2009 Aug 17.
10
Simplifying the development of portable, scalable, and reproducible workflows.简化便携式、可扩展和可重复使用工作流程的开发。
Elife. 2021 Oct 13;10:e71069. doi: 10.7554/eLife.71069.

引用本文的文献

1
Cyberinfrastructure to Improve Forest Health and Productivity: The Role of Tree Databases in Connecting Genomes, Phenomes, and the Environment.改善森林健康与生产力的网络基础设施:树木数据库在连接基因组、表型组与环境中的作用。
Front Plant Sci. 2019 Jun 25;10:813. doi: 10.3389/fpls.2019.00813. eCollection 2019.

本文引用的文献

1
The Widening Gulf between Genomics Data Generation and Consumption: A Practical Guide to Big Data Transfer Technology.基因组学数据生成与应用之间日益扩大的差距:大数据传输技术实用指南
Bioinform Biol Insights. 2015 Sep 23;9(Suppl 1):9-19. doi: 10.4137/BBI.S28988. eCollection 2015.
2
Tripal v1.1: a standards-based toolkit for construction of online genetic and genomic databases.Tripal v1.1:一个基于标准的工具包,用于构建在线遗传和基因组数据库。
Database (Oxford). 2013 Oct 25;2013:bat075. doi: 10.1093/database/bat075. Print 2013.
3
Using Galaxy to perform large-scale interactive data analyses.使用Galaxy进行大规模交互式数据分析。
Curr Protoc Bioinformatics. 2012 Jun;Chapter 10:10.5.1-10.5.47. doi: 10.1002/0471250953.bi1005s38.

大数据智能插座(BDSS):一种从终端用户提取数据传输习惯的系统。

Big Data Smart Socket (BDSS): a system that abstracts data transfer habits from end users.

作者信息

Watts Nicholas A, Feltus Frank A

机构信息

Clemson Computing & Information Technology.

Clemson University Department of Genetics & Biochemistry, Clemson, SC 29634, USA.

出版信息

Bioinformatics. 2017 Feb 15;33(4):627-628. doi: 10.1093/bioinformatics/btw679.

DOI:10.1093/bioinformatics/btw679
PMID:27797780
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC5408802/
Abstract

MOTIVATION

The ability to centralize and store data for long periods on an end user's computational resources is increasingly difficult for many scientific disciplines. For example, genomics data is increasingly large and distributed, and the data needs to be moved into workflow execution sites ranging from lab workstations to the cloud. However, the typical user is not always informed on emerging network technology or the most efficient methods to move and share data. Thus, the user defaults to using inefficient methods for transfer across the commercial internet.

RESULTS

To accelerate large data transfer, we created a tool called the Big Data Smart Socket (BDSS) that abstracts data transfer methodology from the user. The user provides BDSS with a manifest of datasets stored in a remote storage repository. BDSS then queries a metadata repository for curated data transfer mechanisms and optimal path to move each of the files in the manifest to the site of workflow execution. BDSS functions as a standalone tool or can be directly integrated into a computational workflow such as provided by the Galaxy Project. To demonstrate applicability, we use BDSS within a biological context, although it is applicable to any scientific domain.

AVAILABILITY AND IMPLEMENTATION

BDSS is available under version 2 of the GNU General Public License at https://github.com/feltus/BDSS .

CONTACT

ffeltus@clemson.edu.

摘要

动机

对于许多科学学科而言,在终端用户的计算资源上长时间集中存储数据的能力变得越来越困难。例如,基因组学数据越来越庞大且分布广泛,需要将这些数据传输到从实验室工作站到云端等各种工作流执行站点。然而,普通用户往往并不了解新兴的网络技术或移动和共享数据的最有效方法。因此,用户默认采用效率低下的方式通过商业互联网进行数据传输。

结果

为了加速大数据传输,我们创建了一个名为大数据智能套接字(BDSS)的工具,该工具将数据传输方法从用户层面进行了抽象。用户向BDSS提供存储在远程存储库中的数据集清单。BDSS随后在元数据存储库中查询经过整理的数据传输机制以及将清单中的每个文件移动到工作流执行站点的最佳路径。BDSS既可以作为独立工具使用,也可以直接集成到诸如Galaxy项目提供的计算工作流中。为了证明其适用性,我们在生物学背景下使用了BDSS,不过它适用于任何科学领域。

可用性与实现

BDSS根据GNU通用公共许可证第2版发布,可在https://github.com/feltus/BDSS获取。

联系方式

ffeltus@clemson.edu。