• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

VA 百万老兵计划中的高效数据和任务管理的格架。

Trellis for efficient data and task management in the VA Million Veteran Program.

机构信息

Stanford Center for Genomics and Personalized Medicine, Stanford University, Stanford, CA, USA.

Palo Alto Epidemiology Research and Information Center for Genomics, VA Palo Alto, CA, USA.

出版信息

Sci Rep. 2021 Dec 1;11(1):23229. doi: 10.1038/s41598-021-02569-5.

DOI:10.1038/s41598-021-02569-5
PMID:34853358
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC8636485/
Abstract

Biomedical studies have become larger in size and yielded large quantities of data, yet efficient data processing remains a challenge. Here we present Trellis, a cloud-based data and task management framework that completely automates the process from data ingestion to result presentation, while tracking data lineage, facilitating information query, and supporting fault-tolerance and scalability. Using a graph database to coordinate the state of the data processing workflows and a scalable microservice architecture to perform bioinformatics tasks, Trellis has enabled efficient variant calling on 100,000 human genomes collected in the VA Million Veteran Program.

摘要

生物医学研究的规模不断扩大,产生了大量的数据,但有效的数据处理仍然是一个挑战。在这里,我们介绍 Trellis,这是一个基于云的数据和任务管理框架,它完全自动化了从数据摄取到结果呈现的过程,同时跟踪数据沿袭,方便信息查询,并支持容错和可扩展性。使用图形数据库来协调数据处理工作流的状态,以及使用可扩展的微服务架构来执行生物信息学任务,Trellis 已经能够在退伍军人百万基因组计划中收集的 10 万个人类基因组上实现高效的变异调用。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/87db/8636485/9d6dc4f63d09/41598_2021_2569_Fig4_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/87db/8636485/0aed6dcde81c/41598_2021_2569_Fig1_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/87db/8636485/05427061e9be/41598_2021_2569_Fig2_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/87db/8636485/105f0413f220/41598_2021_2569_Fig3_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/87db/8636485/9d6dc4f63d09/41598_2021_2569_Fig4_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/87db/8636485/0aed6dcde81c/41598_2021_2569_Fig1_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/87db/8636485/05427061e9be/41598_2021_2569_Fig2_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/87db/8636485/105f0413f220/41598_2021_2569_Fig3_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/87db/8636485/9d6dc4f63d09/41598_2021_2569_Fig4_HTML.jpg

相似文献

1
Trellis for efficient data and task management in the VA Million Veteran Program.VA 百万老兵计划中的高效数据和任务管理的格架。
Sci Rep. 2021 Dec 1;11(1):23229. doi: 10.1038/s41598-021-02569-5.
2
3
Inexpensive and Highly Reproducible Cloud-Based Variant Calling of 2,535 Human Genomes.2535个人类基因组的基于云的低成本且高度可重复的变异检测
PLoS One. 2015 Jun 25;10(6):e0129277. doi: 10.1371/journal.pone.0129277. eCollection 2015.
4
The multi-trellis software architecture and the intelligent cardiovascular monitor.多格状软件架构与智能心血管监测仪
Methods Inf Med. 1992 Feb;31(1):44-55.
5
TRELLIS+: an effective approach for indexing genome-scale sequences using suffix trees.TRELLIS+:一种使用后缀树对基因组规模序列进行索引的有效方法。
Pac Symp Biocomput. 2008:90-101.
6
SeqWare Query Engine: storing and searching sequence data in the cloud.SeqWare 查询引擎:在云端存储和搜索序列数据。
BMC Bioinformatics. 2010 Dec 21;11 Suppl 12(Suppl 12):S2. doi: 10.1186/1471-2105-11-S12-S2.
7
Trellis codes, receptive fields, and fault tolerant, self-repairing neural networks.网格编码、感受野与容错自修复神经网络。
IEEE Trans Neural Netw. 1990;1(2):154-66. doi: 10.1109/72.80228.
8
Evaluation of serverless computing for scalable execution of a joint variant calling workflow.评估无服务器计算在联合变异调用工作流可伸缩执行中的应用。
PLoS One. 2021 Jul 9;16(7):e0254363. doi: 10.1371/journal.pone.0254363. eCollection 2021.
9
: A Scalable Image Processing Architecture for Large Scale Surveillance Applications.一种用于大规模监控应用的可扩展图像处理架构。
Front Neurorobot. 2021 Aug 23;15:648101. doi: 10.3389/fnbot.2021.648101. eCollection 2021.
10
Secure Skyline Queries on Cloud Platform.云平台上的安全天际线查询
Proc Int Conf Data Eng. 2017 Apr;2017:633-644. doi: 10.1109/ICDE.2017.117. Epub 2017 May 18.

引用本文的文献

1
Exome wide association study for blood lipids in 1,158,017 individuals from diverse populations.对来自不同人群的1,158,017名个体进行血脂外显子组全关联研究。
medRxiv. 2024 Sep 18:2024.09.17.24313718. doi: 10.1101/2024.09.17.24313718.
2
Provenance Information for Biomedical Data and Workflows: Scoping Review.生物医学数据和工作流程的出处信息:范围综述。
J Med Internet Res. 2024 Aug 23;26:e51297. doi: 10.2196/51297.
3
Data Provenance in Biomedical Research: Scoping Review.生物医学研究中的数据溯源:范围综述。

本文引用的文献

1
Sequencing of 53,831 diverse genomes from the NHLBI TOPMed Program.美国国立卫生研究院生物医学高级研究与发展局(NHLBI)TOPMed 项目中对 53831 个不同基因组进行测序。
Nature. 2021 Feb;590(7845):290-299. doi: 10.1038/s41586-021-03205-y. Epub 2021 Feb 10.
2
The mutational constraint spectrum quantified from variation in 141,456 humans.从 141456 名人类个体的变异中量化的突变约束谱。
Nature. 2020 May;581(7809):434-443. doi: 10.1038/s41586-020-2308-7. Epub 2020 May 27.
3
Pan-cancer analysis of whole genomes.泛癌症全基因组分析。
J Med Internet Res. 2023 Mar 27;25:e42289. doi: 10.2196/42289.
Nature. 2020 Feb;578(7793):82-93. doi: 10.1038/s41586-020-1969-6. Epub 2020 Feb 5.
4
The human body at cellular resolution: the NIH Human Biomolecular Atlas Program.细胞分辨率人体图谱:NIH 人类生物分子图谱计划。
Nature. 2019 Oct;574(7777):187-192. doi: 10.1038/s41586-019-1629-x. Epub 2019 Oct 9.
5
The Integrative Human Microbiome Project.整合人类微生物组计划。
Nature. 2019 May;569(7758):641-648. doi: 10.1038/s41586-019-1238-8. Epub 2019 May 29.
6
Functional equivalence of genome sequencing analysis pipelines enables harmonized variant calling across human genetics projects.基因组测序分析管道的功能等效性使得人类遗传学项目中的变异调用得以协调。
Nat Commun. 2018 Oct 2;9(1):4038. doi: 10.1038/s41467-018-06159-4.
7
Eleven quick tips for architecting biomedical informatics workflows with cloud computing.利用云计算构建生物医学信息学工作流程的 11 个快速技巧。
PLoS Comput Biol. 2018 Mar 29;14(3):e1005994. doi: 10.1371/journal.pcbi.1005994. eCollection 2018 Mar.
8
Secure cloud computing for genomic data.用于基因组数据的安全云计算。
Nat Biotechnol. 2016 Jun 9;34(6):588-91. doi: 10.1038/nbt.3496.
9
The FAIR Guiding Principles for scientific data management and stewardship.科学数据管理和保存的 FAIR 指导原则。
Sci Data. 2016 Mar 15;3:160018. doi: 10.1038/sdata.2016.18.
10
Million Veteran Program: A mega-biobank to study genetic influences on health and disease.百万退伍军人计划:一个大型生物银行,用于研究遗传对健康和疾病的影响。
J Clin Epidemiol. 2016 Feb;70:214-23. doi: 10.1016/j.jclinepi.2015.09.016. Epub 2015 Oct 9.