• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

牛油果:用于可重复生物医学研究的工作流衍生数据溯源可视化

AVOCADO: Visualization of Workflow-Derived Data Provenance for Reproducible Biomedical Research.

作者信息

Stitz H, Luger S, Streit M, Gehlenborg N

机构信息

Johannes Kepler University Linz, Austria.

Harvard Medical School, United States of America.

出版信息

Comput Graph Forum. 2016 Jun;35(3):481-490. doi: 10.1111/cgf.12924. Epub 2016 Jul 4.

DOI:10.1111/cgf.12924
PMID:29973745
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC6027754/
Abstract

A major challenge in data-driven biomedical research lies in the collection and representation of data provenance information to ensure that findings are reproducibile. In order to communicate and reproduce multi-step analysis workflows executed on datasets that contain data for dozens or hundreds of samples, it is crucial to be able to visualize the provenance graph at different levels of aggregation. Most existing approaches are based on node-link diagrams, which do not scale to the complexity of typical data provenance graphs. In our proposed approach, we reduce the complexity of the graph using hierarchical and motif-based aggregation. Based on user action and graph attributes, a modular degree-of-interest (DoI) function is applied to expand parts of the graph that are relevant to the user. This interest-driven adaptive approach to provenance visualization allows users to review and communicate complex multi-step analyses, which can be based on hundreds of files that are processed by numerous workflows. We have integrated our approach into an analysis platform that captures extensive data provenance information, and demonstrate its effectiveness by means of a biomedical usage scenario.

摘要

数据驱动的生物医学研究中的一个主要挑战在于数据来源信息的收集和表示,以确保研究结果具有可重复性。为了交流和重现对包含数十个或数百个样本数据的数据集执行的多步骤分析工作流程,能够在不同聚合级别可视化来源图至关重要。大多数现有方法基于节点链接图,这种图无法扩展到典型数据来源图的复杂性。在我们提出的方法中,我们使用基于层次和基序的聚合来降低图的复杂性。基于用户操作和图属性,应用模块化兴趣度(DoI)函数来扩展与用户相关的图的部分。这种兴趣驱动的来源可视化自适应方法允许用户审查和交流复杂的多步骤分析,这些分析可以基于由众多工作流程处理的数百个文件。我们已将我们的方法集成到一个捕获广泛数据来源信息的分析平台中,并通过一个生物医学使用场景展示了其有效性。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ae12/6027754/bfd51803db25/nihms835059f7.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ae12/6027754/b55db2764ecb/nihms835059f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ae12/6027754/8dc6d3021f3e/nihms835059f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ae12/6027754/90b922eee9d0/nihms835059f3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ae12/6027754/f247d4c9294b/nihms835059f4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ae12/6027754/fb9f195436b7/nihms835059f5.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ae12/6027754/2575ae26d763/nihms835059f6.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ae12/6027754/bfd51803db25/nihms835059f7.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ae12/6027754/b55db2764ecb/nihms835059f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ae12/6027754/8dc6d3021f3e/nihms835059f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ae12/6027754/90b922eee9d0/nihms835059f3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ae12/6027754/f247d4c9294b/nihms835059f4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ae12/6027754/fb9f195436b7/nihms835059f5.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ae12/6027754/2575ae26d763/nihms835059f6.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ae12/6027754/bfd51803db25/nihms835059f7.jpg

相似文献

1
AVOCADO: Visualization of Workflow-Derived Data Provenance for Reproducible Biomedical Research.牛油果:用于可重复生物医学研究的工作流衍生数据溯源可视化
Comput Graph Forum. 2016 Jun;35(3):481-490. doi: 10.1111/cgf.12924. Epub 2016 Jul 4.
2
Sharing interoperable workflow provenance: A review of best practices and their practical application in CWLProv.共享可互操作的工作流溯源:最佳实践综述及其在 CWLProv 中的实际应用。
Gigascience. 2019 Nov 1;8(11). doi: 10.1093/gigascience/giz095.
3
Approaches and Criteria for Provenance in Biomedical Data Sets and Workflows: Protocol for a Scoping Review.生物医学数据集和工作流程中出处的方法与标准:范围综述方案
JMIR Res Protoc. 2021 Nov 22;10(11):e31750. doi: 10.2196/31750.
4
Semantic Provenance Graph for Reproducibility of Biomedical Research Studies: Generating and Analyzing Graph Structures from Published Literature.用于生物医学研究可重复性的语义溯源图:从已发表文献中生成和分析图结构。
Stud Health Technol Inform. 2019 Aug 21;264:328-332. doi: 10.3233/SHTI190237.
5
Provenance Information for Biomedical Data and Workflows: Scoping Review.生物医学数据和工作流程的出处信息:范围综述。
J Med Internet Res. 2024 Aug 23;26:e51297. doi: 10.2196/51297.
6
GeNNet: an integrated platform for unifying scientific workflows and graph databases for transcriptome data analysis.GeNNet:一个用于统一科学工作流程和图数据库以进行转录组数据分析的集成平台。
PeerJ. 2017 Jul 5;5:e3509. doi: 10.7717/peerj.3509. eCollection 2017.
7
A semantic proteomics dashboard (SemPoD) for data management in translational research.用于转化研究数据管理的语义蛋白质组学仪表板(SemPoD)。
BMC Syst Biol. 2012;6 Suppl 3(Suppl 3):S20. doi: 10.1186/1752-0509-6-S3-S20. Epub 2012 Dec 17.
8
Research traceability using provenance services for biomedical analysis.利用溯源服务进行生物医学分析的研究可追溯性。
Stud Health Technol Inform. 2010;159:88-99.
9
Provenance for distributed biomedical workflow execution.分布式生物医学工作流执行的出处
Stud Health Technol Inform. 2012;175:91-100.
10
FAIRSCAPE: a Framework for FAIR and Reproducible Biomedical Analytics.FAIRSCAPE:一个用于实现生物医学分析的 FAIR 和可重复的框架。
Neuroinformatics. 2022 Jan;20(1):187-202. doi: 10.1007/s12021-021-09529-4. Epub 2021 Jul 15.

引用本文的文献

1
Provenance Information for Biomedical Data and Workflows: Scoping Review.生物医学数据和工作流程的出处信息:范围综述。
J Med Internet Res. 2024 Aug 23;26:e51297. doi: 10.2196/51297.
2
Facilitating the Sharing of Electrophysiology Data Analysis Results Through In-Depth Provenance Capture.通过深入的溯源捕获来促进电生理数据分析结果的共享。
eNeuro. 2024 Jun 14;11(6). doi: 10.1523/ENEURO.0476-23.2024. Print 2024 Jun.
3
Data Provenance in Biomedical Research: Scoping Review.生物医学研究中的数据溯源:范围综述。

本文引用的文献

1
ThermalPlot: Visualizing Multi-Attribute Time-Series Data Using a Thermal Metaphor.热图:使用热隐喻可视化多属性时间序列数据。
IEEE Trans Vis Comput Graph. 2016 Dec;22(12):2594-2607. doi: 10.1109/TVCG.2015.2513389. Epub 2015 Dec 31.
2
Reducing Snapshots to Points: A Visual Analytics Approach to Dynamic Network Exploration.将快照简化为点:一种动态网络探索的可视化分析方法。
IEEE Trans Vis Comput Graph. 2016 Jan;22(1):1-10. doi: 10.1109/TVCG.2015.2468078.
3
High-Quality Ultra-Compact Grid Layout of Grouped Networks.高质量的分组网络超紧凑栅格布局。
J Med Internet Res. 2023 Mar 27;25:e42289. doi: 10.2196/42289.
IEEE Trans Vis Comput Graph. 2016 Jan;22(1):339-48. doi: 10.1109/TVCG.2015.2467251. Epub 2015 Aug 12.
4
Characterizing Provenance in Visualization and Data Analysis: An Organizational Framework of Provenance Types and Purposes.描绘可视化和数据分析中的溯源:溯源类型和目的的组织框架。
IEEE Trans Vis Comput Graph. 2016 Jan;22(1):31-40. doi: 10.1109/TVCG.2015.2467551. Epub 2015 Aug 12.
5
From Peer-Reviewed to Peer-Reproduced in Scholarly Publishing: The Complementary Roles of Data Models and Workflows in Bioinformatics.从学术出版中的同行评审到同行复现:数据模型和工作流程在生物信息学中的互补作用
PLoS One. 2015 Jul 8;10(7):e0127612. doi: 10.1371/journal.pone.0127612. eCollection 2015.
6
The cancer test.癌症检测。
Science. 2015 Jun 26;348(6242):1411-3. doi: 10.1126/science.348.6242.1411.
7
Solving reproducibility.解决可重复性问题。
Science. 2015 Jun 26;348(6242):1403. doi: 10.1126/science.aac8041.
8
Visual analysis of biological data-knowledge networks.生物数据-知识网络的可视化分析
BMC Bioinformatics. 2015 Apr 29;16:135. doi: 10.1186/s12859-015-0550-z.
9
Reproducibility in science: improving the standard for basic and preclinical research.科学可重复性:提高基础和临床前研究的标准。
Circ Res. 2015 Jan 2;116(1):116-26. doi: 10.1161/CIRCRESAHA.114.303819.
10
A modular degree-of-interest specification for the visual analysis of large dynamic networks.一种用于大型动态网络视觉分析的模块化兴趣度规范。
IEEE Trans Vis Comput Graph. 2014 Mar;20(3):337-50. doi: 10.1109/TVCG.2013.109.