• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

野外的APE:生物工具注册中心中蛋白质组学工作流程的自动探索。

APE in the Wild: Automated Exploration of Proteomics Workflows in the bio.tools Registry.

作者信息

Kasalica Vedran, Schwämmle Veit, Palmblad Magnus, Ison Jon, Lamprecht Anna-Lena

机构信息

Department of Information and Computing Sciences, Utrecht University, Utrecht 3584 CC, The Netherlands.

Department of Biochemistry and Molecular Biology, University of Southern Denmark, Odense 5230, Denmark.

出版信息

J Proteome Res. 2021 Apr 2;20(4):2157-2165. doi: 10.1021/acs.jproteome.0c00983. Epub 2021 Mar 15.

DOI:10.1021/acs.jproteome.0c00983
PMID:33720735
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC8041394/
Abstract

The bio.tools registry is a main catalogue of computational tools in the life sciences. More than 17 000 tools have been registered by the international bioinformatics community. The bio.tools metadata schema includes semantic annotations of tool functions, that is, formal descriptions of tools' data types, formats, and operations with terms from the EDAM bioinformatics ontology. Such annotations enable the automated composition of tools into multistep pipelines or workflows. In this Technical Note, we revisit a previous case study on the automated composition of proteomics workflows. We use the same four workflow scenarios but instead of using a small set of tools with carefully handcrafted annotations, we explore workflows directly on bio.tools. We use the Automated Pipeline Explorer (APE), a reimplementation and extension of the workflow composition method previously used. Moving "into the wild" opens up an unprecedented wealth of tools and a huge number of alternative workflows. Automated composition tools can be used to explore this space of possibilities systematically. Inevitably, the mixed quality of semantic annotations in bio.tools leads to unintended or erroneous tool combinations. However, our results also show that additional control mechanisms (tool filters, configuration options, and workflow constraints) can effectively guide the exploration toward smaller sets of more meaningful workflows.

摘要

bio.tools注册库是生命科学领域计算工具的主要目录。国际生物信息学界已注册了17000多种工具。bio.tools元数据模式包括工具功能的语义注释,即使用EDAM生物信息本体中的术语对工具的数据类型、格式和操作进行形式化描述。这种注释能够将工具自动组合成多步骤管道或工作流程。在本技术说明中,我们重新审视了之前关于蛋白质组学工作流程自动组合的案例研究。我们使用相同的四个工作流程场景,但不是使用一小组经过精心手工注释的工具,而是直接在bio.tools上探索工作流程。我们使用了自动管道探索器(APE),它是之前使用的工作流程组合方法的重新实现和扩展。进入“真实环境”带来了前所未有的大量工具和大量替代工作流程。自动组合工具可用于系统地探索这个可能性空间。不可避免地,bio.tools中语义注释的质量参差不齐会导致意外或错误的工具组合。然而,我们的结果也表明,额外的控制机制(工具过滤器、配置选项和工作流程约束)可以有效地引导探索朝着更有意义的较小工作流程集发展。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/014b/8041394/d22422d53760/pr0c00983_0007.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/014b/8041394/cf8d1bce1ab4/pr0c00983_0001.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/014b/8041394/259c9b37d02b/pr0c00983_0002.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/014b/8041394/7f2c264da2b2/pr0c00983_0004.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/014b/8041394/e8f8b99047b0/pr0c00983_0005.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/014b/8041394/fe423ce22e5e/pr0c00983_0006.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/014b/8041394/d22422d53760/pr0c00983_0007.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/014b/8041394/cf8d1bce1ab4/pr0c00983_0001.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/014b/8041394/259c9b37d02b/pr0c00983_0002.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/014b/8041394/7f2c264da2b2/pr0c00983_0004.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/014b/8041394/e8f8b99047b0/pr0c00983_0005.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/014b/8041394/fe423ce22e5e/pr0c00983_0006.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/014b/8041394/d22422d53760/pr0c00983_0007.jpg

相似文献

1
APE in the Wild: Automated Exploration of Proteomics Workflows in the bio.tools Registry.野外的APE:生物工具注册中心中蛋白质组学工作流程的自动探索。
J Proteome Res. 2021 Apr 2;20(4):2157-2165. doi: 10.1021/acs.jproteome.0c00983. Epub 2021 Mar 15.
2
Automated workflow composition in mass spectrometry-based proteomics.基于质谱的蛋白质组学中的自动化工作流组合。
Bioinformatics. 2019 Feb 15;35(4):656-664. doi: 10.1093/bioinformatics/bty646.
3
Perspectives on automated composition of workflows in the life sciences.生命科学中工作流自动化组合的观点。
F1000Res. 2021 Sep 7;10:897. doi: 10.12688/f1000research.54159.1. eCollection 2021.
4
EDAM: an ontology of bioinformatics operations, types of data and identifiers, topics and formats.EDAM:生物信息学操作、数据和标识符类型、主题和格式的本体论。
Bioinformatics. 2013 May 15;29(10):1325-32. doi: 10.1093/bioinformatics/btt113. Epub 2013 Mar 11.
5
Proteomics Software in bio.tools: Coverage and Annotations.生物工具中的蛋白质组学软件:覆盖范围和注释。
J Proteome Res. 2021 Apr 2;20(4):1821-1825. doi: 10.1021/acs.jproteome.0c00978. Epub 2021 Mar 15.
6
TOPPAS: a graphical workflow editor for the analysis of high-throughput proteomics data.TOPPAS:一个用于分析高通量蛋白质组学数据的图形化工作流编辑器。
J Proteome Res. 2012 Jul 6;11(7):3914-20. doi: 10.1021/pr300187f. Epub 2012 May 24.
7
An Automated Workflow Composition System for Liquid Chromatography-Mass Spectrometry Metabolomics Data Processing.一种用于液相色谱-质谱代谢组学数据处理的自动化工作流组合系统。
J Am Soc Mass Spectrom. 2023 Dec 6;34(12):2857-2863. doi: 10.1021/jasms.3c00248. Epub 2023 Oct 24.
8
Biowep: a workflow enactment portal for bioinformatics applications.生物工作流引擎(Biowep):一个用于生物信息学应用的工作流制定门户。
BMC Bioinformatics. 2007 Mar 8;8 Suppl 1(Suppl 1):S19. doi: 10.1186/1471-2105-8-S1-S19.
9
A graph-based approach for designing extensible pipelines.基于图的可扩展流水线设计方法。
BMC Bioinformatics. 2012 Jul 12;13:163. doi: 10.1186/1471-2105-13-163.
10
Workflow sharing with automated metadata validation and test execution to improve the reusability of published workflows.通过自动化元数据验证和测试执行来共享工作流程,以提高已发布工作流程的可重用性。
Gigascience. 2022 Dec 28;12. doi: 10.1093/gigascience/giad006. Epub 2023 Feb 22.

引用本文的文献

1
An Automated Workflow Composition System for Liquid Chromatography-Mass Spectrometry Metabolomics Data Processing.一种用于液相色谱-质谱代谢组学数据处理的自动化工作流组合系统。
J Am Soc Mass Spectrom. 2023 Dec 6;34(12):2857-2863. doi: 10.1021/jasms.3c00248. Epub 2023 Oct 24.
2
Metabolomics meets systems immunology.代谢组学与系统免疫学相遇。
EMBO Rep. 2023 Apr 5;24(4):e55747. doi: 10.15252/embr.202255747. Epub 2023 Mar 14.
3
Evaluating LC-HRMS metabolomics data processing software using FAIR principles for research software.

本文引用的文献

1
Proteomics Software in bio.tools: Coverage and Annotations.生物工具中的蛋白质组学软件:覆盖范围和注释。
J Proteome Res. 2021 Apr 2;20(4):1821-1825. doi: 10.1021/acs.jproteome.0c00978. Epub 2021 Mar 15.
2
Community curation of bioinformatics software and data resources.生物信息学软件和数据资源的社区管理。
Brief Bioinform. 2020 Sep 25;21(5):1697-1705. doi: 10.1093/bib/bbz075.
3
One Thousand and One Software for Proteomics: Tales of the Toolmakers of Science.一千零一软件:蛋白质组学的故事。
使用研究软件的FAIR原则评估液相色谱-高分辨质谱代谢组学数据处理软件。
Metabolomics. 2023 Feb 6;19(2):11. doi: 10.1007/s11306-023-01974-3.
4
A Checklist for Reproducible Computational Analysis in Clinical Metabolomics Research.临床代谢组学研究中可重复计算分析的检查清单
Metabolites. 2022 Jan 17;12(1):87. doi: 10.3390/metabo12010087.
5
Perspectives on automated composition of workflows in the life sciences.生命科学中工作流自动化组合的观点。
F1000Res. 2021 Sep 7;10:897. doi: 10.12688/f1000research.54159.1. eCollection 2021.
J Proteome Res. 2019 Oct 4;18(10):3580-3585. doi: 10.1021/acs.jproteome.9b00219. Epub 2019 Aug 29.
4
Automated workflow composition in mass spectrometry-based proteomics.基于质谱的蛋白质组学中的自动化工作流组合。
Bioinformatics. 2019 Feb 15;35(4):656-664. doi: 10.1093/bioinformatics/bty646.
5
The Galaxy platform for accessible, reproducible and collaborative biomedical analyses: 2018 update.Galaxy 平台:用于可访问、可重复和协作的生物医学分析:2018 年更新。
Nucleic Acids Res. 2018 Jul 2;46(W1):W537-W544. doi: 10.1093/nar/gky379.
6
Tools and data services registry: a community effort to document bioinformatics resources.工具与数据服务注册库:记录生物信息学资源的社区协作项目。
Nucleic Acids Res. 2016 Jan 4;44(D1):D38-47. doi: 10.1093/nar/gkv1116. Epub 2015 Nov 3.
7
EDAM: an ontology of bioinformatics operations, types of data and identifiers, topics and formats.EDAM:生物信息学操作、数据和标识符类型、主题和格式的本体论。
Bioinformatics. 2013 May 15;29(10):1325-32. doi: 10.1093/bioinformatics/btt113. Epub 2013 Mar 11.
8
SADI, SHARE, and the in silico scientific method.胃空肠旁路吻合术、可调节胃束带术和计算机模拟科学方法。
BMC Bioinformatics. 2010 Dec 21;11 Suppl 12(Suppl 12):S7. doi: 10.1186/1471-2105-11-S12-S7.
9
Magallanes: a web services discovery and automatic workflow composition tool.马加良斯:一种网络服务发现和自动工作流组合工具。
BMC Bioinformatics. 2009 Oct 15;10:334. doi: 10.1186/1471-2105-10-334.
10
Semi-automatic web service composition for the life sciences using the BioMoby semantic web framework.使用BioMoby语义网框架实现生命科学领域的半自动网络服务组合。
J Biomed Inform. 2008 Oct;41(5):837-47. doi: 10.1016/j.jbi.2008.02.005. Epub 2008 Mar 4.