• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

生物工具模式:生物信息学软件描述的形式化模式。

biotoolsSchema: a formalized schema for bioinformatics software description.

机构信息

CNRS, UMS 3601, Institut Français de Bioinformatique, IFB-core, 2 rue Gaston Crémieux, F-91000 Evry, France.

National Life Science Supercomputing Center, Technical University of Denmark, Building 208, DK-2800 Kongens Lyngby, Denmark.

出版信息

Gigascience. 2021 Jan 27;10(1). doi: 10.1093/gigascience/giaa157.

DOI:10.1093/gigascience/giaa157
PMID:33506265
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC7842104/
Abstract

BACKGROUND

Life scientists routinely face massive and heterogeneous data analysis tasks and must find and access the most suitable databases or software in a jungle of web-accessible resources. The diversity of information used to describe life-scientific digital resources presents an obstacle to their utilization. Although several standardization efforts are emerging, no information schema has been sufficiently detailed to enable uniform semantic and syntactic description-and cataloguing-of bioinformatics resources.

FINDINGS

Here we describe biotoolsSchema, a formalized information model that balances the needs of conciseness for rapid adoption against the provision of rich technical information and scientific context. biotoolsSchema results from a series of community-driven workshops and is deployed in the bio.tools registry, providing the scientific community with >17,000 machine-readable and human-understandable descriptions of software and other digital life-science resources. We compare our approach to related initiatives and provide alignments to foster interoperability and reusability.

CONCLUSIONS

biotoolsSchema supports the formalized, rigorous, and consistent specification of the syntax and semantics of bioinformatics resources, and enables cataloguing efforts such as bio.tools that help scientists to find, comprehend, and compare resources. The use of biotoolsSchema in bio.tools promotes the FAIRness of research software, a key element of open and reproducible developments for data-intensive sciences.

摘要

背景

生命科学家经常面临大规模且异构的数据分析任务,必须在网络可访问资源的丛林中找到并访问最合适的数据库或软件。用于描述生命科学数字资源的信息多样性是其利用的障碍。尽管正在出现一些标准化工作,但没有任何信息模式足够详细,无法实现生物信息学资源的统一语义和语法描述和编目。

发现

在这里,我们描述了 biotoolsSchema,这是一种形式化的信息模型,它在快速采用的简洁性需求与提供丰富技术信息和科学上下文之间取得平衡。biotoolsSchema 源自一系列社区驱动的研讨会,并部署在 bio.tools 注册中心,为科学界提供了 >17000 个可机读和可理解的软件和其他数字生命科学资源的描述。我们比较了我们的方法与相关倡议,并提供了对齐以促进互操作性和可重用性。

结论

biotoolsSchema 支持生物信息学资源的语法和语义的形式化、严格和一致的规范,并支持诸如 bio.tools 等编目工作,帮助科学家找到、理解和比较资源。bio.tools 中 biotoolsSchema 的使用促进了研究软件的 FAIRness,这是数据密集型科学开放和可重复发展的关键要素。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/5450/7842104/6e18ac0a3edc/giaa157fig4a.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/5450/7842104/5dc08eb49a1c/giaa157fig1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/5450/7842104/4f5c81570a12/giaa157fig2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/5450/7842104/44f221f94c7a/giaa157fig3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/5450/7842104/6e18ac0a3edc/giaa157fig4a.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/5450/7842104/5dc08eb49a1c/giaa157fig1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/5450/7842104/4f5c81570a12/giaa157fig2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/5450/7842104/44f221f94c7a/giaa157fig3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/5450/7842104/6e18ac0a3edc/giaa157fig4a.jpg

相似文献

1
biotoolsSchema: a formalized schema for bioinformatics software description.生物工具模式:生物信息学软件描述的形式化模式。
Gigascience. 2021 Jan 27;10(1). doi: 10.1093/gigascience/giaa157.
2
linkedISA: semantic representation of ISA-Tab experimental metadata.linkedISA:ISA-Tab 实验元数据的语义表示。
BMC Bioinformatics. 2014;15 Suppl 14(Suppl 14):S4. doi: 10.1186/1471-2105-15-S14-S4. Epub 2014 Nov 27.
3
Harmonizing semantic annotations for computational models in biology.生物学计算模型的语义标注协调。
Brief Bioinform. 2019 Mar 22;20(2):540-550. doi: 10.1093/bib/bby087.
4
BioXSD: the common data-exchange format for everyday bioinformatics web services.BioXSD:日常生物信息学 Web 服务的通用数据交换格式。
Bioinformatics. 2010 Sep 15;26(18):i540-6. doi: 10.1093/bioinformatics/btq391.
5
OILing the way to machine understandable bioinformatics resources.为实现机器可理解的生物信息学资源铺平道路。
IEEE Trans Inf Technol Biomed. 2002 Jun;6(2):129-34. doi: 10.1109/titb.2002.1006300.
6
Tools and data services registry: a community effort to document bioinformatics resources.工具与数据服务注册库:记录生物信息学资源的社区协作项目。
Nucleic Acids Res. 2016 Jan 4;44(D1):D38-47. doi: 10.1093/nar/gkv1116. Epub 2015 Nov 3.
7
Moby and Moby 2: creatures of the deep (web).《白鲸记》与《白鲸记2:深海生灵》(网络版)
Brief Bioinform. 2009 Mar;10(2):114-28. doi: 10.1093/bib/bbn051. Epub 2009 Jan 16.
8
FAIR-Checker: supporting digital resource findability and reuse with Knowledge Graphs and Semantic Web standards.FAIR-Checker:利用知识图谱和语义 Web 标准支持数字资源的可发现性和再利用。
J Biomed Semantics. 2023 Jul 1;14(1):7. doi: 10.1186/s13326-023-00289-5.
9
Semantic Technologies and Bio-Ontologies.语义技术与生物本体论
Methods Mol Biol. 2017;1617:83-91. doi: 10.1007/978-1-4939-7046-9_6.
10
The bio.tools registry of software tools and data resources for the life sciences.生物工具——生命科学领域的软件工具和数据资源注册中心。
Genome Biol. 2019 Aug 12;20(1):164. doi: 10.1186/s13059-019-1772-6.

引用本文的文献

1
Making Biomedical Research Software FAIR: Actionable Step-by-step Guidelines with a User-support Tool.使生物医学研究软件 FAIR:具有用户支持工具的可操作分步指南。
Sci Data. 2023 Aug 23;10(1):557. doi: 10.1038/s41597-023-02463-x.
2
Nine best practices for research software registries and repositories.研究软件注册中心和存储库的九条最佳实践。
PeerJ Comput Sci. 2022 Aug 8;8:e1023. doi: 10.7717/peerj-cs.1023. eCollection 2022.
3
Perspectives on automated composition of workflows in the life sciences.生命科学中工作流自动化组合的观点。

本文引用的文献

1
Community curation of bioinformatics software and data resources.生物信息学软件和数据资源的社区管理。
Brief Bioinform. 2020 Sep 25;21(5):1697-1705. doi: 10.1093/bib/bbz075.
2
One Thousand and One Software for Proteomics: Tales of the Toolmakers of Science.一千零一软件:蛋白质组学的故事。
J Proteome Res. 2019 Oct 4;18(10):3580-3585. doi: 10.1021/acs.jproteome.9b00219. Epub 2019 Aug 29.
3
The bio.tools registry of software tools and data resources for the life sciences.生物工具——生命科学领域的软件工具和数据资源注册中心。
F1000Res. 2021 Sep 7;10:897. doi: 10.12688/f1000research.54159.1. eCollection 2021.
Genome Biol. 2019 Aug 12;20(1):164. doi: 10.1186/s13059-019-1772-6.
4
Automated workflow composition in mass spectrometry-based proteomics.基于质谱的蛋白质组学中的自动化工作流组合。
Bioinformatics. 2019 Feb 15;35(4):656-664. doi: 10.1093/bioinformatics/bty646.
5
Using bio.tools to generate and annotate workbench tool descriptions.使用生物工具生成并注释工作台工具描述。
F1000Res. 2017 Nov 30;6. doi: 10.12688/f1000research.12974.1. eCollection 2017.
6
Four simple recommendations to encourage best practices in research software.鼓励研究软件最佳实践的四条简单建议。
F1000Res. 2017 Jun 13;6. doi: 10.12688/f1000research.11407.1. eCollection 2017.
7
Developing a framework for digital objects in the Big Data to Knowledge (BD2K) commons: Report from the Commons Framework Pilots workshop.为大数据到知识(BD2K)共享库中的数字对象开发一个框架:共享库框架试点研讨会报告
J Biomed Inform. 2017 Jul;71:49-57. doi: 10.1016/j.jbi.2017.05.006. Epub 2017 May 10.
8
ReGaTE: Registration of Galaxy Tools in Elixir.ReGaTE:Elixir中Galaxy工具的注册。
Gigascience. 2017 Jun 1;6(6):1-4. doi: 10.1093/gigascience/gix022.
9
RRIDs: A Simple Step toward Improving Reproducibility through Rigor and Transparency of Experimental Methods.研究资源识别号(RRIDs):通过实验方法的严谨性和透明度迈向提高可重复性的简单一步。
Neuron. 2016 May 4;90(3):434-6. doi: 10.1016/j.neuron.2016.04.030.
10
The Galaxy platform for accessible, reproducible and collaborative biomedical analyses: 2016 update.用于可访问、可重复和协作式生物医学分析的Galaxy平台:2016年更新
Nucleic Acids Res. 2016 Jul 8;44(W1):W3-W10. doi: 10.1093/nar/gkw343. Epub 2016 May 2.