• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

一个在FAIR数据网络中用于生成和共享元数据的生态系统。

An ecosystem for producing and sharing metadata within the web of FAIR Data.

作者信息

Jacob Daniel, Ehrenmann François, David Romain, Tran Joseph, Mirande-Ney Cathleen, Chaumeil Philippe

机构信息

INRAE, Université de Bordeaux, F-33140 Villenave d'Ornon, France.

INRAE, UR1268 BIA, Centre INRAE Pays de Loire-Nantes, F-44000 Nantes, France.

出版信息

Gigascience. 2025 Jan 6;14. doi: 10.1093/gigascience/giae111.

DOI:10.1093/gigascience/giae111
PMID:39775840
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC11707607/
Abstract

BACKGROUND

Descriptive metadata are vital for reporting, discovering, leveraging, and mobilizing research datasets. However, resolving metadata issues as part of a data management plan can be complex for data producers. To organize and document data, various descriptive metadata must be created. Furthermore, when sharing data, it is important to ensure metadata interoperability in line with FAIR (Findable, Accessible, Interoperable, Reusable) principles. Given the practical nature of these challenges, there is a need for management tools that can assist data managers effectively. Additionally, these tools should meet the needs of data producers and be user-friendly, requiring minimal training.

RESULTS

We developed Maggot (Metadata Aggregation on Data Storage), a web-based tool to locally manage a data catalog using high-level metadata. The main goal was to facilitate easy data dissemination and deposition in data repositories. With Maggot, users can easily generate and attach high-level metadata to datasets, allowing for seamless sharing in a collaborative environment. This approach aligns with many data management plans as it effectively addresses challenges related to data organization, documentation, storage, and the sharing of metadata based on FAIR principles within and beyond the collaborative group. Furthermore, Maggot enables metadata crosswalks (i.e., generated metadata can be converted to the schema used by a specific data repository or be exported using a format suitable for data collection by third-party applications).

CONCLUSION

The primary purpose of Maggot is to streamline the collection of high-level metadata using carefully chosen schemas and standards. Additionally, it simplifies data accessibility via metadata, typically a requirement for publicly funded projects. As a result, Maggot can be utilized to promote effective local management with the goal of facilitating data sharing while adhering to the FAIR principles. Furthermore, it can contribute to the preparation of the future EOSC FAIR Web of Data within the European Open Science Cloud framework.

摘要

背景

描述性元数据对于研究数据集的报告、发现、利用和调动至关重要。然而,对于数据生产者而言,将解决元数据问题作为数据管理计划的一部分可能很复杂。为了组织和记录数据,必须创建各种描述性元数据。此外,在共享数据时,确保元数据符合FAIR(可查找、可访问、可互操作、可重用)原则的互操作性很重要。鉴于这些挑战的实际性质,需要能够有效协助数据管理者的管理工具。此外,这些工具应满足数据生产者的需求且用户友好,所需培训最少。

结果

我们开发了Maggot(数据存储上的元数据聚合),这是一个基于网络的工具,用于使用高级元数据在本地管理数据目录。主要目标是便于在数据存储库中轻松进行数据传播和存档。使用Maggot,用户可以轻松生成高级元数据并将其附加到数据集,从而在协作环境中实现无缝共享。这种方法符合许多数据管理计划,因为它有效解决了与数据组织、记录、存储以及基于FAIR原则在协作组内外共享元数据相关的挑战。此外,Maggot支持元数据交叉映射(即生成的元数据可以转换为特定数据存储库使用的模式,或者使用适合第三方应用程序进行数据收集的格式导出)。

结论

Maggot的主要目的是使用精心选择的模式和标准简化高级元数据的收集。此外,它通过元数据简化了数据可访问性,这通常是公共资助项目的要求。因此,Maggot可用于促进有效的本地管理,以实现数据共享为目标,同时遵守FAIR原则。此外,它可以为在欧洲开放科学云框架内构建未来的EOSC FAIR数据网络做出贡献。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/68d7/11707607/48badc75dcf3/giae111fig4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/68d7/11707607/032f8dddb1ca/giae111fig1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/68d7/11707607/73183922ab4e/giae111fig2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/68d7/11707607/24e7c43ebe77/giae111fig3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/68d7/11707607/48badc75dcf3/giae111fig4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/68d7/11707607/032f8dddb1ca/giae111fig1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/68d7/11707607/73183922ab4e/giae111fig2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/68d7/11707607/24e7c43ebe77/giae111fig3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/68d7/11707607/48badc75dcf3/giae111fig4.jpg

相似文献

1
An ecosystem for producing and sharing metadata within the web of FAIR Data.一个在FAIR数据网络中用于生成和共享元数据的生态系统。
Gigascience. 2025 Jan 6;14. doi: 10.1093/gigascience/giae111.
2
Adamant: a JSON schema-based metadata editor for research data management workflows.坚韧不拔:一个基于 JSON 模式的元数据编辑器,用于研究数据管理工作流程。
F1000Res. 2022 Apr 29;11:475. doi: 10.12688/f1000research.110875.2. eCollection 2022.
3
Making Metadata Machine-Readable as the First Step to Providing Findable, Accessible, Interoperable, and Reusable Population Health Data: Framework Development and Implementation Study.将元数据转化为机器可读形式作为提供可查找、可访问、可互操作和可重用的人群健康数据的第一步:框架开发与实施研究
Online J Public Health Inform. 2024 Aug 1;16:e56237. doi: 10.2196/56237.
4
Centralized project-specific metadata platforms: toolkit provides new perspectives on open data management within multi-institution and multidisciplinary research projects.集中式项目特定元数据平台:工具包为多机构和多学科研究项目中的开放数据管理提供了新视角。
BMC Res Notes. 2022 Mar 18;15(1):106. doi: 10.1186/s13104-022-05996-3.
5
Daily life in the Open Biologist's second job, as a Data Curator.开放生物学家的第二份工作——数据管理员的日常生活。
Wellcome Open Res. 2024 Dec 5;9:523. doi: 10.12688/wellcomeopenres.22899.1. eCollection 2024.
6
Globally Accessible Distributed Data Sharing (GADDS): a decentralized FAIR platform to facilitate data sharing in the life sciences.全球可访问分布式数据共享(GADDS):一个去中心化的 FAIR 平台,旨在促进生命科学领域的数据共享。
Bioinformatics. 2022 Aug 2;38(15):3812-3817. doi: 10.1093/bioinformatics/btac362.
7
Exploring and retrieving sequence and metadata for species across the tree of life with NCBI Datasets.利用 NCBI Datasets 探索和获取跨生命之树的物种的序列和元数据。
Sci Data. 2024 Jul 5;11(1):732. doi: 10.1038/s41597-024-03571-y.
8
A Data Transformation Methodology to Create Findable, Accessible, Interoperable, and Reusable Health Data: Software Design, Development, and Evaluation Study.一种创建可发现、可访问、可互操作和可重用健康数据的数据转换方法:软件设计、开发和评估研究。
J Med Internet Res. 2023 Mar 8;25:e42822. doi: 10.2196/42822.
9
dtool and dserver: A flexible ecosystem for findable data.dtool 和 dserver:一个用于可发现数据的灵活生态系统。
PLoS One. 2024 Jun 25;19(6):e0306100. doi: 10.1371/journal.pone.0306100. eCollection 2024.
10
linkedISA: semantic representation of ISA-Tab experimental metadata.linkedISA:ISA-Tab 实验元数据的语义表示。
BMC Bioinformatics. 2014;15 Suppl 14(Suppl 14):S4. doi: 10.1186/1471-2105-15-S14-S4. Epub 2014 Nov 27.

本文引用的文献

1
"Be sustainable": EOSC-Life recommendations for implementation of FAIR principles in life science data handling.“保持可持续性”:EOSC-Life 关于在生命科学数据处理中实施 FAIR 原则的建议。
EMBO J. 2023 Dec 1;42(23):e115008. doi: 10.15252/embj.2023115008. Epub 2023 Nov 15.
2
Modeling community standards for metadata as templates makes data FAIR.将元数据的社区标准建模为模板可使数据变得 FAIR。
Sci Data. 2022 Nov 12;9(1):696. doi: 10.1038/s41597-022-01815-3.
3
Understanding the Nature of Metadata: Systematic Review.理解元数据的本质:系统评价。
J Med Internet Res. 2022 Jan 11;24(1):e25440. doi: 10.2196/25440.
4
Making experimental data tables in the life sciences more FAIR: a pragmatic approach.让生命科学中的实验数据表更加 FAIR:一种务实的方法。
Gigascience. 2020 Dec 15;9(12). doi: 10.1093/gigascience/giaa144.
5
Data sharing and how it can benefit your scientific career.数据共享以及它如何能对你的科研生涯有益。
Nature. 2019 May;569(7756):445-447. doi: 10.1038/d41586-019-01506-x.
6
The FAIR Guiding Principles for scientific data management and stewardship.科学数据管理和保存的 FAIR 指导原则。
Sci Data. 2016 Mar 15;3:160018. doi: 10.1038/sdata.2016.18.
7
SEEK: a systems biology data and model management platform.SEEK:一个系统生物学数据与模型管理平台。
BMC Syst Biol. 2015 Jul 11;9:33. doi: 10.1186/s12918-015-0174-y.
8
The center for expanded data annotation and retrieval.扩展数据注释与检索中心
J Am Med Inform Assoc. 2015 Nov;22(6):1148-52. doi: 10.1093/jamia/ocv048. Epub 2015 Jun 25.
9
Toward interoperable bioscience data.迈向可互操作的生物科学数据
Nat Genet. 2012 Jan 27;44(2):121-6. doi: 10.1038/ng.1054.
10
BioPortal: ontologies and integrated data resources at the click of a mouse.生物门户:一键点击即可获取本体和集成数据资源。
Nucleic Acids Res. 2009 Jul;37(Web Server issue):W170-3. doi: 10.1093/nar/gkp440. Epub 2009 May 29.