• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

通用语言处理器:一个 GLP 领域半监督毒理学基因组学元数据治疗工具。

ESPERANTO: a GLP-field sEmi-SuPERvised toxicogenomics metadAta curatioN TOol.

机构信息

FHAIVE, Faculty of Medicine and Health Technology, Tampere University, Tampere 33520, Finland.

Tampere Institute for Advanced Study, Tampere, 33520, Finland.

出版信息

Bioinformatics. 2023 Jun 1;39(6). doi: 10.1093/bioinformatics/btad405.

DOI:10.1093/bioinformatics/btad405
PMID:37354497
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC10313344/
Abstract

SUMMARY

Biological data repositories are an invaluable source of publicly available research evidence. Unfortunately, the lack of convergence of the scientific community on a common metadata annotation strategy has resulted in large amounts of data with low FAIRness (Findable, Accessible, Interoperable and Reusable). The possibility of generating high-quality insights from their integration relies on data curation, which is typically an error-prone process while also being expensive in terms of time and human labour. Here, we present ESPERANTO, an innovative framework that enables a standardized semi-supervised harmonization and integration of toxicogenomics metadata and increases their FAIRness in a Good Laboratory Practice-compliant fashion. The harmonization across metadata is guaranteed with the definition of an ad hoc vocabulary. The tool interface is designed to support the user in metadata harmonization in a user-friendly manner, regardless of the background and the type of expertise.

AVAILABILITY AND IMPLEMENTATION

ESPERANTO and its user manual are freely available for academic purposes at https://github.com/fhaive/esperanto. The input and the results showcased in Supplementary File S1 are available at the same link.

摘要

摘要

生物数据存储库是公共可用研究证据的宝贵资源。然而,科学界缺乏对通用元数据标注策略的共识,导致大量数据的 FAIR 程度较低(可发现性、可访问性、互操作性和可重用性)。从其整合中生成高质量见解的可能性依赖于数据管理,这通常是一个容易出错的过程,而且在时间和人力方面也很昂贵。在这里,我们提出了 ESPERANTO,这是一个创新的框架,能够以标准化的半监督方式协调和整合毒理学元数据,并以符合良好实验室规范的方式提高其 FAIR 程度。通过定义专门的词汇表来保证元数据的协调一致。该工具的界面旨在以用户友好的方式支持用户进行元数据协调,无论其背景和专业类型如何。

可用性和实现

ESPERANTO 及其用户手册可在学术用途上免费在 https://github.com/fhaive/esperanto 获取。在补充文件 S1 中展示的输入和结果可在同一链接获取。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/9d01/10313344/e4646b894ddc/btad405f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/9d01/10313344/e4646b894ddc/btad405f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/9d01/10313344/e4646b894ddc/btad405f1.jpg

相似文献

1
ESPERANTO: a GLP-field sEmi-SuPERvised toxicogenomics metadAta curatioN TOol.通用语言处理器:一个 GLP 领域半监督毒理学基因组学元数据治疗工具。
Bioinformatics. 2023 Jun 1;39(6). doi: 10.1093/bioinformatics/btad405.
2
Adamant: a JSON schema-based metadata editor for research data management workflows.坚韧不拔:一个基于 JSON 模式的元数据编辑器,用于研究数据管理工作流程。
F1000Res. 2022 Apr 29;11:475. doi: 10.12688/f1000research.110875.2. eCollection 2022.
3
linkedISA: semantic representation of ISA-Tab experimental metadata.linkedISA:ISA-Tab 实验元数据的语义表示。
BMC Bioinformatics. 2014;15 Suppl 14(Suppl 14):S4. doi: 10.1186/1471-2105-15-S14-S4. Epub 2014 Nov 27.
4
Patpat: a public proteomics dataset search framework.Patpat:一个公共蛋白质组学数据集搜索框架。
Bioinformatics. 2023 Feb 3;39(2). doi: 10.1093/bioinformatics/btad076.
5
Sequencing data discovery with MetaSeek.利用 MetaSeek 进行测序数据发现。
Bioinformatics. 2019 Nov 1;35(22):4857-4859. doi: 10.1093/bioinformatics/btz499.
6
medna-metadata: an open-source data management system for tracking environmental DNA samples and metadata.medna-metadata:一个用于跟踪环境 DNA 样本和元数据的开源数据管理系统。
Bioinformatics. 2022 Sep 30;38(19):4589-4597. doi: 10.1093/bioinformatics/btac556.
7
grabseqs: simple downloading of reads and metadata from multiple next-generation sequencing data repositories.grabseqs:从多个下一代测序数据存储库中简单地下载读取和元数据。
Bioinformatics. 2020 Jun 1;36(11):3607-3609. doi: 10.1093/bioinformatics/btaa167.
8
Detecting and correcting misclassified sequences in the large-scale public databases.检测和纠正大规模公共数据库中的错误分类序列。
Bioinformatics. 2020 Sep 15;36(18):4699-4705. doi: 10.1093/bioinformatics/btaa586.
9
PeakForest: a multi-platform digital infrastructure for interoperable metabolite spectral data and metadata management.PeakForest:一个用于互操作代谢物光谱数据和元数据管理的多平台数字基础设施。
Metabolomics. 2022 Jun 14;18(6):40. doi: 10.1007/s11306-022-01899-3.
10
GEOMetaCuration: a web-based application for accurate manual curation of Gene Expression Omnibus metadata.GEOMetaCuration:一个基于网络的应用程序,用于准确地手动整理基因表达综合数据集元数据。
Database (Oxford). 2018 Jan 1;2018. doi: 10.1093/database/bay019.

引用本文的文献

1
CompSafeNano project: NanoInformatics approaches for safe-by-design nanomaterials.CompSafeNano项目:用于设计安全纳米材料的纳米信息学方法。
Comput Struct Biotechnol J. 2024 Dec 25;29:13-28. doi: 10.1016/j.csbj.2024.12.024. eCollection 2025.
2
Current state of data stewardship tools in life science.生命科学领域数据管理工具的现状
Front Big Data. 2024 Sep 16;7:1428568. doi: 10.3389/fdata.2024.1428568. eCollection 2024.

本文引用的文献

1
Nextcast: A software suite to analyse and model toxicogenomics data.Nextcast:一个用于分析和建模毒理基因组学数据的软件套件。
Comput Struct Biotechnol J. 2022 Mar 18;20:1413-1426. doi: 10.1016/j.csbj.2022.03.014. eCollection 2022.
2
Prospects and challenges for FAIR toxicogenomics data.公平信息检索(FAIR)毒理基因组学数据的前景与挑战
Nat Nanotechnol. 2022 Jan;17(1):17-18. doi: 10.1038/s41565-021-01049-1. Epub 2021 Dec 23.
3
BioSamples database: FAIRer samples metadata to accelerate research data management.生物样本数据库:FAIRer 样本元数据加速研究数据管理。
Nucleic Acids Res. 2022 Jan 7;50(D1):D1500-D1507. doi: 10.1093/nar/gkab1046.
4
Manually curated transcriptomics data collection for toxicogenomic assessment of engineered nanomaterials.人工策管转录组学数据收集,用于工程纳米材料的毒基因组评估。
Sci Data. 2021 Feb 8;8(1):49. doi: 10.1038/s41597-021-00808-y.
5
Text mining meets community curation: a newly designed curation platform to improve author experience and participation at WormBase.文本挖掘与社区策展相结合:一个新设计的策展平台,旨在改善 WormBase 的作者体验和参与度。
Database (Oxford). 2020 Jan 1;2020. doi: 10.1093/database/baaa006.
6
Textpresso Central: a customizable platform for searching, text mining, viewing, and curating biomedical literature.Textpresso 中心:一个可定制的平台,用于搜索、文本挖掘、查看和管理生物医学文献。
BMC Bioinformatics. 2018 Mar 9;19(1):94. doi: 10.1186/s12859-018-2103-8.
7
The FAIR Guiding Principles for scientific data management and stewardship.科学数据管理和保存的 FAIR 指导原则。
Sci Data. 2016 Mar 15;3:160018. doi: 10.1038/sdata.2016.18.