• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

isa4j:一个用于创建ISA-Tab元数据的可扩展Java库。

isa4j: a scalable Java library for creating ISA-Tab metadata.

作者信息

Psaroudakis Dennis, Liu Feng, König Patrick, Scholz Uwe, Junker Astrid, Lange Matthias, Arend Daniel

机构信息

Leibniz Institute of Plant Genetics and Crop Plant Research (IPK) Gatersleben, Seeland, 06466, Germany.

Hochschule Mittweida, University of Applied Sciences, Mittweida, 09648, Germany.

出版信息

F1000Res. 2020 Dec 3;9. doi: 10.12688/f1000research.27188.1. eCollection 2020.

DOI:10.12688/f1000research.27188.1
PMID:33728038
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC7941097/
Abstract

Experimental data is only useful to other researchers if it is findable, accessible, interoperable, and reusable (FAIR). The ISA-Tab framework enables scientists to publish metadata about their experiments in a plain text, machine-readable format that aims to confer that interoperability and reusability. A Python software package (isatools) is currently being developed to programmatically produce these metadata files. For Java-based environments, there is no equivalent solution yet. While the isatools package provides a lot of flexibility and a wealth of different features for the Python ecosystem, a package for JVM-based applications might offer the speed and scalability needed for writing very large ISA-Tab files, making the ISA framework available in an even wider range of situations and environments. Here we present a light-weight and scalable Java library (isa4j) for generating metadata files in the ISA-Tab format, which elegantly integrates into existing JVM applications and especially shines at generating very large files. It is modeled after the ISA core specifications and designed in keeping with isatools conventions, making it consistent and intuitive to use for the community. isa4j is implemented in Java (JDK11+) and freely available under the terms of the MIT license from the Central Maven Repository ( https://mvnrepository.com/artifact/de.ipk-gatersleben/isa4j). The source code, detailed documentation, usage examples and performance evaluations can be found at https://github.com/IPK-BIT/isa4j.

摘要

实验数据只有在具备可查找、可访问、可互操作和可重复使用(FAIR)的特性时,才对其他研究人员有用。ISA-Tab框架使科学家能够以一种纯文本、机器可读的格式发布有关其实验的元数据,旨在实现这种互操作性和可重复使用性。目前正在开发一个Python软件包(isatools),用于以编程方式生成这些元数据文件。对于基于Java的环境,目前还没有等效的解决方案。虽然isatools包为Python生态系统提供了很大的灵活性和丰富的不同功能,但一个基于JVM的应用程序包可能会提供编写非常大的ISA-Tab文件所需的速度和可扩展性,使ISA框架能够在更广泛的情况和环境中使用。在这里,我们展示了一个轻量级且可扩展的Java库(isa4j),用于生成ISA-Tab格式的元数据文件,它能优雅地集成到现有的JVM应用程序中,尤其在生成非常大的文件时表现出色。它以ISA核心规范为模型,并按照isatools的约定进行设计,使其对社区来说使用起来既一致又直观。isa4j用Java(JDK11+)实现,可在中央Maven仓库(https://mvnrepository.com/artifact/de.ipk-gatersleben/isa4j)根据MIT许可免费获取。源代码、详细文档、使用示例和性能评估可在https://github.com/IPK-BIT/isa4j上找到。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/cc18/7941097/b1dddb0dd86c/f1000research-9-30037-g0002.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/cc18/7941097/0ba28dbaec9c/f1000research-9-30037-g0000.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/cc18/7941097/43e2c9609b3c/f1000research-9-30037-g0001.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/cc18/7941097/b1dddb0dd86c/f1000research-9-30037-g0002.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/cc18/7941097/0ba28dbaec9c/f1000research-9-30037-g0000.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/cc18/7941097/43e2c9609b3c/f1000research-9-30037-g0001.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/cc18/7941097/b1dddb0dd86c/f1000research-9-30037-g0002.jpg

相似文献

1
isa4j: a scalable Java library for creating ISA-Tab metadata.isa4j:一个用于创建ISA-Tab元数据的可扩展Java库。
F1000Res. 2020 Dec 3;9. doi: 10.12688/f1000research.27188.1. eCollection 2020.
2
The Risa R/Bioconductor package: integrative data analysis from experimental metadata and back again.Risa R/Bioconductor 包:从实验元数据到实验结果的综合数据分析。
BMC Bioinformatics. 2014;15 Suppl 1(Suppl 1):S11. doi: 10.1186/1471-2105-15-S1-S11. Epub 2014 Jan 10.
3
ISA API: An open platform for interoperable life science experimental metadata.ISA API:一个用于可互操作的生命科学实验元数据的开放平台。
Gigascience. 2021 Sep 16;10(9). doi: 10.1093/gigascience/giab060.
4
mzML2ISA & nmrML2ISA: generating enriched ISA-Tab metadata files from metabolomics XML data.mzML2ISA和nmrML2ISA:从代谢组学XML数据生成丰富的ISA-Tab元数据文件。
Bioinformatics. 2017 Aug 15;33(16):2598-2600. doi: 10.1093/bioinformatics/btx169.
5
linkedISA: semantic representation of ISA-Tab experimental metadata.linkedISA:ISA-Tab 实验元数据的语义表示。
BMC Bioinformatics. 2014;15 Suppl 14(Suppl 14):S4. doi: 10.1186/1471-2105-15-S14-S4. Epub 2014 Nov 27.
6
A Python library for FAIRer access and deposition to the Metabolomics Workbench Data Repository.一个用于更公平地访问和存入代谢组学工作台数据存储库的Python库。
Metabolomics. 2018;14(5):64. doi: 10.1007/s11306-018-1356-6. Epub 2018 Apr 20.
7
SODAR: managing multiomics study data and metadata.SODAR:管理多组学研究数据和元数据。
Gigascience. 2022 Dec 28;12. doi: 10.1093/gigascience/giad052. Epub 2023 Jul 27.
8
pISA-tree - a data management framework for life science research projects using a standardised directory tree.pISA 树 - 使用标准化目录树的生命科学研究项目的数据管理框架。
Sci Data. 2022 Nov 10;9(1):685. doi: 10.1038/s41597-022-01805-5.
9
JPhyloIO: a Java library for event-based reading and writing of different phylogenetic file formats through a common interface.JPhyloIO:一个用于基于事件的读取和写入不同系统发育文件格式的 Java 库,通过一个公共接口。
BMC Bioinformatics. 2019 Jul 22;20(1):402. doi: 10.1186/s12859-019-2982-3.
10
Making Metadata Machine-Readable as the First Step to Providing Findable, Accessible, Interoperable, and Reusable Population Health Data: Framework Development and Implementation Study.将元数据转化为机器可读形式作为提供可查找、可访问、可互操作和可重用的人群健康数据的第一步:框架开发与实施研究
Online J Public Health Inform. 2024 Aug 1;16:e56237. doi: 10.2196/56237.

引用本文的文献

1
SEA CDM: Study-Experiment-Assay Common Data Model and Databases for Cross-Domain Data Integration and Analysis.SEA CDM:用于跨域数据集成与分析的研究-实验-检测通用数据模型及数据库
bioRxiv. 2025 Aug 28:2025.08.26.671804. doi: 10.1101/2025.08.26.671804.
2
A Current Encyclopedia of Bioinformatics Tools, Data Formats and Resources for Mass Spectrometry Lipidomics.《质谱脂质组学的生物信息学工具、数据格式和资源最新百科全书》
Metabolites. 2022 Jun 23;12(7):584. doi: 10.3390/metabo12070584.
3
ISA API: An open platform for interoperable life science experimental metadata.

本文引用的文献

1
BRIDGE - A Visual Analytics Web Tool for Barley Genebank Genomics.BRIDGE - 一种用于大麦基因库基因组学的可视化分析网络工具。
Front Plant Sci. 2020 Jun 11;11:701. doi: 10.3389/fpls.2020.00701. eCollection 2020.
2
Enabling reusability of plant phenomic datasets with MIAPPE 1.1.利用MIAPPE 1.1实现植物表型组学数据集的可重复使用性。
New Phytol. 2020 Jul;227(1):260-273. doi: 10.1111/nph.16544. Epub 2020 Apr 25.
3
Invest 5% of research funds in ensuring data are reusable.将5%的研究资金投入到确保数据可重复使用方面。
ISA API:一个用于可互操作的生命科学实验元数据的开放平台。
Gigascience. 2021 Sep 16;10(9). doi: 10.1093/gigascience/giab060.
Nature. 2020 Feb;578(7796):491. doi: 10.1038/d41586-020-00505-7.
4
Genebank genomics highlights the diversity of a global barley collection.基因银行基因组学突出了全球大麦收藏的多样性。
Nat Genet. 2019 Feb;51(2):319-326. doi: 10.1038/s41588-018-0266-x. Epub 2018 Nov 12.
5
GenBank.GenBank。
Nucleic Acids Res. 2018 Jan 4;46(D1):D41-D47. doi: 10.1093/nar/gkx1094.
6
The FAIR Guiding Principles for scientific data management and stewardship.科学数据管理和保存的 FAIR 指导原则。
Sci Data. 2016 Mar 15;3:160018. doi: 10.1038/sdata.2016.18.
7
UniProt: a hub for protein information.通用蛋白质数据库(UniProt):蛋白质信息中心。
Nucleic Acids Res. 2015 Jan;43(Database issue):D204-12. doi: 10.1093/nar/gku989. Epub 2014 Oct 27.
8
The Risa R/Bioconductor package: integrative data analysis from experimental metadata and back again.Risa R/Bioconductor 包:从实验元数据到实验结果的综合数据分析。
BMC Bioinformatics. 2014;15 Suppl 1(Suppl 1):S11. doi: 10.1186/1471-2105-15-S1-S11. Epub 2014 Jan 10.
9
OntoMaton: a bioportal powered ontology widget for Google Spreadsheets.OntoMaton:一个为 Google Spreadsheets 提供动力的生物门户本体小部件。
Bioinformatics. 2013 Feb 15;29(4):525-7. doi: 10.1093/bioinformatics/bts718. Epub 2012 Dec 24.
10
MetaboLights--an open-access general-purpose repository for metabolomics studies and associated meta-data.MetaboLights--一个开放获取的通用代谢组学研究和相关元数据存储库。
Nucleic Acids Res. 2013 Jan;41(Database issue):D781-6. doi: 10.1093/nar/gks1004. Epub 2012 Oct 29.