• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

Risa R/Bioconductor 包:从实验元数据到实验结果的综合数据分析。

The Risa R/Bioconductor package: integrative data analysis from experimental metadata and back again.

出版信息

BMC Bioinformatics. 2014;15 Suppl 1(Suppl 1):S11. doi: 10.1186/1471-2105-15-S1-S11. Epub 2014 Jan 10.

DOI:10.1186/1471-2105-15-S1-S11
PMID:24564732
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC4015122/
Abstract

BACKGROUND

The ISA-Tab format and software suite have been developed to break the silo effect induced by technology-specific formats for a variety of data types and to better support experimental metadata tracking. Experimentalists seldom use a single technique to monitor biological signals. Providing a multi-purpose, pragmatic and accessible format that abstracts away common constructs for describing Investigations, Studies and Assays, ISA is increasingly popular. To attract further interest towards the format and extend support to ensure reproducible research and reusable data, we present the Risa package, which delivers a central component to support the ISA format by enabling effortless integration with R, the popular, open source data crunching environment.

RESULTS

The Risa package bridges the gap between the metadata collection and curation in an ISA-compliant way and the data analysis using the widely used statistical computing environment R. The package offers functionality for: i) parsing ISA-Tab datasets into R objects, ii) augmenting annotation with extra metadata not explicitly stated in the ISA syntax; iii) interfacing with domain specific R packages iv) suggesting potentially useful R packages available in Bioconductor for subsequent processing of the experimental data described in the ISA format; and finally v) saving back to ISA-Tab files augmented with analysis specific metadata from R. We demonstrate these features by presenting use cases for mass spectrometry data and DNA microarray data.

CONCLUSIONS

The Risa package is open source (with LGPL license) and freely available through Bioconductor. By making Risa available, we aim to facilitate the task of processing experimental data, encouraging a uniform representation of experimental information and results while delivering tools for ensuring traceability and provenance tracking.

SOFTWARE AVAILABILITY

The Risa package is available since Bioconductor 2.11 (version 1.0.0) and version 1.2.1 appeared in Bioconductor 2.12, both along with documentation and examples. The latest version of the code is at the development branch in Bioconductor and can also be accessed from GitHub https://github.com/ISA-tools/Risa, where the issue tracker allows users to report bugs or feature requests.

摘要

背景

ISA-Tab 格式和软件套件的开发旨在打破由于各种数据类型的技术特定格式而导致的信息孤岛效应,并更好地支持实验元数据跟踪。实验人员很少使用单一技术来监测生物信号。ISA 提供了一种多用途、实用且易于访问的格式,它抽象出了用于描述研究、实验和分析的常见结构,因此越来越受欢迎。为了进一步吸引人们对该格式的兴趣,并扩展支持以确保可重复的研究和可重复使用的数据,我们提出了 Risa 包,它通过提供一个核心组件来支持 ISA 格式,从而实现与流行的开源数据处理环境 R 的轻松集成。

结果

Risa 包以符合 ISA 的方式弥合了元数据收集和管理方面的差距,以及使用广泛使用的统计计算环境 R 进行数据分析之间的差距。该包提供了以下功能:i)将 ISA-Tab 数据集解析为 R 对象,ii)使用 ISA 语法中未明确说明的额外元数据扩充注释;iii)与特定于域的 R 包接口;iv)为随后处理以 ISA 格式描述的实验数据,建议在 Bioconductor 中可用的潜在有用的 R 包;最后 v)将数据保存回 ISA-Tab 文件,并从 R 中添加分析特定的元数据。我们通过演示质谱数据和 DNA 微阵列数据的用例来展示这些功能。

结论

Risa 包是开源的(使用 LGPL 许可证),并可通过 Bioconductor 免费获得。通过提供 Risa,我们旨在简化处理实验数据的任务,鼓励对实验信息和结果进行统一表示,同时提供确保可追溯性和出处跟踪的工具。

软件可用性

Risa 包自 Bioconductor 2.11(版本 1.0.0)以来可用,版本 1.2.1 出现在 Bioconductor 2.12 中,同时提供了文档和示例。代码的最新版本位于 Bioconductor 的开发分支中,也可以从 GitHub https://github.com/ISA-tools/Risa 访问,在那里,问题跟踪器允许用户报告错误或功能请求。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d612/4015122/8cb9b428a22c/1471-2105-15-S1-S11-5.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d612/4015122/96508560d60c/1471-2105-15-S1-S11-1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d612/4015122/c394a6a0b3ce/1471-2105-15-S1-S11-2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d612/4015122/8ccdb13f881c/1471-2105-15-S1-S11-3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d612/4015122/728ee8c8621c/1471-2105-15-S1-S11-4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d612/4015122/8cb9b428a22c/1471-2105-15-S1-S11-5.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d612/4015122/96508560d60c/1471-2105-15-S1-S11-1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d612/4015122/c394a6a0b3ce/1471-2105-15-S1-S11-2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d612/4015122/8ccdb13f881c/1471-2105-15-S1-S11-3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d612/4015122/728ee8c8621c/1471-2105-15-S1-S11-4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d612/4015122/8cb9b428a22c/1471-2105-15-S1-S11-5.jpg

相似文献

1
The Risa R/Bioconductor package: integrative data analysis from experimental metadata and back again.Risa R/Bioconductor 包:从实验元数据到实验结果的综合数据分析。
BMC Bioinformatics. 2014;15 Suppl 1(Suppl 1):S11. doi: 10.1186/1471-2105-15-S1-S11. Epub 2014 Jan 10.
2
linkedISA: semantic representation of ISA-Tab experimental metadata.linkedISA:ISA-Tab 实验元数据的语义表示。
BMC Bioinformatics. 2014;15 Suppl 14(Suppl 14):S4. doi: 10.1186/1471-2105-15-S14-S4. Epub 2014 Nov 27.
3
isa4j: a scalable Java library for creating ISA-Tab metadata.isa4j:一个用于创建ISA-Tab元数据的可扩展Java库。
F1000Res. 2020 Dec 3;9. doi: 10.12688/f1000research.27188.1. eCollection 2020.
4
mzML2ISA & nmrML2ISA: generating enriched ISA-Tab metadata files from metabolomics XML data.mzML2ISA和nmrML2ISA:从代谢组学XML数据生成丰富的ISA-Tab元数据文件。
Bioinformatics. 2017 Aug 15;33(16):2598-2600. doi: 10.1093/bioinformatics/btx169.
5
ISA API: An open platform for interoperable life science experimental metadata.ISA API:一个用于可互操作的生命科学实验元数据的开放平台。
Gigascience. 2021 Sep 16;10(9). doi: 10.1093/gigascience/giab060.
6
BiocPkgTools: Toolkit for mining the package ecosystem.BiocPkgTools:用于挖掘软件包生态系统的工具包。
F1000Res. 2019 May 29;8:752. doi: 10.12688/f1000research.19410.1. eCollection 2019.
7
RGMQL: scalable and interoperable computing of heterogeneous omics big data and metadata in R/Bioconductor.RGMQL:在 R/Bioconductor 中可扩展和互操作的异构组学大数据和元数据的计算。
BMC Bioinformatics. 2022 Apr 7;23(1):123. doi: 10.1186/s12859-022-04648-4.
8
SODAR: managing multiomics study data and metadata.SODAR:管理多组学研究数据和元数据。
Gigascience. 2022 Dec 28;12. doi: 10.1093/gigascience/giad052. Epub 2023 Jul 27.
9
A Python library for FAIRer access and deposition to the Metabolomics Workbench Data Repository.一个用于更公平地访问和存入代谢组学工作台数据存储库的Python库。
Metabolomics. 2018;14(5):64. doi: 10.1007/s11306-018-1356-6. Epub 2018 Apr 20.
10
VariantAnnotation: a Bioconductor package for exploration and annotation of genetic variants.VariantAnnotation:一个用于探索和注释遗传变异的 Bioconductor 软件包。
Bioinformatics. 2014 Jul 15;30(14):2076-8. doi: 10.1093/bioinformatics/btu168. Epub 2014 Mar 28.

引用本文的文献

1
EGAsubmitter: A software to automate submission of nucleic acid sequencing data to the European Genome-phenome Archive.EGA提交工具:一种用于将核酸测序数据自动提交至欧洲基因组-表型组档案库的软件。
Front Bioinform. 2023 Mar 30;3:1143014. doi: 10.3389/fbinf.2023.1143014. eCollection 2023.
2
pISA-tree - a data management framework for life science research projects using a standardised directory tree.pISA 树 - 使用标准化目录树的生命科学研究项目的数据管理框架。
Sci Data. 2022 Nov 10;9(1):685. doi: 10.1038/s41597-022-01805-5.
3
ISA API: An open platform for interoperable life science experimental metadata.

本文引用的文献

1
OntoMaton: a bioportal powered ontology widget for Google Spreadsheets.OntoMaton:一个为 Google Spreadsheets 提供动力的生物门户本体小部件。
Bioinformatics. 2013 Feb 15;29(4):525-7. doi: 10.1093/bioinformatics/bts718. Epub 2012 Dec 24.
2
The PRoteomics IDEntifications (PRIDE) database and associated tools: status in 2013.PRIDE 数据库及相关工具:2013 年的现状。
Nucleic Acids Res. 2013 Jan;41(Database issue):D1063-9. doi: 10.1093/nar/gks1262. Epub 2012 Nov 29.
3
ArrayExpress update--trends in database growth and links to data analysis tools.
ISA API:一个用于可互操作的生命科学实验元数据的开放平台。
Gigascience. 2021 Sep 16;10(9). doi: 10.1093/gigascience/giab060.
4
isa4j: a scalable Java library for creating ISA-Tab metadata.isa4j:一个用于创建ISA-Tab元数据的可扩展Java库。
F1000Res. 2020 Dec 3;9. doi: 10.12688/f1000research.27188.1. eCollection 2020.
5
PhenoMeNal: processing and analysis of metabolomics data in the cloud.PhenoMeNal:云端代谢组学数据的处理和分析。
Gigascience. 2019 Feb 1;8(2). doi: 10.1093/gigascience/giy149.
6
mzML2ISA & nmrML2ISA: generating enriched ISA-Tab metadata files from metabolomics XML data.mzML2ISA和nmrML2ISA:从代谢组学XML数据生成丰富的ISA-Tab元数据文件。
Bioinformatics. 2017 Aug 15;33(16):2598-2600. doi: 10.1093/bioinformatics/btx169.
7
The Ontology for Biomedical Investigations.生物医学研究本体论
PLoS One. 2016 Apr 29;11(4):e0154556. doi: 10.1371/journal.pone.0154556. eCollection 2016.
8
Data standards can boost metabolomics research, and if there is a will, there is a way.数据标准可以推动代谢组学研究,有志者,事竟成。
Metabolomics. 2016;12:14. doi: 10.1007/s11306-015-0879-3. Epub 2015 Nov 17.
9
COordination of Standards in MetabOlomicS (COSMOS): facilitating integrated metabolomics data access.代谢组学标准协调组织(COSMOS):促进代谢组学数据的集成访问。
Metabolomics. 2015;11(6):1587-1597. doi: 10.1007/s11306-015-0810-y. Epub 2015 May 26.
10
From Peer-Reviewed to Peer-Reproduced in Scholarly Publishing: The Complementary Roles of Data Models and Workflows in Bioinformatics.从学术出版中的同行评审到同行复现:数据模型和工作流程在生物信息学中的互补作用
PLoS One. 2015 Jul 8;10(7):e0127612. doi: 10.1371/journal.pone.0127612. eCollection 2015.
ArrayExpress 更新——数据库增长趋势及与数据分析工具的链接。
Nucleic Acids Res. 2013 Jan;41(Database issue):D987-90. doi: 10.1093/nar/gks1174. Epub 2012 Nov 27.
4
NCBI GEO: archive for functional genomics data sets--update.NCBI GEO:功能基因组学数据集存档 - 更新。
Nucleic Acids Res. 2013 Jan;41(Database issue):D991-5. doi: 10.1093/nar/gks1193. Epub 2012 Nov 27.
5
MetaboLights--an open-access general-purpose repository for metabolomics studies and associated meta-data.MetaboLights--一个开放获取的通用代谢组学研究和相关元数据存储库。
Nucleic Acids Res. 2013 Jan;41(Database issue):D781-6. doi: 10.1093/nar/gks1004. Epub 2012 Oct 29.
6
BATMAN--an R package for the automated quantification of metabolites from nuclear magnetic resonance spectra using a Bayesian model.BATMAN-一个使用贝叶斯模型自动定量分析核磁共振光谱代谢物的 R 包。
Bioinformatics. 2012 Aug 1;28(15):2088-90. doi: 10.1093/bioinformatics/bts308. Epub 2012 May 26.
7
Toward interoperable bioscience data.迈向可互操作的生物科学数据
Nat Genet. 2012 Jan 27;44(2):121-6. doi: 10.1038/ng.1054.
8
The Stem Cell Discovery Engine: an integrated repository and analysis system for cancer stem cell comparisons.干细胞发现引擎:癌症干细胞比较的集成存储库和分析系统。
Nucleic Acids Res. 2012 Jan;40(Database issue):D984-91. doi: 10.1093/nar/gkr1051. Epub 2011 Nov 24.
9
CAMERA: an integrated strategy for compound spectra extraction and annotation of liquid chromatography/mass spectrometry data sets.CAMERA:一种用于液相色谱/质谱数据集的化合物谱提取和注释的集成策略。
Anal Chem. 2012 Jan 3;84(1):283-9. doi: 10.1021/ac202450g. Epub 2011 Dec 12.
10
BioPortal: enhanced functionality via new Web services from the National Center for Biomedical Ontology to access and use ontologies in software applications.生物信息学知识库:通过国家生物医学本体学研究中心提供的新 Web 服务增强功能,以便在软件应用程序中访问和使用本体。
Nucleic Acids Res. 2011 Jul;39(Web Server issue):W541-5. doi: 10.1093/nar/gkr469. Epub 2011 Jun 14.