• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

质谱数据核心应用程序编程接口:一个用于计算蛋白质组学的面向元数据的开源库。

ms-data-core-api: an open-source, metadata-oriented library for computational proteomics.

作者信息

Perez-Riverol Yasset, Uszkoreit Julian, Sanchez Aniel, Ternent Tobias, Del Toro Noemi, Hermjakob Henning, Vizcaíno Juan Antonio, Wang Rui

机构信息

European Molecular Biology Laboratory, European Bioinformatics Institute (EMBL-EBI), Wellcome Trust Genome Campus, Hinxton, Cambridge, CB10 1SD, UK.

Ruhr-Universität Bochum, Medizinisches Proteom-Zenter, Medical Bioinformatics, ZKF, E.142, Universitätsstr. 150, D-44801 Bochum, Germany and.

出版信息

Bioinformatics. 2015 Sep 1;31(17):2903-5. doi: 10.1093/bioinformatics/btv250. Epub 2015 Apr 24.

DOI:10.1093/bioinformatics/btv250
PMID:25910694
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC4547611/
Abstract

UNLABELLED

The ms-data-core-api is a free, open-source library for developing computational proteomics tools and pipelines. The Application Programming Interface, written in Java, enables rapid tool creation by providing a robust, pluggable programming interface and common data model. The data model is based on controlled vocabularies/ontologies and captures the whole range of data types included in common proteomics experimental workflows, going from spectra to peptide/protein identifications to quantitative results. The library contains readers for three of the most used Proteomics Standards Initiative standard file formats: mzML, mzIdentML, and mzTab. In addition to mzML, it also supports other common mass spectra data formats: dta, ms2, mgf, pkl, apl (text-based), mzXML and mzData (XML-based). Also, it can be used to read PRIDE XML, the original format used by the PRIDE database, one of the world-leading proteomics resources. Finally, we present a set of algorithms and tools whose implementation illustrates the simplicity of developing applications using the library.

AVAILABILITY AND IMPLEMENTATION

The software is freely available at https://github.com/PRIDE-Utilities/ms-data-core-api.

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online

CONTACT

juan@ebi.ac.uk.

摘要

未标注

ms-data-core-api是一个用于开发计算蛋白质组学工具和管道的免费开源库。该应用程序编程接口用Java编写,通过提供一个强大的、可插拔的编程接口和通用数据模型,实现快速创建工具。数据模型基于受控词汇表/本体,涵盖了常见蛋白质组学实验工作流程中包含的所有数据类型,从光谱到肽/蛋白质鉴定再到定量结果。该库包含用于三种最常用的蛋白质组学标准倡议标准文件格式的读取器:mzML、mzIdentML和mzTab。除了mzML,它还支持其他常见的质谱数据格式:dta、ms2、mgf、pkl、apl(基于文本)、mzXML和mzData(基于XML)。此外,它还可用于读取PRIDE XML,这是PRIDE数据库使用的原始格式,PRIDE数据库是世界领先的蛋白质组学资源之一。最后,我们展示了一组算法和工具,其实现说明了使用该库开发应用程序的简便性。

可用性和实现

该软件可在https://github.com/PRIDE-Utilities/ms-data-core-api上免费获取。

补充信息

补充数据可在《生物信息学》在线获取。

联系方式

juan@ebi.ac.uk。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/6642/4547611/6b11dc8db84d/btv250f1p.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/6642/4547611/6b11dc8db84d/btv250f1p.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/6642/4547611/6b11dc8db84d/btv250f1p.jpg

相似文献

1
ms-data-core-api: an open-source, metadata-oriented library for computational proteomics.质谱数据核心应用程序编程接口:一个用于计算蛋白质组学的面向元数据的开源库。
Bioinformatics. 2015 Sep 1;31(17):2903-5. doi: 10.1093/bioinformatics/btv250. Epub 2015 Apr 24.
2
jmzReader: A Java parser library to process and visualize multiple text and XML-based mass spectrometry data formats.jmzReader:一个用于处理和可视化多种基于文本和 XML 的质谱数据格式的 Java 解析库。
Proteomics. 2012 Mar;12(6):795-8. doi: 10.1002/pmic.201100578.
3
PRIDE Inspector Toolsuite: Moving Toward a Universal Visualization Tool for Proteomics Data Standard Formats and Quality Assessment of ProteomeXchange Datasets.PRIDE Inspector工具套件:迈向用于蛋白质组学数据标准格式和ProteomeXchange数据集质量评估的通用可视化工具
Mol Cell Proteomics. 2016 Jan;15(1):305-17. doi: 10.1074/mcp.O115.050229. Epub 2015 Nov 6.
4
jmzTab: a java interface to the mzTab data standard.jmzTab:mzTab 数据标准的 Java 接口。
Proteomics. 2014 Jun;14(11):1328-32. doi: 10.1002/pmic.201300560. Epub 2014 Apr 29.
5
OLS Client and OLS Dialog: Open Source Tools to Annotate Public Omics Datasets.OLS客户端和OLS对话框:用于注释公共组学数据集的开源工具。
Proteomics. 2017 Oct;17(19). doi: 10.1002/pmic.201700244.
6
jmzML, an open-source Java API for mzML, the PSI standard for MS data.jmzML,一个用于 mzML 的开源 Java API,mzML 是 MS 数据的 PSI 标准。
Proteomics. 2010 Apr;10(7):1332-5. doi: 10.1002/pmic.200900719.
7
PRIDE: a public repository of protein and peptide identifications for the proteomics community.PRIDE:蛋白质组学领域蛋白质和肽段鉴定信息的公共数据库。
Nucleic Acids Res. 2006 Jan 1;34(Database issue):D659-63. doi: 10.1093/nar/gkj138.
8
The mzTab data exchange format: communicating mass-spectrometry-based proteomics and metabolomics experimental results to a wider audience.mzTab数据交换格式:将基于质谱的蛋白质组学和代谢组学实验结果传达给更广泛的受众。
Mol Cell Proteomics. 2014 Oct;13(10):2765-75. doi: 10.1074/mcp.O113.036681. Epub 2014 Jun 30.
9
2016 update of the PRIDE database and its related tools.PRIDE数据库及其相关工具的2016年更新。
Nucleic Acids Res. 2016 Jan 4;44(D1):D447-56. doi: 10.1093/nar/gkv1145. Epub 2015 Nov 2.
10
ThermoRawFileParser: Modular, Scalable, and Cross-Platform RAW File Conversion.ThermoRawFileParser:模块化、可扩展且跨平台的 RAW 文件转换。
J Proteome Res. 2020 Jan 3;19(1):537-542. doi: 10.1021/acs.jproteome.9b00328. Epub 2019 Dec 6.

引用本文的文献

1
The PRIDE database at 20 years: 2025 update.20年的PRIDE数据库:2025年更新
Nucleic Acids Res. 2025 Jan 6;53(D1):D543-D553. doi: 10.1093/nar/gkae1011.
2
The PRIDE database resources in 2022: a hub for mass spectrometry-based proteomics evidences.PRIDE 数据库资源在 2022 年:一个基于质谱的蛋白质组学证据的中心。
Nucleic Acids Res. 2022 Jan 7;50(D1):D543-D552. doi: 10.1093/nar/gkab1038.
3
piNET: a versatile web platform for downstream analysis and visualization of proteomics data.piNET:一个用于蛋白质组学数据下游分析和可视化的通用网络平台。

本文引用的文献

1
Making proteomics data accessible and reusable: current state of proteomics databases and repositories.使蛋白质组学数据可访问且可重复使用:蛋白质组学数据库和资源库的现状。
Proteomics. 2015 Mar;15(5-6):930-49. doi: 10.1002/pmic.201400302.
2
The mzTab data exchange format: communicating mass-spectrometry-based proteomics and metabolomics experimental results to a wider audience.mzTab数据交换格式:将基于质谱的蛋白质组学和代谢组学实验结果传达给更广泛的受众。
Mol Cell Proteomics. 2014 Oct;13(10):2765-75. doi: 10.1074/mcp.O113.036681. Epub 2014 Jun 30.
3
ProteomeXchange provides globally coordinated proteomics data submission and dissemination.
Nucleic Acids Res. 2020 Jul 2;48(W1):W85-W93. doi: 10.1093/nar/gkaa436.
4
The ProteomeXchange consortium in 2020: enabling 'big data' approaches in proteomics.2020 年蛋白质组交换联盟:在蛋白质组学中启用“大数据”方法。
Nucleic Acids Res. 2020 Jan 8;48(D1):D1145-D1152. doi: 10.1093/nar/gkz984.
5
psims - A Declarative Writer for mzML and mzIdentML for Python.psims - 用于 Python 的 mzML 和 mzIdentML 的声明式编写器。
Mol Cell Proteomics. 2019 Mar;18(3):571-575. doi: 10.1074/mcp.RP118.001070. Epub 2018 Dec 18.
6
The PRIDE database and related tools and resources in 2019: improving support for quantification data.PRIDE 数据库及相关工具和资源在 2019 年的进展:提高定量数据支持。
Nucleic Acids Res. 2019 Jan 8;47(D1):D442-D450. doi: 10.1093/nar/gky1106.
7
iProX: an integrated proteome resource.iProX:一个综合蛋白质组资源库。
Nucleic Acids Res. 2019 Jan 8;47(D1):D1211-D1217. doi: 10.1093/nar/gky869.
8
A Fast and Quantitative Method for Post-translational Modification and Variant Enabled Mapping of Peptides to Genomes.一种用于翻译后修饰和肽段到基因组的变异映射的快速定量方法。
J Vis Exp. 2018 May 22(135):57633. doi: 10.3791/57633.
9
JAMI: a Java library for molecular interactions and data interoperability.JAMI:用于分子相互作用和数据互操作性的 Java 库。
BMC Bioinformatics. 2018 Apr 11;19(1):133. doi: 10.1186/s12859-018-2119-0.
10
The proBAM and proBed standard formats: enabling a seamless integration of genomics and proteomics data.proBAM 和 proBed 标准格式:实现基因组学和蛋白质组学数据的无缝集成。
Genome Biol. 2018 Jan 31;19(1):12. doi: 10.1186/s13059-017-1377-x.
蛋白质组学交换库提供全球协调的蛋白质组学数据提交和传播服务。
Nat Biotechnol. 2014 Mar;32(3):223-6. doi: 10.1038/nbt.2839.
4
Open source libraries and frameworks for mass spectrometry based proteomics: a developer's perspective.基于质谱的蛋白质组学的开源库和框架:开发者视角
Biochim Biophys Acta. 2014 Jan;1844(1 Pt A):63-76. doi: 10.1016/j.bbapap.2013.02.032. Epub 2013 Mar 1.
5
HI-bone: a scoring system for identifying phenylisothiocyanate-derivatized peptides based on precursor mass and high intensity fragment ions.HI-bone:一种基于母离子质量和高强度碎片离子鉴定苯异硫氰酸酯衍生肽的评分系统。
Anal Chem. 2013 Apr 2;85(7):3515-20. doi: 10.1021/ac303239g. Epub 2013 Mar 20.
6
The PRoteomics IDEntifications (PRIDE) database and associated tools: status in 2013.PRIDE 数据库及相关工具:2013 年的现状。
Nucleic Acids Res. 2013 Jan;41(Database issue):D1063-9. doi: 10.1093/nar/gks1262. Epub 2012 Nov 29.
7
The mzIdentML data standard for mass spectrometry-based proteomics results.基于质谱的蛋白质组学结果的 mzIdentML 数据标准。
Mol Cell Proteomics. 2012 Jul;11(7):M111.014381. doi: 10.1074/mcp.M111.014381. Epub 2012 Feb 27.
8
Isoelectric point optimization using peptide descriptors and support vector machines.使用肽描述符和支持向量机进行等电点优化。
J Proteomics. 2012 Apr 3;75(7):2269-74. doi: 10.1016/j.jprot.2012.01.029. Epub 2012 Feb 3.
9
PRIDE Inspector: a tool to visualize and validate MS proteomics data.PRIDE Inspector:一种可视化和验证质谱蛋白质组学数据的工具。
Nat Biotechnol. 2012 Feb 8;30(2):135-7. doi: 10.1038/nbt.2112.
10
mzML--a community standard for mass spectrometry data.mzML--质谱数据的社区标准。
Mol Cell Proteomics. 2011 Jan;10(1):R110.000133. doi: 10.1074/mcp.R110.000133. Epub 2010 Aug 17.