• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

MSLib:高效生成开放的多阶段碎裂质谱图库。

MSLib: efficient generation of open multi-stage fragmentation mass spectral libraries.

作者信息

Brungs Corinna, Schmid Robin, Heuckeroth Steffen, Mazumdar Aninda, Drexler Matúš, Šácha Pavel, Dorrestein Pieter C, Petras Daniel, Nothias Louis-Felix, Veverka Václav, Nencka Radim, Kameník Zdeněk, Pluskal Tomáš

机构信息

Institute of Organic Chemistry and Biochemistry of the Czech Academy of Sciences, Prague, Czechia.

Department of Pharmaceutical Sciences, Faculty of Life Sciences, University of Vienna, Vienna, Austria.

出版信息

Nat Methods. 2025 Sep 15. doi: 10.1038/s41592-025-02813-0.

DOI:10.1038/s41592-025-02813-0
PMID:40954295
Abstract

Untargeted high-resolution mass spectrometry is a key tool in clinical metabolomics, natural product discovery and exposomics, with compound identification remaining the major bottleneck. Currently, the standard workflow applies spectral library matching against tandem mass spectrometry (MS) fragmentation data. Multi-stage fragmentation (MS) yields more profound insights into substructures, enabling validation of fragmentation pathways; however, the community lacks open MS reference data of diverse natural products and other chemicals. Here we describe MSLib, a machine learning-ready open resource of >2 million spectra in MS trees of 30,008 unique small molecules, built with a high-throughput data acquisition and processing pipeline in the open-source software mzmine.

摘要

非靶向高分辨率质谱是临床代谢组学、天然产物发现和暴露组学中的关键工具,化合物鉴定仍然是主要瓶颈。目前,标准工作流程是将光谱库与串联质谱(MS)碎片数据进行匹配。多级碎裂(MS)能更深入地了解子结构,有助于验证碎裂途径;然而,该领域缺乏各种天然产物和其他化学品的开放MS参考数据。在此,我们描述了MSLib,这是一个可供机器学习使用的开放资源,包含30,008种独特小分子的MS树中的200多万个光谱,通过开源软件mzmine中的高通量数据采集和处理管道构建而成。

相似文献

1
MSLib: efficient generation of open multi-stage fragmentation mass spectral libraries.MSLib:高效生成开放的多阶段碎裂质谱图库。
Nat Methods. 2025 Sep 15. doi: 10.1038/s41592-025-02813-0.
2
mineMS2: annotation of spectral libraries with exact fragmentation patterns.mineMS2:使用精确的碎片模式对光谱库进行注释。
J Cheminform. 2025 Jul 24;17(1):111. doi: 10.1186/s13321-025-01051-y.
3
Reproducible mass spectrometry data processing and compound annotation in MZmine 3.在 MZmine 3 中实现可重复的质谱数据处理和化合物注释。
Nat Protoc. 2024 Sep;19(9):2597-2641. doi: 10.1038/s41596-024-00996-y. Epub 2024 May 20.
4
Adduct-Induced Variability in Tandem Mass Spectrometry.加合物诱导的串联质谱法中的变异性。
Anal Chem. 2025 Aug 12;97(31):17058-17066. doi: 10.1021/acs.analchem.5c02792. Epub 2025 Jul 30.
5
An evaluation methodology for machine learning-based tandem mass spectra similarity prediction.一种基于机器学习的串联质谱相似性预测评估方法。
BMC Bioinformatics. 2025 Jul 11;26(1):174. doi: 10.1186/s12859-025-06194-1.
6
Neural Spectral Prediction for Structure Elucidation with Tandem Mass Spectrometry.用于串联质谱结构解析的神经光谱预测
bioRxiv. 2025 Jun 1:2025.05.28.656653. doi: 10.1101/2025.05.28.656653.
7
Tidy-Direct-to-MS: An Open-Source Data-Processing Pipeline for Direct Mass Spectrometry-Based Metabolomics Experiments.Tidy-Direct-to-MS:一种基于直接质谱的代谢组学实验的开源数据处理流程。
J Proteome Res. 2024 Aug 2;23(8):3208-3216. doi: 10.1021/acs.jproteome.3c00784. Epub 2024 Jun 4.
8
Identifying Hair Biomarker Candidates for Alzheimer's Disease Using Three High Resolution Mass Spectrometry-Based Untargeted Metabolomics Strategies.使用三种基于高分辨率质谱的非靶向代谢组学策略鉴定阿尔茨海默病的头发生物标志物候选物。
J Am Soc Mass Spectrom. 2023 Apr 5;34(4):550-561. doi: 10.1021/jasms.2c00294. Epub 2023 Mar 27.
9
SingleFrag: a deep learning tool for MS/MS fragment and spectral prediction and metabolite annotation.SingleFrag:一种用于串联质谱(MS/MS)碎片和光谱预测以及代谢物注释的深度学习工具。
Brief Bioinform. 2025 Jul 2;26(4). doi: 10.1093/bib/bbaf333.
10
Increasing the Scale of the Mass Spectrometry Query Language Compendium with Explainable AI.利用可解释人工智能扩大质谱查询语言纲要的规模
Anal Chem. 2025 Sep 9;97(35):18860-18866. doi: 10.1021/acs.analchem.5c02591. Epub 2025 Aug 25.

引用本文的文献

1
Empirically establishing drug exposure records directly from untargeted metabolomics data.直接从非靶向代谢组学数据中凭经验建立药物暴露记录。
bioRxiv. 2024 Oct 26:2024.10.07.617109. doi: 10.1101/2024.10.07.617109.

本文引用的文献

1
Coverage bias in small molecule machine learning.小分子机器学习中的覆盖偏差
Nat Commun. 2025 Jan 9;16(1):554. doi: 10.1038/s41467-024-55462-w.
2
The ChEMBL Database in 2023: a drug discovery platform spanning multiple bioactivity data types and time periods.2023 年的 ChEMBL 数据库:一个涵盖多种生物活性数据类型和时间段的药物发现平台。
Nucleic Acids Res. 2024 Jan 5;52(D1):D1180-D1192. doi: 10.1093/nar/gkad1004.
3
Integrative analysis of multimodal mass spectrometry data in MZmine 3.在MZmine 3中对多模态质谱数据进行综合分析。
Nat Biotechnol. 2023 Apr;41(4):447-449. doi: 10.1038/s41587-023-01690-2.
4
Good practices and recommendations for using and benchmarking computational metabolomics metabolite annotation tools.使用和基准测试计算代谢组学生物标志物注释工具的良好实践和建议。
Metabolomics. 2022 Dec 5;18(12):103. doi: 10.1007/s11306-022-01963-y.
5
The critical role that spectral libraries play in capturing the metabolomics community knowledge.光谱库在捕获代谢组学领域知识方面的关键作用。
Metabolomics. 2022 Nov 19;18(12):94. doi: 10.1007/s11306-022-01947-y.
6
PubChem 2023 update.PubChem 2023 更新。
Nucleic Acids Res. 2023 Jan 6;51(D1):D1373-D1380. doi: 10.1093/nar/gkac956.
7
An open source chemical structure curation pipeline using RDKit.一个使用RDKit的开源化学结构编目流程。
J Cheminform. 2020 Sep 1;12(1):51. doi: 10.1186/s13321-020-00456-1.
8
Visualization of very large high-dimensional data sets as minimum spanning trees.将超大型高维数据集可视化为最小生成树。
J Cheminform. 2020 Feb 12;12(1):12. doi: 10.1186/s13321-020-0416-x.
9
COCONUT online: Collection of Open Natural Products database.COCONUT在线:开放天然产物数据库集合。
J Cheminform. 2021 Jan 10;13(1):2. doi: 10.1186/s13321-020-00478-9.
10
Feature-based molecular networking in the GNPS analysis environment.基于特征的分子网络在 GNPS 分析环境中的应用。
Nat Methods. 2020 Sep;17(9):905-908. doi: 10.1038/s41592-020-0933-6. Epub 2020 Aug 24.