• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

Carafe可实现用于非数据依赖采集蛋白质组学的高质量谱图库生成。

Carafe enables high quality spectral library generation for data-independent acquisition proteomics.

作者信息

Wen Bo, Hsu Chris, Zeng Wen-Feng, Riffle Michael, Chang Alexis, Mudge Miranda, Nunn Brook, Berg Matthew D, Villén Judit, MacCoss Michael J, Noble William S

机构信息

Department of Genome Sciences, University of Washington.

Department of Proteomics and Signal Transduction, Max Planck Institute of Biochemistry, Germany.

出版信息

bioRxiv. 2024 Oct 18:2024.10.15.618504. doi: 10.1101/2024.10.15.618504.

DOI:10.1101/2024.10.15.618504
PMID:39463980
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC11507862/
Abstract

Data-independent acquisition (DIA)-based mass spectrometry is becoming an increasingly popular mass spectrometry acquisition strategy for carrying out quantitative proteomics experiments. Most of the popular DIA search engines make use of generated spectral libraries. However, the generation of high-quality spectral libraries for DIA data analysis remains a challenge, particularly because most such libraries are generated directly from data-dependent acquisition (DDA) data or are from prediction using models trained on DDA data. In this study, we developed Carafe, a tool that generates high-quality experiment-specific spectral libraries by training deep learning models directly on DIA data. We demonstrate the performance of Carafe on a wide range of DIA datasets, where we observe improved fragment ion intensity prediction and peptide detection relative to existing pretrained DDA models.

摘要

基于数据非依赖采集(DIA)的质谱分析正日益成为开展定量蛋白质组学实验的一种流行的质谱采集策略。大多数流行的DIA搜索引擎都利用生成的谱图库。然而,为DIA数据分析生成高质量的谱图库仍然是一项挑战,特别是因为大多数此类库是直接从数据依赖采集(DDA)数据生成的,或者是基于使用在DDA数据上训练的模型进行预测得到的。在本研究中,我们开发了Carafe,这是一种通过直接在DIA数据上训练深度学习模型来生成高质量的特定实验谱图库的工具。我们在广泛的DIA数据集上展示了Carafe的性能,在这些数据集中,我们观察到相对于现有的预训练DDA模型,其碎片离子强度预测和肽段检测得到了改进。

相似文献

1
Carafe enables high quality spectral library generation for data-independent acquisition proteomics.Carafe可实现用于非数据依赖采集蛋白质组学的高质量谱图库生成。
bioRxiv. 2024 Oct 18:2024.10.15.618504. doi: 10.1101/2024.10.15.618504.
2
Reproducibility, Specificity and Accuracy of Relative Quantification Using Spectral Library-based Data-independent Acquisition.基于谱库的非依赖数据采集的相对定量的重现性、特异性和准确性。
Mol Cell Proteomics. 2020 Jan;19(1):181-197. doi: 10.1074/mcp.RA119.001714. Epub 2019 Nov 7.
3
In silico spectral libraries by deep learning facilitate data-independent acquisition proteomics.深度学习构建的虚拟光谱库促进了数据非依赖采集蛋白质组学的发展。
Nat Commun. 2020 Jan 9;11(1):146. doi: 10.1038/s41467-019-13866-z.
4
[Research progress and application of retention time prediction method based on deep learning].基于深度学习的保留时间预测方法的研究进展与应用
Se Pu. 2021 Mar;39(3):211-218. doi: 10.3724/SP.J.1123.2020.08015.
5
Sensitive Immunopeptidomics by Leveraging Available Large-Scale Multi-HLA Spectral Libraries, Data-Independent Acquisition, and MS/MS Prediction.利用可用的大规模多 HLA 光谱文库、数据非依赖采集和 MS/MS 预测进行敏感免疫肽组学分析。
Mol Cell Proteomics. 2021;20:100080. doi: 10.1016/j.mcpro.2021.100080. Epub 2021 Apr 9.
6
Benefit of In Silico Predicted Spectral Libraries in Data-Independent Acquisition Data Analysis Workflows.基于计算预测的光谱库在非依赖性数据采集数据分析工作流程中的优势。
J Proteome Res. 2024 Jun 7;23(6):2078-2089. doi: 10.1021/acs.jproteome.4c00048. Epub 2024 Apr 26.
7
Characterization of Cerebrospinal Fluid via Data-Independent Acquisition Mass Spectrometry.通过数据非依赖性采集质谱技术对脑脊液进行特征分析。
J Proteome Res. 2018 Oct 5;17(10):3418-3430. doi: 10.1021/acs.jproteome.8b00308. Epub 2018 Sep 12.
8
DeepPhospho accelerates DIA phosphoproteome profiling through in silico library generation.DeepPhospho 通过计算机文库生成加速 DIA 磷酸化蛋白质组学分析。
Nat Commun. 2021 Nov 18;12(1):6685. doi: 10.1038/s41467-021-26979-1.
9
iSwathX 2.0 for Processing DDA Spectral Libraries for DIA Data Analysis.iSwathX 2.0 用于处理 DIA 数据分析的 DDA 谱库。
Curr Protoc Bioinformatics. 2020 Jun;70(1):e101. doi: 10.1002/cpbi.101.
10
PIONEER: Pipeline for Generating High-Quality Spectral Libraries for DIA-MS Data.PIONEER:用于生成 DIA-MS 数据高质量光谱库的管道。
Curr Protoc. 2021 Mar;1(3):e69. doi: 10.1002/cpz1.69.

引用本文的文献

1
Reproductive resilience: pathways to gametogenic success in Montipora capitata after bleaching.生殖弹性:密孔珊瑚在白化后配子发生成功的途径。
Sci Rep. 2024 Nov 13;14(1):27765. doi: 10.1038/s41598-024-78768-7.

本文引用的文献

1
Microbial Metagenomes Across a Complete Phytoplankton Bloom Cycle: High-Resolution Sampling Every 4 Hours Over 22 Days.整个浮游植物爆发周期的微生物宏基因组:22 天内每 4 小时进行高分辨率采样。
Sci Data. 2024 Nov 22;11(1):1270. doi: 10.1038/s41597-024-04013-5.
2
The Proteomics Standards Initiative Standardized Formats for Spectral Libraries and Fragment Ion Peak Annotations: mzSpecLib and mzPAF.蛋白质组学标准倡议标准化格式的光谱库和碎片离子峰注释:mzSpecLib 和 mzPAF。
Anal Chem. 2024 Nov 19;96(46):18491-18501. doi: 10.1021/acs.analchem.4c04091. Epub 2024 Nov 8.
3
Evaluating the Performance of the Astral Mass Analyzer for Quantitative Proteomics Using Data-Independent Acquisition.
使用数据非依赖采集方法评估 Astral 质量分析仪在定量蛋白质组学中的性能。
J Proteome Res. 2023 Oct 6;22(10):3290-3300. doi: 10.1021/acs.jproteome.3c00357. Epub 2023 Sep 8.
4
Oktoberfest: Open-source spectral library generation and rescoring pipeline based on Prosit.慕尼黑啤酒节:基于 Prosit 的开源光谱库生成和重评分管道。
Proteomics. 2024 Apr;24(8):e2300112. doi: 10.1002/pmic.202300112. Epub 2023 Sep 6.
5
Analysis of DIA proteomics data using MSFragger-DIA and FragPipe computational platform.使用 MSFragger-DIA 和 FragPipe 计算平台分析 DIA 蛋白质组学数据。
Nat Commun. 2023 Jul 12;14(1):4154. doi: 10.1038/s41467-023-39869-5.
6
Automated Enrichment of Phosphotyrosine Peptides for High-Throughput Proteomics.自动化富集磷酸化酪氨酸肽用于高通量蛋白质组学。
J Proteome Res. 2023 Jun 2;22(6):1868-1880. doi: 10.1021/acs.jproteome.2c00850. Epub 2023 Apr 25.
7
AlphaPeptDeep: a modular deep learning framework to predict peptide properties for proteomics.AlphaPeptDeep:用于蛋白质组学的模块化深度学习框架,用于预测肽性质。
Nat Commun. 2022 Nov 24;13(1):7238. doi: 10.1038/s41467-022-34904-3.
8
A comprehensive LFQ benchmark dataset on modern day acquisition strategies in proteomics.基于现代蛋白质组学采集策略的全面 LFQ 基准数据集。
Sci Data. 2022 Mar 30;9(1):126. doi: 10.1038/s41597-022-01216-6.
9
MSLibrarian: Optimized Predicted Spectral Libraries for Data-Independent Acquisition Proteomics.MSLibrarian:用于数据非依赖性采集蛋白质组学的优化预测谱库。
J Proteome Res. 2022 Feb 4;21(2):535-546. doi: 10.1021/acs.jproteome.1c00796. Epub 2022 Jan 19.
10
DeepPhospho accelerates DIA phosphoproteome profiling through in silico library generation.DeepPhospho 通过计算机文库生成加速 DIA 磷酸化蛋白质组学分析。
Nat Commun. 2021 Nov 18;12(1):6685. doi: 10.1038/s41467-021-26979-1.