准确估计自上而下蛋白质组学中上下文相关的假发现率。

Accurate Estimation of Context-Dependent False Discovery Rates in Top-Down Proteomics.

机构信息

From the ‡Proteomics Center of Excellence, Northwestern University, Evanston, Illinois;.

From the ‡Proteomics Center of Excellence, Northwestern University, Evanston, Illinois.

出版信息

Mol Cell Proteomics. 2019 Apr;18(4):796-805. doi: 10.1074/mcp.RA118.000993. Epub 2019 Jan 15.

DOI:10.1074/mcp.RA118.000993

PMID:30647073

原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC6442365/

Abstract

Within the last several years, top-down proteomics has emerged as a high throughput technique for protein and proteoform identification. This technique has the potential to identify and characterize thousands of proteoforms within a single study, but the absence of accurate false discovery rate (FDR) estimation could hinder the adoption and consistency of top-down proteomics in the future. In automated identification and characterization of proteoforms, FDR calculation strongly depends on the context of the search. The context includes MS data quality, the database being interrogated, the search engine, and the parameters of the search. Particular to top-down proteomics-there are four molecular levels of study: proteoform spectral match (PrSM), protein, isoform, and proteoform. Here, a context-dependent framework for calculating an accurate FDR at each level was designed, implemented, and validated against a manually curated training set with 546 confirmed proteoforms. We examined several search contexts and found that an FDR calculated at the PrSM level under-reported the true FDR at the protein level by an average of 24-fold. We present a new open-source tool, the TDCD_FDR_Calculator, which provides a scalable, context-dependent FDR calculation that can be applied post-search to enhance the quality of results in top-down proteomics from any search engine.

摘要

在过去的几年中，自上而下的蛋白质组学已成为一种高通量的蛋白质和蛋白质翻译后修饰鉴定技术。该技术有可能在单个研究中鉴定和表征数千种蛋白质翻译后修饰，但缺乏准确的错误发现率 (FDR) 估计可能会阻碍自上而下的蛋白质组学在未来的采用和一致性。在蛋白质翻译后修饰的自动鉴定和表征中，FDR 计算强烈依赖于搜索的上下文。上下文包括 MS 数据质量、被查询的数据库、搜索引擎以及搜索的参数。对于自上而下的蛋白质组学来说，有四个研究的分子水平：蛋白质翻译后修饰谱匹配 (PrSM)、蛋白质、异构体和蛋白质翻译后修饰。在这里，设计、实现了一个针对每个水平的准确 FDR 计算的上下文相关框架，并与一个包含 546 个确认的蛋白质翻译后修饰的手动整理训练集进行了验证。我们检查了几种搜索环境，发现平均而言，在 PrSM 水平计算的 FDR 比蛋白质水平的真实 FDR 低 24 倍。我们提出了一个新的开源工具，即 TDCD_FDR_Calculator，它提供了一种可扩展的、上下文相关的 FDR 计算方法，可在搜索后应用于增强来自任何搜索引擎的自上而下的蛋白质组学结果的质量。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/77cf/6442365/dd58bf8f9a88/zjw0041958990006.jpg

相似文献

Accurate Estimation of Context-Dependent False Discovery Rates in Top-Down Proteomics.准确估计自上而下蛋白质组学中上下文相关的假发现率。

Mol Cell Proteomics. 2019 Apr;18(4):796-805. doi: 10.1074/mcp.RA118.000993. Epub 2019 Jan 15.

Constructing Human Proteoform Families Using Intact-Mass and Top-Down Proteomics with a Multi-Protease Global Post-Translational Modification Discovery Database.使用完整质量和自上而下的蛋白质组学以及具有多种蛋白酶的全局翻译后修饰发现数据库构建人类蛋白质形式家族。

J Proteome Res. 2019 Oct 4;18(10):3671-3680. doi: 10.1021/acs.jproteome.9b00339. Epub 2019 Sep 18.

Precursor deconvolution error estimation: The missing puzzle piece in false discovery rate in top-down proteomics.前体去卷积误差估计：自上而下蛋白质组学中假发现率缺失的关键。

Proteomics. 2024 Feb;24(3-4):e2300068. doi: 10.1002/pmic.202300068. Epub 2023 Nov 23.

Comparing Top-Down Proteoform Identification: Deconvolution, PrSM Overlap, and PTM Detection.比较自上而下的蛋白组鉴定：去卷积、PrSM 重叠和 PTM 检测。

J Proteome Res. 2023 Jul 7;22(7):2199-2217. doi: 10.1021/acs.jproteome.2c00673. Epub 2023 May 26.

Predicting Electrophoretic Mobility of Proteoforms for Large-Scale Top-Down Proteomics.预测大规模从头蛋白质组学中蛋白构象的电泳迁移率。

Anal Chem. 2020 Mar 3;92(5):3503-3507. doi: 10.1021/acs.analchem.9b05578. Epub 2020 Feb 17.

Thorough Performance Evaluation of 213 nm Ultraviolet Photodissociation for Top-down Proteomics.213nm 紫外光光解在自上而下蛋白质组学中的全面性能评估。

Mol Cell Proteomics. 2020 Feb;19(2):405-420. doi: 10.1074/mcp.TIR119.001638. Epub 2019 Dec 30.

False discovery rates in spectral identification.光谱识别中的假发现率。

BMC Bioinformatics. 2012;13 Suppl 16(Suppl 16):S2. doi: 10.1186/1471-2105-13-S16-S2. Epub 2012 Nov 5.

Construction of Human Proteoform Families from 21 Tesla Fourier Transform Ion Cyclotron Resonance Mass Spectrometry Top-Down Proteomic Data.从 21 特斯拉傅里叶变换离子回旋共振质谱的自上而下蛋白质组学数据构建人类蛋白质组形式家族。

J Proteome Res. 2021 Jan 1;20(1):317-325. doi: 10.1021/acs.jproteome.0c00403. Epub 2020 Oct 19.

Improving Proteoform Identifications in Complex Systems Through Integration of Bottom-Up and Top-Down Data.通过整合自下而上和自上而下的数据改进复杂系统中的蛋白质异构体鉴定

J Proteome Res. 2020 Aug 7;19(8):3510-3517. doi: 10.1021/acs.jproteome.0c00332. Epub 2020 Jul 10.

Capillary Zone Electrophoresis-Tandem Mass Spectrometry with Activated Ion Electron Transfer Dissociation for Large-scale Top-down Proteomics.毛细管区带电泳-串联质谱联用的激活离子电子转移解离技术在大规模从头蛋白质组学中的应用。

J Am Soc Mass Spectrom. 2019 Dec;30(12):2470-2479. doi: 10.1007/s13361-019-02206-6. Epub 2019 May 9.

引用本文的文献

Proteoform-predictor: Increasing the Phylogenetic Reach of Top-Down Proteomics.蛋白质异构体预测器：扩大自上而下蛋白质组学的系统发育范围

J Proteome Res. 2025 Apr 4;24(4):1861-1870. doi: 10.1021/acs.jproteome.4c00943. Epub 2025 Mar 10.

Top-Down Proteomics Identifies Plasma Proteoform Signatures of Liver Cirrhosis Progression.自上而下蛋白质组学鉴定肝硬化进展的血浆蛋白质异构体特征

Mol Cell Proteomics. 2024 Dec;23(12):100876. doi: 10.1016/j.mcpro.2024.100876. Epub 2024 Nov 8.

Influence of different sample preparation approaches on proteoform identification by top-down proteomics.不同样品制备方法对自上而下蛋白质组学中蛋白质异构体鉴定的影响。

Nat Methods. 2024 Dec;21(12):2397-2407. doi: 10.1038/s41592-024-02481-6. Epub 2024 Oct 22.

Deep Profiling of Plasma Proteoforms with Engineered Nanoparticles for Top-Down Proteomics.利用工程纳米颗粒对血浆蛋白进行深度蛋白质组学分析。

J Proteome Res. 2024 Oct 4;23(10):4694-4703. doi: 10.1021/acs.jproteome.4c00621. Epub 2024 Sep 23.

Top-Down Proteomics Identifies Plasma Proteoform Signatures of Liver Cirrhosis Progression.自上而下蛋白质组学确定肝硬化进展的血浆蛋白变体特征。

bioRxiv. 2024 Jun 19:2024.06.19.599662. doi: 10.1101/2024.06.19.599662.

Orbitrap Mass Spectrometry and High-Field Asymmetric Waveform Ion Mobility Spectrometry (FAIMS) Enable the in-Depth Analysis of Human Serum Proteoforms.轨道阱质谱和高场非对称波形离子迁移谱（FAIMS）能够深入分析人血清蛋白质组。

J Proteome Res. 2023 Nov 3;22(11):3418-3426. doi: 10.1021/acs.jproteome.3c00488. Epub 2023 Sep 29.

Identification of Splice Variants and Isoforms in Transcriptomics and Proteomics.转录组学和蛋白质组学中的剪接变体和同工型鉴定。

Annu Rev Biomed Data Sci. 2023 Aug 10;6:357-376. doi: 10.1146/annurev-biodatasci-020722-044021.

Comparing Top-Down Proteoform Identification: Deconvolution, PrSM Overlap, and PTM Detection.比较自上而下的蛋白组鉴定：去卷积、PrSM 重叠和 PTM 检测。

J Proteome Res. 2023 Jul 7;22(7):2199-2217. doi: 10.1021/acs.jproteome.2c00673. Epub 2023 May 26.

Proteoforms expand the world of microproteins and short open reading frame-encoded peptides.蛋白质异构体拓展了微蛋白和短开放阅读框编码肽的世界。

iScience. 2023 Jan 27;26(2):106069. doi: 10.1016/j.isci.2023.106069. eCollection 2023 Feb 17.

Spatially Resolved Top-Down Proteomics of Tissue Sections Based on a Microfluidic Nanodroplet Sample Preparation Platform.基于微流控纳升级样制备平台的组织切片的空间分辨自上而下蛋白质组学。

Mol Cell Proteomics. 2023 Feb;22(2):100491. doi: 10.1016/j.mcpro.2022.100491. Epub 2023 Jan 2.

本文引用的文献

Accurate Sequence Analysis of a Monoclonal Antibody by Top-Down and Middle-Down Orbitrap Mass Spectrometry Applying Multiple Ion Activation Techniques.采用多种离子活化技术的自上而下和中间向下轨道阱质谱法对单克隆抗体进行准确的序列分析。

Anal Chem. 2018 Jul 17;90(14):8421-8429. doi: 10.1021/acs.analchem.8b00984. Epub 2018 Jun 28.

Top-Down Proteomics Enables Comparative Analysis of Brain Proteoforms Between Mouse Strains.自上而下蛋白质组学可实现不同小鼠品系脑蛋白异构体的比较分析。

Anal Chem. 2018 Mar 20;90(6):3802-3810. doi: 10.1021/acs.analchem.7b04108. Epub 2018 Feb 26.

Gentle Introduction to the Statistical Foundations of False Discovery Rate in Quantitative Proteomics.定量蛋白质组学中错误发现率统计基础的简要介绍。

J Proteome Res. 2018 Jan 5;17(1):12-22. doi: 10.1021/acs.jproteome.7b00170. Epub 2017 Nov 14.

Informed-Proteomics: open-source software package for top-down proteomics.知情蛋白质组学：用于自上而下蛋白质组学的开源软件包。

Nat Methods. 2017 Sep;14(9):909-914. doi: 10.1038/nmeth.4388. Epub 2017 Aug 7.

Proteoforms in Peripheral Blood Mononuclear Cells as Novel Rejection Biomarkers in Liver Transplant Recipients.外周血单个核细胞中的蛋白异构体作为肝移植受者新型排斥反应生物标志物

Am J Transplant. 2017 Sep;17(9):2458-2467. doi: 10.1111/ajt.14359. Epub 2017 Jun 27.

Advancing Top-down Analysis of the Human Proteome Using a Benchtop Quadrupole-Orbitrap Mass Spectrometer.使用台式四极杆-轨道阱质谱仪推进人类蛋白质组的自上而下分析

J Proteome Res. 2017 Feb 3;16(2):609-618. doi: 10.1021/acs.jproteome.6b00698. Epub 2016 Dec 2.

Identification and Characterization of Human Proteoforms by Top-Down LC-21 Tesla FT-ICR Mass Spectrometry.通过自上而下的液相色谱-21特斯拉傅里叶变换离子回旋共振质谱法鉴定和表征人类蛋白质异构体

J Proteome Res. 2017 Feb 3;16(2):1087-1096. doi: 10.1021/acs.jproteome.6b00696. Epub 2016 Dec 12.

UniProt: the universal protein knowledgebase.通用蛋白质知识库：UniProt

Nucleic Acids Res. 2017 Jan 4;45(D1):D158-D169. doi: 10.1093/nar/gkw1099. Epub 2016 Nov 29.

TopPIC: a software tool for top-down mass spectrometry-based proteoform identification and characterization.TopPIC：一种用于基于自上而下质谱法的蛋白质异构体鉴定和表征的软件工具。

Bioinformatics. 2016 Nov 15;32(22):3495-3497. doi: 10.1093/bioinformatics/btw398. Epub 2016 Jul 16.

The Galaxy platform for accessible, reproducible and collaborative biomedical analyses: 2016 update.用于可访问、可重复和协作式生物医学分析的Galaxy平台：2016年更新

Nucleic Acids Res. 2016 Jul 8;44(W1):W3-W10. doi: 10.1093/nar/gkw343. Epub 2016 May 2.

文献检索

告别复杂PubMed语法，用中文像聊天一样搜索，搜遍4000万医学文献。AI智能推荐，让科研检索更轻松。

立即免费搜索

文件翻译

保留排版，准确专业，支持PDF/Word/PPT等文件格式，支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述，25分钟生成高质量综述，智能提取关键信息，辅助科研写作。

立即免费体验

准确估计自上而下蛋白质组学中上下文相关的假发现率。

Accurate Estimation of Context-Dependent False Discovery Rates in Top-Down Proteomics.

机构信息

出版信息

相似文献

引用本文的文献

本文引用的文献

文献检索

文件翻译

深度研究

Suppr 超能文献

相似文献

引用本文的文献

本文引用的文献