• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

C分数:一种用于大幅提高高通量自上而下蛋白质组学中蛋白质异构体评分的贝叶斯框架。

The C-score: a Bayesian framework to sharply improve proteoform scoring in high-throughput top down proteomics.

作者信息

LeDuc Richard D, Fellers Ryan T, Early Bryan P, Greer Joseph B, Thomas Paul M, Kelleher Neil L

机构信息

National Center for Genome Analysis Support, Indiana University , 2709 E. 10th Street, Bloomington, Indiana 47408, United States.

出版信息

J Proteome Res. 2014 Jul 3;13(7):3231-40. doi: 10.1021/pr401277r. Epub 2014 Jun 12.

DOI:10.1021/pr401277r
PMID:24922115
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC4084843/
Abstract

The automated processing of data generated by top down proteomics would benefit from improved scoring for protein identification and characterization of highly related protein forms (proteoforms). Here we propose the "C-score" (short for Characterization Score), a Bayesian approach to the proteoform identification and characterization problem, implemented within a framework to allow the infusion of expert knowledge into generative models that take advantage of known properties of proteins and top down analytical systems (e.g., fragmentation propensities, "off-by-1 Da" discontinuous errors, and intelligent weighting for site-specific modifications). The performance of the scoring system based on the initial generative models was compared to the current probability-based scoring system used within both ProSightPC and ProSightPTM on a manually curated set of 295 human proteoforms. The current implementation of the C-score framework generated a marked improvement over the existing scoring system as measured by the area under the curve on the resulting ROC chart (AUC of 0.99 versus 0.78).

摘要

自上而下蛋白质组学产生的数据的自动化处理将受益于改进的蛋白质鉴定评分以及高度相关蛋白质形式(蛋白异构体)的表征。在此,我们提出了“C评分”(表征评分的缩写),这是一种用于蛋白异构体鉴定和表征问题的贝叶斯方法,在一个框架内实施,以便将专家知识注入到利用蛋白质已知特性和自上而下分析系统(例如,片段化倾向、“相差1 Da”的不连续误差以及位点特异性修饰的智能加权)的生成模型中。在一组经人工整理的295种人类蛋白异构体上,将基于初始生成模型的评分系统的性能与ProSightPC和ProSightPTM中使用的当前基于概率的评分系统进行了比较。通过所得ROC图上的曲线下面积衡量,C评分框架的当前实现相对于现有评分系统有显著改进(AUC为0.99对0.78)。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8370/4084843/64276b3ba0b1/pr-2013-01277r_0005.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8370/4084843/cd52a8940de2/pr-2013-01277r_0001.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8370/4084843/64a53cf2ef2b/pr-2013-01277r_0002.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8370/4084843/10e9a1e3ffb9/pr-2013-01277r_0003.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8370/4084843/d13e5018c0fe/pr-2013-01277r_0004.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8370/4084843/64276b3ba0b1/pr-2013-01277r_0005.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8370/4084843/cd52a8940de2/pr-2013-01277r_0001.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8370/4084843/64a53cf2ef2b/pr-2013-01277r_0002.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8370/4084843/10e9a1e3ffb9/pr-2013-01277r_0003.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8370/4084843/d13e5018c0fe/pr-2013-01277r_0004.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8370/4084843/64276b3ba0b1/pr-2013-01277r_0005.jpg

相似文献

1
The C-score: a Bayesian framework to sharply improve proteoform scoring in high-throughput top down proteomics.C分数:一种用于大幅提高高通量自上而下蛋白质组学中蛋白质异构体评分的贝叶斯框架。
J Proteome Res. 2014 Jul 3;13(7):3231-40. doi: 10.1021/pr401277r. Epub 2014 Jun 12.
2
Characterization of Proteoforms with Unknown Post-translational Modifications Using the MIScore.使用MIScore对具有未知翻译后修饰的蛋白质异构体进行表征。
J Proteome Res. 2016 Aug 5;15(8):2422-32. doi: 10.1021/acs.jproteome.5b01098. Epub 2016 Jul 1.
3
Improving Proteoform Identifications in Complex Systems Through Integration of Bottom-Up and Top-Down Data.通过整合自下而上和自上而下的数据改进复杂系统中的蛋白质异构体鉴定
J Proteome Res. 2020 Aug 7;19(8):3510-3517. doi: 10.1021/acs.jproteome.0c00332. Epub 2020 Jul 10.
4
Protein identification using top-down.使用自上而下法进行蛋白质鉴定。
Mol Cell Proteomics. 2012 Jun;11(6):M111.008524. doi: 10.1074/mcp.M111.008524. Epub 2011 Oct 25.
5
Expanding Proteoform Identifications in Top-Down Proteomic Analyses by Constructing Proteoform Families.通过构建蛋白形式家族来增加从头蛋白质组分析中的蛋白形式鉴定。
Anal Chem. 2018 Jan 16;90(2):1325-1333. doi: 10.1021/acs.analchem.7b04221. Epub 2017 Dec 22.
6
Intact-Mass Analysis Facilitating the Identification of Large Human Heart Proteoforms.完整质量分析促进大型人心肌蛋白组型鉴定。
Anal Chem. 2019 Sep 3;91(17):10937-10942. doi: 10.1021/acs.analchem.9b02343. Epub 2019 Aug 14.
7
Systematic Evaluation of Protein Sequence Filtering Algorithms for Proteoform Identification Using Top-Down Mass Spectrometry.基于自上而下质谱法的蛋白肽段鉴定的蛋白质序列过滤算法的系统评估。
Proteomics. 2018 Feb;18(3-4). doi: 10.1002/pmic.201700306. Epub 2018 Feb 6.
8
A mass graph-based approach for the identification of modified proteoforms using top-down tandem mass spectra.一种基于质量图谱的方法,用于使用自上而下的串联质谱鉴定修饰的蛋白质异构体。
Bioinformatics. 2017 May 1;33(9):1309-1316. doi: 10.1093/bioinformatics/btw806.
9
TopPIC: a software tool for top-down mass spectrometry-based proteoform identification and characterization.TopPIC:一种用于基于自上而下质谱法的蛋白质异构体鉴定和表征的软件工具。
Bioinformatics. 2016 Nov 15;32(22):3495-3497. doi: 10.1093/bioinformatics/btw398. Epub 2016 Jul 16.
10
Capillary Zone Electrophoresis-Tandem Mass Spectrometry with Activated Ion Electron Transfer Dissociation for Large-scale Top-down Proteomics.毛细管区带电泳-串联质谱联用的激活离子电子转移解离技术在大规模从头蛋白质组学中的应用。
J Am Soc Mass Spectrom. 2019 Dec;30(12):2470-2479. doi: 10.1007/s13361-019-02206-6. Epub 2019 May 9.

引用本文的文献

1
Gel-Based Sample Fractionation with SP3-Purification for Top-Down Proteomics.用于自上而下蛋白质组学的基于凝胶的样品分级分离与SP3纯化
J Proteome Res. 2025 Feb 7;24(2):850-860. doi: 10.1021/acs.jproteome.4c00941. Epub 2025 Jan 22.
2
Influence of different sample preparation approaches on proteoform identification by top-down proteomics.不同样品制备方法对自上而下蛋白质组学中蛋白质异构体鉴定的影响。
Nat Methods. 2024 Dec;21(12):2397-2407. doi: 10.1038/s41592-024-02481-6. Epub 2024 Oct 22.
3
Determining KRAS4B-Targeting Compound Specificity by Top-Down Mass Spectrometry.

本文引用的文献

1
The first pilot project of the consortium for top-down proteomics: a status report.联盟自上而下蛋白质组学的首个试点项目:现状报告。
Proteomics. 2014 May;14(10):1130-40. doi: 10.1002/pmic.201300438. Epub 2014 Apr 14.
2
Complete large-molecule high-resolution mass spectra from 50-femtomole microvolume injection.从 50 飞摩尔微体积进样中获得完整的大分子高分辨率质谱。
J Am Soc Mass Spectrom. 1995 Mar;6(3):220-1. doi: 10.1016/1044-0305(95)00088-U.
3
Large-scale top-down proteomics of the human proteome: membrane proteins, mitochondria, and senescence.
通过自上而下的质谱法确定 KRAS4B 靶向化合物的特异性。
Methods Mol Biol. 2024;2823:291-310. doi: 10.1007/978-1-0716-3922-1_18.
4
Top-down proteomics.自上而下蛋白质组学
Nat Rev Methods Primers. 2024;4(1). doi: 10.1038/s43586-024-00318-2. Epub 2024 Jun 13.
5
A High-Throughput Workflow for Mass Spectrometry Analysis of Nucleic Acids by Nanoflow Desalting.一种用于通过纳流脱盐对核酸进行质谱分析的高通量工作流程。
Anal Chem. 2024 Feb 8. doi: 10.1021/acs.analchem.3c05428.
6
Automated imaging and identification of proteoforms directly from ovarian cancer tissue.直接从卵巢癌组织中自动成像和鉴定蛋白异构体。
Nat Commun. 2023 Oct 14;14(1):6478. doi: 10.1038/s41467-023-42208-3.
7
Characterization of Proteoform Post-Translational Modifications by Top-Down and Bottom-Up Mass Spectrometry in Conjunction with Annotations.通过与注释相结合的自上而下和自下而上的质谱法对蛋白质翻译后修饰进行特征描述。
J Proteome Res. 2023 Oct 6;22(10):3178-3189. doi: 10.1021/acs.jproteome.3c00207. Epub 2023 Sep 20.
8
Resolution of apolipoprotein A1 and A2 proteoforms: their cardiometabolic correlates and implications for future research.载脂蛋白 A1 和 A2 蛋白水解物的解析:其与心血管代谢的相关性及其对未来研究的意义。
Curr Opin Lipidol. 2022 Aug 1;33(4):264-269. doi: 10.1097/MOL.0000000000000840.
9
Discovery of Unknown Posttranslational Modifications by Top-Down Mass Spectrometry.通过自上而下的质谱法发现未知的翻译后修饰。
Methods Mol Biol. 2022;2500:181-199. doi: 10.1007/978-1-0716-2325-1_13.
10
Proteoform Analysis and Construction of Proteoform Families in Proteoform Suite.在 Proteoform Suite 中进行 Proteoform 分析和 Proteoform 家族构建。
Methods Mol Biol. 2022;2500:67-81. doi: 10.1007/978-1-0716-2325-1_7.
人类蛋白质组的大规模自上而下蛋白质组学:膜蛋白、线粒体和衰老。
Mol Cell Proteomics. 2013 Dec;12(12):3465-73. doi: 10.1074/mcp.M113.030114. Epub 2013 Sep 10.
4
Top-down proteomics reveals a unique protein S-thiolation switch in Salmonella Typhimurium in response to infection-like conditions.自上而下的蛋白质组学揭示了沙门氏菌 Typhimurium 在感染样条件下独特的蛋白质 S-巯基化开关。
Proc Natl Acad Sci U S A. 2013 Jun 18;110(25):10153-8. doi: 10.1073/pnas.1221210110. Epub 2013 May 29.
5
Complete protein characterization using top-down mass spectrometry and ultraviolet photodissociation.使用自上而下的质谱分析和紫外光解离进行完整蛋白质表征。
J Am Chem Soc. 2013 Aug 28;135(34):12646-51. doi: 10.1021/ja4029654. Epub 2013 Jun 4.
6
Proteoform: a single term describing protein complexity.蛋白质异构体:一个描述蛋白质复杂性的单一术语。
Nat Methods. 2013 Mar;10(3):186-7. doi: 10.1038/nmeth.2369.
7
Top down proteomics of human membrane proteins from enriched mitochondrial fractions.从富含线粒体的级分中对人膜蛋白进行自上而下的蛋白质组学分析。
Anal Chem. 2013 Feb 5;85(3):1880-8. doi: 10.1021/ac3031527. Epub 2013 Jan 23.
8
Universal and confident phosphorylation site localization using phosphoRS.使用 phosphoRS 进行通用且自信的磷酸化位点定位。
J Proteome Res. 2011 Dec 2;10(12):5354-62. doi: 10.1021/pr200611n. Epub 2011 Nov 10.
9
Mapping intact protein isoforms in discovery mode using top-down proteomics.采用自上而下的蛋白质组学技术在发现模式下绘制完整蛋白质亚型图谱。
Nature. 2011 Oct 30;480(7376):254-8. doi: 10.1038/nature10575.
10
Integrating titania enrichment, iTRAQ labeling, and Orbitrap CID-HCD for global identification and quantitative analysis of phosphopeptides.采用 TiO2 富集、iTRAQ 标记和 Orbitrap CID-HCD 进行全局鉴定和磷酸肽定量分析。
Proteomics. 2010 Jun;10(11):2224-34. doi: 10.1002/pmic.200900788.