• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

蛋白质推断综述。

A Review of Protein Inference.

机构信息

Medical Bioinformatics, Medical Faculty, Ruhr University Bochum, Bochum, Germany.

Medizinisches Proteom-Center, Medical Faculty, Ruhr University Bochum, Bochum, Germany.

出版信息

Methods Mol Biol. 2025;2859:53-64. doi: 10.1007/978-1-0716-4152-1_4.

DOI:10.1007/978-1-0716-4152-1_4
PMID:39436596
Abstract

Protein inference is an often neglected though crucial step in most proteomic experiments. In the bottom-up proteomic approach, the actual molecules of interest, the proteins, are digested into peptides before measurement on a mass spectrometer. This approach introduces a loss of information: The actual proteins must be inferred based on the identified peptides. While this might seem trivial, there are certain problems, one of the biggest being the presence of peptides that are shared among proteins. These amino acid sequences can, based on the database used for identification, belong to more than one protein. If such peptides are identified in a sample, it cannot be said which proteins actually were in the sample, but only an estimate on the most probable proteins or protein groups can be given based on a predefined inference strategy.Here we describe the effect of the chosen database for peptide identification on the number of shared peptides. Afterward, the mainly used protein inference methods will be sketched, and the necessity of stringent false discovery rate on peptide and protein level is discussed. Finally, we explain how the tool "PIA or protein inference algorithms" can be used together with the workflow environment KNIME and OpenMS to perform protein inference in a common proteomic experiment.

摘要

蛋白质推断是大多数蛋白质组学实验中经常被忽视但至关重要的步骤。在自上而下的蛋白质组学方法中,实际感兴趣的分子,即蛋白质,在质谱仪上进行测量之前被消化成肽。这种方法会导致信息丢失:必须根据鉴定的肽推断实际的蛋白质。虽然这似乎微不足道,但存在某些问题,其中最大的问题之一是存在在蛋白质之间共享的肽。根据用于鉴定的数据库,这些氨基酸序列可以属于多个蛋白质。如果在样品中鉴定出这样的肽,则不能说实际上有哪些蛋白质存在于样品中,而只能根据预设的推断策略给出最可能的蛋白质或蛋白质组的估计。在这里,我们描述了选择用于肽鉴定的数据库对共享肽数量的影响。之后,将简述主要使用的蛋白质推断方法,并讨论肽和蛋白质水平上严格的错误发现率的必要性。最后,我们解释了如何使用“PIA 或蛋白质推断算法”工具与 KNIME 和 OpenMS 工作流环境一起在常见的蛋白质组学实验中执行蛋白质推断。

相似文献

1
A Review of Protein Inference.蛋白质推断综述。
Methods Mol Biol. 2025;2859:53-64. doi: 10.1007/978-1-0716-4152-1_4.
2
In-depth analysis of protein inference algorithms using multiple search engines and well-defined metrics.使用多个搜索引擎和明确的指标对蛋白质推断算法进行深入分析。
J Proteomics. 2017 Jan 6;150:170-182. doi: 10.1016/j.jprot.2016.08.002. Epub 2016 Aug 4.
3
Protein Inference Using PIA Workflows and PSI Standard File Formats.使用 PIA 工作流程和 PSI 标准文件格式进行蛋白质推断。
J Proteome Res. 2019 Feb 1;18(2):741-747. doi: 10.1021/acs.jproteome.8b00723. Epub 2018 Dec 5.
4
Interpretation of shotgun proteomic data: the protein inference problem.鸟枪法蛋白质组学数据的解读:蛋白质推断问题。
Mol Cell Proteomics. 2005 Oct;4(10):1419-40. doi: 10.1074/mcp.R500012-MCP200. Epub 2005 Jul 11.
5
Improving the Protein Inference from Bottom-Up Proteomic Data Using Identifications from MS1 Spectra.利用 MS1 谱图鉴定提高从头测序蛋白质组学数据的蛋白质推断。
J Am Soc Mass Spectrom. 2021 May 5;32(5):1258-1262. doi: 10.1021/jasms.1c00061. Epub 2021 Apr 26.
6
Current algorithmic solutions for peptide-based proteomics data generation and identification.当前基于肽段的蛋白质组学数据生成和鉴定的算法解决方案。
Curr Opin Biotechnol. 2013 Feb;24(1):31-8. doi: 10.1016/j.copbio.2012.10.013. Epub 2012 Nov 8.
7
Elective affinities--bioinformatic analysis of proteomic mass spectrometry data.选修亲和力——蛋白质组学质谱数据分析的生物信息学分析。
Arch Physiol Biochem. 2009 Dec;115(5):311-9. doi: 10.3109/13813450903390039.
8
Scientific workflow optimization for improved peptide and protein identification.优化科学工作流程以改进肽和蛋白质鉴定
BMC Bioinformatics. 2015 Sep 3;16(1):284. doi: 10.1186/s12859-015-0714-x.
9
Computational Methods in Mass Spectrometry-Based Proteomics.基于质谱的蛋白质组学中的计算方法
Adv Exp Med Biol. 2016;939:63-89. doi: 10.1007/978-981-10-1503-8_4.
10
A survey of computational methods and error rate estimation procedures for peptide and protein identification in shotgun proteomics.用于在鸟枪法蛋白质组学中鉴定肽和蛋白质的计算方法和错误率估计程序的调查。
J Proteomics. 2010 Oct 10;73(11):2092-123. doi: 10.1016/j.jprot.2010.08.009. Epub 2010 Sep 8.

本文引用的文献

1
Protein Inference Using PIA Workflows and PSI Standard File Formats.使用 PIA 工作流程和 PSI 标准文件格式进行蛋白质推断。
J Proteome Res. 2019 Feb 1;18(2):741-747. doi: 10.1021/acs.jproteome.8b00723. Epub 2018 Dec 5.
2
The PRIDE database and related tools and resources in 2019: improving support for quantification data.PRIDE 数据库及相关工具和资源在 2019 年的进展:提高定量数据支持。
Nucleic Acids Res. 2019 Jan 8;47(D1):D442-D450. doi: 10.1093/nar/gky1106.
3
Anatomy and evolution of database search engines-a central component of mass spectrometry based proteomic workflows.
数据库搜索引擎的解剖结构和演化——基于质谱的蛋白质组学工作流程的核心组件。
Mass Spectrom Rev. 2020 May;39(3):292-306. doi: 10.1002/mas.21543. Epub 2017 Sep 13.
4
BioInfra.Prot: A comprehensive proteomics workflow including data standardization, protein inference, expression analysis and data publication.BioInfra.Prot:一个全面的蛋白质组学工作流程,包括数据标准化、蛋白质推断、表达分析和数据发布。
J Biotechnol. 2017 Nov 10;261:116-125. doi: 10.1016/j.jbiotec.2017.06.005. Epub 2017 Jun 9.
5
PGMiner reloaded, fully automated proteogenomic annotation tool linking genomes to proteomes.PGMiner升级版,将基因组与蛋白质组相联系的全自动蛋白质基因组注释工具。
J Integr Bioinform. 2016 Dec 18;13(4):293. doi: 10.2390/biecoll-jib-2016-293.
6
OpenMS: a flexible open-source software platform for mass spectrometry data analysis.OpenMS:一个灵活的开源质谱数据分析软件平台。
Nat Methods. 2016 Aug 30;13(9):741-8. doi: 10.1038/nmeth.3959.
7
How to talk about protein-level false discovery rates in shotgun proteomics.如何在鸟枪法蛋白质组学中探讨蛋白质水平的错误发现率。
Proteomics. 2016 Sep;16(18):2461-9. doi: 10.1002/pmic.201500431.
8
PIA: An Intuitive Protein Inference Engine with a Web-Based User Interface.PIA:一款具有基于网络用户界面的直观蛋白质推断引擎。
J Proteome Res. 2015 Jul 2;14(7):2988-97. doi: 10.1021/acs.jproteome.5b00121. Epub 2015 Jun 10.
9
Multiple evidence strands suggest that there may be as few as 19,000 human protein-coding genes.多条证据链表明,人类蛋白质编码基因可能少至19000个。
Hum Mol Genet. 2014 Nov 15;23(22):5866-78. doi: 10.1093/hmg/ddu309. Epub 2014 Jun 16.
10
ProteomeXchange provides globally coordinated proteomics data submission and dissemination.蛋白质组学交换库提供全球协调的蛋白质组学数据提交和传播服务。
Nat Biotechnol. 2014 Mar;32(3):223-6. doi: 10.1038/nbt.2839.