• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

无诱饵的蛋白质水平假发现率估计。

Decoy-free protein-level false discovery rate estimation.

机构信息

School of Software, Dalian University of Technology, Dalian 116621, China.

出版信息

Bioinformatics. 2014 Mar 1;30(5):675-81. doi: 10.1093/bioinformatics/btt431. Epub 2013 Aug 6.

DOI:10.1093/bioinformatics/btt431
PMID:23926225
Abstract

MOTIVATION

Statistical validation of protein identifications is an important issue in shotgun proteomics. The false discovery rate (FDR) is a powerful statistical tool for evaluating the protein identification result. Several research efforts have been made for FDR estimation at the protein level. However, there are still certain drawbacks in the existing FDR estimation methods based on the target-decoy strategy.

RESULTS

In this article, we propose a decoy-free protein-level FDR estimation method. Under the null hypothesis that each candidate protein matches an identified peptide totally at random, we assign statistical significance to protein identifications in terms of the permutation P-value and use these P-values to calculate the FDR. Our method consists of three key steps: (i) generating random bipartite graphs with the same structure; (ii) calculating the protein scores on these random graphs; and (iii) calculating the permutation P value and final FDR. As it is time-consuming or prohibitive to execute the protein inference algorithms for thousands of times in step ii, we first train a linear regression model using the original bipartite graph and identification scores provided by the target inference algorithm. Then we use the learned regression model as a substitute of original protein inference method to predict protein scores on shuffled graphs. We test our method on six public available datasets. The results show that our method is comparable with those state-of-the-art algorithms in terms of estimation accuracy.

AVAILABILITY

The source code of our algorithm is available at: https://sourceforge.net/projects/plfdr/

摘要

动机

在鸟枪法蛋白质组学中,蛋白质鉴定的统计验证是一个重要问题。错误发现率(FDR)是评估蛋白质鉴定结果的强大统计工具。已经进行了一些研究工作来估计蛋白质水平的 FDR。然而,基于目标诱饵策略的现有 FDR 估计方法仍然存在某些缺点。

结果

在本文中,我们提出了一种无诱饵的蛋白质水平 FDR 估计方法。在每个候选蛋白质与随机识别的肽完全匹配的零假设下,我们根据置换 P 值为蛋白质鉴定分配统计学意义,并使用这些 P 值计算 FDR。我们的方法包括三个关键步骤:(i)生成具有相同结构的随机二分图;(ii)在这些随机图上计算蛋白质得分;(iii)计算置换 P 值和最终 FDR。由于在步骤 ii 中对数千次执行蛋白质推断算法既耗时又不可行,因此我们首先使用原始二分图和目标推断算法提供的鉴定得分训练线性回归模型。然后,我们使用学习的回归模型作为原始蛋白质推断方法的替代物,在打乱的图上预测蛋白质得分。我们在六个公共可用数据集上测试了我们的方法。结果表明,我们的方法在估计准确性方面与那些最先进的算法相当。

可用性

我们的算法的源代码可在:https://sourceforge.net/projects/plfdr/ 获得。

相似文献

1
Decoy-free protein-level false discovery rate estimation.无诱饵的蛋白质水平假发现率估计。
Bioinformatics. 2014 Mar 1;30(5):675-81. doi: 10.1093/bioinformatics/btt431. Epub 2013 Aug 6.
2
A new estimation of protein-level false discovery rate.一种新的蛋白质水平假发现率估计方法。
BMC Genomics. 2018 Aug 13;19(Suppl 6):567. doi: 10.1186/s12864-018-4923-3.
3
Unbiased False Discovery Rate Estimation for Shotgun Proteomics Based on the Target-Decoy Approach.基于目标-诱饵法的鸟枪法蛋白质组学无偏错误发现率估计
J Proteome Res. 2017 Feb 3;16(2):393-397. doi: 10.1021/acs.jproteome.6b00144. Epub 2016 Dec 13.
4
A linear programming model for protein inference problem in shotgun proteomics.一种用于鸟枪法蛋白质组学中蛋白质推断问题的线性规划模型。
Bioinformatics. 2012 Nov 15;28(22):2956-62. doi: 10.1093/bioinformatics/bts540. Epub 2012 Sep 6.
5
An algorithm for decoy-free false discovery rate estimation in XL-MS/MS proteomics.XL-MS/MS 蛋白质组学中无诱饵的假发现率估计算法。
Bioinformatics. 2024 Jun 28;40(Suppl 1):i428-i436. doi: 10.1093/bioinformatics/btae233.
6
ProteoStats--a library for estimating false discovery rates in proteomics pipelines.ProteoStats--一个用于估计蛋白质组学管道中假发现率的库。
Bioinformatics. 2013 Nov 1;29(21):2799-800. doi: 10.1093/bioinformatics/btt490. Epub 2013 Aug 20.
7
Reverse and Random Decoy Methods for False Discovery Rate Estimation in High Mass Accuracy Peptide Spectral Library Searches.反转和随机诱饵方法在高质量精度肽谱库搜索中的假发现率估计。
J Proteome Res. 2018 Feb 2;17(2):846-857. doi: 10.1021/acs.jproteome.7b00614. Epub 2018 Jan 11.
8
Common Decoy Distributions Simplify False Discovery Rate Estimation in Shotgun Proteomics.通用诱饵分布简化了鸟枪法蛋白质组学中的错误发现率估计
J Proteome Res. 2022 Feb 4;21(2):339-348. doi: 10.1021/acs.jproteome.1c00600. Epub 2022 Jan 6.
9
Improved False Discovery Rate Estimation Procedure for Shotgun Proteomics.用于鸟枪法蛋白质组学的改进型错误发现率估计程序
J Proteome Res. 2015 Aug 7;14(8):3148-61. doi: 10.1021/acs.jproteome.5b00081. Epub 2015 Jul 27.
10
Repeat-Preserving Decoy Database for False Discovery Rate Estimation in Peptide Identification.重复保留诱饵数据库用于肽鉴定中的错误发现率估计。
J Proteome Res. 2020 Mar 6;19(3):1029-1036. doi: 10.1021/acs.jproteome.9b00555. Epub 2020 Feb 21.

引用本文的文献

1
A Bioinformatics Approach to Explore MicroRNAs as Tools to Bridge Pathways Between Plants and Animals. Is DNA Damage Response (DDR) a Potential Target Process?一种探索微小RNA作为连接植物和动物途径工具的生物信息学方法。DNA损伤反应(DDR)是一个潜在的目标过程吗?
Front Plant Sci. 2019 Nov 26;10:1535. doi: 10.3389/fpls.2019.01535. eCollection 2019.
2
Clinical proteomic biomarkers: relevant issues on study design & technical considerations in biomarker development.临床蛋白质组学标志物:在生物标志物开发的研究设计和技术考虑方面的相关问题。
Clin Transl Med. 2014 Mar 29;3(1):7. doi: 10.1186/2001-1326-3-7.