• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

PyViscount:通过随机搜索空间划分验证错误发现率估计方法

PyViscount: Validating False Discovery Rate Estimation Methods via Random Search Space Partition.

作者信息

Madej Dominik, Lam Henry

机构信息

Department of Chemical and Biological Engineering, The Hong Kong University of Science and Technology, Hong Kong 999077, China.

出版信息

J Proteome Res. 2025 Mar 7;24(3):1118-1134. doi: 10.1021/acs.jproteome.4c00743. Epub 2025 Feb 5.

DOI:10.1021/acs.jproteome.4c00743
PMID:39905949
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC11894659/
Abstract

Validating false discovery rate (FDR) estimation is an essential but surprisingly understudied aspect of method development in shotgun proteomics. Currently available validation protocols mostly rely on ground truth data sets, which typically involve manipulating the properties of the search space or query spectra used. As a result, comparing estimated FDR and ground truth-based false discovery proportion values may not be representative of the scenarios involving natural data sets encountered in practice. In this study, we introduce PyViscount─a Python tool implementing a novel validation protocol based on random search space partition, which enables generating a quasi ground-truth using unaltered search spaces of unique candidate peptides and generic data sets of experimental query spectra. Furthermore, validation of existing FDR estimation methods by PyViscount is consistent with alternative validation protocols. The presented novel approach to validation free from the need for synthetic data sets or dubious manipulation of the data may be an attractive alternative for proteomics practitioners, allowing them to obtain deeper insights into the performance of existing and new FDR estimation methods.

摘要

验证错误发现率(FDR)估计是鸟枪法蛋白质组学方法开发中一个重要但却惊人地未得到充分研究的方面。目前可用的验证方案大多依赖于真实数据集,而这些数据集通常涉及操纵所使用的搜索空间或查询光谱的属性。因此,比较估计的FDR和基于真实情况的错误发现比例值可能无法代表实际中遇到的涉及自然数据集的情况。在本研究中,我们引入了PyViscount——一个用Python实现的工具,它基于随机搜索空间划分实现了一种新颖的验证方案,该方案能够使用独特候选肽的未改变搜索空间和实验查询光谱的通用数据集生成准真实情况。此外,PyViscount对现有FDR估计方法的验证与其他验证方案一致。所提出的无需合成数据集或对数据进行可疑操纵的新颖验证方法,对于蛋白质组学从业者来说可能是一个有吸引力的选择,使他们能够更深入地了解现有和新的FDR估计方法的性能。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/98bd/11894659/6ae1830267c3/pr4c00743_0009.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/98bd/11894659/11ff670bc7c8/pr4c00743_0001.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/98bd/11894659/ac382199d406/pr4c00743_0002.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/98bd/11894659/4bbe13c0171b/pr4c00743_0003.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/98bd/11894659/2f9f831d1b70/pr4c00743_0004.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/98bd/11894659/c27c051c5d60/pr4c00743_0005.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/98bd/11894659/9b52753eadcc/pr4c00743_0006.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/98bd/11894659/eb842ab89663/pr4c00743_0007.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/98bd/11894659/f43ef6409fdc/pr4c00743_0008.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/98bd/11894659/6ae1830267c3/pr4c00743_0009.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/98bd/11894659/11ff670bc7c8/pr4c00743_0001.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/98bd/11894659/ac382199d406/pr4c00743_0002.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/98bd/11894659/4bbe13c0171b/pr4c00743_0003.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/98bd/11894659/2f9f831d1b70/pr4c00743_0004.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/98bd/11894659/c27c051c5d60/pr4c00743_0005.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/98bd/11894659/9b52753eadcc/pr4c00743_0006.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/98bd/11894659/eb842ab89663/pr4c00743_0007.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/98bd/11894659/f43ef6409fdc/pr4c00743_0008.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/98bd/11894659/6ae1830267c3/pr4c00743_0009.jpg

相似文献

1
PyViscount: Validating False Discovery Rate Estimation Methods via Random Search Space Partition.PyViscount:通过随机搜索空间划分验证错误发现率估计方法
J Proteome Res. 2025 Mar 7;24(3):1118-1134. doi: 10.1021/acs.jproteome.4c00743. Epub 2025 Feb 5.
2
On the use of tandem mass spectra acquired from samples of evolutionarily distant organisms to validate methods for false discovery rate estimation.利用来自进化上相距较远的生物体样本获得的串联质谱数据来验证假发现率估计方法。
Proteomics. 2024 Aug;24(15):e2300398. doi: 10.1002/pmic.202300398. Epub 2024 Mar 15.
3
Common Decoy Distributions Simplify False Discovery Rate Estimation in Shotgun Proteomics.通用诱饵分布简化了鸟枪法蛋白质组学中的错误发现率估计
J Proteome Res. 2022 Feb 4;21(2):339-348. doi: 10.1021/acs.jproteome.1c00600. Epub 2022 Jan 6.
4
Query Mix-Max Method for FDR Estimation Supported by Entrapment Queries.由截留查询支持的用于错误发现率(FDR)估计的查询混合最大化方法。
J Proteome Res. 2025 Mar 7;24(3):1135-1147. doi: 10.1021/acs.jproteome.4c00744. Epub 2025 Feb 5.
5
Targeted Feature Detection for Data-Dependent Shotgun Proteomics.针对数据依赖型鸟枪法蛋白质组学的靶向特征检测。
J Proteome Res. 2017 Aug 4;16(8):2964-2974. doi: 10.1021/acs.jproteome.7b00248. Epub 2017 Jul 19.
6
Reverse and Random Decoy Methods for False Discovery Rate Estimation in High Mass Accuracy Peptide Spectral Library Searches.反转和随机诱饵方法在高质量精度肽谱库搜索中的假发现率估计。
J Proteome Res. 2018 Feb 2;17(2):846-857. doi: 10.1021/acs.jproteome.7b00614. Epub 2018 Jan 11.
7
pValid 2: A deep learning based validation method for peptide identification in shotgun proteomics with increased discriminating power.pValid 2:一种基于深度学习的 shotgun 蛋白质组学中肽段鉴定的验证方法,具有更高的判别能力。
J Proteomics. 2022 Jan 16;251:104414. doi: 10.1016/j.jprot.2021.104414. Epub 2021 Nov 2.
8
Improved False Discovery Rate Estimation Procedure for Shotgun Proteomics.用于鸟枪法蛋白质组学的改进型错误发现率估计程序
J Proteome Res. 2015 Aug 7;14(8):3148-61. doi: 10.1021/acs.jproteome.5b00081. Epub 2015 Jul 27.
9
Deep Learning-Based Prediction of Decoy Spectra for False Discovery Rate Estimation in Spectral Library Searching.基于深度学习的诱饵光谱预测用于谱图库搜索中错误发现率的估计
J Proteome Res. 2025 May 2;24(5):2235-2242. doi: 10.1021/acs.jproteome.4c00304. Epub 2025 Apr 19.
10
False Discovery Rate Estimation for Hybrid Mass Spectral Library Search Identifications in Bottom-up Proteomics.用于 Bottom-up 蛋白质组学中混合质谱文库搜索鉴定的假发现率估计。
J Proteome Res. 2019 Sep 6;18(9):3223-3234. doi: 10.1021/acs.jproteome.8b00863. Epub 2019 Aug 14.

引用本文的文献

1
Query Mix-Max Method for FDR Estimation Supported by Entrapment Queries.由截留查询支持的用于错误发现率(FDR)估计的查询混合最大化方法。
J Proteome Res. 2025 Mar 7;24(3):1135-1147. doi: 10.1021/acs.jproteome.4c00744. Epub 2025 Feb 5.

本文引用的文献

1
Merging Full-Spectrum and Fragment Ion Intensity Predictions from Deep Learning for High-Quality Spectral Libraries.深度学习融合全谱和碎片离子强度预测,构建高质量的谱库。
J Proteome Res. 2023 Dec 1;22(12):3692-3702. doi: 10.1021/acs.jproteome.3c00180. Epub 2023 Nov 1.
2
Spectroscape enables real-time query and visualization of a spectral archive in proteomics.Spectroscape 能够实时查询和可视化蛋白质组学中的光谱档案。
Nat Commun. 2023 Oct 7;14(1):6267. doi: 10.1038/s41467-023-42006-x.
3
Modeling Lower-Order Statistics to Enable Decoy-Free FDR Estimation in Proteomics.
对低阶统计量进行建模以实现蛋白质组学中无诱饵的错误发现率估计。
J Proteome Res. 2023 Apr 7;22(4):1159-1171. doi: 10.1021/acs.jproteome.2c00604. Epub 2023 Mar 24.
4
Improving Peptide-Level Mass Spectrometry Analysis via Double Competition.通过双重竞争提高肽段水平的质谱分析。
J Proteome Res. 2022 Oct 7;21(10):2412-2420. doi: 10.1021/acs.jproteome.2c00282. Epub 2022 Sep 27.
5
Group-walk: a rigorous approach to group-wise false discovery rate analysis by target-decoy competition.组步行:一种通过目标诱饵竞争进行组-wise 假发现率分析的严格方法。
Bioinformatics. 2022 Sep 16;38(Suppl_2):ii82-ii88. doi: 10.1093/bioinformatics/btac471.
6
Common Decoy Distributions Simplify False Discovery Rate Estimation in Shotgun Proteomics.通用诱饵分布简化了鸟枪法蛋白质组学中的错误发现率估计
J Proteome Res. 2022 Feb 4;21(2):339-348. doi: 10.1021/acs.jproteome.1c00600. Epub 2022 Jan 6.
7
Benchmarking Quantitative Performance in Label-Free Proteomics.无标记蛋白质组学中的定量性能基准测试
ACS Omega. 2021 Jan 20;6(4):2494-2504. doi: 10.1021/acsomega.0c04030. eCollection 2021 Feb 2.
8
MS2CNN: predicting MS/MS spectrum based on protein sequence using deep convolutional neural networks.MS2CNN:基于深度卷积神经网络的蛋白质序列预测 MS/MS 谱。
BMC Genomics. 2019 Dec 24;20(Suppl 9):906. doi: 10.1186/s12864-019-6297-6.
9
pValid: Validation Beyond the Target-Decoy Approach for Peptide Identification in Shotgun Proteomics.pValid:在 shotgun 蛋白质组学中对肽鉴定的目标诱饵方法之外的验证。
J Proteome Res. 2019 Jul 5;18(7):2747-2758. doi: 10.1021/acs.jproteome.8b00993. Epub 2019 Jun 24.
10
Bias in False Discovery Rate Estimation in Mass-Spectrometry-Based Peptide Identification.基于质谱的肽鉴定中错误发现率估计的偏差。
J Proteome Res. 2019 May 3;18(5):2354-2358. doi: 10.1021/acs.jproteome.8b00991. Epub 2019 Apr 18.