• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

ProtGraph:一种利用图形对源自蛋白质序列数据库的肽搜索空间进行快速全面探索和利用的工具。

ProtGraph: a tool for the quick and comprehensive exploration and exploitation of the peptide search space derived from protein sequence databases using graphs.

作者信息

Lux Dominik, Marcus-Alic Katrin, Eisenacher Martin, Uszkoreit Julian

机构信息

Ruhr University Bochum, Medical Faculty, Medizinisches Proteom-Center, Gesundheitscampus 4, 44801 Bochum, Germany.

Ruhr University Bochum, Medical Faculty, Center for Protein Diagnostics (PRODI), Gesundheitscampus 4, 44801 Bochum, Germany.

出版信息

Brief Bioinform. 2024 Nov 22;26(1). doi: 10.1093/bib/bbae671.

DOI:10.1093/bib/bbae671
PMID:39757114
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC11700661/
Abstract

Due to computational resource limitations, in mass spectrometry based proteomics only a limited set of peptide sequences is used for the matching against measured spectra. We present an approach to represent proteins by graphs and allow not only the canonical sequences but also known isoforms and annotated amino acid variations, e.g. originating from genomic mutations, and further common protein sequence features contained in Uniprot KB or other protein databases. Our C++ and Python implementation enables a groundbreaking comprehensive characterization of the peptide search space, encompassing for the first time all available annotations in a protein database (in combination more than $10^{200}$ possibilities). Additionally, it can be used to quickly extract the relevant subset of the search space for peptide to spectrum matching, e.g. filtering by the peptide mass. We demonstrate the advantages and innovative findings of our implementation compared to previous workflows by re-analysing publicly available datasets.

摘要

由于计算资源的限制,在基于质谱的蛋白质组学中,只有有限的一组肽序列用于与测量光谱进行匹配。我们提出了一种用图形表示蛋白质的方法,不仅允许使用标准序列,还允许使用已知的异构体和注释的氨基酸变异,例如源自基因组突变的变异,以及包含在UniProt KB或其他蛋白质数据库中的其他常见蛋白质序列特征。我们用C++和Python实现的方法能够对肽搜索空间进行开创性的全面表征,首次涵盖了蛋白质数据库中的所有可用注释(组合起来有超过(10^{200})种可能性)。此外,它可用于快速提取肽与光谱匹配搜索空间的相关子集,例如按肽质量进行过滤。我们通过重新分析公开可用的数据集,展示了我们的实现方法与以前的工作流程相比的优势和创新性发现。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d758/11700661/0381c4a21063/bbae671f7.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d758/11700661/f75ee4cabd81/bbae671ga1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d758/11700661/e54a6285026b/bbae671f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d758/11700661/db4e1d720e53/bbae671f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d758/11700661/bb371636094e/bbae671f3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d758/11700661/c71df9fbe619/bbae671f4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d758/11700661/0381c4a21063/bbae671f7.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d758/11700661/f75ee4cabd81/bbae671ga1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d758/11700661/e54a6285026b/bbae671f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d758/11700661/db4e1d720e53/bbae671f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d758/11700661/bb371636094e/bbae671f3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d758/11700661/c71df9fbe619/bbae671f4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/d758/11700661/0381c4a21063/bbae671f7.jpg

相似文献

1
ProtGraph: a tool for the quick and comprehensive exploration and exploitation of the peptide search space derived from protein sequence databases using graphs.ProtGraph:一种利用图形对源自蛋白质序列数据库的肽搜索空间进行快速全面探索和利用的工具。
Brief Bioinform. 2024 Nov 22;26(1). doi: 10.1093/bib/bbae671.
2
In-depth analysis of protein inference algorithms using multiple search engines and well-defined metrics.使用多个搜索引擎和明确的指标对蛋白质推断算法进行深入分析。
J Proteomics. 2017 Jan 6;150:170-182. doi: 10.1016/j.jprot.2016.08.002. Epub 2016 Aug 4.
3
Mass spectrum sequential subtraction speeds up searching large peptide MS/MS spectra datasets against large nucleotide databases for proteogenomics.质谱序列减法可加快针对大型核苷酸数据库搜索大型肽 MS/MS 光谱数据集的速度,用于蛋白质基因组学研究。
Genes Cells. 2012 Aug;17(8):633-44. doi: 10.1111/j.1365-2443.2012.01615.x. Epub 2012 Jun 12.
4
Analysis of the tryptic search space in UniProt databases.对UniProt数据库中胰蛋白酶搜索空间的分析。
Proteomics. 2015 Jan;15(1):48-57. doi: 10.1002/pmic.201400227. Epub 2014 Dec 3.
5
VEMS 3.0: algorithms and computational tools for tandem mass spectrometry based identification of post-translational modifications in proteins.VEMS 3.0:用于基于串联质谱法鉴定蛋白质翻译后修饰的算法和计算工具
J Proteome Res. 2005 Nov-Dec;4(6):2338-47. doi: 10.1021/pr050264q.
6
MSDA, a proteomics software suite for in-depth Mass Spectrometry Data Analysis using grid computing.MSDA,一款用于利用网格计算进行深入质谱数据分析的蛋白质组学软件套件。
Proteomics. 2014 May;14(9):1014-9. doi: 10.1002/pmic.201300415. Epub 2014 Mar 12.
7
DeNovoID: a web-based tool for identifying peptides from sequence and mass tags deduced from de novo peptide sequencing by mass spectroscopy.DeNovoID:一种基于网络的工具,用于从通过质谱从头肽测序推导的序列和质量标签中鉴定肽段。
Nucleic Acids Res. 2005 Jul 1;33(Web Server issue):W376-81. doi: 10.1093/nar/gki461.
8
Evaluating de novo sequencing in proteomics: already an accurate alternative to database-driven peptide identification?评估蛋白质组学中的从头测序:是否已经成为数据库驱动肽鉴定的准确替代方法?
Brief Bioinform. 2018 Sep 28;19(5):954-970. doi: 10.1093/bib/bbx033.
9
Informatics for protein identification by mass spectrometry.用于通过质谱法进行蛋白质鉴定的信息学。
Methods. 2005 Mar;35(3):223-36. doi: 10.1016/j.ymeth.2004.08.014. Epub 2005 Jan 13.
10
De novo sequencing methods in proteomics.蛋白质组学中的从头测序方法。
Methods Mol Biol. 2010;604:105-21. doi: 10.1007/978-1-60761-444-9_8.

本文引用的文献

1
MSRescore 3.0 Is a Modular, Flexible, and User-Friendly Platform to Boost Peptide Identifications, as Showcased with MS Amanda 3.0.MSRescore 3.0 是一个模块化、灵活且用户友好的平台,可提高肽鉴定的质量,这一点在 MS Amanda 3.0 中得到了很好的展示。
J Proteome Res. 2024 Aug 2;23(8):3200-3207. doi: 10.1021/acs.jproteome.3c00785. Epub 2024 Mar 16.
2
Retention Time and Fragmentation Predictors Increase Confidence in Identification of Common Variant Peptides.保留时间和碎片化预测因子提高了常见变异肽鉴定的可信度。
J Proteome Res. 2023 Oct 6;22(10):3190-3199. doi: 10.1021/acs.jproteome.3c00243. Epub 2023 Sep 1.
3
Annotation of biologically relevant ligands in UniProtKB using ChEBI.
使用 ChEBI 对 UniProtKB 中的生物相关配体进行注释。
Bioinformatics. 2023 Jan 1;39(1). doi: 10.1093/bioinformatics/btac793.
4
The STRING database in 2023: protein-protein association networks and functional enrichment analyses for any sequenced genome of interest.2023 年的 STRING 数据库:针对任何感兴趣的测序基因组的蛋白质-蛋白质关联网络和功能富集分析。
Nucleic Acids Res. 2023 Jan 6;51(D1):D638-D646. doi: 10.1093/nar/gkac1000.
5
The PRIDE database resources in 2022: a hub for mass spectrometry-based proteomics evidences.PRIDE 数据库资源在 2022 年:一个基于质谱的蛋白质组学证据的中心。
Nucleic Acids Res. 2022 Jan 7;50(D1):D543-D552. doi: 10.1093/nar/gkab1038.
6
MaCPepDB: A Database to Quickly Access All Tryptic Peptides of the UniProtKB.MaCPepDB:一个快速访问 UniProtKB 中所有胰蛋白酶肽的数据库。
J Proteome Res. 2021 Apr 2;20(4):2145-2150. doi: 10.1021/acs.jproteome.0c00967. Epub 2021 Mar 16.
7
A Critical Review of Bottom-Up Proteomics: The Good, the Bad, and the Future of this Field.自下而上蛋白质组学的批判性综述:该领域的优势、不足与未来
Proteomes. 2020 Jul 6;8(3):14. doi: 10.3390/proteomes8030014.
8
ThermoRawFileParser: Modular, Scalable, and Cross-Platform RAW File Conversion.ThermoRawFileParser:模块化、可扩展且跨平台的 RAW 文件转换。
J Proteome Res. 2020 Jan 3;19(1):537-542. doi: 10.1021/acs.jproteome.9b00328. Epub 2019 Dec 6.
9
XMAn v2-a database of Homo sapiens mutated peptides.XMAn v2-a 数据库,包含人类突变肽。
Bioinformatics. 2020 Feb 15;36(4):1311-1313. doi: 10.1093/bioinformatics/btz693.
10
Prosit: proteome-wide prediction of peptide tandem mass spectra by deep learning.Prosit:基于深度学习的肽串联质谱的蛋白质组范围预测。
Nat Methods. 2019 Jun;16(6):509-518. doi: 10.1038/s41592-019-0426-7. Epub 2019 May 27.