• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

AlphaPeptStats:一个用于基于质谱的蛋白质组学的自动化和可扩展的统计分析的开源 Python 包。

AlphaPeptStats: an open-source Python package for automated and scalable statistical analysis of mass spectrometry-based proteomics.

机构信息

Department of Clinical Proteomics, Novo Nordisk Foundation Center for Protein Research, Faculty of Health Sciences, University of Copenhagen, 2200 Copenhagen, Denmark.

Department of Proteomics and Signal Transduction, Max Planck Institute of Biochemistry, 82152 Martinsried, Germany.

出版信息

Bioinformatics. 2023 Aug 1;39(8). doi: 10.1093/bioinformatics/btad461.

DOI:10.1093/bioinformatics/btad461
PMID:37527012
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC10415174/
Abstract

SUMMARY

The widespread application of mass spectrometry (MS)-based proteomics in biomedical research increasingly requires robust, transparent, and streamlined solutions to extract statistically reliable insights. We have designed and implemented AlphaPeptStats, an inclusive Python package with currently with broad functionalities for normalization, imputation, visualization, and statistical analysis of label-free proteomics data. It modularly builds on the established stack of Python scientific libraries and is accompanied by a rigorous testing framework with 98% test coverage. It imports the output of a range of popular search engines. Data can be filtered and normalized according to user specifications. At its heart, AlphaPeptStats provides a wide range of robust statistical algorithms such as t-tests, analysis of variance, principal component analysis, hierarchical clustering, and multiple covariate analysis-all in an automatable manner. Data visualization capabilities include heat maps, volcano plots, and scatter plots in publication-ready format. AlphaPeptStats advances proteomic research through its robust tools that enable researchers to manually or automatically explore complex datasets to identify interesting patterns and outliers.

AVAILABILITY AND IMPLEMENTATION

AlphaPeptStats is implemented in Python and part of the AlphaPept framework. It is released under a permissive Apache license. The source code and one-click installers are freely available and on GitHub at https://github.com/MannLabs/alphapeptstats.

摘要

摘要

基于质谱(MS)的蛋白质组学在生物医学研究中的广泛应用越来越需要强大、透明和简化的解决方案,以提取具有统计学可靠性的见解。我们设计并实现了 AlphaPeptStats,这是一个包含广泛功能的 Python 包,目前具有广泛的功能,可用于无标记蛋白质组学数据的归一化、插补、可视化和统计分析。它在成熟的 Python 科学库堆栈上进行了模块化构建,并附有一个严格的测试框架,具有 98%的测试覆盖率。它导入了一系列流行的搜索引擎的输出。可以根据用户规范对数据进行过滤和归一化。AlphaPeptStats 的核心是提供广泛的强大统计算法,例如 t 检验、方差分析、主成分分析、层次聚类和多协变量分析 - 所有这些都可以自动化进行。数据可视化功能包括热图、火山图和散点图,以出版物准备的格式呈现。AlphaPeptStats 通过其强大的工具推进蛋白质组学研究,使研究人员能够手动或自动探索复杂数据集,以识别有趣的模式和异常值。

可用性和实现

AlphaPeptStats 是用 Python 实现的,是 AlphaPept 框架的一部分。它在宽松的 Apache 许可证下发布。源代码和一键安装程序可在 GitHub 上免费获得,网址为 https://github.com/MannLabs/alphapeptstats。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4a71/10415174/d5988cf9a594/btad461f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4a71/10415174/d5988cf9a594/btad461f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4a71/10415174/d5988cf9a594/btad461f1.jpg

相似文献

1
AlphaPeptStats: an open-source Python package for automated and scalable statistical analysis of mass spectrometry-based proteomics.AlphaPeptStats:一个用于基于质谱的蛋白质组学的自动化和可扩展的统计分析的开源 Python 包。
Bioinformatics. 2023 Aug 1;39(8). doi: 10.1093/bioinformatics/btad461.
2
AlphaMap: an open-source Python package for the visual annotation of proteomics data with sequence-specific knowledge.AlphaMap:一个开源的 Python 软件包,用于利用序列特异性知识对蛋白质组学数据进行可视化注释。
Bioinformatics. 2022 Jan 12;38(3):849-852. doi: 10.1093/bioinformatics/btab674.
3
AlphaPept: a modern and open framework for MS-based proteomics.AlphaPept:基于 MS 的蛋白质组学的现代开放框架。
Nat Commun. 2024 Mar 9;15(1):2168. doi: 10.1038/s41467-024-46485-4.
4
A collection of open source applications for mass spectrometry data mining.一套用于质谱数据挖掘的开源应用程序。
Proteomics. 2014 Oct;14(20):2275-9. doi: 10.1002/pmic.201400124. Epub 2014 Sep 5.
5
Efficient visualization of high-throughput targeted proteomics experiments: TAPIR.高通量靶向蛋白质组学实验的高效可视化:TAPIR
Bioinformatics. 2015 Jul 15;31(14):2415-7. doi: 10.1093/bioinformatics/btv152. Epub 2015 Mar 18.
6
MassDash: A Web-Based Dashboard for Data-Independent Acquisition Mass Spectrometry Visualization.MassDash:用于数据非依赖性采集质谱可视化的基于 Web 的仪表板。
J Proteome Res. 2024 Jun 7;23(6):2306-2314. doi: 10.1021/acs.jproteome.4c00026. Epub 2024 Apr 29.
7
Calib-RT: an open source python package for peptide retention time calibration in DIA mass spectrometry data.Calib-RT:一个用于 DIA 质谱数据中肽保留时间校准的开源 Python 包。
Bioinformatics. 2024 Jul 1;40(7). doi: 10.1093/bioinformatics/btae417.
8
MSPypeline: a python package for streamlined data analysis of mass spectrometry-based proteomics.MSPypeline:一个用于简化基于质谱的蛋白质组学数据分析的Python软件包。
Bioinform Adv. 2022 Jan 17;2(1):vbac004. doi: 10.1093/bioadv/vbac004. eCollection 2022.
9
Decon2LS: An open-source software package for automated processing and visualization of high resolution mass spectrometry data.Decon2LS:一个用于高分辨率质谱数据自动处理和可视化的开源软件包。
BMC Bioinformatics. 2009 Mar 17;10:87. doi: 10.1186/1471-2105-10-87.
10
pyOpenMS: a Python-based interface to the OpenMS mass-spectrometry algorithm library.pyOpenMS:一个基于 Python 的 OpenMS 质谱算法库接口。
Proteomics. 2014 Jan;14(1):74-7. doi: 10.1002/pmic.201300246.

引用本文的文献

1
Probing condensate microenvironments with a micropeptide killswitch.用一种微型肽开关探测凝聚物微环境。
Nature. 2025 Jun 4. doi: 10.1038/s41586-025-09141-5.
2
Systematic evaluation of normalization approaches in tandem mass tag and label-free protein quantification data using PRONE.使用PRONE对串联质谱标签和无标记蛋白质定量数据中的归一化方法进行系统评估。
Brief Bioinform. 2025 May 1;26(3). doi: 10.1093/bib/bbaf201.
3
Deep visual proteomics reveals DNA replication stress as a hallmark of signet ring cell carcinoma.深度视觉蛋白质组学揭示DNA复制应激是印戒细胞癌的一个标志。

本文引用的文献

1
AlphaPept: a modern and open framework for MS-based proteomics.AlphaPept:基于 MS 的蛋白质组学的现代开放框架。
Nat Commun. 2024 Mar 9;15(1):2168. doi: 10.1038/s41467-024-46485-4.
2
MSPypeline: a python package for streamlined data analysis of mass spectrometry-based proteomics.MSPypeline:一个用于简化基于质谱的蛋白质组学数据分析的Python软件包。
Bioinform Adv. 2022 Jan 17;2(1):vbac004. doi: 10.1093/bioadv/vbac004. eCollection 2022.
3
AlphaPeptDeep: a modular deep learning framework to predict peptide properties for proteomics.
NPJ Precis Oncol. 2025 Feb 5;9(1):37. doi: 10.1038/s41698-025-00819-7.
4
Spatial proteomics: unveiling the multidimensional landscape of protein localization in human diseases.空间蛋白质组学:揭示人类疾病中蛋白质定位的多维图景。
Proteome Sci. 2024 Sep 20;22(1):7. doi: 10.1186/s12953-024-00231-2.
5
Comprehensive Overview of Bottom-Up Proteomics Using Mass Spectrometry.基于质谱的自下而上蛋白质组学综合概述
ACS Meas Sci Au. 2024 Jun 4;4(4):338-417. doi: 10.1021/acsmeasuresciau.3c00068. eCollection 2024 Aug 21.
6
Comprehensive Overview of Bottom-Up Proteomics using Mass Spectrometry.基于质谱的自下而上蛋白质组学综合概述
ArXiv. 2023 Nov 13:arXiv:2311.07791v1.
AlphaPeptDeep:用于蛋白质组学的模块化深度学习框架,用于预测肽性质。
Nat Commun. 2022 Nov 24;13(1):7238. doi: 10.1038/s41467-022-34904-3.
4
Protein Contaminants Matter: Building Universal Protein Contaminant Libraries for DDA and DIA Proteomics.蛋白质污染物不容忽视:构建适用于 DDA 和 DIA 蛋白质组学的通用蛋白质污染物文库。
J Proteome Res. 2022 Sep 2;21(9):2104-2113. doi: 10.1021/acs.jproteome.2c00145. Epub 2022 Jul 6.
5
AlphaMap: an open-source Python package for the visual annotation of proteomics data with sequence-specific knowledge.AlphaMap:一个开源的 Python 软件包,用于利用序列特异性知识对蛋白质组学数据进行可视化注释。
Bioinformatics. 2022 Jan 12;38(3):849-852. doi: 10.1093/bioinformatics/btab674.
6
IonQuant Enables Accurate and Sensitive Label-Free Quantification With FDR-Controlled Match-Between-Runs.IonQuant 实现了基于 FDR 控制的匹配运行间精确、灵敏的无标记定量分析。
Mol Cell Proteomics. 2021;20:100077. doi: 10.1016/j.mcpro.2021.100077. Epub 2021 Apr 2.
7
A comparative study of evaluating missing value imputation methods in label-free proteomics.基于无标记蛋白质组学的缺失值插补方法评估的比较研究。
Sci Rep. 2021 Jan 19;11(1):1760. doi: 10.1038/s41598-021-81279-4.
8
Fast Deisotoping Algorithm and Its Implementation in the MSFragger Search Engine.快速去同位素算法及其在 MSFragger 搜索引擎中的实现。
J Proteome Res. 2021 Jan 1;20(1):498-505. doi: 10.1021/acs.jproteome.0c00544. Epub 2020 Dec 17.
9
Array programming with NumPy.使用 NumPy 进行数组编程。
Nature. 2020 Sep;585(7825):357-362. doi: 10.1038/s41586-020-2649-2. Epub 2020 Sep 16.
10
Philosopher: a versatile toolkit for shotgun proteomics data analysis.哲学家:用于鸟枪法蛋白质组学数据分析的多功能工具包。
Nat Methods. 2020 Sep;17(9):869-870. doi: 10.1038/s41592-020-0912-y.