• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

Patpat:一个公共蛋白质组学数据集搜索框架。

Patpat: a public proteomics dataset search framework.

机构信息

State Key Laboratory of Genetic Engineering, School of Life Sciences, Fudan University, Shanghai 200438, China.

出版信息

Bioinformatics. 2023 Feb 3;39(2). doi: 10.1093/bioinformatics/btad076.

DOI:10.1093/bioinformatics/btad076
PMID:36744907
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC9933831/
Abstract

SUMMARY

As the FAIR (Findable, Accessible, Interoperable, Reusable) principles have become widely accepted in the proteomics field, under the guidance of ProteomeXchange and The Human Proteome Organization Proteomics Standards Initiative, proteomics public databases have been providing Application Programming Interfaces for programmatic access. Based on generating logic from proteomics data, we present Patpat, an extensible framework for searching public datasets, merging results from multiple databases to help researchers find their proteins of interest in the vast mass spectrometry. Patpat's 2D strategy of combining results from multiple databases allows users to provide only protein identifiers to obtain metadata for relevant datasets, improving the 'Findable' of proteomics data.

AVAILABILITY AND IMPLEMENTATION

The Patpat framework is released under the Apache 2.0 license open source, and the source code is stored on GitHub (https://github.com/henry-leo/Patpat) and is freely available.

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

摘要

随着 FAIR(可发现、可访问、可互操作、可重用)原则在蛋白质组学领域得到广泛接受,在 ProteomeXchange 和人类蛋白质组组织蛋白质组学标准倡议的指导下,蛋白质组学公共数据库一直在提供用于编程访问的应用程序编程接口。基于蛋白质组学数据的生成逻辑,我们提出了 Patpat,这是一个用于搜索公共数据集的可扩展框架,合并来自多个数据库的结果,以帮助研究人员在大量质谱中找到他们感兴趣的蛋白质。Patpat 将多个数据库的结果结合起来的 2D 策略允许用户仅提供蛋白质标识符,以获取相关数据集的元数据,从而提高蛋白质组学数据的“可发现性”。

可用性和实现

Patpat 框架根据 Apache 2.0 许可证以开源形式发布,源代码存储在 GitHub(https://github.com/henry-leo/Patpat)上,可以免费使用。

补充信息

补充数据可在 Bioinformatics 在线获得。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/f022/9933831/dd8e3bac2e34/btad076f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/f022/9933831/dd8e3bac2e34/btad076f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/f022/9933831/dd8e3bac2e34/btad076f1.jpg

相似文献

1
Patpat: a public proteomics dataset search framework.Patpat:一个公共蛋白质组学数据集搜索框架。
Bioinformatics. 2023 Feb 3;39(2). doi: 10.1093/bioinformatics/btad076.
2
ppx: Programmatic Access to Proteomics Data Repositories.ppx:蛋白质组学数据存储库的编程访问。
J Proteome Res. 2021 Sep 3;20(9):4621-4624. doi: 10.1021/acs.jproteome.1c00454. Epub 2021 Aug 3.
3
ms-data-core-api: an open-source, metadata-oriented library for computational proteomics.质谱数据核心应用程序编程接口:一个用于计算蛋白质组学的面向元数据的开源库。
Bioinformatics. 2015 Sep 1;31(17):2903-5. doi: 10.1093/bioinformatics/btv250. Epub 2015 Apr 24.
4
iProX: an integrated proteome resource.iProX:一个综合蛋白质组资源库。
Nucleic Acids Res. 2019 Jan 8;47(D1):D1211-D1217. doi: 10.1093/nar/gky869.
5
PRIDE Inspector Toolsuite: Moving Toward a Universal Visualization Tool for Proteomics Data Standard Formats and Quality Assessment of ProteomeXchange Datasets.PRIDE Inspector工具套件:迈向用于蛋白质组学数据标准格式和ProteomeXchange数据集质量评估的通用可视化工具
Mol Cell Proteomics. 2016 Jan;15(1):305-17. doi: 10.1074/mcp.O115.050229. Epub 2015 Nov 6.
6
Toward a Sample Metadata Standard in Public Proteomics Repositories.迈向公共蛋白质组学数据库中的样本元数据标准。
J Proteome Res. 2020 Oct 2;19(10):3906-3909. doi: 10.1021/acs.jproteome.0c00376. Epub 2020 Sep 22.
7
Is DIA proteomics data FAIR? Current data sharing practices, available bioinformatics infrastructure and recommendations for the future.DIA 蛋白质组学数据是否符合 FAIR 原则?当前的数据共享实践、现有的生物信息学基础设施以及对未来的建议。
Proteomics. 2023 Apr;23(7-8):e2200014. doi: 10.1002/pmic.202200014. Epub 2022 Sep 13.
8
isa4j: a scalable Java library for creating ISA-Tab metadata.isa4j:一个用于创建ISA-Tab元数据的可扩展Java库。
F1000Res. 2020 Dec 3;9. doi: 10.12688/f1000research.27188.1. eCollection 2020.
9
medna-metadata: an open-source data management system for tracking environmental DNA samples and metadata.medna-metadata:一个用于跟踪环境 DNA 样本和元数据的开源数据管理系统。
Bioinformatics. 2022 Sep 30;38(19):4589-4597. doi: 10.1093/bioinformatics/btac556.
10
PDV: an integrative proteomics data viewer.PDV:一种综合蛋白质组学数据查看器。
Bioinformatics. 2019 Apr 1;35(7):1249-1251. doi: 10.1093/bioinformatics/bty770.

本文引用的文献

1
The PRIDE database resources in 2022: a hub for mass spectrometry-based proteomics evidences.PRIDE 数据库资源在 2022 年:一个基于质谱的蛋白质组学证据的中心。
Nucleic Acids Res. 2022 Jan 7;50(D1):D543-D552. doi: 10.1093/nar/gkab1038.
2
The Arabidopsis PeptideAtlas: Harnessing worldwide proteomics data to create a comprehensive community proteomics resource.拟南芥肽图集:利用全球蛋白质组学数据创建全面的社区蛋白质组学资源。
Plant Cell. 2021 Nov 4;33(11):3421-3453. doi: 10.1093/plcell/koab211.
3
Universal Spectrum Identifier for mass spectra.
通用质谱光谱标识符。
Nat Methods. 2021 Jul;18(7):768-770. doi: 10.1038/s41592-021-01184-6. Epub 2021 Jun 28.
4
UniProt: the universal protein knowledgebase in 2021.UniProt:2021 年的通用蛋白质知识库。
Nucleic Acids Res. 2021 Jan 8;49(D1):D480-D489. doi: 10.1093/nar/gkaa1100.
5
The ProteomeXchange consortium in 2020: enabling 'big data' approaches in proteomics.2020 年蛋白质组交换联盟:在蛋白质组学中启用“大数据”方法。
Nucleic Acids Res. 2020 Jan 8;48(D1):D1145-D1152. doi: 10.1093/nar/gkz984.
6
Pyteomics 4.0: Five Years of Development of a Python Proteomics Framework.Pyteomics 4.0:五年 Python 蛋白质组学框架的发展。
J Proteome Res. 2019 Feb 1;18(2):709-714. doi: 10.1021/acs.jproteome.8b00717. Epub 2019 Jan 8.
7
Proteomics data reuse with MassIVE-KB.利用MassIVE知识库进行蛋白质组学数据再利用。
Nat Methods. 2019 Jan;16(1):26. doi: 10.1038/s41592-018-0283-9.
8
iProX: an integrated proteome resource.iProX:一个综合蛋白质组资源库。
Nucleic Acids Res. 2019 Jan 8;47(D1):D1211-D1217. doi: 10.1093/nar/gky869.
9
Proteomics Standards Initiative: Fifteen Years of Progress and Future Work.蛋白质组学标准倡议:十五年的进展和未来工作。
J Proteome Res. 2017 Dec 1;16(12):4288-4298. doi: 10.1021/acs.jproteome.7b00370. Epub 2017 Sep 15.
10
Discovering and linking public omics data sets using the Omics Discovery Index.使用组学发现指数发现并链接公共组学数据集。
Nat Biotechnol. 2017 May 9;35(5):406-409. doi: 10.1038/nbt.3790.