• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

本地 pdb-a Python 包,用于管理蛋白质结构及其注释。

localpdb-a Python package to manage protein structures and their annotations.

机构信息

Laboratory of Structural Bioinformatics, Centre of New Technologies, University of Warsaw, 02-097 Warsaw, Poland.

出版信息

Bioinformatics. 2022 Apr 28;38(9):2633-2635. doi: 10.1093/bioinformatics/btac121.

DOI:10.1093/bioinformatics/btac121
PMID:35199148
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC9048648/
Abstract

MOTIVATION

The wealth of protein structures collected in the Protein Data Bank enabled large-scale studies of their function and evolution. Such studies, however, require the generation of customized datasets combining the structural data with miscellaneous accessory resources providing functional, taxonomic and other annotations. Unfortunately, the functionality of currently available tools for the creation of such datasets is limited and their usage frequently requires laborious surveying of various data sources and resolving inconsistencies between their versions.

RESULTS

To address this problem, we developed localpdb, a versatile Python library for the management of protein structures and their annotations. The library features a flexible plugin system enabling seamless unification of the structural data with diverse auxiliary resources, full version control and powerful functionality of creating highly customized datasets. The localpdb can be used in a wide range of bioinformatic tasks, in particular those involving large-scale protein structural analyses and machine learning.

AVAILABILITY AND IMPLEMENTATION

localpdb is freely available at https://github.com/labstructbioinf/localpdb. Documentation along with the usage examples can be accessed at https://labstructbioinf.github.io/localpdb/.

摘要

动机

蛋白质数据库中收集的丰富蛋白质结构数据使大规模研究其功能和进化成为可能。然而,此类研究需要生成自定义数据集,将结构数据与提供功能、分类学和其他注释的各种辅助资源相结合。不幸的是,目前用于创建此类数据集的工具的功能有限,并且它们的使用通常需要费力地调查各种数据源,并解决它们版本之间的不一致性。

结果

为了解决这个问题,我们开发了 localpdb,这是一个用于管理蛋白质结构及其注释的多功能 Python 库。该库具有灵活的插件系统,能够无缝地将结构数据与各种辅助资源统一起来,实现完整的版本控制,并具有创建高度自定义数据集的强大功能。localpdb 可用于广泛的生物信息学任务,特别是涉及大规模蛋白质结构分析和机器学习的任务。

可用性和实现

localpdb 可在 https://github.com/labstructbioinf/localpdb 上免费获得。使用示例和文档可在 https://labstructbioinf.github.io/localpdb/ 上访问。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ad3f/9048648/abdc94e97a57/btac121f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ad3f/9048648/abdc94e97a57/btac121f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/ad3f/9048648/abdc94e97a57/btac121f1.jpg

相似文献

1
localpdb-a Python package to manage protein structures and their annotations.本地 pdb-a Python 包,用于管理蛋白质结构及其注释。
Bioinformatics. 2022 Apr 28;38(9):2633-2635. doi: 10.1093/bioinformatics/btac121.
2
Pygenprop: a Python library for programmatic exploration and comparison of organism genome properties.Pygenprop:一个用于程序化探索和比较生物基因组属性的 Python 库。
Bioinformatics. 2019 Dec 1;35(23):5063-5065. doi: 10.1093/bioinformatics/btz522.
3
Pybedtools: a flexible Python library for manipulating genomic datasets and annotations.Pybedtools:一个灵活的 Python 库,用于操作基因组数据集和注释。
Bioinformatics. 2011 Dec 15;27(24):3423-4. doi: 10.1093/bioinformatics/btr539. Epub 2011 Sep 23.
4
SHEPHARD: a modular and extensible software architecture for analyzing and annotating large protein datasets.SHEPHARD:一种用于分析和注释大型蛋白质数据集的模块化和可扩展的软件架构。
Bioinformatics. 2023 Aug 1;39(8). doi: 10.1093/bioinformatics/btad488.
5
Brain Predictability toolbox: a Python library for neuroimaging-based machine learning.脑可预测性工具包:一个基于神经影像学的机器学习的 Python 库。
Bioinformatics. 2021 Jul 12;37(11):1637-1638. doi: 10.1093/bioinformatics/btaa974.
6
Genopyc: a Python library for investigating the functional effects of genomic variants associated to complex diseases.Genopyc:一个用于研究与复杂疾病相关的基因组变异的功能影响的 Python 库。
Bioinformatics. 2024 Jun 3;40(6). doi: 10.1093/bioinformatics/btae379.
7
GSEApy: a comprehensive package for performing gene set enrichment analysis in Python.GSEApy:一个用于在 Python 中进行基因集富集分析的综合软件包。
Bioinformatics. 2023 Jan 1;39(1). doi: 10.1093/bioinformatics/btac757.
8
Pygenomics: manipulating genomic intervals and data files in Python.Pygenomics:在 Python 中操作基因组区间和数据文件。
Bioinformatics. 2023 Jun 1;39(6). doi: 10.1093/bioinformatics/btad346.
9
cyvcf2: fast, flexible variant analysis with Python.cyvcf2:使用Python进行快速、灵活的变异分析。
Bioinformatics. 2017 Jun 15;33(12):1867-1869. doi: 10.1093/bioinformatics/btx057.
10
Gos: a declarative library for interactive genomics visualization in Python.Gos:一个用于 Python 中交互式基因组学可视化的声明式库。
Bioinformatics. 2023 Jan 1;39(1). doi: 10.1093/bioinformatics/btad050.

引用本文的文献

1
Applicability of AlphaFold2 in the modeling of dimeric, trimeric, and tetrameric coiled-coil domains.AlphaFold2在二聚体、三聚体和四聚体卷曲螺旋结构域建模中的适用性。
Protein Sci. 2025 Jan;34(1):e5244. doi: 10.1002/pro.5244.
2
Comprehensive detection and characterization of human druggable pockets through binding site descriptors.通过结合位点描述符对人类可成药口袋进行全面检测和特征描述。
Nat Commun. 2024 Sep 10;15(1):7917. doi: 10.1038/s41467-024-52146-3.
3
pLM-BLAST: distant homology detection based on direct comparison of sequence representations from protein language models.
pLM-BLAST:基于蛋白质语言模型序列表示的直接比较进行远缘同源检测。
Bioinformatics. 2023 Oct 3;39(10). doi: 10.1093/bioinformatics/btad579.