• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

表面标识:一个用于蛋白质分子表面比较的几何感知系统。

Surface ID: a geometry-aware system for protein molecular surface comparison.

机构信息

Large Molecule Research, Sanofi, Cambridge, MA 02141, United States.

Data & Data Science, Sanofi, Cambridge, MA 02141, United States.

出版信息

Bioinformatics. 2023 Apr 3;39(4). doi: 10.1093/bioinformatics/btad196.

DOI:10.1093/bioinformatics/btad196
PMID:37067488
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC10133531/
Abstract

MOTIVATION

A protein can be represented in several forms, including its 1D sequence, 3D atom coordinates, and molecular surface. A protein surface contains rich structural and chemical features directly related to the protein's function such as its ability to interact with other molecules. While many methods have been developed for comparing the similarity of proteins using the sequence and structural representations, computational methods based on molecular surface representation are limited.

RESULTS

Here, we describe "Surface ID," a geometric deep learning system for high-throughput surface comparison based on geometric and chemical features. Surface ID offers a novel grouping and alignment algorithm useful for clustering proteins by function, visualization, and in silico screening of potential binding partners to a target molecule. Our method demonstrates top performance in surface similarity assessment, indicating great potential for protein functional annotation, a major need in protein engineering and therapeutic design.

AVAILABILITY AND IMPLEMENTATION

Source code for the Surface ID model, trained weights, and inference script are available at https://github.com/Sanofi-Public/LMR-SurfaceID.

摘要

动机

蛋白质可以有多种形式表示,包括其一维序列、三维原子坐标和分子表面。蛋白质表面包含丰富的结构和化学特征,这些特征与蛋白质的功能直接相关,例如与其他分子相互作用的能力。虽然已经开发出许多使用序列和结构表示来比较蛋白质相似性的方法,但基于分子表面表示的计算方法却受到限制。

结果

在这里,我们描述了“Surface ID”,这是一种基于几何和化学特征的用于高通量表面比较的几何深度学习系统。Surface ID 提供了一种新颖的分组和对齐算法,可用于根据功能对蛋白质进行聚类、可视化和对靶分子的潜在结合伙伴进行计算机筛选。我们的方法在表面相似性评估方面表现出了卓越的性能,表明其在蛋白质功能注释方面具有巨大的潜力,这是蛋白质工程和治疗设计的主要需求。

可用性和实现

Surface ID 模型的源代码、训练权重和推理脚本可在 https://github.com/Sanofi-Public/LMR-SurfaceID 上获得。

相似文献

1
Surface ID: a geometry-aware system for protein molecular surface comparison.表面标识:一个用于蛋白质分子表面比较的几何感知系统。
Bioinformatics. 2023 Apr 3;39(4). doi: 10.1093/bioinformatics/btad196.
2
A spatial-temporal gated attention module for molecular property prediction based on molecular geometry.基于分子几何的分子性质预测的时空门控注意力模块。
Brief Bioinform. 2021 Sep 2;22(5). doi: 10.1093/bib/bbab078.
3
DeepSurf: a surface-based deep learning approach for the prediction of ligand binding sites on proteins.深度表面预测法:一种基于表面的深度学习方法,用于预测蛋白质上的配体结合位点。
Bioinformatics. 2021 Jul 19;37(12):1681-1690. doi: 10.1093/bioinformatics/btab009.
4
LS-align: an atom-level, flexible ligand structural alignment algorithm for high-throughput virtual screening.LS-align:一种适用于高通量虚拟筛选的原子级、灵活的配体结构对齐算法。
Bioinformatics. 2018 Jul 1;34(13):2209-2218. doi: 10.1093/bioinformatics/bty081.
5
Geometric epitope and paratope prediction.几何表位和变构位预测。
Bioinformatics. 2024 Jul 1;40(7). doi: 10.1093/bioinformatics/btae405.
6
APoc: large-scale identification of similar protein pockets.APoc:大规模识别相似蛋白口袋。
Bioinformatics. 2013 Mar 1;29(5):597-604. doi: 10.1093/bioinformatics/btt024. Epub 2013 Jan 17.
7
A novel methodology on distributed representations of proteins using their interacting ligands.一种利用蛋白质相互作用配体进行蛋白质分布表示的新方法。
Bioinformatics. 2018 Jul 1;34(13):i295-i303. doi: 10.1093/bioinformatics/bty287.
8
Deep learning embedder method and tool for mass spectra similarity search.用于质谱相似性搜索的深度学习嵌入器方法和工具。
J Proteomics. 2021 Feb 10;232:104070. doi: 10.1016/j.jprot.2020.104070. Epub 2020 Dec 8.
9
Atomic protein structure refinement using all-atom graph representations and SE(3)-equivariant graph transformer.使用全原子图表示和 SE(3)-等变图转换器进行原子蛋白质结构精修。
Bioinformatics. 2023 May 4;39(5). doi: 10.1093/bioinformatics/btad298.
10
SVM-Fold: a tool for discriminative multi-class protein fold and superfamily recognition.支持向量机折叠法:一种用于判别式多类别蛋白质折叠和超家族识别的工具。
BMC Bioinformatics. 2007 May 22;8 Suppl 4(Suppl 4):S2. doi: 10.1186/1471-2105-8-S4-S2.

引用本文的文献

1
sesA: A Program for the Analytic Computation of Solvent-Excluded Surface Areas.sesA:溶剂排除表面积的解析计算程序。
ChemistryOpen. 2024 Dec;13(12):e202400172. doi: 10.1002/open.202400172. Epub 2024 Oct 22.
2
Antibody design using deep learning: from sequence and structure design to affinity maturation.使用深度学习进行抗体设计:从序列和结构设计到亲和力成熟。
Brief Bioinform. 2024 May 23;25(4). doi: 10.1093/bib/bbae307.
3
FP-Zernike: An Open-source Structural Database Construction Toolkit for Fast Structure Retrieval.FP-Zernike:用于快速结构检索的开源结构数据库构建工具包。

本文引用的文献

1
Dali server: structural unification of protein families.达尔服务器:蛋白质家族的结构统一。
Nucleic Acids Res. 2022 Jul 5;50(W1):W210-W215. doi: 10.1093/nar/gkac387.
2
Design of protein-binding proteins from the target structure alone.从目标结构设计蛋白质结合蛋白。
Nature. 2022 May;605(7910):551-560. doi: 10.1038/s41586-022-04654-9. Epub 2022 Mar 24.
3
AlphaFold Protein Structure Database: massively expanding the structural coverage of protein-sequence space with high-accuracy models.AlphaFold 蛋白质结构数据库:用高精度模型极大地扩展蛋白质序列空间的结构覆盖范围。
Genomics Proteomics Bioinformatics. 2024 May 9;22(1). doi: 10.1093/gpbjnl/qzae007.
4
Benchmarking antibody clustering methods using sequence, structural, and machine learning similarity measures for antibody discovery applications.使用序列、结构和机器学习相似性度量对抗体聚类方法进行基准测试,以用于抗体发现应用。
Front Mol Biosci. 2024 Mar 28;11:1352508. doi: 10.3389/fmolb.2024.1352508. eCollection 2024.
Nucleic Acids Res. 2022 Jan 7;50(D1):D439-D444. doi: 10.1093/nar/gkab1061.
4
Accurate prediction of protein structures and interactions using a three-track neural network.使用三轨神经网络准确预测蛋白质结构和相互作用。
Science. 2021 Aug 20;373(6557):871-876. doi: 10.1126/science.abj8754. Epub 2021 Jul 15.
5
Highly accurate protein structure prediction with AlphaFold.利用 AlphaFold 进行高精度蛋白质结构预测。
Nature. 2021 Aug;596(7873):583-589. doi: 10.1038/s41586-021-03819-2. Epub 2021 Jul 15.
6
Biological structure and function emerge from scaling unsupervised learning to 250 million protein sequences.生物结构和功能源于将无监督学习扩展到 2.5 亿个蛋白质序列。
Proc Natl Acad Sci U S A. 2021 Apr 13;118(15). doi: 10.1073/pnas.2016239118.
7
CoV-AbDab: the coronavirus antibody database.CoV-AbDab:冠状病毒抗体数据库。
Bioinformatics. 2021 May 5;37(5):734-735. doi: 10.1093/bioinformatics/btaa739.
8
Protein Family Classification from Scratch: A CNN Based Deep Learning Approach.从头开始的蛋白质家族分类:基于 CNN 的深度学习方法。
IEEE/ACM Trans Comput Biol Bioinform. 2021 Sep-Oct;18(5):1996-2007. doi: 10.1109/TCBB.2020.2966633. Epub 2021 Oct 8.
9
Deciphering interaction fingerprints from protein molecular surfaces using geometric deep learning.利用几何深度学习破译蛋白质分子表面的相互作用指纹。
Nat Methods. 2020 Feb;17(2):184-192. doi: 10.1038/s41592-019-0666-6. Epub 2019 Dec 9.
10
Antibody Structure and Function: The Basis for Engineering Therapeutics.抗体结构与功能:工程治疗学的基础。
Antibodies (Basel). 2019 Dec 3;8(4):55. doi: 10.3390/antib8040055.