• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

利用《结构域百科全书》探索蛋白质宇宙中的结构多样性。

Exploring structural diversity across the protein universe with The Encyclopedia of Domains.

机构信息

Department of Computer Science, University College London, London WC1E 6BT, UK.

Institute of Structural and Molecular Biology, University College London, London WC1E 6BT, UK.

出版信息

Science. 2024 Nov;386(6721):eadq4946. doi: 10.1126/science.adq4946. Epub 2024 Nov 1.

DOI:10.1126/science.adq4946
PMID:39480926
Abstract

The AlphaFold Protein Structure Database (AFDB) contains more than 214 million predicted protein structures composed of domains, which are independently folding units found in multiple structural and functional contexts. Identifying domains can enable many functional and evolutionary analyses but has remained challenging because of the sheer scale of the data. Using deep learning methods, we have detected and classified every domain in the AFDB, producing The Encyclopedia of Domains. We detected nearly 365 million domains, over 100 million more than can be found by sequence methods, covering more than 1 million taxa. Reassuringly, 77% of the nonredundant domains are similar to known superfamilies, greatly expanding representation of their domain space. We uncovered more than 10,000 new structural interactions between superfamilies and thousands of new folds across the fold space continuum.

摘要

AlphaFold 蛋白质结构数据库 (AFDB) 包含超过 2.14 亿个由结构域组成的预测蛋白质结构,这些结构域是在多种结构和功能背景下独立折叠的单元。鉴定结构域可以实现许多功能和进化分析,但由于数据规模庞大,一直具有挑战性。我们使用深度学习方法,在 AFDB 中检测和分类了每一个结构域,生成了结构域百科全书。我们检测到近 3.65 亿个结构域,比序列方法多 1 亿多个,涵盖了超过 100 万个分类单元。令人放心的是,77%的非冗余结构域与已知的超家族相似,极大地扩展了它们的结构域空间的代表性。我们发现了超家族之间 10000 多个新的结构相互作用和折叠空间连续体上千个新的折叠。

相似文献

1
Exploring structural diversity across the protein universe with The Encyclopedia of Domains.利用《结构域百科全书》探索蛋白质宇宙中的结构多样性。
Science. 2024 Nov;386(6721):eadq4946. doi: 10.1126/science.adq4946. Epub 2024 Nov 1.
2
CATH 2024: CATH-AlphaFlow Doubles the Number of Structures in CATH and Reveals Nearly 200 New Folds.CATH 2024:CATH-AlphaFlow 将 CATH 中的结构数量增加了一倍,并揭示了近 200 个新结构折叠类型。
J Mol Biol. 2024 Sep 1;436(17):168551. doi: 10.1016/j.jmb.2024.168551. Epub 2024 Mar 27.
3
DPAM-AI: a domain parser for AlphaFold models powered by artificial intelligence.DPAM-AI:一种由人工智能驱动的AlphaFold模型的结构域解析器。
Bioinformatics. 2024 Dec 26;41(1). doi: 10.1093/bioinformatics/btae740.
4
CATH v4.4: major expansion of CATH by experimental and predicted structural data.CATH v4.4:通过实验和预测结构数据对CATH进行重大扩展。
Nucleic Acids Res. 2025 Jan 6;53(D1):D348-D355. doi: 10.1093/nar/gkae1087.
5
Bridging the Gap between Sequence and Structure Classifications of Proteins with AlphaFold Models.利用 AlphaFold 模型弥合蛋白质序列和结构分类之间的差距。
J Mol Biol. 2024 Nov 15;436(22):168764. doi: 10.1016/j.jmb.2024.168764. Epub 2024 Aug 26.
6
The CATH hierarchy revisited-structural divergence in domain superfamilies and the continuity of fold space.重新审视 CATH 层次结构——结构域超家族中的差异以及折叠空间的连续性。
Structure. 2009 Aug 12;17(8):1051-62. doi: 10.1016/j.str.2009.06.015.
7
Uncovering new families and folds in the natural protein universe.揭示自然蛋白质宇宙中的新家族和新折叠。
Nature. 2023 Oct;622(7983):646-653. doi: 10.1038/s41586-023-06622-3. Epub 2023 Sep 13.
8
Exploring dynamics of protein structure determination and homology-based prediction to estimate the number of superfamilies and folds.探索蛋白质结构测定和基于同源性预测的动力学,以估计超家族和折叠的数量。
BMC Struct Biol. 2006 Mar 20;6:6. doi: 10.1186/1472-6807-6-6.
9
ECOD: integrating classifications of protein domains from experimental and predicted structures.ECOD:整合来自实验结构和预测结构的蛋白质结构域分类
Nucleic Acids Res. 2025 Jan 6;53(D1):D411-D418. doi: 10.1093/nar/gkae1029.
10
A galaxy of folds.一片褶皱的星系。
Protein Sci. 2010 Jan;19(1):124-30. doi: 10.1002/pro.297.

引用本文的文献

1
TRPtracker: a community database for monitoring praziquantel sensitivity at TRPM variants.TRPtracker:一个用于监测TRPM变体对吡喹酮敏感性的社区数据库。
bioRxiv. 2025 Aug 27:2025.08.27.671753. doi: 10.1101/2025.08.27.671753.
2
Functional (re)annotation of proteome using integrative sequence and AI-based structural approaches.使用整合序列和基于人工智能的结构方法对蛋白质组进行功能(重新)注释。
Curr Res Struct Biol. 2025 Aug 6;10:100172. doi: 10.1016/j.crstbi.2025.100172. eCollection 2025 Dec.
3
Large protein databases reveal structural complementarity and functional locality.
大型蛋白质数据库揭示了结构互补性和功能局部性。
Nat Commun. 2025 Aug 25;16(1):7925. doi: 10.1038/s41467-025-63250-3.
4
Piecing Together the History of Protein Folds From a Fragmented Evolutionary Record.从碎片化的进化记录中拼凑蛋白质折叠的历史
Genome Biol Evol. 2025 Jul 30;17(8). doi: 10.1093/gbe/evaf148.
5
DrugDomain 2.0: comprehensive database of protein domains-ligands/drugs interactions across the whole Protein Data Bank.DrugDomain 2.0:涵盖整个蛋白质数据库中蛋白质结构域与配体/药物相互作用的综合数据库。
bioRxiv. 2025 Jul 7:2025.07.03.663025. doi: 10.1101/2025.07.03.663025.
6
The role of metabolism in shaping enzyme structures over 400 million years.新陈代谢在塑造超过4亿年的酶结构过程中的作用。
Nature. 2025 Jul 9. doi: 10.1038/s41586-025-09205-6.
7
A self-assembling surface layer flattens the cytokinetic furrow to aid cell division in an archaeon.一种自组装表面层使细胞分裂沟变平,以辅助古菌中的细胞分裂。
Proc Natl Acad Sci U S A. 2025 Jun 24;122(25):e2501044122. doi: 10.1073/pnas.2501044122. Epub 2025 Jun 18.
8
Genome-Wide Identification of the Gene Family in Bunge and Its Expression Analysis Under Fire Blight Stress.沙冬青中 基因家族的全基因组鉴定及其在火疫病胁迫下的表达分析。
Int J Mol Sci. 2025 May 24;26(11):5074. doi: 10.3390/ijms26115074.
9
LucaPCycle: Illuminating microbial phosphorus cycling in deep-sea cold seep sediments using protein language models.卢卡磷循环:利用蛋白质语言模型揭示深海冷泉沉积物中的微生物磷循环
Nat Commun. 2025 May 26;16(1):4862. doi: 10.1038/s41467-025-60142-4.
10
3-D substructure search by transitive closure in AlphaFold database.通过传递闭包在AlphaFold数据库中进行三维子结构搜索。
Protein Sci. 2025 Jun;34(6):e70169. doi: 10.1002/pro.70169.