Suppr超能文献

通过 AlphaFold 生成一组高可信度的结构域-结构域界面类型集合,以指导蛋白质复合物结构预测。

Generation of a high confidence set of domain-domain interface types to guide protein complex structure predictions by AlphaFold.

机构信息

Institute of Molecular Biology (IMB) gGmbH, Mainz 55128, Germany.

3rd Medical Department, University Medical Center, Johannes Gutenberg University Mainz, Mainz 55131, Germany.

出版信息

Bioinformatics. 2024 Aug 2;40(8). doi: 10.1093/bioinformatics/btae482.

Abstract

MOTIVATION

While the release of AlphaFold (AF) represented a breakthrough for the prediction of protein complex structures, its sensitivity, especially when using full length protein sequences, still remains limited. Modeling success rates might increase if AF predictions were guided by likely interacting protein fragments. This approach requires available sets of highly confident protein-protein interface types. Computational resources, such as 3did, infer interacting globular domain types from observed contacts in protein structures. Assessing the accuracy of these predicted interface types is difficult because we lack hand-curated reference sets of verified domain-domain interface (DDI) types.

RESULTS

To improve protein complex modeling of DDIs by AF, we manually inspected 80 randomly selected DDI types from the 3did resource to generate a first reference set of DDI types. Identified cases of DDI type nonapproval (40%) primarily resulted from inaccurate Pfam domain matches, crystal contacts, and synthetic protein constructs. Using logistic regression, we predicted a subset of 2411 out of 5724 considered DDI types in 3did to be of high confidence, which we subsequently applied to 53 000 human-protein interactions to predict DDIs followed by AF modeling. We obtained highly confident AF models for 604 out of 1129 predicted DDIs. Of note, for 47% of them no confident AF structural model could be obtained using full length protein sequences.

AVAILABILITY AND IMPLEMENTATION

Code is available at https://github.com/KatjaLuckLab/DDI_manuscript.

摘要

动机

虽然 AlphaFold (AF) 的发布代表了蛋白质复合物结构预测的突破,但它的灵敏度,尤其是在使用全长蛋白质序列时,仍然有限。如果 AF 预测能够得到可能相互作用的蛋白质片段的指导,建模成功率可能会提高。这种方法需要可用的高度置信的蛋白质-蛋白质界面类型集。计算资源,如 3did,从蛋白质结构中的观察到的接触推断出相互作用的球状结构域类型。评估这些预测的界面类型的准确性是困难的,因为我们缺乏经过手工整理的已验证的域-域界面 (DDI) 类型的参考集。

结果

为了通过 AF 改进 DDIs 的蛋白质复合物建模,我们手动检查了 3did 资源中随机选择的 80 个 DDI 类型,以生成 DDI 类型的第一个参考集。DDI 类型不被批准的情况(40%)主要是由于 Pfam 结构域匹配、晶体接触和合成蛋白质结构不准确造成的。使用逻辑回归,我们预测了 3did 中考虑的 5724 个 DDI 类型中的 2411 个子集具有高度置信度,随后我们将其应用于 53000 个人-蛋白质相互作用,以预测 DDIs,然后进行 AF 建模。我们对预测的 1129 个 DDIs 中的 604 个获得了高度置信的 AF 模型。值得注意的是,对于其中的 47%,使用全长蛋白质序列无法获得可靠的 AF 结构模型。

可用性和实现

代码可在 https://github.com/KatjaLuckLab/DDI_manuscript 获得。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/2e11/11361816/4d552a130637/btae482f1.jpg

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验