• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

利用随机森林模型预测残基-残基接触。

Predicting residue-residue contacts using random forest models.

机构信息

Applied Bioinformatics Laboratory, The University of Kansas, Lawrence, KS 66047, USA.

出版信息

Bioinformatics. 2011 Dec 15;27(24):3379-84. doi: 10.1093/bioinformatics/btr579. Epub 2011 Oct 20.

DOI:10.1093/bioinformatics/btr579
PMID:22016406
Abstract

MOTIVATION

Protein residue-residue contact prediction can be useful in predicting protein 3D structures. Current algorithms for such a purpose leave room for improvement.

RESULTS

We develop ProC_S3, a set of Random Forest algorithm-based models, for predicting residue-residue contact maps. The models are constructed based on a collection of 1490 non-redundant, high-resolution protein structures using >1280 sequence-based features. A new amino acid residue contact propensity matrix and a new set of seven amino acid groups based on contact preference are developed and used in ProC_S3. ProC_S3 delivers a 3-fold cross-validated accuracy of 26.9% with coverage of 4.7% for top L/5 predictions (L is the number of residues in a protein) of long-range contacts (sequence separation ≥24). Further benchmark tests deliver an accuracy of 29.7% and coverage of 5.6% for an independent set of 329 proteins. In the recently completed Ninth Community Wide Experiment on the Critical Assessment of Techniques for Protein Structure Prediction (CASP9), ProC_S3 is ranked as No. 1, No. 3, and No. 2 accuracies in the top L/5, L/10 and best 5 predictions of long-range contacts, respectively, among 18 automatic prediction servers.

AVAILABILITY

http://www.abl.ku.edu/proc/proc_s3.html.

CONTACT

jwfang@ku.edu

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

动机

蛋白质残基残基接触预测可用于预测蛋白质 3D 结构。目前用于此目的的算法还有改进的空间。

结果

我们开发了 ProC_S3,这是一组基于随机森林算法的模型,用于预测残基残基接触图。这些模型是基于 1490 个非冗余、高分辨率蛋白质结构和>1280 个基于序列的特征构建的。开发了新的氨基酸残基接触倾向矩阵和基于接触偏好的新的七组氨基酸,并在 ProC_S3 中使用。ProC_S3 在 3 倍交叉验证中的准确率为 26.9%,覆盖率为 4.7%,对于长程接触(序列间隔≥24)的前 L/5 预测(L 是蛋白质中残基的数量)。进一步的基准测试在一组独立的 329 个蛋白质中提供了 29.7%的准确率和 5.6%的覆盖率。在最近完成的第九届蛋白质结构预测技术关键评估(CASP9)的社区广泛实验中,ProC_S3 在长程接触的前 L/5、L/10 和最佳 5 预测的准确率排名中分别位列第一、第三和第二,在 18 个自动预测服务器中。

可用性

http://www.abl.ku.edu/proc/proc_s3.html。

联系方式

jwfang@ku.edu。

补充信息

补充数据可在 Bioinformatics 在线获得。

相似文献

1
Predicting residue-residue contacts using random forest models.利用随机森林模型预测残基-残基接触。
Bioinformatics. 2011 Dec 15;27(24):3379-84. doi: 10.1093/bioinformatics/btr579. Epub 2011 Oct 20.
2
Predicting protein residue-residue contacts using random forests and deep networks.利用随机森林和深度网络预测蛋白质残基-残基接触。
BMC Bioinformatics. 2019 Mar 14;20(Suppl 2):100. doi: 10.1186/s12859-019-2627-6.
3
Identification of residue pairing in interacting β-strands from a predicted residue contact map.从预测的残基接触图中鉴定相互作用的β-折叠中的残基对。
BMC Bioinformatics. 2018 Apr 19;19(1):146. doi: 10.1186/s12859-018-2150-1.
4
Deep architectures for protein contact map prediction.用于蛋白质接触图预测的深度架构。
Bioinformatics. 2012 Oct 1;28(19):2449-57. doi: 10.1093/bioinformatics/bts475. Epub 2012 Jul 30.
5
Improving accuracy of protein contact prediction using balanced network deconvolution.利用平衡网络去卷积提高蛋白质接触预测的准确性。
Proteins. 2015 Mar;83(3):485-96. doi: 10.1002/prot.24744. Epub 2015 Jan 24.
6
CONFOLD: Residue-residue contact-guided ab initio protein folding.CONFOLD:基于残基-残基接触引导的从头算蛋白质折叠。
Proteins. 2015 Aug;83(8):1436-49. doi: 10.1002/prot.24829. Epub 2015 Jun 6.
7
R2C: improving ab initio residue contact map prediction using dynamic fusion strategy and Gaussian noise filter.R2C:使用动态融合策略和高斯噪声滤波器改进从头开始的残基接触图预测。
Bioinformatics. 2016 Aug 15;32(16):2435-43. doi: 10.1093/bioinformatics/btw181. Epub 2016 Apr 10.
8
Predicting residue-residue contact maps by a two-layer, integrated neural-network method.通过一种双层集成神经网络方法预测残基-残基接触图。
Proteins. 2009 Jul;76(1):176-83. doi: 10.1002/prot.22329.
9
KScons: a Bayesian approach for protein residue contact prediction using the knob-socket model of protein tertiary structure.KScons:一种使用蛋白质三级结构的旋钮-插座模型进行蛋白质残基接触预测的贝叶斯方法。
Bioinformatics. 2016 Dec 15;32(24):3774-3781. doi: 10.1093/bioinformatics/btw553. Epub 2016 Aug 24.
10
A two-stage approach for improved prediction of residue contact maps.一种用于改进残基接触图预测的两阶段方法。
BMC Bioinformatics. 2006 Mar 30;7:180. doi: 10.1186/1471-2105-7-180.

引用本文的文献

1
Deep learning methods for 3D structural proteome and interactome modeling.深度学习方法在 3D 结构蛋白质组学和互作组学建模中的应用。
Curr Opin Struct Biol. 2022 Apr;73:102329. doi: 10.1016/j.sbi.2022.102329. Epub 2022 Feb 6.
2
Predicting protein residue-residue contacts using random forests and deep networks.利用随机森林和深度网络预测蛋白质残基-残基接触。
BMC Bioinformatics. 2019 Mar 14;20(Suppl 2):100. doi: 10.1186/s12859-019-2627-6.
3
Forecasting residue-residue contact prediction accuracy.预测残差-残基接触预测精度。
Bioinformatics. 2017 Nov 1;33(21):3405-3414. doi: 10.1093/bioinformatics/btx416.
4
Finding the needle in the haystack: towards solving the protein-folding problem computationally.在干草堆中找针:用计算的方法解决蛋白质折叠问题。
Crit Rev Biochem Mol Biol. 2018 Feb;53(1):1-28. doi: 10.1080/10409238.2017.1380596. Epub 2017 Oct 4.
5
RRCRank: a fusion method using rank strategy for residue-residue contact prediction.RRCRank:一种使用排序策略进行残基-残基接触预测的融合方法。
BMC Bioinformatics. 2017 Sep 2;18(1):390. doi: 10.1186/s12859-017-1811-9.
6
Elastic network model of learned maintained contacts to predict protein motion.用于预测蛋白质运动的学习维持接触的弹性网络模型。
PLoS One. 2017 Aug 30;12(8):e0183889. doi: 10.1371/journal.pone.0183889. eCollection 2017.
7
EPSILON-CP: using deep learning to combine information from multiple sources for protein contact prediction.EPSILON-CP:利用深度学习整合多源信息进行蛋白质接触预测。
BMC Bioinformatics. 2017 Jun 17;18(1):303. doi: 10.1186/s12859-017-1713-x.
8
In silico identification of enhancers on the basis of a combination of transcription factor binding motif occurrences.基于转录因子结合基序出现情况的组合对增强子进行计算机识别。
Sci Rep. 2016 Sep 1;6:32476. doi: 10.1038/srep32476.
9
OMPcontact: An Outer Membrane Protein Inter-Barrel Residue Contact Prediction Method.OMPcontact:一种外膜蛋白跨桶残基接触预测方法。
J Comput Biol. 2017 Mar;24(3):217-228. doi: 10.1089/cmb.2015.0236. Epub 2016 Aug 11.
10
Protein Residue Contacts and Prediction Methods.蛋白质残基接触与预测方法
Methods Mol Biol. 2016;1415:463-76. doi: 10.1007/978-1-4939-3572-7_24.