• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

蛋白质结构域的重复和顺序可以增强对蛋白质功能的预测。

Protein domain recurrence and order can enhance prediction of protein functions.

机构信息

Mathematical and Computer Sciences and Engineering Division, King Abdullah University of Science and Technology, Thuwal, 23955-6900, Saudi Arabia.

出版信息

Bioinformatics. 2012 Sep 15;28(18):i444-i450. doi: 10.1093/bioinformatics/bts398.

DOI:10.1093/bioinformatics/bts398
PMID:22962465
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC3436825/
Abstract

MOTIVATION

Burgeoning sequencing technologies have generated massive amounts of genomic and proteomic data. Annotating the functions of proteins identified in this data has become a big and crucial problem. Various computational methods have been developed to infer the protein functions based on either the sequences or domains of proteins. The existing methods, however, ignore the recurrence and the order of the protein domains in this function inference.

RESULTS

We developed two new methods to infer protein functions based on protein domain recurrence and domain order. Our first method, DRDO, calculates the posterior probability of the Gene Ontology terms based on domain recurrence and domain order information, whereas our second method, DRDO-NB, relies on the naïve Bayes methodology using the same domain architecture information. Our large-scale benchmark comparisons show strong improvements in the accuracy of the protein function inference achieved by our new methods, demonstrating that domain recurrence and order can provide important information for inference of protein functions.

AVAILABILITY

The new models are provided as open source programs at http://sfb.kaust.edu.sa/Pages/Software.aspx.

CONTACT

dkihara@cs.purdue.edu, xin.gao@kaust.edu.sa

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics Online.

摘要

动机

蓬勃发展的测序技术产生了大量的基因组和蛋白质组数据。注释在这些数据中发现的蛋白质的功能已成为一个大而关键的问题。已经开发了各种计算方法来基于蛋白质的序列或结构域来推断蛋白质的功能。然而,现有的方法忽略了蛋白质功能推断中蛋白质结构域的重现和顺序。

结果

我们开发了两种基于蛋白质结构域重现和结构域顺序推断蛋白质功能的新方法。我们的第一个方法 DRDO,基于结构域重现和结构域顺序信息计算基因本体术语的后验概率,而我们的第二个方法 DRDO-NB,则依赖于使用相同结构域体系结构信息的朴素贝叶斯方法。我们的大规模基准比较显示,我们的新方法在蛋白质功能推断的准确性方面取得了显著提高,表明结构域重现和顺序可以为蛋白质功能推断提供重要信息。

可用性

新模型作为开源程序在 http://sfb.kaust.edu.sa/Pages/Software.aspx 提供。

联系方式

dkihara@cs.purdue.edu,xin.gao@kaust.edu.sa

补充信息

补充数据可在 Bioinformatics Online 上获得。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/c3b6/3436825/fb833053f872/bts398f5.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/c3b6/3436825/6a53d7886b05/bts398f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/c3b6/3436825/37493f9fc764/bts398f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/c3b6/3436825/ab0707853adc/bts398f3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/c3b6/3436825/ccd022f93329/bts398f4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/c3b6/3436825/fb833053f872/bts398f5.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/c3b6/3436825/6a53d7886b05/bts398f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/c3b6/3436825/37493f9fc764/bts398f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/c3b6/3436825/ab0707853adc/bts398f3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/c3b6/3436825/ccd022f93329/bts398f4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/c3b6/3436825/fb833053f872/bts398f5.jpg

相似文献

1
Protein domain recurrence and order can enhance prediction of protein functions.蛋白质结构域的重复和顺序可以增强对蛋白质功能的预测。
Bioinformatics. 2012 Sep 15;28(18):i444-i450. doi: 10.1093/bioinformatics/bts398.
2
CMsearch: simultaneous exploration of protein sequence space and structure space improves not only protein homology detection but also protein structure prediction.CMsearch:同时探索蛋白质序列空间和结构空间不仅能改善蛋白质同源性检测,还能提升蛋白质结构预测。
Bioinformatics. 2016 Jun 15;32(12):i332-i340. doi: 10.1093/bioinformatics/btw271.
3
DeepGO: predicting protein functions from sequence and interactions using a deep ontology-aware classifier.DeepGO:使用深度本体感知分类器从序列和相互作用预测蛋白质功能。
Bioinformatics. 2018 Feb 15;34(4):660-668. doi: 10.1093/bioinformatics/btx624.
4
SECOM: a novel hash seed and community detection based-approach for genome-scale protein domain identification.SECOM:一种基于新型哈希种子和社区检测的全基因组蛋白质结构域识别方法。
PLoS One. 2012;7(6):e39475. doi: 10.1371/journal.pone.0039475. Epub 2012 Jun 28.
5
WaVPeak: picking NMR peaks through wavelet-based smoothing and volume-based filtering.WaVPeak:基于小波平滑和基于体积的滤波的 NMR 峰提取。
Bioinformatics. 2012 Apr 1;28(7):914-20. doi: 10.1093/bioinformatics/bts078. Epub 2012 Feb 10.
6
Domain prediction with probabilistic directional context.基于概率性方向上下文的域预测
Bioinformatics. 2017 Aug 15;33(16):2471-2478. doi: 10.1093/bioinformatics/btx221.
7
Gracob: a novel graph-based constant-column biclustering method for mining growth phenotype data.格拉科布:一种用于挖掘生长表型数据的基于图的新型恒定列双聚类方法。
Bioinformatics. 2017 Aug 15;33(16):2523-2531. doi: 10.1093/bioinformatics/btx199.
8
FuncPatch: a web server for the fast Bayesian inference of conserved functional patches in protein 3D structures.FuncPatch:一个用于快速贝叶斯推断蛋白质 3D 结构中保守功能斑块的网络服务器。
Bioinformatics. 2015 Feb 15;31(4):523-31. doi: 10.1093/bioinformatics/btu673. Epub 2014 Oct 15.
9
A naive Bayes model to predict coupling between seven transmembrane domain receptors and G-proteins.一种用于预测七跨膜结构域受体与G蛋白之间偶联的朴素贝叶斯模型。
Bioinformatics. 2003 Jan 22;19(2):234-40. doi: 10.1093/bioinformatics/19.2.234.
10
PANDA: Protein function prediction using domain architecture and affinity propagation.PANDA:基于结构域和亲和传播的蛋白质功能预测。
Sci Rep. 2018 Feb 22;8(1):3484. doi: 10.1038/s41598-018-21849-1.

引用本文的文献

1
Domain-PFP allows protein function prediction using function-aware domain embedding representations.域-PFP 使用感知功能的域嵌入表示来进行蛋白质功能预测。
Commun Biol. 2023 Oct 31;6(1):1103. doi: 10.1038/s42003-023-05476-9.
2
Domain-PFP: Protein Function Prediction Using Function-Aware Domain Embedding Representations.领域-蛋白质功能预测:使用功能感知领域嵌入表示进行蛋白质功能预测。
bioRxiv. 2023 Aug 24:2023.08.23.554486. doi: 10.1101/2023.08.23.554486.
3
FAS: assessing the similarity between proteins using multi-layered feature architectures.

本文引用的文献

1
Structure- and sequence-based function prediction for non-homologous proteins.基于结构和序列的非同源蛋白质功能预测
J Struct Funct Genomics. 2012 Jun;13(2):111-23. doi: 10.1007/s10969-012-9126-6. Epub 2012 Jan 22.
2
SUPERFAMILY 1.75 including a domain-centric gene ontology method.超家族1.75,包括一种以结构域为中心的基因本体方法。
Nucleic Acids Res. 2011 Jan;39(Database issue):D427-34. doi: 10.1093/nar/gkq1130. Epub 2010 Nov 9.
3
Real-time ligand binding pocket database search using local surface descriptors.使用局部表面描述符进行实时配体结合口袋数据库搜索。
FAS:使用多层特征架构评估蛋白质之间的相似性。
Bioinformatics. 2023 May 4;39(5). doi: 10.1093/bioinformatics/btad226.
4
Phylo-PFP: improved automated protein function prediction using phylogenetic distance of distantly related sequences.Phylo-PFP:利用远缘序列的系统发育距离改进自动化蛋白质功能预测。
Bioinformatics. 2019 Mar 1;35(5):753-759. doi: 10.1093/bioinformatics/bty704.
5
Missing gene identification using functional coherence scores.利用功能一致性评分进行缺失基因鉴定。
Sci Rep. 2016 Aug 24;6:31725. doi: 10.1038/srep31725.
6
CMsearch: simultaneous exploration of protein sequence space and structure space improves not only protein homology detection but also protein structure prediction.CMsearch:同时探索蛋白质序列空间和结构空间不仅能改善蛋白质同源性检测,还能提升蛋白质结构预测。
Bioinformatics. 2016 Jun 15;32(12):i332-i340. doi: 10.1093/bioinformatics/btw271.
7
UniProt-DAAC: domain architecture alignment and classification, a new method for automatic functional annotation in UniProtKB.UniProt-DAAC:结构域架构比对与分类,一种在UniProtKB中进行自动功能注释的新方法。
Bioinformatics. 2016 Aug 1;32(15):2264-71. doi: 10.1093/bioinformatics/btw114. Epub 2016 Mar 7.
8
PatchSurfers: Two methods for local molecular property-based binding ligand prediction.PatchSurfers:基于局部分子性质的两种结合配体预测方法。
Methods. 2016 Jan 15;93:41-50. doi: 10.1016/j.ymeth.2015.09.026. Epub 2015 Sep 30.
9
Domain similarity based orthology detection.基于结构域相似性的直系同源物检测。
BMC Bioinformatics. 2015 May 13;16:154. doi: 10.1186/s12859-015-0570-8.
10
DomSign: a top-down annotation pipeline to enlarge enzyme space in the protein universe.DomSign:一种自上而下的注释流程,用于拓展蛋白质世界中的酶空间。
BMC Bioinformatics. 2015 Mar 21;16:96. doi: 10.1186/s12859-015-0499-y.
Proteins. 2010 Jul;78(9):2007-28. doi: 10.1002/prot.22715.
4
Global sequence properties for superfamily prediction: a machine learning approach.用于超家族预测的全局序列特性:一种机器学习方法。
J Integr Bioinform. 2009 Aug 23;6(1):109. doi: 10.2390/biecoll-jib-2009-109.
5
Generation of new protein functions by nonhomologous combinations and rearrangements of domains and modules.通过结构域和模块的非同源组合和重排产生新的蛋白质功能。
Curr Opin Biotechnol. 2009 Aug;20(4):398-404. doi: 10.1016/j.copbio.2009.07.007. Epub 2009 Aug 21.
6
Semantic similarity in biomedical ontologies.生物医学本体中的语义相似性。
PLoS Comput Biol. 2009 Jul;5(7):e1000443. doi: 10.1371/journal.pcbi.1000443. Epub 2009 Jul 31.
7
ESG: extended similarity group method for automated protein function prediction.ESG:用于蛋白质功能自动预测的扩展相似性分组方法。
Bioinformatics. 2009 Jul 15;25(14):1739-45. doi: 10.1093/bioinformatics/btp309. Epub 2009 May 12.
8
Protein function prediction--the power of multiplicity.蛋白质功能预测——多样性的力量。
Trends Biotechnol. 2009 Apr;27(4):210-9. doi: 10.1016/j.tibtech.2009.01.002. Epub 2009 Feb 27.
9
A dual role for the adaptor protein DRK in Drosophila olfactory learning and memory.衔接蛋白DRK在果蝇嗅觉学习与记忆中的双重作用。
J Neurosci. 2009 Feb 25;29(8):2611-25. doi: 10.1523/JNEUROSCI.3670-08.2009.
10
Predicting protein function from domain content.从结构域组成预测蛋白质功能。
Bioinformatics. 2008 Aug 1;24(15):1681-7. doi: 10.1093/bioinformatics/btn312. Epub 2008 Jun 30.