• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

使用模拟进化训练的隐马尔可夫模型识别β结构基序。

Recognition of beta-structural motifs using hidden Markov models trained with simulated evolution.

机构信息

Department of Computer Science, Tufts University, Medford, MA, USA.

出版信息

Bioinformatics. 2010 Jun 15;26(12):i287-93. doi: 10.1093/bioinformatics/btq199.

DOI:10.1093/bioinformatics/btq199
PMID:20529918
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC2881384/
Abstract

MOTIVATION

One of the most successful methods to date for recognizing protein sequences that are evolutionarily related, has been profile hidden Markov models. However, these models do not capture pairwise statistical preferences of residues that are hydrogen bonded in beta-sheets. We thus explore methods for incorporating pairwise dependencies into these models.

RESULTS

We consider the remote homology detection problem for beta-structural motifs. In particular, we ask if a statistical model trained on members of only one family in a SCOP beta-structural superfamily, can recognize members of other families in that superfamily. We show that HMMs trained with our pairwise model of simulated evolution achieve nearly a median 5% improvement in AUC for beta-structural motif recognition as compared to ordinary HMMs.

AVAILABILITY

All datasets and HMMs are available at: http://bcb.cs.tufts.edu/pairwise/.

摘要

动机

迄今为止,用于识别进化相关蛋白质序列的最成功方法之一是轮廓隐马尔可夫模型。然而,这些模型无法捕获β-折叠中氢键结合的残基的成对统计偏好。因此,我们探索了将成对相关性纳入这些模型的方法。

结果

我们考虑了β-结构基序的远程同源检测问题。具体来说,我们询问一个仅在 SCOP β-结构超家族中的一个家族成员上训练的统计模型,是否可以识别该超家族中的其他家族成员。我们表明,与普通隐马尔可夫模型相比,使用我们的模拟进化成对模型训练的隐马尔可夫模型在β-结构基序识别方面的 AUC 几乎提高了 5%。

可利用性

所有数据集和隐马尔可夫模型均可在以下网址获得:http://bcb.cs.tufts.edu/pairwise/。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/44c9/2881384/4a4a116fbfb3/btq199f8.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/44c9/2881384/1b3956fefc80/btq199f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/44c9/2881384/01a31cc11441/btq199f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/44c9/2881384/8b9e16e20da7/btq199f3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/44c9/2881384/49cac2545db7/btq199f4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/44c9/2881384/ce905bca1ab7/btq199f5.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/44c9/2881384/bea504e74498/btq199f6.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/44c9/2881384/d63ceac906b8/btq199f7.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/44c9/2881384/4a4a116fbfb3/btq199f8.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/44c9/2881384/1b3956fefc80/btq199f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/44c9/2881384/01a31cc11441/btq199f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/44c9/2881384/8b9e16e20da7/btq199f3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/44c9/2881384/49cac2545db7/btq199f4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/44c9/2881384/ce905bca1ab7/btq199f5.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/44c9/2881384/bea504e74498/btq199f6.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/44c9/2881384/d63ceac906b8/btq199f7.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/44c9/2881384/4a4a116fbfb3/btq199f8.jpg

相似文献

1
Recognition of beta-structural motifs using hidden Markov models trained with simulated evolution.使用模拟进化训练的隐马尔可夫模型识别β结构基序。
Bioinformatics. 2010 Jun 15;26(12):i287-93. doi: 10.1093/bioinformatics/btq199.
2
SMURFLite: combining simplified Markov random fields with simulated evolution improves remote homology detection for beta-structural proteins into the twilight zone.SMURFLite:将简化的马尔可夫随机场与模拟进化相结合,可提高β结构蛋白远程同源检测的进入黄昏区的性能。
Bioinformatics. 2012 May 1;28(9):1216-22. doi: 10.1093/bioinformatics/bts110. Epub 2012 Mar 9.
3
Augmented training of hidden Markov models to recognize remote homologs via simulated evolution.通过模拟进化对隐马尔可夫模型进行增强训练以识别远缘同源物。
Bioinformatics. 2009 Jul 1;25(13):1602-8. doi: 10.1093/bioinformatics/btp265. Epub 2009 Apr 23.
4
MRFy: Remote Homology Detection for Beta-Structural Proteins Using Markov Random Fields and Stochastic Search.MRFy:使用马尔可夫随机场和随机搜索对β结构蛋白进行远程同源性检测
IEEE/ACM Trans Comput Biol Bioinform. 2015 Jan-Feb;12(1):4-16. doi: 10.1109/TCBB.2014.2344682.
5
Assignment of homology to genome sequences using a library of hidden Markov models that represent all proteins of known structure.使用代表所有已知结构蛋白质的隐马尔可夫模型库将同源性分配给基因组序列。
J Mol Biol. 2001 Nov 2;313(4):903-19. doi: 10.1006/jmbi.2001.5080.
6
A network of SCOP hidden Markov models and its analysis.SCOP 隐马尔可夫模型网络及其分析。
BMC Bioinformatics. 2011 May 23;12:191. doi: 10.1186/1471-2105-12-191.
7
Accurate domain identification with structure-anchored hidden Markov models, saHMMs.基于结构锚定隐马尔可夫模型(saHMMs)的精确领域识别。
Proteins. 2009 Aug 1;76(2):343-52. doi: 10.1002/prot.22349.
8
FORESST: fold recognition from secondary structure predictions of proteins.FORESST:基于蛋白质二级结构预测的折叠识别
Bioinformatics. 1999 Feb;15(2):131-40. doi: 10.1093/bioinformatics/15.2.131.
9
Meta-MEME: motif-based hidden Markov models of protein families.Meta-MEME:基于模体的蛋白质家族隐马尔可夫模型
Comput Appl Biosci. 1997 Aug;13(4):397-406. doi: 10.1093/bioinformatics/13.4.397.
10
Protein homology detection by HMM-HMM comparison.通过隐马尔可夫模型(HMM)比较进行蛋白质同源性检测。
Bioinformatics. 2005 Apr 1;21(7):951-60. doi: 10.1093/bioinformatics/bti125. Epub 2004 Nov 5.

引用本文的文献

1
Discriminative motif discovery via simulated evolution and random under-sampling.通过模拟进化和随机欠采样进行判别基序发现
PLoS One. 2014 Feb 13;9(2):e87670. doi: 10.1371/journal.pone.0087670. eCollection 2014.
2
Compressive genomics for protein databases.基于压缩的基因组学蛋白质数据库。
Bioinformatics. 2013 Jul 1;29(13):i283-90. doi: 10.1093/bioinformatics/btt214.
3
LASAGNA: a novel algorithm for transcription factor binding site alignment.LASAGNA:一种用于转录因子结合位点比对的新算法。

本文引用的文献

1
Markov random fields reveal an N-terminal double beta-propeller motif as part of a bacterial hybrid two-component sensor system.马科夫随机场揭示了一种 N 端双 β-发夹模体,作为细菌混合双组分传感器系统的一部分。
Proc Natl Acad Sci U S A. 2010 Mar 2;107(9):4069-74. doi: 10.1073/pnas.0909950107. Epub 2010 Feb 10.
2
Conditional graphical models for protein structural motif recognition.用于蛋白质结构基序识别的条件图形模型。
J Comput Biol. 2009 May;16(5):639-57. doi: 10.1089/cmb.2008.0176.
3
Computational protein design as a tool for fold recognition.
BMC Bioinformatics. 2013 Mar 24;14:108. doi: 10.1186/1471-2105-14-108.
4
Formatt: Correcting protein multiple structural alignments by incorporating sequence alignment.格式:通过结合序列比对来校正蛋白质多重结构比对。
BMC Bioinformatics. 2012 Oct 6;13:259. doi: 10.1186/1471-2105-13-259.
5
A computational framework for boosting confidence in high-throughput protein-protein interaction datasets.一种用于增强对高通量蛋白质-蛋白质相互作用数据集信心的计算框架。
Genome Biol. 2012 Aug 31;13(8):R76. doi: 10.1186/gb-2012-13-8-r76.
6
An amino acid packing code for α-helical structure and protein design.氨基酸α-螺旋结构的包装码和蛋白质设计。
J Mol Biol. 2012 Jun 8;419(3-4):234-54. doi: 10.1016/j.jmb.2012.03.004. Epub 2012 Mar 15.
7
SMURFLite: combining simplified Markov random fields with simulated evolution improves remote homology detection for beta-structural proteins into the twilight zone.SMURFLite:将简化的马尔可夫随机场与模拟进化相结合,可提高β结构蛋白远程同源检测的进入黄昏区的性能。
Bioinformatics. 2012 May 1;28(9):1216-22. doi: 10.1093/bioinformatics/bts110. Epub 2012 Mar 9.
计算蛋白质设计作为一种折叠识别工具。
Proteins. 2009 Oct;77(1):139-58. doi: 10.1002/prot.22426.
4
Augmented training of hidden Markov models to recognize remote homologs via simulated evolution.通过模拟进化对隐马尔可夫模型进行增强训练以识别远缘同源物。
Bioinformatics. 2009 Jul 1;25(13):1602-8. doi: 10.1093/bioinformatics/btp265. Epub 2009 Apr 23.
5
BETASCAN: probable beta-amyloids identified by pairwise probabilistic analysis.BETASCAN:通过成对概率分析识别出的可能的β-淀粉样蛋白。
PLoS Comput Biol. 2009 Mar;5(3):e1000333. doi: 10.1371/journal.pcbi.1000333. Epub 2009 Mar 27.
6
A probabilistic model of local sequence alignment that simplifies statistical significance estimation.一种简化统计显著性估计的局部序列比对概率模型。
PLoS Comput Biol. 2008 May 30;4(5):e1000069. doi: 10.1371/journal.pcbi.1000069.
7
Matt: local flexibility aids protein multiple structure alignment.马特:局部灵活性有助于蛋白质多结构比对。
PLoS Comput Biol. 2008 Jan;4(1):e10. doi: 10.1371/journal.pcbi.0040010.
8
ROC analysis: applications to the classification of biological sequences and 3D structures.ROC分析:在生物序列和三维结构分类中的应用
Brief Bioinform. 2008 May;9(3):198-209. doi: 10.1093/bib/bbm064. Epub 2008 Jan 11.
9
Modeling ensembles of transmembrane beta-barrel proteins.跨膜β桶状蛋白的模型集成
Proteins. 2008 May 15;71(3):1097-112. doi: 10.1002/prot.21788.
10
The SUPERFAMILY database in 2007: families and functions.2007年的超家族数据库:家族与功能
Nucleic Acids Res. 2007 Jan;35(Database issue):D308-13. doi: 10.1093/nar/gkl910. Epub 2006 Nov 10.