• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

通过迭代序列比对鉴定蛋白质同源物和结构域边界

Identification of Protein Homologs and Domain Boundaries by Iterative Sequence Alignment.

作者信息

Schaeffer Dustin, Grishin Nick V

机构信息

Department of Biophysics, University of Texas Southwestern Medical Center, Dallas, TX, USA.

Howard Hughes Medical Institute, University of Texas Southwestern Medical Center, Dallas, TX, USA.

出版信息

Methods Mol Biol. 2019;1851:277-286. doi: 10.1007/978-1-4939-8736-8_15.

DOI:10.1007/978-1-4939-8736-8_15
PMID:30298403
Abstract

Evolutionary domains are protein regions with observable sequence similarity to other known domains. Here we describe how to use common sequence and profile alignment algorithms (i.e., BLAST, HHsearch) to delineate putative domains in novel protein sequences, given a reference library of protein domains. In this case, we use our database of evolutionary domains (ECOD) as a reference, but other domain sequence libraries could be used (e.g., SCOP, CATH). We describe our domain partition algorithm along with specific notes on how to avoid domain indexing errors when working with multiple data sources and software algorithms with differing outputs.

摘要

进化结构域是与其他已知结构域具有可观察到的序列相似性的蛋白质区域。在此,我们描述了在给定蛋白质结构域参考库的情况下,如何使用常见的序列和轮廓比对算法(即BLAST、HHsearch)来确定新蛋白质序列中的推定结构域。在这种情况下,我们使用我们的进化结构域数据库(ECOD)作为参考,但也可以使用其他结构域序列库(例如SCOP、CATH)。我们描述了我们的结构域划分算法,以及在使用具有不同输出的多个数据源和软件算法时如何避免结构域索引错误的具体注意事项。

相似文献

1
Identification of Protein Homologs and Domain Boundaries by Iterative Sequence Alignment.通过迭代序列比对鉴定蛋白质同源物和结构域边界
Methods Mol Biol. 2019;1851:277-286. doi: 10.1007/978-1-4939-8736-8_15.
2
ASH structure alignment package: sensitivity and selectivity in domain classification.ASH结构比对软件包:结构域分类中的敏感性和选择性
BMC Bioinformatics. 2007 Apr 4;8:116. doi: 10.1186/1471-2105-8-116.
3
ProClust: improved clustering of protein sequences with an extended graph-based approach.ProClust:基于扩展的图形方法改进蛋白质序列聚类
Bioinformatics. 2002;18 Suppl 2:S182-91. doi: 10.1093/bioinformatics/18.suppl_2.s182.
4
Protein homology detection by HMM-HMM comparison.通过隐马尔可夫模型(HMM)比较进行蛋白质同源性检测。
Bioinformatics. 2005 Apr 1;21(7):951-60. doi: 10.1093/bioinformatics/bti125. Epub 2004 Nov 5.
5
EVEREST: automatic identification and classification of protein domains in all protein sequences.EVEREST:对所有蛋白质序列中的蛋白质结构域进行自动识别和分类。
BMC Bioinformatics. 2006 Jun 2;7:277. doi: 10.1186/1471-2105-7-277.
6
Cross-over between discrete and continuous protein structure space: insights into automatic classification and networks of protein structures.离散与连续蛋白质结构空间之间的交叉:对蛋白质结构自动分类及网络的见解。
PLoS Comput Biol. 2009 Mar;5(3):e1000331. doi: 10.1371/journal.pcbi.1000331. Epub 2009 Mar 27.
7
Protein domain identification and improved sequence similarity searching using PSI-BLAST.使用PSI-BLAST进行蛋白质结构域鉴定及改进序列相似性搜索。
Proteins. 2002 Sep 1;48(4):672-81. doi: 10.1002/prot.10175.
8
CATHEDRAL: a fast and effective algorithm to predict folds and domain boundaries from multidomain protein structures.大教堂:一种从多结构域蛋白质结构预测折叠和结构域边界的快速有效算法。
PLoS Comput Biol. 2007 Nov;3(11):e232. doi: 10.1371/journal.pcbi.0030232.
9
SPIDER: software for protein identification from sequence tags with de novo sequencing error.SPIDER:用于从带有从头测序错误的序列标签中鉴定蛋白质的软件。
Proc IEEE Comput Syst Bioinform Conf. 2004:206-15. doi: 10.1109/csb.2004.1332434.
10
A sequence family database built on ECOD structural domains.基于 ECOD 结构域构建的序列家族数据库。
Bioinformatics. 2018 Sep 1;34(17):2997-3003. doi: 10.1093/bioinformatics/bty214.

引用本文的文献

1
Evolutionary and functional classification of the CARF domain superfamily, key sensors in prokaryotic antivirus defense.CARF 结构域超家族的进化和功能分类,原核抗病毒防御的关键传感器。
Nucleic Acids Res. 2020 Sep 18;48(16):8828-8847. doi: 10.1093/nar/gkaa635.