• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

一种蛋白质序列间新的相似性度量方法。

A new similarity measure among protein sequences.

作者信息

Wu Kuen-Pin, Lin Hsin-Nan, Sung Ting-Yi, Hsu Wen-Lian

机构信息

Institute of Information Sciences, Academia Sinica, Taipei, 115, Taiwan.

出版信息

Proc IEEE Comput Soc Bioinform Conf. 2003;2:347-52.

PMID:16452810
Abstract

Protein sequence analysis is an important tool to decode the logic of life. One of the most important similarity measures in this area is the edit distance between amino acids of two sequences. We believe this criterion should be reconsidered because protein features are probably associated more with small peptide fragments than with individual amino acids. In this paper, we design small patterns that are associated with highly conversed regions among a set of protein sequences. These patterns are used analogous to the index terms in information retrieval. Therefore, we do not consider gaps within patterns. This new similarity measure has been applied to phylogenetic tree construction, protein clustering and protein secondary structure prediction and has produced promising results.

摘要

蛋白质序列分析是解读生命逻辑的一项重要工具。该领域最重要的相似性度量之一是两条序列氨基酸之间的编辑距离。我们认为这一标准应该重新审视,因为蛋白质特征可能与小肽片段的关联度更高,而非单个氨基酸。在本文中,我们设计了与一组蛋白质序列中高度保守区域相关的小模式。这些模式类似于信息检索中的索引词那样使用。因此,我们不考虑模式内的空位。这种新的相似性度量已应用于系统发育树构建、蛋白质聚类和蛋白质二级结构预测,并取得了有前景的结果。

相似文献

1
A new similarity measure among protein sequences.一种蛋白质序列间新的相似性度量方法。
Proc IEEE Comput Soc Bioinform Conf. 2003;2:347-52.
2
Towards automatic clustering of protein sequences.迈向蛋白质序列的自动聚类
Proc IEEE Comput Soc Bioinform Conf. 2002;1:175-86.
3
Towards index-based similarity search for protein structure databases.面向蛋白质结构数据库的基于索引的相似性搜索
Proc IEEE Comput Soc Bioinform Conf. 2003;2:148-58.
4
SVM-Fold: a tool for discriminative multi-class protein fold and superfamily recognition.支持向量机折叠法:一种用于判别式多类别蛋白质折叠和超家族识别的工具。
BMC Bioinformatics. 2007 May 22;8 Suppl 4(Suppl 4):S2. doi: 10.1186/1471-2105-8-S4-S2.
5
On the quality of tree-based protein classification.论基于树的蛋白质分类的质量。
Bioinformatics. 2005 May 1;21(9):1876-90. doi: 10.1093/bioinformatics/bti244. Epub 2005 Jan 12.
6
Application of latent semantic analysis to protein remote homology detection.潜在语义分析在蛋白质远程同源性检测中的应用。
Bioinformatics. 2006 Feb 1;22(3):285-90. doi: 10.1093/bioinformatics/bti801. Epub 2005 Nov 29.
7
Protein homology detection using string alignment kernels.使用字符串比对核进行蛋白质同源性检测。
Bioinformatics. 2004 Jul 22;20(11):1682-9. doi: 10.1093/bioinformatics/bth141. Epub 2004 Feb 26.
8
Accuracy of structure-based sequence alignment of automatic methods.自动方法的基于结构的序列比对准确性。
BMC Bioinformatics. 2007 Sep 20;8:355. doi: 10.1186/1471-2105-8-355.
9
SimShift: identifying structural similarities from NMR chemical shifts.SimShift:从核磁共振化学位移中识别结构相似性。
Bioinformatics. 2006 Feb 15;22(4):460-5. doi: 10.1093/bioinformatics/bti805. Epub 2005 Nov 29.
10
Bayesian search of functionally divergent protein subgroups and their function specific residues.功能趋异蛋白质亚组及其功能特异性残基的贝叶斯搜索
Bioinformatics. 2006 Oct 15;22(20):2466-74. doi: 10.1093/bioinformatics/btl411. Epub 2006 Jul 26.

引用本文的文献

1
Comparison study on k-word statistical measures for protein: from sequence to 'sequence space'.蛋白质的k字统计量比较研究:从序列到“序列空间”
BMC Bioinformatics. 2008 Sep 23;9:394. doi: 10.1186/1471-2105-9-394.