• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

面向蛋白质结构数据库的基于索引的相似性搜索

Towards index-based similarity search for protein structure databases.

作者信息

Camoğlu Orhan, Kahveci Tamer, Singh Ambuj K

机构信息

Department of Computer Science, University of California, Santa Barbara, 93106, USA.

出版信息

Proc IEEE Comput Soc Bioinform Conf. 2003;2:148-58.

PMID:16452789
Abstract

We propose two methods for finding similarities in protein structure databases. Our techniques extract feature vectors on triplets of SSEs (Secondary Structure Elements) of proteins. These feature vectors are then indexed using a multidimensional index structure. Our first technique considers the problem of finding proteins similar to a given query protein in a protein dataset. This technique quickly finds promising proteins using the index structure. These proteins are then aligned to the query protein using a popular pairwise alignment tool such as VAST. We also develop a novel statistical model to estimate the goodness of a match using the SSEs. Our second technique considers the problem of joining two protein datasets to find an all-to-all similarity. Experimental results show that our techniques improve the pruning time of VAST 3 to 3.5 times while keeping the sensitivity similar.

摘要

我们提出了两种在蛋白质结构数据库中寻找相似性的方法。我们的技术在蛋白质的二级结构元件(SSE)三元组上提取特征向量。然后使用多维索引结构对这些特征向量进行索引。我们的第一种技术考虑在蛋白质数据集中寻找与给定查询蛋白质相似的蛋白质的问题。该技术使用索引结构快速找到有前景的蛋白质。然后使用诸如VAST之类的流行成对比对工具将这些蛋白质与查询蛋白质进行比对。我们还开发了一种新颖的统计模型,以使用SSE来估计匹配的优度。我们的第二种技术考虑合并两个蛋白质数据集以找到全对全相似性的问题。实验结果表明,我们的技术在保持灵敏度相似的同时,将VAST的剪枝时间提高了3至3.5倍。

相似文献

1
Towards index-based similarity search for protein structure databases.面向蛋白质结构数据库的基于索引的相似性搜索
Proc IEEE Comput Soc Bioinform Conf. 2003;2:148-58.
2
Index-based similarity search for protein structure databases.基于索引的蛋白质结构数据库相似性搜索。
J Bioinform Comput Biol. 2004 Mar;2(1):99-126. doi: 10.1142/s0219720004000491.
3
PSI: indexing protein structures for fast similarity search.PSI:为快速相似性搜索对蛋白质结构进行索引。
Bioinformatics. 2003;19 Suppl 1:i81-3. doi: 10.1093/bioinformatics/btg1009.
4
Accelerating approximate subsequence search on large protein sequence databases.加速大型蛋白质序列数据库上的近似子序列搜索
Proc IEEE Comput Soc Bioinform Conf. 2002;1:207-16.
5
A nearest neighbor approach for automated transporter prediction and categorization from protein sequences.一种基于最近邻方法从蛋白质序列进行自动转运蛋白预测和分类的方法。
Bioinformatics. 2008 May 1;24(9):1129-36. doi: 10.1093/bioinformatics/btn099. Epub 2008 Mar 12.
6
A genetic similarity algorithm for searching the Gene Ontology terms and annotating anonymous protein sequences.一种用于搜索基因本体术语和注释匿名蛋白质序列的遗传相似性算法。
J Biomed Inform. 2008 Feb;41(1):65-81. doi: 10.1016/j.jbi.2007.05.010. Epub 2007 Jun 27.
7
Protein structural similarity search by Ramachandran codes.通过拉马钱德兰编码进行蛋白质结构相似性搜索。
BMC Bioinformatics. 2007 Aug 23;8:307. doi: 10.1186/1471-2105-8-307.
8
Classification and knowledge discovery in protein databases.蛋白质数据库中的分类与知识发现。
J Biomed Inform. 2004 Aug;37(4):224-39. doi: 10.1016/j.jbi.2004.07.008.
9
MagicMatch--cross-referencing sequence identifiers across databases.MagicMatch——跨数据库交叉引用序列标识符。
Bioinformatics. 2005 Aug 15;21(16):3429-30. doi: 10.1093/bioinformatics/bti548. Epub 2005 Jun 16.
10
A new similarity measure among protein sequences.一种蛋白质序列间新的相似性度量方法。
Proc IEEE Comput Soc Bioinform Conf. 2003;2:347-52.

引用本文的文献

1
Alignment-free local structural search by writhe decomposition.无比对的局部结构搜索通过纽结分解。
Bioinformatics. 2010 May 1;26(9):1176-84. doi: 10.1093/bioinformatics/btq127. Epub 2010 Apr 5.
2
Exploring protein structural dissimilarity to facilitate structure classification.探索蛋白质结构差异以促进结构分类。
BMC Struct Biol. 2009 Sep 19;9:60. doi: 10.1186/1472-6807-9-60.