• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

一种用于数据库搜索和聚类的新方法。

A New Method for Database Searching and Clustering.

作者信息

Krause A, Vingron M

出版信息

Genome Inform Ser Workshop Genome Inform. 1997;8:90-99.

PMID:11072309
Abstract

An iterative database searching method is introduced and applied to the design of a database clustering procedure. The search method virtually never produces false positive hits while determining meaningfully large sets of sequences related to the query. A novel set-theoretic database clustering algorithm exploits this feature and avoids a traditional, distance-based clustering step. This makes it fast and applicable to data-sets of the size of, e.g., the Swiss-Prot database. In practice we achieve unambiguous assignment of 80% of Swiss-Prot sequences to non-overlapping sequence clusters in an entirely automatic fashion.

摘要

介绍了一种迭代数据库搜索方法,并将其应用于数据库聚类程序的设计。该搜索方法在确定与查询相关的大量有意义的序列集时几乎不会产生误报。一种新颖的集合论数据库聚类算法利用了这一特性,避免了传统的基于距离的聚类步骤。这使得它速度快,适用于如瑞士蛋白质数据库大小的数据集。在实践中,我们以完全自动的方式将80%的瑞士蛋白质序列明确分配到非重叠的序列簇中。

相似文献

1
A New Method for Database Searching and Clustering.一种用于数据库搜索和聚类的新方法。
Genome Inform Ser Workshop Genome Inform. 1997;8:90-99.
2
A set-theoretic approach to database searching and clustering.一种用于数据库搜索和聚类的集合论方法。
Bioinformatics. 1998 Jun;14(5):430-8. doi: 10.1093/bioinformatics/14.5.430.
3
SledgeHMMER: a web server for batch searching the Pfam database.SledgeHMMER:一个用于批量搜索Pfam数据库的网络服务器。
Nucleic Acids Res. 2004 Jul 1;32(Web Server issue):W542-4. doi: 10.1093/nar/gkh395.
4
Fast iterative gene clustering based on information theoretic criteria for selecting the cluster structure.基于信息论准则选择聚类结构的快速迭代基因聚类
J Comput Biol. 2004;11(4):660-82. doi: 10.1089/1066527041887285.
5
Incremental generation of summarized clustering hierarchy for protein family analysis.用于蛋白质家族分析的汇总聚类层次结构的增量生成。
Bioinformatics. 2004 Nov 1;20(16):2586-96. doi: 10.1093/bioinformatics/bth290. Epub 2004 May 6.
6
A graph-based clustering method for a large set of sequences using a graph partitioning algorithm.一种使用图划分算法对大量序列进行基于图的聚类方法。
Genome Inform. 2001;12:93-102.
7
How many clusters? An information-theoretic perspective.多少个聚类?一种信息论视角。
Neural Comput. 2004 Dec;16(12):2483-506. doi: 10.1162/0899766042321751.
8
Iterative class discovery and feature selection using Minimal Spanning Trees.使用最小生成树的迭代类发现和特征选择
BMC Bioinformatics. 2004 Sep 8;5:126. doi: 10.1186/1471-2105-5-126.
9
A hybrid clustering approach to recognition of protein families in 114 microbial genomes.一种用于识别114个微生物基因组中蛋白质家族的混合聚类方法。
BMC Bioinformatics. 2004 Apr 29;5:45. doi: 10.1186/1471-2105-5-45.
10
A graph-based clustering method applied to protein sequences.
Bioinformation. 2011;6(10):372-4. doi: 10.6026/97320630006372. Epub 2011 Aug 2.