Suppr超能文献

一种用于找出所有最大得分子序列的线性时间算法。

A linear time algorithm for finding all maximal scoring subsequences.

作者信息

Ruzzo W L, Tompa M

机构信息

Department of Computer Science and Engineering, University of Washington, Seattle 98195-2350, USA.

出版信息

Proc Int Conf Intell Syst Mol Biol. 1999:234-41.

Abstract

Given a sequence of real numbers ("scores"), we present a practical linear time algorithm to find those nonoverlapping, contiguous subsequences having greatest total scores. This improves on the best previously known algorithm, which requires quadratic time in the worst case. The problem arises in biological sequence analysis, where the high-scoring subsequences correspond to regions of unusual composition in a nucleic acid or protein sequence. For instance, Altschul, Karlin, and others have used this approach to identify transmembrane regions, DNA binding domains, and regions of high charge in proteins.

摘要

给定一个实数序列(“分数”),我们提出一种实用的线性时间算法,以找到那些具有最大总分的非重叠连续子序列。这改进了之前已知的最佳算法,该算法在最坏情况下需要二次时间。这个问题出现在生物序列分析中,其中高分的子序列对应于核酸或蛋白质序列中组成异常的区域。例如,阿尔茨舒尔、卡林等人已经使用这种方法来识别跨膜区域、DNA结合结构域以及蛋白质中的高电荷区域。

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验