Suppr超能文献

一种针对核苷酸和氨基酸序列的具有k个差异的高效字符串匹配算法。

An efficient string matching algorithm with k differences for nucleotide and amino acid sequences.

作者信息

Landau G M, Vishkin U, Nussinov R

出版信息

Nucleic Acids Res. 1986 Jan 10;14(1):31-46. doi: 10.1093/nar/14.1.31.

Abstract

There are a few algorithms designed to solve the problem of the optimal alignment of one sequence, the pattern, of length m, with another, longer sequence the text, of length n. These algorithms allow mismatches, deletions and insertions. Algorithms to date run in O(mn) time. Let us define an integer, k, which is the maximal number of differences allowed. We present a simple algorithm showing that sequences can be optimally aligned in O(k2n) time. For long sequences the gain factor over the currently used algorithms is very large.

摘要

有一些算法旨在解决长度为m的一个序列(模式)与另一个更长的长度为n的序列(文本)的最优比对问题。这些算法允许错配、删除和插入。迄今为止的算法运行时间为O(mn)。我们定义一个整数k,它是允许的最大差异数。我们提出一种简单算法,表明序列可以在O(k²n)时间内进行最优比对。对于长序列,相对于当前使用的算法,增益因子非常大。

相似文献

4
Approximate matching of regular expressions.正则表达式的近似匹配。
Bull Math Biol. 1989;51(1):5-37. doi: 10.1007/BF02458834.
9
10
On pattern matching with mismatches and few don't cares.关于带有不匹配项和少量无关项的模式匹配。
Inf Process Lett. 2017 Feb;118:78-82. doi: 10.1016/j.ipl.2016.10.003. Epub 2016 Oct 27.

本文引用的文献

1
Pattern recognition in genetic sequences.基因序列中的模式识别。
Proc Natl Acad Sci U S A. 1979 Jul;76(7):3041. doi: 10.1073/pnas.76.7.3041.
4
Fast optimal alignment.快速最优比对
Nucleic Acids Res. 1984 Jan 11;12(1 Pt 1):175-9. doi: 10.1093/nar/12.1part1.175.
8
Fast algorithm for predicting the secondary structure of single-stranded RNA.预测单链RNA二级结构的快速算法
Proc Natl Acad Sci U S A. 1980 Nov;77(11):6309-13. doi: 10.1073/pnas.77.11.6309.
10

文献AI研究员

20分钟写一篇综述,助力文献阅读效率提升50倍。

立即体验

用中文搜PubMed

大模型驱动的PubMed中文搜索引擎

马上搜索

文档翻译

学术文献翻译模型,支持多种主流文档格式。

立即体验