Suppr超能文献

一种无需序列比对的序列集相似性度量方法。

A measure of the similarity of sets of sequences not requiring sequence alignment.

作者信息

Blaisdell B E

出版信息

Proc Natl Acad Sci U S A. 1986 Jul;83(14):5155-9. doi: 10.1073/pnas.83.14.5155.

Abstract

Determination of first- and second-order Markov chain homogeneity of sets of nuclear eukaryotic DNA sequences, both coding and noncoding, finds similarities imperceptible to the standard Needleman-Wunsch base matching or dot-matrix algorithms. These measures of the similarities of the distributions of adjacent pairs or triplets are in agreement with accepted evolutionary-tree topologies. Hierarchical clustering of the distributions of doublets of 30 miscellaneous coding sequences gives clusters in reasonable agreement with accepted biological classifications. In addition to similarity by homology, there is also observed similarity of disparate genes in the same organism--for example, all three disparate yeast genes (two enzymes and actin) form a well-distinguished cluster.

摘要

对有编码功能和无编码功能的真核细胞核DNA序列集进行一阶和二阶马尔可夫链同质性测定,结果发现,这些相似性是标准的Needleman-Wunsch碱基匹配算法或点阵算法无法察觉的。这些相邻碱基对或三联体分布相似性的测定结果与公认的进化树拓扑结构一致。对30个不同的编码序列的二联体分布进行层次聚类,得到的聚类结果与公认的生物学分类相当吻合。除了同源相似性外,还观察到同一生物体中不同基因间的相似性——例如,酵母中所有三个不同的基因(两种酶和肌动蛋白)形成一个明显不同的聚类。

相似文献

4
Comparative biosequence metrics.比较生物序列度量
J Mol Evol. 1981;18(1):38-46. doi: 10.1007/BF01733210.
7
Sequence comparison by exponentially-damped alignment.通过指数衰减比对进行序列比较。
Nucleic Acids Res. 1984 Jan 11;12(1 Pt 2):457-64. doi: 10.1093/nar/12.1part2.457.
9
A method for multiple sequence alignment with gaps.一种带空位的多序列比对方法。
J Mol Biol. 1989 Oct 20;209(4):539-48. doi: 10.1016/0022-2836(89)90592-5.

引用本文的文献

5
Exploring geometry of genome space via Grassmann manifolds.通过格拉斯曼流形探索基因组空间的几何结构。
Innovation (Camb). 2024 Jul 22;5(5):100677. doi: 10.1016/j.xinn.2024.100677. eCollection 2024 Sep 9.
7
A survey of k-mer methods and applications in bioinformatics.生物信息学中k-mer方法及其应用综述。
Comput Struct Biotechnol J. 2024 May 21;23:2289-2303. doi: 10.1016/j.csbj.2024.05.025. eCollection 2024 Dec.
9
Reference-free phylogeny from sequencing data.基于测序数据的无参考系统发育分析
BioData Min. 2023 Mar 27;16(1):13. doi: 10.1186/s13040-023-00329-x.

本文引用的文献

9
Codon catalog usage and the genome hypothesis.密码子目录使用与基因组假说。
Nucleic Acids Res. 1980 Jan 11;8(1):r49-r62. doi: 10.1093/nar/8.1.197-c.

文献AI研究员

20分钟写一篇综述,助力文献阅读效率提升50倍。

立即体验

用中文搜PubMed

大模型驱动的PubMed中文搜索引擎

马上搜索

文档翻译

学术文献翻译模型,支持多种主流文档格式。

立即体验