• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

相似文献

1
On the statistical assessment of similarities in DNA sequences.关于DNA序列相似性的统计评估。
Nucleic Acids Res. 1984 Jul 11;12(13):5529-43. doi: 10.1093/nar/12.13.5529.
2
The probabilities of similarities in DNA sequence comparisons.DNA序列比较中相似性的概率。
Genomics. 1988 Oct;3(3):207-16. doi: 10.1016/0888-7543(88)90081-x.
3
The statistical distribution of nucleic acid similarities.核酸相似性的统计分布。
Nucleic Acids Res. 1985 Jan 25;13(2):645-56. doi: 10.1093/nar/13.2.645.
4
Simple diagnostic statistical tests of models for DNA substitution.DNA 取代模型的简单诊断统计检验。
J Mol Evol. 1993 Dec;37(6):650-61. doi: 10.1007/BF00182751.
5
Sequence comparison by exponentially-damped alignment.通过指数衰减比对进行序列比较。
Nucleic Acids Res. 1984 Jan 11;12(1 Pt 2):457-64. doi: 10.1093/nar/12.1part2.457.
6
DNA sequence comparisons of the human, mouse, and rabbit immunoglobulin kappa gene.人类、小鼠和兔免疫球蛋白κ基因的DNA序列比较。
Mol Biol Evol. 1985 Jan;2(1):35-52. doi: 10.1093/oxfordjournals.molbev.a040336.
7
A representation of DNA primary sequences by random walk.通过随机游走对DNA一级序列的一种表示。
Math Biosci. 2007 Sep;209(1):282-91. doi: 10.1016/j.mbs.2006.06.004. Epub 2006 Jun 30.
8
Statistical significance of symmetrical and repetitive segments in DNA.DNA中对称和重复片段的统计学意义。
Nucleic Acids Res. 1982 Dec 20;10(24):8323-39. doi: 10.1093/nar/10.24.8323.
9
Statistical scales of order in DNA.DNA中的统计有序尺度。
Biophys Chem. 2009 May;141(2-3):203-13. doi: 10.1016/j.bpc.2009.02.003. Epub 2009 Feb 20.
10
On the statistical significance of nucleic acid similarities.论核酸相似性的统计学意义。
Nucleic Acids Res. 1984 Jan 11;12(1 Pt 1):215-26. doi: 10.1093/nar/12.1part1.215.

引用本文的文献

1
Metagenomic Assembly: Overview, Challenges and Applications.宏基因组组装:概述、挑战与应用
Yale J Biol Med. 2016 Sep 30;89(3):353-362. eCollection 2016 Sep.
2
Probable epitopes: Relationships between myelin basic protein antigenic determinants and viral and bacterial proteins.可能的表位:髓鞘碱性蛋白抗原决定簇与病毒及细菌蛋白之间的关系。
Neuroinformatics. 2004;2(1):59-70. doi: 10.1385/NI:2:1:059.
3
Significance of similarities in patterns: an application to beta interferon-related DNA on human chromosome 2.模式相似性的意义:在人类2号染色体上与β干扰素相关DNA的应用。
Proc Natl Acad Sci U S A. 1985 Jun;82(12):4090-4. doi: 10.1073/pnas.82.12.4090.
4
Principle of codification for quick comparisons with the entire biomolecule databanks and associated programs in FORTRAN 77.用于与整个生物分子数据库以及 FORTRAN 77 相关程序进行快速比较的编码原则。
Nucleic Acids Res. 1986 Jan 10;14(1):197-204. doi: 10.1093/nar/14.1.197.
5
Locally optimal subalignments using nonlinear similarity functions.使用非线性相似函数的局部最优子比对
Bull Math Biol. 1986;48(5-6):633-60. doi: 10.1007/BF02462328.
6
Optimized homology searches of the gene and protein sequence data banks.对基因和蛋白质序列数据库进行优化的同源性搜索。
Bull Math Biol. 1986;48(5-6):569-83. doi: 10.1007/BF02462324.
7
Analysis of the occurrence of promoter-sites in DNA.DNA中启动子位点出现情况的分析。
Nucleic Acids Res. 1986 Jan 10;14(1):109-26. doi: 10.1093/nar/14.1.109.

本文引用的文献

1
Optimal sequence alignments.最佳序列比对。
Proc Natl Acad Sci U S A. 1983 Mar;80(5):1382-6. doi: 10.1073/pnas.80.5.1382.
2
An interactive graphics program for comparing and aligning nucleic acid and amino acid sequences.一个用于比较和比对核酸及氨基酸序列的交互式图形程序。
Nucleic Acids Res. 1982 May 11;10(9):2951-61. doi: 10.1093/nar/10.9.2951.
3
A surprising new protein superfamily containing ovalbumin, antithrombin-III, and alpha 1-proteinase inhibitor.一个包含卵清蛋白、抗凝血酶III和α1-蛋白酶抑制剂的惊人新蛋白质超家族。
Biochem Biophys Res Commun. 1980 Jul 31;95(2):864-71. doi: 10.1016/0006-291x(80)90867-0.
4
Pattern recognition in nucleic acid sequences. I. A general method for finding local homologies and symmetries.核酸序列中的模式识别。I. 寻找局部同源性和对称性的通用方法。
Nucleic Acids Res. 1982 Jan 11;10(1):247-63. doi: 10.1093/nar/10.1.247.
5
Rapid similarity searches of nucleic acid and protein data banks.核酸和蛋白质数据库的快速相似性搜索。
Proc Natl Acad Sci U S A. 1983 Feb;80(3):726-30. doi: 10.1073/pnas.80.3.726.
6
The sequence of human serum albumin cDNA and its expression in E. coli.人血清白蛋白cDNA序列及其在大肠杆菌中的表达。
Nucleic Acids Res. 1981 Nov 25;9(22):6103-114. doi: 10.1093/nar/9.22.6103.
7
A general method applicable to the search for similarities in the amino acid sequence of two proteins.一种适用于寻找两种蛋白质氨基酸序列相似性的通用方法。
J Mol Biol. 1970 Mar;48(3):443-53. doi: 10.1016/0022-2836(70)90057-4.
8
Matching sequences under deletion-insertion constraints.在缺失-插入约束下匹配序列。
Proc Natl Acad Sci U S A. 1972 Jan;69(1):4-6. doi: 10.1073/pnas.69.1.4.
9
A test for nucleotide sequence homology.
J Mol Biol. 1973 Jun 15;77(1):169-64. doi: 10.1016/0022-2836(73)90369-0.

关于DNA序列相似性的统计评估。

On the statistical assessment of similarities in DNA sequences.

作者信息

Reich J G, Drabsch H, Däumler A

出版信息

Nucleic Acids Res. 1984 Jul 11;12(13):5529-43. doi: 10.1093/nar/12.13.5529.

DOI:10.1093/nar/12.13.5529
PMID:6462914
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC318937/
Abstract

The statistical behavior of the similarity score for unrelated DNA sequences calculated as letter-by-letter comparison or from various forms of optimal alignment was studied. It was found that natural DNA-sequences from a data base and true random sequences show the same statistical behavior in terms of such scores. This makes it possible to adopt a simple criterion for the rejection of fortuitous similarity. It is based on the mean and standard deviation of chance scores whose expected values, depending on chain length, gap penalty and probability of letter coincidence, may be calculated from formulae given in the paper.

摘要

研究了通过逐字母比较或各种形式的最佳比对计算得出的不相关DNA序列相似性得分的统计行为。结果发现,来自数据库的天然DNA序列和真正的随机序列在这些得分方面表现出相同的统计行为。这使得采用一种简单的标准来排除偶然相似性成为可能。该标准基于偶然得分的均值和标准差,其期望值取决于链长、空位罚分和字母匹配概率,可根据本文给出的公式计算得出。