• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

DNA序列中统计相关性的研究。

Study of statistical correlations in DNA sequences.

作者信息

Bernaola-Galván P, Carpena P, Román-Roldán R, Oliver J L

机构信息

Departamento de Física Aplicada II, E.T.S.I. de Telecomunicación, Universidad de Málaga, Málaga, Spain.

出版信息

Gene. 2002 Oct 30;300(1-2):105-15. doi: 10.1016/s0378-1119(02)01037-5.

DOI:10.1016/s0378-1119(02)01037-5
PMID:12468092
Abstract

Here we present a study of statistical correlations among different positions in DNA sequences and their implications by directly using the autocorrelation function. Such an analysis is possible now because of the availability of large sequences or even complete genomes of many organisms. After describing the way in which the autocorrelation function can be applied to DNA-sequence analysis, we show that long-range correlations, implying scale independence, appear in several bacterial genomes as well as in long human chromosome contigs. The source for such correlations in bacteria, which may extend up to 60 kb in Bacillus subtilis, may be related to massive lateral transfer of compositionally biased genes from other genomes. In the human genome, correlations extend for more than five decades and may be related to the evolution of the 'neogenome', a modern evolutionary acquisition composed by GC-rich isochores displaying long-range correlations and scale invariance.

摘要

在此,我们通过直接使用自相关函数,对DNA序列中不同位置之间的统计相关性及其影响进行了一项研究。由于现在有许多生物体的大量序列甚至完整基因组可供使用,这样的分析成为可能。在描述了自相关函数可应用于DNA序列分析的方式之后,我们表明,暗示尺度独立性的长程相关性出现在几个细菌基因组以及人类长染色体重叠群中。细菌中这种相关性的来源,在枯草芽孢杆菌中可能延伸至60 kb,可能与来自其他基因组的成分偏向基因的大量横向转移有关。在人类基因组中,相关性延伸超过五个数量级,可能与“新基因组”的进化有关,“新基因组”是一种现代进化产物,由显示长程相关性和尺度不变性的富含GC的等臂组成。

相似文献

1
Study of statistical correlations in DNA sequences.DNA序列中统计相关性的研究。
Gene. 2002 Oct 30;300(1-2):105-15. doi: 10.1016/s0378-1119(02)01037-5.
2
The vertebrate genome: isochores and evolution.脊椎动物基因组:等密度区与进化
Mol Biol Evol. 1993 Jan;10(1):186-204. doi: 10.1093/oxfordjournals.molbev.a039994.
3
Statistics of DNA sequences: a low-frequency analysis.DNA序列统计:低频分析
Phys Rev E Stat Phys Plasmas Fluids Relat Interdiscip Topics. 1999 Nov;60(5 Pt B):5932-7. doi: 10.1103/physreve.60.5932.
4
Isochore chromosome maps of eukaryotic genomes.真核生物基因组的等臂染色体图谱。
Gene. 2001 Oct 3;276(1-2):47-56. doi: 10.1016/s0378-1119(01)00641-2.
5
Compositional heterogeneity within and among isochores in mammalian genomes. II. Some general comments.哺乳动物基因组中同线区内及同线区之间的组成异质性。II. 一些一般性评论。
Gene. 2001 Oct 3;276(1-2):25-31. doi: 10.1016/s0378-1119(01)00668-0.
6
Bacterial genomes lacking long-range correlations may not be modeled by low-order Markov chains: the role of mixing statistics and frame shift of neighboring genes.缺乏长程相关性的细菌基因组可能无法用低阶马尔可夫链建模:混合统计和相邻基因移码的作用。
Comput Biol Chem. 2014 Dec;53 Pt A:15-25. doi: 10.1016/j.compbiolchem.2014.08.005. Epub 2014 Aug 30.
7
Compositional heterogeneity within and among isochores in mammalian genomes. I. CsCl and sequence analyses.哺乳动物基因组中同线染色体内部和之间的组成异质性。I. 氯化铯和序列分析。
Gene. 2001 Oct 3;276(1-2):15-24. doi: 10.1016/s0378-1119(01)00667-9.
8
Standard deviations and correlations of GC levels in DNA sequences.DNA序列中GC含量的标准差和相关性。
Gene. 2001 Oct 3;276(1-2):33-8. doi: 10.1016/s0378-1119(01)00666-7.
9
Compositional mapping of mouse chromosomes and identification of the gene-rich regions.小鼠染色体的组成图谱绘制及基因富集区域的鉴定。
Chromosome Res. 1997 Aug;5(5):293-300. doi: 10.1023/B:CHRO.0000038759.09018.a7.
10
DNA segmentation through the Bayesian approach.通过贝叶斯方法进行DNA分割。
J Comput Biol. 2000 Feb-Apr;7(1-2):215-31. doi: 10.1089/10665270050081487.

引用本文的文献

1
Compositional Structure of the Genome: A Review.基因组的组成结构:综述
Biology (Basel). 2023 Jun 13;12(6):849. doi: 10.3390/biology12060849.
2
General Designs Reveal Distinct Codes in Protein-Coding and Non-Coding Human DNA.一般设计揭示了蛋白质编码和非编码人类 DNA 中的不同代码。
Genes (Basel). 2022 Oct 28;13(11):1970. doi: 10.3390/genes13111970.
3
A signal processing method for alignment-free metagenomic binning: multi-resolution genomic binary patterns.一种无对齐信号处理方法在宏基因组分箱中的应用:多分辨率基因组二值模式。
Sci Rep. 2019 Feb 15;9(1):2159. doi: 10.1038/s41598-018-38197-9.
4
Complex multifractal nature in Mycobacterium tuberculosis genome.结核分枝杆菌基因组中的复杂多重分形性质。
Sci Rep. 2017 Apr 25;7:46395. doi: 10.1038/srep46395.
5
Magnitude and sign of long-range correlated time series: Decomposition and surrogate signal generation.长程相关时间序列的幅度和符号:分解和替代信号生成。
Phys Rev E. 2016 Apr;93:042201. doi: 10.1103/PhysRevE.93.042201. Epub 2016 Apr 4.
6
Genomic signal processing methods for computation of alignment-free distances from DNA sequences.用于从DNA序列计算无比对距离的基因组信号处理方法。
PLoS One. 2014 Nov 13;9(11):e110954. doi: 10.1371/journal.pone.0110954. eCollection 2014.
7
Diminishing return for increased Mappability with longer sequencing reads: implications of the k-mer distributions in the human genome.测序读长增加导致可测性提高的收益递减:人类基因组中 k-mer 分布的意义。
BMC Bioinformatics. 2014 Jan 3;15:2. doi: 10.1186/1471-2105-15-2.
8
Segmentation of time series with long-range fractal correlations.具有长程分形相关性的时间序列分割
Eur Phys J B. 2012 Jun 1;85(6). doi: 10.1140/epjb/e2012-20969-5.
9
Size effects on correlation measures.相关性度量的尺寸效应。
J Biol Phys. 2005 Jan;31(1):121-33. doi: 10.1007/s10867-005-3126-8.
10
Wavelet analysis of DNA walks on the human and chimpanzee MAGE/CSAG-palindromes.人类和黑猩猩 MAGE/CSAG 回文序列上 DNA 行走的小波分析。
Genomics Proteomics Bioinformatics. 2012 Aug;10(4):230-6. doi: 10.1016/j.gpb.2012.07.004. Epub 2012 Aug 6.