• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

用于分析基因组中存在缺失和倒位的片段重复的高效算法。

Efficient algorithms for analyzing segmental duplications with deletions and inversions in genomes.

作者信息

Kahn Crystal L, Mozes Shay, Raphael Benjamin J

出版信息

Algorithms Mol Biol. 2010 Jan 4;5(1):11. doi: 10.1186/1748-7188-5-11.

DOI:10.1186/1748-7188-5-11
PMID:20047668
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC2820476/
Abstract

BACKGROUND

Segmental duplications, or low-copy repeats, are common in mammalian genomes. In the human genome, most segmental duplications are mosaics comprised of multiple duplicated fragments. This complex genomic organization complicates analysis of the evolutionary history of these sequences. One model proposed to explain this mosaic patterns is a model of repeated aggregation and subsequent duplication of genomic sequences.

RESULTS

We describe a polynomial-time exact algorithm to compute duplication distance, a genomic distance defined as the most parsimonious way to build a target string by repeatedly copying substrings of a fixed source string. This distance models the process of repeated aggregation and duplication. We also describe extensions of this distance to include certain types of substring deletions and inversions. Finally, we provide a description of a sequence of duplication events as a context-free grammar (CFG).

CONCLUSION

These new genomic distances will permit more biologically realistic analyses of segmental duplications in genomes.

摘要

背景

片段重复,即低拷贝重复,在哺乳动物基因组中很常见。在人类基因组中,大多数片段重复是由多个重复片段组成的镶嵌体。这种复杂的基因组组织使这些序列的进化历史分析变得复杂。为解释这种镶嵌模式而提出的一种模型是基因组序列重复聚集和随后重复的模型。

结果

我们描述了一种多项式时间精确算法来计算重复距离,这是一种基因组距离,定义为通过重复复制固定源字符串的子串来构建目标字符串的最简约方式。这个距离模拟了重复聚集和重复的过程。我们还描述了这个距离的扩展,以包括某些类型的子串删除和倒置。最后,我们将重复事件序列描述为上下文无关语法(CFG)。

结论

这些新的基因组距离将允许对基因组中的片段重复进行更符合生物学实际的分析。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/e687/2820476/195faf22e5ad/1748-7188-5-11-8.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/e687/2820476/26ffad663c43/1748-7188-5-11-1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/e687/2820476/b6bf9698e848/1748-7188-5-11-2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/e687/2820476/ae4441e3b8fe/1748-7188-5-11-3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/e687/2820476/4a794c01dd24/1748-7188-5-11-4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/e687/2820476/a4ccd3392424/1748-7188-5-11-5.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/e687/2820476/2cede104e489/1748-7188-5-11-6.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/e687/2820476/89ff5b047eb5/1748-7188-5-11-7.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/e687/2820476/195faf22e5ad/1748-7188-5-11-8.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/e687/2820476/26ffad663c43/1748-7188-5-11-1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/e687/2820476/b6bf9698e848/1748-7188-5-11-2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/e687/2820476/ae4441e3b8fe/1748-7188-5-11-3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/e687/2820476/4a794c01dd24/1748-7188-5-11-4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/e687/2820476/a4ccd3392424/1748-7188-5-11-5.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/e687/2820476/2cede104e489/1748-7188-5-11-6.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/e687/2820476/89ff5b047eb5/1748-7188-5-11-7.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/e687/2820476/195faf22e5ad/1748-7188-5-11-8.jpg

相似文献

1
Efficient algorithms for analyzing segmental duplications with deletions and inversions in genomes.用于分析基因组中存在缺失和倒位的片段重复的高效算法。
Algorithms Mol Biol. 2010 Jan 4;5(1):11. doi: 10.1186/1748-7188-5-11.
2
Analysis of segmental duplications via duplication distance.通过重复距离分析节段性重复。
Bioinformatics. 2008 Aug 15;24(16):i133-8. doi: 10.1093/bioinformatics/btn292.
3
Association of microsatellite pairs with segmental duplications in insect genomes.昆虫基因组中微卫星对与片段重复的关联。
BMC Genomics. 2013 Dec 21;14:907. doi: 10.1186/1471-2164-14-907.
4
A parsimony approach to analysis of human segmental duplications.一种用于人类片段重复分析的简约方法。
Pac Symp Biocomput. 2009:126-37.
5
Parsimony and likelihood reconstruction of human segmental duplications.人类节段性重复序列的简约性和似然性重建。
Bioinformatics. 2010 Sep 15;26(18):i446-52. doi: 10.1093/bioinformatics/btq368.
6
Modelling segmental duplications in the human genome.人类基因组中节段性重复序列的建模。
BMC Genomics. 2021 Jul 2;22(1):496. doi: 10.1186/s12864-021-07789-7.
7
A prescient evolutionary model for genesis, duplication and differentiation of MIR160 homologs in Brassicaceae.拟南芥科 MIR160 同源物的发生、复制和分化的有远见的进化模型。
Mol Genet Genomics. 2021 Jul;296(4):985-1003. doi: 10.1007/s00438-021-01797-8. Epub 2021 May 29.
8
Discovery of tandem and interspersed segmental duplications using high-throughput sequencing.利用高通量测序发现串联和散在的片段重复。
Bioinformatics. 2019 Oct 15;35(20):3923-3930. doi: 10.1093/bioinformatics/btz237.
9
Analysis of recent segmental duplications in the bovine genome.牛基因组中近期片段重复的分析。
BMC Genomics. 2009 Dec 1;10:571. doi: 10.1186/1471-2164-10-571.
10
Sorting by reversals, block interchanges, tandem duplications, and deletions.通过反转、块交换、串联重复和缺失进行排序。
BMC Bioinformatics. 2009 Jan 30;10 Suppl 1(Suppl 1):S9. doi: 10.1186/1471-2105-10-S1-S9.

引用本文的文献

1
Fast computation of a string duplication history under no-breakpoint-reuse.无重复断点情况下的字符串复制历史的快速计算。
Philos Trans A Math Phys Eng Sci. 2014 Apr 21;372(2016):20130133. doi: 10.1098/rsta.2013.0133. Print 2014 May 28.
2
Parsimony and likelihood reconstruction of human segmental duplications.人类节段性重复序列的简约性和似然性重建。
Bioinformatics. 2010 Sep 15;26(18):i446-52. doi: 10.1093/bioinformatics/btq368.

本文引用的文献

1
A parsimony approach to analysis of human segmental duplications.一种用于人类片段重复分析的简约方法。
Pac Symp Biocomput. 2009:126-37.
2
Inferring ancestral gene orders for a family of tandemly arrayed genes.推断串联排列基因家族的祖先基因顺序。
J Comput Biol. 2008 Oct;15(8):1063-77. doi: 10.1089/cmb.2008.0025.
3
DUPCAR: reconstructing contiguous ancestral regions with duplications.DUPCAR:通过重复重建连续的祖先区域。
J Comput Biol. 2008 Oct;15(8):1007-27. doi: 10.1089/cmb.2008.0069.
4
Analysis of segmental duplications via duplication distance.通过重复距离分析节段性重复。
Bioinformatics. 2008 Aug 15;24(16):i133-8. doi: 10.1093/bioinformatics/btn292.
5
Ancestral reconstruction of segmental duplications reveals punctuated cores of human genome evolution.节段性重复的祖先重建揭示了人类基因组进化的间断核心。
Nat Genet. 2007 Nov;39(11):1361-8. doi: 10.1038/ng.2007.9. Epub 2007 Oct 7.
6
Duplication and inversion history of a tandemly repeated genes family.一个串联重复基因家族的复制与倒位历史。
J Comput Biol. 2007 May;14(4):462-78. doi: 10.1089/cmb.2007.A007.
7
Recurrent duplication-driven transposition of DNA during hominoid evolution.在类人猿进化过程中,DNA的重复驱动转座反复发生。
Proc Natl Acad Sci U S A. 2006 Nov 21;103(47):17626-31. doi: 10.1073/pnas.0605426103. Epub 2006 Nov 13.
8
Assignment of orthologous genes via genome rearrangement.通过基因组重排进行直系同源基因的分配。
IEEE/ACM Trans Comput Biol Bioinform. 2005 Oct-Dec;2(4):302-15. doi: 10.1109/TCBB.2005.48.
9
Primate segmental duplications: crucibles of evolution, diversity and disease.灵长类基因组片段重复:进化、多样性和疾病的熔炉
Nat Rev Genet. 2006 Jul;7(7):552-64. doi: 10.1038/nrg1895. Epub 2006 Jun 13.
10
Reconstructing the duplication history of tandemly repeated genes.重建串联重复基因的复制历史。
Mol Biol Evol. 2002 Mar;19(3):278-88. doi: 10.1093/oxfordjournals.molbev.a004081.