• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

与串联重复的序列比对。

Sequence alignment with tandem duplication.

作者信息

Benson G

机构信息

Department of Biomathematical Sciences, Mount Sinai School of Medicine, New York, New York 10029-6574, USA.

出版信息

J Comput Biol. 1997 Fall;4(3):351-67. doi: 10.1089/cmb.1997.4.351.

DOI:10.1089/cmb.1997.4.351
PMID:9278065
Abstract

Algorithm development for comparing and aligning biological sequences has, until recently, been based on the SI model of mutational events which assumes that modification of sequences proceeds through any of the operations of substitution, insertion or deletion (the latter two collectively termed indels). While this model has worked fairly well, it has long been apparent that other mutational events occur. In this paper, we introduce a new model, the DSI model which includes another common mutational event, tandem duplication. Tandem duplication produces tandem repeats which are common in DNA, making up perhaps 10% of the human genome. They are responsible for some human diseases and may serve a multitude of functions in DNA regulation and evolution. Using the DSI model, we develop new exact and heuristic algorithms for comparing and aligning DNA sequences when they contain tandem repeats.

摘要

直到最近,用于比较和比对生物序列的算法开发一直基于突变事件的SI模型,该模型假定序列的修改通过替换、插入或删除(后两者统称为插入缺失)等任何操作进行。虽然这个模型运行得相当不错,但长期以来很明显还会发生其他突变事件。在本文中,我们引入了一种新模型——DSI模型,它包含另一种常见的突变事件——串联重复。串联重复会产生串联重复序列,这些序列在DNA中很常见,可能占人类基因组的10%左右。它们与一些人类疾病有关,并且可能在DNA调控和进化中发挥多种功能。使用DSI模型,我们开发了新的精确算法和启发式算法,用于在DNA序列包含串联重复时进行比较和比对。

相似文献

1
Sequence alignment with tandem duplication.与串联重复的序列比对。
J Comput Biol. 1997 Fall;4(3):351-67. doi: 10.1089/cmb.1997.4.351.
2
Indel seeds for homology search.用于同源性搜索的插入缺失种子。
Bioinformatics. 2006 Jul 15;22(14):e341-9. doi: 10.1093/bioinformatics/btl263.
3
Bayesian coestimation of phylogeny and sequence alignment.系统发育与序列比对的贝叶斯联合估计
BMC Bioinformatics. 2005 Apr 1;6:83. doi: 10.1186/1471-2105-6-83.
4
Algorithms for sequence analysis via mutagenesis.通过诱变进行序列分析的算法。
Bioinformatics. 2004 Oct 12;20(15):2401-10. doi: 10.1093/bioinformatics/bth258. Epub 2004 May 14.
5
HomologMiner: looking for homologous genomic groups in whole genomes.同源基因挖掘器:在全基因组中寻找同源基因组群。
Bioinformatics. 2007 Apr 15;23(8):917-25. doi: 10.1093/bioinformatics/btm048. Epub 2007 Feb 18.
6
Tandem repeats over the edit distance.编辑距离上的串联重复序列。
Bioinformatics. 2007 Jan 15;23(2):e30-5. doi: 10.1093/bioinformatics/btl309.
7
Reconstructing the duplication history of a tandem repeat.重建串联重复序列的复制历史。
Proc Int Conf Intell Syst Mol Biol. 1999:44-53.
8
Sequence alignment by cross-correlation.通过互相关进行序列比对。
J Biomol Tech. 2005 Dec;16(4):453-8.
9
STAR: an algorithm to Search for Tandem Approximate Repeats.STAR:一种搜索串联近似重复序列的算法。
Bioinformatics. 2004 Nov 1;20(16):2812-20. doi: 10.1093/bioinformatics/bth335. Epub 2004 Jun 4.
10
Meta-analysis of indels causing human genetic disease: mechanisms of mutagenesis and the role of local DNA sequence complexity.导致人类遗传疾病的插入缺失的荟萃分析:诱变机制及局部DNA序列复杂性的作用
Hum Mutat. 2003 Jan;21(1):28-44. doi: 10.1002/humu.10146.

引用本文的文献

1
-Typing of : A Frontline Tool for Epidemiological Studies, but Not Predictive of Fibrinogen Binding Ability.-分型:流行病学研究的一线工具,但无法预测纤维蛋白原结合能力。
Front Microbiol. 2019 May 17;10:1109. doi: 10.3389/fmicb.2019.01109. eCollection 2019.
2
Emergence of new CMRSA7/USA400 methicillin-resistant Staphylococcus aureus spa types in Alberta, Canada, from 2005 to 2012.2005年至2012年加拿大艾伯塔省新出现的CMRSA7/USA400型耐甲氧西林金黄色葡萄球菌spa分型
J Clin Microbiol. 2014 Jul;52(7):2439-46. doi: 10.1128/JCM.00505-14. Epub 2014 Apr 30.
3
Probabilistic approaches to alignment with tandem repeats.
与串联重复序列比对的概率方法。
Algorithms Mol Biol. 2014 Mar 1;9(1):3. doi: 10.1186/1748-7188-9-3.
4
The molecular epidemiology of the highly virulent ST93 Australian community Staphylococcus aureus strain.高毒力 ST93 澳大利亚社区型金黄色葡萄球菌的分子流行病学研究。
PLoS One. 2012;7(8):e43037. doi: 10.1371/journal.pone.0043037. Epub 2012 Aug 10.
5
A lossy compression technique enabling duplication-aware sequence alignment.一种有损压缩技术,支持具有重复检测功能的序列比对。
Evol Bioinform Online. 2012;8:171-80. doi: 10.4137/EBO.S9131. Epub 2012 Apr 2.
6
Characterization of nasal and blood culture isolates of methicillin-resistant Staphylococcus aureus from patients in United States Hospitals.从美国医院的患者中分离的耐甲氧西林金黄色葡萄球菌的鼻和血培养物的特性。
Antimicrob Agents Chemother. 2012 Mar;56(3):1324-30. doi: 10.1128/AAC.05804-11. Epub 2011 Dec 12.
7
A monte carlo method for assessing the quality of duplication-aware alignment algorithms.一种用于评估具有重复检测功能的比对算法质量的蒙特卡罗方法。
Evol Bioinform Online. 2011;7:31-40. doi: 10.4137/EBO.S6662. Epub 2011 May 10.
8
TRedD--a database for tandem repeats over the edit distance.TRedD--一个针对编辑距离上串联重复的数据库。
Database (Oxford). 2010 Jul 6;2010:baq003. doi: 10.1093/database/baq003.
9
Enhanced discrimination of highly clonal ST22-methicillin-resistant Staphylococcus aureus IV isolates achieved by combining spa, dru, and pulsed-field gel electrophoresis typing data.通过 spa、dru 和脉冲场凝胶电泳分型数据的联合应用,提高了 ST22 型耐甲氧西林金黄色葡萄球菌 IV 型克隆株的鉴别能力。
J Clin Microbiol. 2010 May;48(5):1839-52. doi: 10.1128/JCM.02155-09. Epub 2010 Mar 24.
10
Typing Clostridium difficile strains based on tandem repeat sequences.基于串联重复序列对艰难梭菌菌株进行分型。
BMC Microbiol. 2009 Jan 8;9:6. doi: 10.1186/1471-2180-9-6.