• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

逐部分映射序列。

Mapping sequences by parts.

作者信息

Didier Gilles, Guziolowski Carito

机构信息

Institut de Mathématiques de Luminy, 163 avenue de Luminy, Case 907, 13288 Marseille Cedex 9, France.

出版信息

Algorithms Mol Biol. 2007 Sep 19;2:11. doi: 10.1186/1748-7188-2-11.

DOI:10.1186/1748-7188-2-11
PMID:17880695
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC2148040/
Abstract

BACKGROUND

We present the N-map method, a pairwise and asymmetrical approach which allows us to compare sequences by taking into account evolutionary events that produce shuffled, reversed or repeated elements. Basically, the optimal N-map of a sequence s over a sequence t is the best way of partitioning the first sequence into N parts and placing them, possibly complementary reversed, over the second sequence in order to maximize the sum of their gapless alignment scores.

RESULTS

We introduce an algorithm computing an optimal N-map with time complexity O (|s| x |t| x N) using O (|s| x |t| x N) memory space. Among all the numbers of parts taken in a reasonable range, we select the value N for which the optimal N-map has the most significant score. To evaluate this significance, we study the empirical distributions of the scores of optimal N-maps and show that they can be approximated by normal distributions with a reasonable accuracy. We test the functionality of the approach over random sequences on which we apply artificial evolutionary events.

PRACTICAL APPLICATION

The method is illustrated with four case studies of pairs of sequences involving non-standard evolutionary events.

摘要

背景

我们提出了N映射方法,这是一种成对且不对称的方法,通过考虑产生洗牌、反转或重复元素的进化事件,使我们能够比较序列。基本上,序列s相对于序列t的最优N映射是将第一个序列划分为N个部分并将它们(可能是互补反转的)放置在第二个序列上的最佳方式,以便最大化它们的无间隙比对分数之和。

结果

我们引入了一种算法,该算法使用O(|s|×|t|×N)的内存空间,以O(|s|×|t|×N)的时间复杂度计算最优N映射。在合理范围内选取的所有部分数量中,我们选择最优N映射得分最高的N值。为了评估这种显著性,我们研究了最优N映射得分的经验分布,并表明它们可以以合理的精度用正态分布近似。我们在应用了人工进化事件的随机序列上测试了该方法的功能。

实际应用

该方法通过涉及非标准进化事件的四对序列的案例研究进行了说明。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8f5a/2148040/56eca899077a/1748-7188-2-11-9.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8f5a/2148040/b717b8c37fd9/1748-7188-2-11-1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8f5a/2148040/6436b5d1e67b/1748-7188-2-11-2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8f5a/2148040/4cdbf4ba68e0/1748-7188-2-11-3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8f5a/2148040/b8861bb5cb1e/1748-7188-2-11-4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8f5a/2148040/2c35f68197b1/1748-7188-2-11-5.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8f5a/2148040/14ef3bfc2d27/1748-7188-2-11-6.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8f5a/2148040/39f2362cce0b/1748-7188-2-11-7.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8f5a/2148040/78ba0b8f45cd/1748-7188-2-11-8.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8f5a/2148040/56eca899077a/1748-7188-2-11-9.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8f5a/2148040/b717b8c37fd9/1748-7188-2-11-1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8f5a/2148040/6436b5d1e67b/1748-7188-2-11-2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8f5a/2148040/4cdbf4ba68e0/1748-7188-2-11-3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8f5a/2148040/b8861bb5cb1e/1748-7188-2-11-4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8f5a/2148040/2c35f68197b1/1748-7188-2-11-5.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8f5a/2148040/14ef3bfc2d27/1748-7188-2-11-6.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8f5a/2148040/39f2362cce0b/1748-7188-2-11-7.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8f5a/2148040/78ba0b8f45cd/1748-7188-2-11-8.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8f5a/2148040/56eca899077a/1748-7188-2-11-9.jpg

相似文献

1
Mapping sequences by parts.逐部分映射序列。
Algorithms Mol Biol. 2007 Sep 19;2:11. doi: 10.1186/1748-7188-2-11.
2
Ancestral sequence alignment under optimal conditions.在最佳条件下进行祖先序列比对。
BMC Bioinformatics. 2005 Nov 17;6:273. doi: 10.1186/1471-2105-6-273.
3
Comparison of minisatellites.微卫星的比较。
J Comput Biol. 2003;10(3-4):357-72. doi: 10.1089/10665270360688066.
4
WAS IT A MATch I SAW? Approximate palindromes lead to overstated false match rates in benchmarks using reversed sequences.我看到的是一场匹配吗?在使用反向序列的基准测试中,近似回文会导致过高的错误匹配率。
Bioinform Adv. 2024 Apr 8;4(1):vbae052. doi: 10.1093/bioadv/vbae052. eCollection 2024.
5
Optimal sum-of-pairs multiple sequence alignment using incremental Carrillo and Lipman bounds.使用增量卡里略和利普曼边界的最优成对和多序列比对。
J Comput Biol. 2006 Apr;13(3):668-85. doi: 10.1089/cmb.2006.13.668.
6
A space-efficient algorithm for the constrained pairwise sequence alignment problem.一种用于受限成对序列比对问题的节省空间的算法。
Genome Inform. 2005;16(2):237-46.
7
A linear memory algorithm for Baum-Welch training.一种用于Baum-Welch训练的线性记忆算法。
BMC Bioinformatics. 2005 Sep 19;6:231. doi: 10.1186/1471-2105-6-231.
8
Optimal alignment between groups of sequences and its application to multiple sequence alignment.序列组之间的最优比对及其在多序列比对中的应用。
Comput Appl Biosci. 1993 Jun;9(3):361-70. doi: 10.1093/bioinformatics/9.3.361.
9
Recent developments in linear-space alignment methods: a survey.线性空间对齐方法的最新进展:一项综述。
J Comput Biol. 1994 Winter;1(4):271-91. doi: 10.1089/cmb.1994.1.271.
10
Score distributions of gapped multiple sequence alignments down to the low-probability tail.有空隙的多重序列比对的分数分布到低概率尾部。
Phys Rev E. 2016 Aug;94(2-1):022127. doi: 10.1103/PhysRevE.94.022127. Epub 2016 Aug 19.

本文引用的文献

1
Statistical evaluation and comparison of a pairwise alignment algorithm that a priori assigns the number of gaps rather than employing gap penalties.一种先验分配空位数量而非采用空位罚分的两两比对算法的统计评估与比较。
Bioinformatics. 2005 Apr 15;21(8):1421-8. doi: 10.1093/bioinformatics/bti198. Epub 2004 Dec 10.
2
A novel method for multiple alignment of sequences with repeated and shuffled elements.一种用于对具有重复和重排元件的序列进行多重比对的新方法。
Genome Res. 2004 Nov;14(11):2336-46. doi: 10.1101/gr.2657504.
3
Comparison of minisatellites.
微卫星的比较。
J Comput Biol. 2003;10(3-4):357-72. doi: 10.1089/10665270360688066.
4
Glocal alignment: finding rearrangements during alignment.全局比对:比对过程中发现重排
Bioinformatics. 2003;19 Suppl 1:i54-62. doi: 10.1093/bioinformatics/btg1005.
5
Recurrent exon shuffling between distant P-element families.
Mol Biol Evol. 2003 Feb;20(2):190-9. doi: 10.1093/molbev/msg036.
6
Measuring genome divergence in bacteria: a case study using chlamydian data.测量细菌中的基因组差异:以衣原体数据为例的研究
J Mol Evol. 2002 Jul;55(1):24-36. doi: 10.1007/s00239-001-0087-9.
7
Swaps in protein sequences.蛋白质序列中的交换。
Proteins. 2002 Aug 1;48(2):377-87. doi: 10.1002/prot.10156.
8
Transformation distances: a family of dissimilarity measures based on movements of segments.变换距离:基于线段移动的一类差异度量。
Bioinformatics. 1999 Mar;15(3):194-202. doi: 10.1093/bioinformatics/15.3.194.
9
Matching sequences under deletion-insertion constraints.在缺失-插入约束下匹配序列。
Proc Natl Acad Sci U S A. 1972 Jan;69(1):4-6. doi: 10.1073/pnas.69.1.4.
10
Methods for assessing the statistical significance of molecular sequence features by using general scoring schemes.使用通用评分方案评估分子序列特征统计显著性的方法。
Proc Natl Acad Sci U S A. 1990 Mar;87(6):2264-8. doi: 10.1073/pnas.87.6.2264.