• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

使用偏序图的多序列比对。

Multiple sequence alignment using partial order graphs.

作者信息

Lee Christopher, Grasso Catherine, Sharlow Mark F

机构信息

Department of Chemistry and Biochemistry, University of California, Los Angeles, Los Angeles, CA 90095-1570, USA.

出版信息

Bioinformatics. 2002 Mar;18(3):452-64. doi: 10.1093/bioinformatics/18.3.452.

DOI:10.1093/bioinformatics/18.3.452
PMID:11934745
Abstract

MOTIVATION

Progressive Multiple Sequence Alignment (MSA) methods depend on reducing an MSA to a linear profile for each alignment step. However, this leads to loss of information needed for accurate alignment, and gap scoring artifacts.

RESULTS

We present a graph representation of an MSA that can itself be aligned directly by pairwise dynamic programming, eliminating the need to reduce the MSA to a profile. This enables our algorithm (Partial Order Alignment (POA)) to guarantee that the optimal alignment of each new sequence versus each sequence in the MSA will be considered. Moreover, this algorithm introduces a new edit operator, homologous recombination, important for multidomain sequences. The algorithm has improved speed (linear time complexity) over existing MSA algorithms, enabling construction of massive and complex alignments (e.g. an alignment of 5000 sequences in 4 h on a Pentium II). We demonstrate the utility of this algorithm on a family of multidomain SH2 proteins, and on EST assemblies containing alternative splicing and polymorphism.

AVAILABILITY

The partial order alignment program POA is available at http://www.bioinformatics.ucla.edu/poa.

摘要

动机

渐进式多序列比对(MSA)方法在每个比对步骤中都依赖于将多序列比对简化为线性轮廓。然而,这会导致丢失准确比对所需的信息以及空位计分假象。

结果

我们提出了一种多序列比对的图形表示,它本身可以通过成对动态规划直接进行比对,从而无需将多序列比对简化为轮廓。这使得我们的算法(偏序比对(POA))能够确保考虑每个新序列与多序列比对中每个序列的最优比对。此外,该算法引入了一种新的编辑操作符——同源重组,这对于多结构域序列很重要。与现有的多序列比对算法相比,该算法具有更高的速度(线性时间复杂度),能够构建大规模且复杂的比对(例如,在奔腾II处理器上4小时内完成5000个序列的比对)。我们在一个多结构域SH2蛋白家族以及包含可变剪接和多态性的EST组装上展示了该算法的实用性。

可用性

偏序比对程序POA可在http://www.bioinformatics.ucla.edu/poa获取。

相似文献

1
Multiple sequence alignment using partial order graphs.使用偏序图的多序列比对。
Bioinformatics. 2002 Mar;18(3):452-64. doi: 10.1093/bioinformatics/18.3.452.
2
Generating consensus sequences from partial order multiple sequence alignment graphs.从偏序多序列比对图生成一致序列。
Bioinformatics. 2003 May 22;19(8):999-1008. doi: 10.1093/bioinformatics/btg109.
3
Combining partial order alignment and progressive multiple sequence alignment increases alignment speed and scalability to very large alignment problems.结合偏序比对和渐进多序列比对可提高比对速度,并增强对超大型比对问题的可扩展性。
Bioinformatics. 2004 Jul 10;20(10):1546-56. doi: 10.1093/bioinformatics/bth126. Epub 2004 Feb 12.
4
Improvement in accuracy of multiple sequence alignment using novel group-to-group sequence alignment algorithm with piecewise linear gap cost.使用具有分段线性间隙成本的新型组对组序列比对算法提高多序列比对的准确性。
BMC Bioinformatics. 2006 Dec 1;7:524. doi: 10.1186/1471-2105-7-524.
5
Combining many multiple alignments in one improved alignment.将多个多序列比对合并为一个改进的比对。
Bioinformatics. 1999 Feb;15(2):122-30. doi: 10.1093/bioinformatics/15.2.122.
6
POAVIZ: a Partial order multiple sequence alignment visualizer.POAVIZ:一种偏序多序列比对可视化工具。
Bioinformatics. 2003 Jul 22;19(11):1446-8. doi: 10.1093/bioinformatics/btg175.
7
Super pairwise alignment (SPA): an efficient approach to global alignment for homologous sequences.超双序列比对(SPA):一种用于同源序列全局比对的高效方法。
J Comput Biol. 2002;9(3):477-86. doi: 10.1089/106652702760138574.
8
Accurate extension of multiple sequence alignments using a phylogeny-aware graph algorithm.使用一种基于系统发育感知图算法的多重序列比对精确扩展方法。
Bioinformatics. 2012 Jul 1;28(13):1684-91. doi: 10.1093/bioinformatics/bts198. Epub 2012 Apr 23.
9
Improving the practical space and time efficiency of the shortest-paths approach to sum-of-pairs multiple sequence alignment.提高用于成对总和多序列比对的最短路径方法的实际空间和时间效率。
J Comput Biol. 1995 Fall;2(3):459-72. doi: 10.1089/cmb.1995.2.459.
10
A simple genetic algorithm for multiple sequence alignment.一种用于多序列比对的简单遗传算法。
Genet Mol Res. 2007 Oct 5;6(4):964-82.

引用本文的文献

1
Algorithms to reconstruct past indels: The deletion-only parsimony problem.重建过去插入缺失的算法:仅删除的简约问题。
PLoS Comput Biol. 2025 Jul 28;21(7):e1012585. doi: 10.1371/journal.pcbi.1012585. eCollection 2025 Jul.
2
A survey of sequence-to-graph mapping algorithms in the pangenome era.泛基因组时代序列到图谱映射算法综述。
Genome Biol. 2025 May 22;26(1):138. doi: 10.1186/s13059-025-03606-6.
3
TopoQual polishes circular consensus sequencing data and accurately predicts quality scores.TopoQual优化环状一致序列测序数据并准确预测质量分数。
BMC Bioinformatics. 2025 Jan 16;26(1):17. doi: 10.1186/s12859-024-06020-0.
4
Fast and exact gap-affine partial order alignment with POASTA.使用POASTA进行快速准确的间隙仿射偏序比对。
Bioinformatics. 2024 Dec 26;41(1). doi: 10.1093/bioinformatics/btae757.
5
MetaCONNET: A metagenomic polishing tool for long-read assemblies.MetaCONNET:一种用于长读段组装的宏基因组优化工具。
PLoS One. 2024 Dec 3;19(12):e0313515. doi: 10.1371/journal.pone.0313515. eCollection 2024.
6
TSTA: thread and SIMD-based trapezoidal pairwise/multiple sequence-alignment method.TSTA:基于线程和单指令多数据的梯形成对/多序列比对方法。
GigaByte. 2024 Nov 5;2024:gigabyte141. doi: 10.46471/gigabyte.141. eCollection 2024.
7
Building pangenome graphs.构建泛基因组图谱。
Nat Methods. 2024 Nov;21(11):2008-2012. doi: 10.1038/s41592-024-02430-3. Epub 2024 Oct 21.
8
Sequence Flow: interactive web application for visualizing partial order alignments.序列流:用于可视化偏序比对的交互式网络应用程序。
BMC Genomics. 2024 Oct 16;25(1):973. doi: 10.1186/s12864-024-10886-y.
9
Cluster-efficient pangenome graph construction with nf-core/pangenome.使用 nf-core/pangenome 进行高效聚类的泛基因组图构建。
Bioinformatics. 2024 Nov 1;40(11). doi: 10.1093/bioinformatics/btae609.
10
Jointly benchmarking small and structural variant calls with vcfdist.使用 vcfdist 联合基准小型和结构变异调用。
Genome Biol. 2024 Oct 2;25(1):253. doi: 10.1186/s13059-024-03394-5.