• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

递归 MAGUS:可扩展且精确的多重序列比对。

Recursive MAGUS: Scalable and accurate multiple sequence alignment.

机构信息

Department of Computer Science, University of Illinois at Urbana-Champaign, Urbana, Illinois, United States of America.

出版信息

PLoS Comput Biol. 2021 Oct 6;17(10):e1008950. doi: 10.1371/journal.pcbi.1008950. eCollection 2021 Oct.

DOI:10.1371/journal.pcbi.1008950
PMID:34613974
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC8523058/
Abstract

Multiple sequence alignment tools struggle to keep pace with rapidly growing sequence data, as few methods can handle large datasets while maintaining alignment accuracy. We recently introduced MAGUS, a new state-of-the-art method for aligning large numbers of sequences. In this paper, we present a comprehensive set of enhancements that allow MAGUS to align vastly larger datasets with greater speed. We compare MAGUS to other leading alignment methods on datasets of up to one million sequences. Our results demonstrate the advantages of MAGUS over other alignment software in both accuracy and speed. MAGUS is freely available in open-source form at https://github.com/vlasmirnov/MAGUS.

摘要

多序列比对工具难以跟上快速增长的序列数据,因为很少有方法可以在保持比对准确性的同时处理大型数据集。我们最近引入了 MAGUS,这是一种用于对齐大量序列的最新方法。在本文中,我们提出了一组全面的增强功能,使 MAGUS 能够以更快的速度对齐更大的数据集。我们在多达一百万条序列的数据集上将 MAGUS 与其他领先的比对方法进行了比较。我们的结果表明,MAGUS 在准确性和速度方面都优于其他比对软件。MAGUS 可在 https://github.com/vlasmirnov/MAGUS 上以开源形式免费获得。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4c07/8523058/415daff05a61/pcbi.1008950.g010.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4c07/8523058/cf6972186808/pcbi.1008950.g001.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4c07/8523058/b6abc012b70f/pcbi.1008950.g002.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4c07/8523058/86904015d521/pcbi.1008950.g003.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4c07/8523058/e733251b76c4/pcbi.1008950.g004.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4c07/8523058/c872c292fc42/pcbi.1008950.g005.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4c07/8523058/1ddfa73f3339/pcbi.1008950.g006.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4c07/8523058/24d5b5770f38/pcbi.1008950.g007.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4c07/8523058/71a1d075741d/pcbi.1008950.g008.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4c07/8523058/f4248c4eebf4/pcbi.1008950.g009.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4c07/8523058/415daff05a61/pcbi.1008950.g010.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4c07/8523058/cf6972186808/pcbi.1008950.g001.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4c07/8523058/b6abc012b70f/pcbi.1008950.g002.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4c07/8523058/86904015d521/pcbi.1008950.g003.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4c07/8523058/e733251b76c4/pcbi.1008950.g004.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4c07/8523058/c872c292fc42/pcbi.1008950.g005.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4c07/8523058/1ddfa73f3339/pcbi.1008950.g006.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4c07/8523058/24d5b5770f38/pcbi.1008950.g007.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4c07/8523058/71a1d075741d/pcbi.1008950.g008.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4c07/8523058/f4248c4eebf4/pcbi.1008950.g009.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4c07/8523058/415daff05a61/pcbi.1008950.g010.jpg

相似文献

1
Recursive MAGUS: Scalable and accurate multiple sequence alignment.递归 MAGUS:可扩展且精确的多重序列比对。
PLoS Comput Biol. 2021 Oct 6;17(10):e1008950. doi: 10.1371/journal.pcbi.1008950. eCollection 2021 Oct.
2
MAGUS+eHMMs: improved multiple sequence alignment accuracy for fragmentary sequences.MAGUS+隐马尔可夫模型:提高了片段序列的多序列比对准确性。
Bioinformatics. 2022 Jan 27;38(4):918-924. doi: 10.1093/bioinformatics/btab788.
3
MAGUS: Multiple sequence Alignment using Graph clUStering.MAGUS:基于图聚类的多重序列比对。
Bioinformatics. 2021 Jul 19;37(12):1666-1672. doi: 10.1093/bioinformatics/btaa992.
4
Large-Scale Multiple Sequence Alignment and the Maximum Weight Trace Alignment Merging Problem.大规模多重序列比对和最大权重轨迹比对合并问题。
IEEE/ACM Trans Comput Biol Bioinform. 2023 May-Jun;20(3):1700-1712. doi: 10.1109/TCBB.2022.3191848. Epub 2023 Jun 5.
5
PASTASpark: multiple sequence alignment meets Big Data.PASTASpark:多重序列比对与大数据相遇。
Bioinformatics. 2017 Sep 15;33(18):2948-2950. doi: 10.1093/bioinformatics/btx354.
6
MAFFT online service: multiple sequence alignment, interactive sequence choice and visualization.MAFFT 在线服务:多序列比对、交互式序列选择和可视化。
Brief Bioinform. 2019 Jul 19;20(4):1160-1166. doi: 10.1093/bib/bbx108.
7
Multiple Sequence Alignment for Large Heterogeneous Datasets Using SATé, PASTA, and UPP.使用SATé、PASTA和UPP对大型异构数据集进行多序列比对。
Methods Mol Biol. 2021;2231:99-119. doi: 10.1007/978-1-0716-1036-7_7.
8
DCA: an efficient implementation of the divide-and-conquer approach to simultaneous multiple sequence alignment.DCA:一种用于同时进行多序列比对的分治方法的高效实现。
Comput Appl Biosci. 1997 Dec;13(6):625-6. doi: 10.1093/bioinformatics/13.6.625.
9
CSA: an efficient algorithm to improve circular DNA multiple alignment.CSA:一种改进环状DNA多重比对的高效算法。
BMC Bioinformatics. 2009 Jul 23;10:230. doi: 10.1186/1471-2105-10-230.
10
Fast multiple sequence alignment via multi-armed bandits.基于多臂老虎机的快速多重序列比对。
Bioinformatics. 2024 Jun 28;40(Suppl 1):i328-i336. doi: 10.1093/bioinformatics/btae225.

引用本文的文献

1
Advancing therapeutic vaccines for chronic hepatitis B: Integrating reverse vaccinology and immunoinformatics.推进慢性乙型肝炎治疗性疫苗:整合反向疫苗学与免疫信息学
World J Hepatol. 2025 Jul 27;17(7):107620. doi: 10.4254/wjh.v17.i7.107620.
2
Ultrafast and ultralarge multiple sequence alignments using TWILIGHT.使用TWILIGHT进行超快速和超大的多序列比对。
Bioinformatics. 2025 Jul 1;41(Supplement_1):i332-i341. doi: 10.1093/bioinformatics/btaf212.
3
UPP2: fast and accurate alignment of datasets with fragmentary sequences.UPP2:快速准确地对齐具有片段序列的数据集。

本文引用的文献

1
MAGUS: Multiple sequence Alignment using Graph clUStering.MAGUS:基于图聚类的多重序列比对。
Bioinformatics. 2021 Jul 19;37(12):1666-1672. doi: 10.1093/bioinformatics/btaa992.
2
Large multiple sequence alignments with a root-to-leaf regressive method.使用根到叶回溯方法的大型多重序列比对。
Nat Biotechnol. 2019 Dec;37(12):1466-1470. doi: 10.1038/s41587-019-0333-6. Epub 2019 Dec 2.
3
Kalign 3: multiple sequence alignment of large data sets.Kalign 3:大型数据集的多序列比对
Bioinformatics. 2023 Jan 1;39(1). doi: 10.1093/bioinformatics/btad007.
4
learnMSA: learning and aligning large protein families.learnMSA:学习和对齐大型蛋白质家族。
Gigascience. 2022 Nov 18;11. doi: 10.1093/gigascience/giac104.
5
Recent progress on methods for estimating and updating large phylogenies.关于估计和更新大型系统发育树的方法的最新进展。
Philos Trans R Soc Lond B Biol Sci. 2022 Oct 10;377(1861):20210244. doi: 10.1098/rstb.2021.0244. Epub 2022 Aug 22.
Bioinformatics. 2019 Oct 26;36(6):1928-9. doi: 10.1093/bioinformatics/btz795.
4
Ultra-large alignments using phylogeny-aware profiles.使用系统发育感知概况的超大比对。
Genome Biol. 2015 Jun 16;16(1):124. doi: 10.1186/s13059-015-0688-z.
5
PASTA: Ultra-Large Multiple Sequence Alignment for Nucleotide and Amino-Acid Sequences.PASTA:用于核苷酸和氨基酸序列的超大多重序列比对
J Comput Biol. 2015 May;22(5):377-86. doi: 10.1089/cmb.2014.0156. Epub 2014 Dec 30.
6
SATe-II: very fast and accurate simultaneous estimation of multiple sequence alignments and phylogenetic trees.SATe-II:一种非常快速且准确的同时估计多个序列比对和系统发育树的方法。
Syst Biol. 2012 Jan;61(1):90-106. doi: 10.1093/sysbio/syr095. Epub 2011 Dec 1.
7
Fast, scalable generation of high-quality protein multiple sequence alignments using Clustal Omega.使用 Clustal Omega 快速、可扩展地生成高质量蛋白质多重序列比对。
Mol Syst Biol. 2011 Oct 11;7:539. doi: 10.1038/msb.2011.75.
8
FastSP: linear time calculation of alignment accuracy.FastSP:线性时间计算比对准确性。
Bioinformatics. 2011 Dec 1;27(23):3250-8. doi: 10.1093/bioinformatics/btr553. Epub 2011 Oct 7.
9
FastTree 2--approximately maximum-likelihood trees for large alignments.FastTree 2--用于大型比对的近似最大似然树。
PLoS One. 2010 Mar 10;5(3):e9490. doi: 10.1371/journal.pone.0009490.
10
Rapid and accurate large-scale coestimation of sequence alignments and phylogenetic trees.序列比对和系统发育树的快速准确大规模联合估计
Science. 2009 Jun 19;324(5934):1561-4. doi: 10.1126/science.1171243.