• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

使用 BAli-Phy 进行准确的大规模系统发育感知对齐。

Accurate large-scale phylogeny-aware alignment using BAli-Phy.

机构信息

Department of Computer Science, University of Illinois Urbana-Champaign, Urbana, IL 61801, USA.

出版信息

Bioinformatics. 2021 Dec 11;37(24):4677-4683. doi: 10.1093/bioinformatics/btab555.

DOI:10.1093/bioinformatics/btab555
PMID:34320635
Abstract

MOTIVATION

BAli-Phy, a popular Bayesian method that co-estimates multiple sequence alignments and phylogenetic trees, is a rigorous statistical method, but due to its computational requirements, it has generally been limited to relatively small datasets (at most about 100 sequences). Here, we repurpose BAli-Phy as a 'phylogeny-aware' alignment method: we estimate the phylogeny from the input of unaligned sequences, and then use that as a fixed tree within BAli-Phy.

RESULTS

We show that this approach achieves high accuracy, greatly superior to Prank, the current most popular phylogeny-aware alignment method, and is even more accurate than MAFFT, one of the top performing alignment methods in common use. Furthermore, this approach can be used to align very large datasets (up to 1000 sequences in this study).

AVAILABILITY AND IMPLEMENTATION

See https://doi.org/10.13012/B2IDB-7863273_V1 for datasets used in this study.

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

动机

BAli-Phy 是一种流行的贝叶斯方法,可同时估计多个序列比对和系统发育树,它是一种严格的统计方法,但由于其计算要求,通常仅限于相对较小的数据集(最多约 100 个序列)。在这里,我们将 BAli-Phy 重新用作“了解系统发育的”比对方法:我们从未对齐序列的输入中估计系统发育,然后将其作为 BAli-Phy 中的固定树使用。

结果

我们表明,这种方法具有很高的准确性,大大优于当前最流行的了解系统发育的比对方法 Prank,甚至比常用的顶级比对方法之一 MAFFT 更准确。此外,这种方法可用于对齐非常大的数据集(在本研究中可达 1000 个序列)。

可用性和实现

有关本研究中使用的数据集,请参见 https://doi.org/10.13012/B2IDB-7863273_V1。

补充信息

补充数据可在“Bioinformatics”在线获取。

相似文献

1
Accurate large-scale phylogeny-aware alignment using BAli-Phy.使用 BAli-Phy 进行准确的大规模系统发育感知对齐。
Bioinformatics. 2021 Dec 11;37(24):4677-4683. doi: 10.1093/bioinformatics/btab555.
2
Scaling statistical multiple sequence alignment to large datasets.将统计多序列比对扩展到大型数据集。
BMC Genomics. 2016 Nov 11;17(Suppl 10):764. doi: 10.1186/s12864-016-3101-8.
3
BAli-Phy version 3: model-based co-estimation of alignment and phylogeny.BAli-Phy版本3:基于模型的比对与系统发育共同估计
Bioinformatics. 2021 Sep 29;37(18):3032-3034. doi: 10.1093/bioinformatics/btab129.
4
BAli-Phy: simultaneous Bayesian inference of alignment and phylogeny.BAli-Phy:比对和系统发育的同步贝叶斯推断
Bioinformatics. 2006 Aug 15;22(16):2047-8. doi: 10.1093/bioinformatics/btl175. Epub 2006 May 5.
5
Erasing errors due to alignment ambiguity when estimating positive selection.在估计正选择时消除由于比对歧义导致的错误。
Mol Biol Evol. 2014 Aug;31(8):1979-93. doi: 10.1093/molbev/msu174. Epub 2014 May 27.
6
Evaluating Statistical Multiple Sequence Alignment in Comparison to Other Alignment Methods on Protein Data Sets.评估统计多重序列比对与蛋白质数据集上其他比对方法的比较。
Syst Biol. 2019 May 1;68(3):396-411. doi: 10.1093/sysbio/syy068.
7
UPP2: fast and accurate alignment of datasets with fragmentary sequences.UPP2:快速准确地对齐具有片段序列的数据集。
Bioinformatics. 2023 Jan 1;39(1). doi: 10.1093/bioinformatics/btad007.
8
SATe-II: very fast and accurate simultaneous estimation of multiple sequence alignments and phylogenetic trees.SATe-II:一种非常快速且准确的同时估计多个序列比对和系统发育树的方法。
Syst Biol. 2012 Jan;61(1):90-106. doi: 10.1093/sysbio/syr095. Epub 2011 Dec 1.
9
Bayesian coestimation of phylogeny and sequence alignment.系统发育与序列比对的贝叶斯联合估计
BMC Bioinformatics. 2005 Apr 1;6:83. doi: 10.1186/1471-2105-6-83.
10
DACTAL: divide-and-conquer trees (almost) without alignments.DACTAL:无需对齐的分而治之树(几乎)。
Bioinformatics. 2012 Jun 15;28(12):i274-82. doi: 10.1093/bioinformatics/bts218.

引用本文的文献

1
Insertions and Deletions: Computational Methods, Evolutionary Dynamics, and Biological Applications.插入和缺失:计算方法、进化动态和生物应用。
Mol Biol Evol. 2024 Sep 4;41(9). doi: 10.1093/molbev/msae177.
2
Recent progress on methods for estimating and updating large phylogenies.关于估计和更新大型系统发育树的方法的最新进展。
Philos Trans R Soc Lond B Biol Sci. 2022 Oct 10;377(1861):20210244. doi: 10.1098/rstb.2021.0244. Epub 2022 Aug 22.