• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

带插入和缺失的概率系统发育推断

Probabilistic phylogenetic inference with insertions and deletions.

作者信息

Rivas Elena, Eddy Sean R

机构信息

Janelia Farm Research Campus, Howard Hughes Medical Institute, Ashburn, Virginia, United States of America.

出版信息

PLoS Comput Biol. 2008 Sep 19;4(9):e1000172. doi: 10.1371/journal.pcbi.1000172.

DOI:10.1371/journal.pcbi.1000172
PMID:18787703
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC2527138/
Abstract

A fundamental task in sequence analysis is to calculate the probability of a multiple alignment given a phylogenetic tree relating the sequences and an evolutionary model describing how sequences change over time. However, the most widely used phylogenetic models only account for residue substitution events. We describe a probabilistic model of a multiple sequence alignment that accounts for insertion and deletion events in addition to substitutions, given a phylogenetic tree, using a rate matrix augmented by the gap character. Starting from a continuous Markov process, we construct a non-reversible generative (birth-death) evolutionary model for insertions and deletions. The model assumes that insertion and deletion events occur one residue at a time. We apply this model to phylogenetic tree inference by extending the program dnaml in phylip. Using standard benchmarking methods on simulated data and a new "concordance test" benchmark on real ribosomal RNA alignments, we show that the extended program dnamlepsilon improves accuracy relative to the usual approach of ignoring gaps, while retaining the computational efficiency of the Felsenstein peeling algorithm.

摘要

序列分析中的一项基本任务是,在给出与序列相关的系统发育树以及描述序列随时间如何变化的进化模型的情况下,计算多重比对的概率。然而,最广泛使用的系统发育模型仅考虑残基替换事件。我们描述了一种多重序列比对的概率模型,该模型在给定系统发育树的情况下,除了替换事件外还考虑插入和缺失事件,使用由空位字符扩充的速率矩阵。从连续马尔可夫过程出发,我们构建了一个用于插入和缺失的不可逆生成(生死)进化模型。该模型假设插入和缺失事件一次发生一个残基。我们通过扩展phylip中的程序dnaml,将此模型应用于系统发育树推断。使用模拟数据上的标准基准测试方法以及真实核糖体RNA比对上的新“一致性测试”基准,我们表明扩展后的程序dnamlepsilon相对于忽略空位的常规方法提高了准确性,同时保留了费尔斯滕森剥离算法的计算效率。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/a329/2527138/b9e233d8d151/pcbi.1000172.g004.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/a329/2527138/2fc629b709ff/pcbi.1000172.g001.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/a329/2527138/1c74da8f3e90/pcbi.1000172.g002.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/a329/2527138/8a1ef7f2cc53/pcbi.1000172.g003.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/a329/2527138/b9e233d8d151/pcbi.1000172.g004.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/a329/2527138/2fc629b709ff/pcbi.1000172.g001.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/a329/2527138/1c74da8f3e90/pcbi.1000172.g002.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/a329/2527138/8a1ef7f2cc53/pcbi.1000172.g003.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/a329/2527138/b9e233d8d151/pcbi.1000172.g004.jpg

相似文献

1
Probabilistic phylogenetic inference with insertions and deletions.带插入和缺失的概率系统发育推断
PLoS Comput Biol. 2008 Sep 19;4(9):e1000172. doi: 10.1371/journal.pcbi.1000172.
2
Bayesian coestimation of phylogeny and sequence alignment.系统发育与序列比对的贝叶斯联合估计
BMC Bioinformatics. 2005 Apr 1;6:83. doi: 10.1186/1471-2105-6-83.
3
Evolutionary inference via the Poisson Indel Process.通过泊松插入缺失过程进行进化推断。
Proc Natl Acad Sci U S A. 2013 Jan 22;110(4):1160-6. doi: 10.1073/pnas.1220450110. Epub 2012 Dec 28.
4
Statistically consistent and computationally efficient inference of ancestral DNA sequences in the TKF91 model under dense taxon sampling.在密集分类采样下,使用 TKF91 模型对祖先 DNA 序列进行统计一致且计算高效的推断。
Bull Math Biol. 2020 Jan 22;82(2):21. doi: 10.1007/s11538-020-00693-3.
5
Phylogenetic inference under varying proportions of indel-induced alignment gaps.在不同比例的插入缺失导致的比对空位情况下的系统发育推断。
BMC Evol Biol. 2009 Aug 23;9:211. doi: 10.1186/1471-2148-9-211.
6
Phylogeny-Aware Alignment with PRANK and PAGAN.使用PRANK和PAGAN进行系统发育感知比对。
Methods Mol Biol. 2021;2231:17-37. doi: 10.1007/978-1-0716-1036-7_2.
7
An algorithm for progressive multiple alignment of sequences with insertions.一种用于含插入序列的渐进多序列比对算法。
Proc Natl Acad Sci U S A. 2005 Jul 26;102(30):10557-62. doi: 10.1073/pnas.0409137102. Epub 2005 Jul 6.
8
Using evolutionary Expectation Maximization to estimate indel rates.使用进化期望最大化算法来估计插入缺失率。
Bioinformatics. 2005 May 15;21(10):2294-300. doi: 10.1093/bioinformatics/bti177. Epub 2005 Feb 24.
9
Evolutionary models for insertions and deletions in a probabilistic modeling framework.概率建模框架下插入和缺失的进化模型。
BMC Bioinformatics. 2005 Mar 21;6:63. doi: 10.1186/1471-2105-6-63.
10
Evolutionary HMMs: a Bayesian approach to multiple alignment.进化隐马尔可夫模型:一种用于多序列比对的贝叶斯方法。
Bioinformatics. 2001 Sep;17(9):803-20. doi: 10.1093/bioinformatics/17.9.803.

引用本文的文献

1
Protein Structural Phylogenetics.蛋白质结构系统发育学
Genome Biol Evol. 2025 Jul 30;17(8). doi: 10.1093/gbe/evaf139.
2
Insertions and Deletions: Computational Methods, Evolutionary Dynamics, and Biological Applications.插入和缺失:计算方法、进化动态和生物应用。
Mol Biol Evol. 2024 Sep 4;41(9). doi: 10.1093/molbev/msae177.
3
Optimal phylogenetic reconstruction of insertion and deletion events.最优的插入和缺失事件的系统发育重建。

本文引用的文献

1
Indelign: a probabilistic framework for annotation of insertions and deletions in a multiple alignment.Indelign:一种用于在多序列比对中注释插入和缺失的概率框架。
Bioinformatics. 2007 Feb 1;23(3):289-97. doi: 10.1093/bioinformatics/btl578. Epub 2006 Nov 15.
2
Efficient likelihood computations with nonreversible models of evolution.使用不可逆进化模型进行高效似然计算。
Syst Biol. 2006 Oct;55(5):756-68. doi: 10.1080/10635150600975218.
3
On the inference of parsimonious indel evolutionary scenarios.关于简约插入缺失进化情景的推断。
Bioinformatics. 2024 Jun 28;40(Suppl 1):i277-i286. doi: 10.1093/bioinformatics/btae254.
4
The Two Domains of the Avian Double-β-Defensin AvBD11 Have Different Ancestors, Common with Potential Monodomain Crocodile and Turtle Defensins.鸟类双β-防御素AvBD11的两个结构域有不同的祖先,与潜在的单结构域鳄鱼和海龟防御素相同。
Biology (Basel). 2022 Apr 30;11(5):690. doi: 10.3390/biology11050690.
5
A phylogenetic approach for weighting genetic sequences.一种用于遗传序列加权的系统发育方法。
BMC Bioinformatics. 2021 May 28;22(1):285. doi: 10.1186/s12859-021-04183-8.
6
The Cumulative Indel Model: Fast and Accurate Statistical Evolutionary Alignment.累积插入缺失模型:快速准确的统计进化比对。
Syst Biol. 2021 Feb 10;70(2):236-257. doi: 10.1093/sysbio/syaa050.
7
Eleven grand challenges in single-cell data science.单细胞数据科学的 11 大挑战。
Genome Biol. 2020 Feb 7;21(1):31. doi: 10.1186/s13059-020-1926-6.
8
Split-inducing indels in phylogenomic analysis.系统发育基因组分析中的分裂诱导插入缺失
Algorithms Mol Biol. 2018 Jul 16;13:12. doi: 10.1186/s13015-018-0130-7. eCollection 2018.
9
Solving the master equation for Indels.求解插入缺失的主方程。
BMC Bioinformatics. 2017 May 12;18(1):255. doi: 10.1186/s12859-017-1665-1.
10
Measuring Accelerated Rates of Insertions and Deletions Independent of Rates of Nucleotide Substitution.测量与核苷酸替换速率无关的插入和缺失的加速速率。
J Mol Evol. 2016 Oct;83(3-4):137-146. doi: 10.1007/s00239-016-9761-9. Epub 2016 Oct 21.
J Bioinform Comput Biol. 2006 Jun;4(3):721-44. doi: 10.1142/s0219720006002168.
4
MCALIGN2: faster, accurate global pairwise alignment of non-coding DNA sequences based on explicit models of indel evolution.MCALIGN2:基于插入缺失进化的显式模型,对非编码DNA序列进行更快、更准确的全局成对比对。
BMC Bioinformatics. 2006 Jun 8;7:292. doi: 10.1186/1471-2105-7-292.
5
REPRESENTATION OF A CLASS OF STOCHASTIC Processes.一类随机过程的表示
Proc Natl Acad Sci U S A. 1955 Jun 15;41(6):387-91. doi: 10.1073/pnas.41.6.387.
6
SIMPROT: using an empirically determined indel distribution in simulations of protein evolution.SIMPROT:在蛋白质进化模拟中使用经验确定的插入缺失分布。
BMC Bioinformatics. 2005 Sep 27;6:236. doi: 10.1186/1471-2105-6-236.
7
Simultaneous statistical multiple alignment and phylogeny reconstruction.同时进行统计多重比对和系统发育重建。
Syst Biol. 2005 Aug;54(4):548-61. doi: 10.1080/10635150590950371.
8
Evolutionarily conserved elements in vertebrate, insect, worm, and yeast genomes.脊椎动物、昆虫、蠕虫和酵母基因组中的进化保守元件。
Genome Res. 2005 Aug;15(8):1034-50. doi: 10.1101/gr.3715005. Epub 2005 Jul 15.
9
Bayesian coestimation of phylogeny and sequence alignment.系统发育与序列比对的贝叶斯联合估计
BMC Bioinformatics. 2005 Apr 1;6:83. doi: 10.1186/1471-2105-6-83.
10
Evolutionary models for insertions and deletions in a probabilistic modeling framework.概率建模框架下插入和缺失的进化模型。
BMC Bioinformatics. 2005 Mar 21;6:63. doi: 10.1186/1471-2105-6-63.