• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

大规模系统发育树上非参数跨位点速率模型的可识别性与推断

Identifiability and inference of non-parametric rates-across-sites models on large-scale phylogenies.

作者信息

Mossel Elchanan, Roch Sebastien

机构信息

U.C. Berkeley, Berkeley, USA.

出版信息

J Math Biol. 2013 Oct;67(4):767-97. doi: 10.1007/s00285-012-0571-4. Epub 2012 Aug 9.

DOI:10.1007/s00285-012-0571-4
PMID:22875145
Abstract

Mutation rate variation across loci is well known to cause difficulties, notably identifiability issues, in the reconstruction of evolutionary trees from molecular sequences. Here we introduce a new approach for estimating general rates-across-sites models. Our results imply, in particular, that large phylogenies are typically identifiable under rate variation. We also derive sequence-length requirements for high-probability reconstruction. Our main contribution is a novel algorithm that clusters sites according to their mutation rate. Following this site clustering step, standard reconstruction techniques can be used to recover the phylogeny. Our results rely on a basic insight: that, for large trees, certain site statistics experience concentration-of-measure phenomena.

摘要

众所周知,位点间的突变率变化会给从分子序列重建进化树带来困难,尤其是可识别性问题。在此,我们引入一种新方法来估计通用的位点特异模型。我们的结果特别表明,在突变率变化的情况下,大型系统发育树通常是可识别的。我们还推导出了高概率重建所需的序列长度要求。我们的主要贡献是一种新颖的算法,该算法根据位点的突变率对位点进行聚类。在这个位点聚类步骤之后,可以使用标准的重建技术来恢复系统发育树。我们的结果依赖于一个基本观点:对于大型树,某些位点统计量会经历测度集中现象。

相似文献

1
Identifiability and inference of non-parametric rates-across-sites models on large-scale phylogenies.大规模系统发育树上非参数跨位点速率模型的可识别性与推断
J Math Biol. 2013 Oct;67(4):767-97. doi: 10.1007/s00285-012-0571-4. Epub 2012 Aug 9.
2
On the inference of large phylogenies with long branches: how long is too long?具有长分支的大系统发育推断:多长算太长?
Bull Math Biol. 2011 Jul;73(7):1627-44. doi: 10.1007/s11538-010-9584-6. Epub 2010 Oct 8.
3
Identifiability of tree-child phylogenetic networks under a probabilistic recombination-mutation model of evolution.在概率性重组-突变进化模型下树子系统发育网络的可识别性
J Theor Biol. 2018 Jun 7;446:160-167. doi: 10.1016/j.jtbi.2018.03.011. Epub 2018 Mar 13.
4
Shortest triplet clustering: reconstructing large phylogenies using representative sets.最短三元组聚类:使用代表性集合重建大型系统发育树。
BMC Bioinformatics. 2005 Apr 8;6:92. doi: 10.1186/1471-2105-6-92.
5
A Poissonian Model of Indel Rate Variation for Phylogenetic Tree Inference.用于系统发育树推断的插入缺失率变异的泊松模型。
Syst Biol. 2017 Sep 1;66(5):698-714. doi: 10.1093/sysbio/syx033.
6
Identifiability of large phylogenetic mixture models.大型系统发育混合模型的可识别性。
Bull Math Biol. 2012 Jan;74(1):212-31. doi: 10.1007/s11538-011-9672-2. Epub 2011 Jun 30.
7
Bayesian coestimation of phylogeny and sequence alignment.系统发育与序列比对的贝叶斯联合估计
BMC Bioinformatics. 2005 Apr 1;6:83. doi: 10.1186/1471-2105-6-83.
8
Identifiability of Phylogenetic Parameters from k-mer Data Under the Coalescent.在合并模型下,k-mer 数据中系统发育参数的可识别性
Bull Math Biol. 2019 Feb;81(2):431-451. doi: 10.1007/s11538-018-0399-1. Epub 2018 Feb 1.
9
A signal-to-noise analysis of phylogeny estimation by neighbor-joining: Insufficiency of polynomial length sequences.通过邻接法进行系统发育估计的信噪比分析:多项式长度序列的不足。
Math Biosci. 2006 Feb;199(2):188-215. doi: 10.1016/j.mbs.2005.11.003. Epub 2006 Jan 18.
10
Parametric analysis of alignment and phylogenetic uncertainty.参数分析的排列和系统发育的不确定性。
Bull Math Biol. 2011 Apr;73(4):795-810. doi: 10.1007/s11538-010-9610-8. Epub 2011 Mar 16.

本文引用的文献

1
Identifiability of large phylogenetic mixture models.大型系统发育混合模型的可识别性。
Bull Math Biol. 2012 Jan;74(1):212-31. doi: 10.1007/s11538-011-9672-2. Epub 2011 Jun 30.
2
On Rogers' proof of identifiability for the GTR + Γ + I model.关于罗杰斯对广义相对论+Γ+I模型可识别性的证明。
Syst Biol. 2011 Oct;60(5):713-8. doi: 10.1093/sysbio/syr023. Epub 2011 Mar 28.
3
Rate-variation need not defeat phylogenetic inference through pairwise sequence comparisons.速率变化不一定会通过成对序列比较而妨碍系统发育推断。
J Theor Biol. 2010 Apr 21;263(4):587-9. doi: 10.1016/j.jtbi.2009.12.022. Epub 2010 Jan 4.
4
A basic limitation on inferring phylogenies by pairwise sequence comparisons.通过成对序列比较推断系统发育的一个基本限制。
J Theor Biol. 2009 Feb 7;256(3):467-72. doi: 10.1016/j.jtbi.2008.10.010. Epub 2008 Oct 22.
5
Mixed-up trees: the structure of phylogenetic mixtures.混乱的树:系统发育混合体的结构
Bull Math Biol. 2008 May;70(4):1115-39. doi: 10.1007/s11538-007-9293-y. Epub 2008 Jan 3.
6
Phylogenetic mixtures on a single tree can mimic a tree of another topology.单棵树上的系统发育混合可以模拟出具有另一种拓扑结构的树。
Syst Biol. 2007 Oct;56(5):767-75. doi: 10.1080/10635150701627304.
7
Phylogeny of mixture models: robustness of maximum likelihood and non-identifiable distributions.混合模型的系统发育:最大似然法的稳健性与不可识别分布
J Comput Biol. 2007 Mar;14(2):156-89. doi: 10.1089/cmb.2006.0126.
8
Pitfalls of heterogeneous processes for phylogenetic reconstruction.系统发育重建异质过程的陷阱。
Syst Biol. 2007 Feb;56(1):113-24. doi: 10.1080/10635150701245388.
9
Distorted metrics on trees and phylogenetic forests.
IEEE/ACM Trans Comput Biol Bioinform. 2007 Jan-Mar;4(1):108-16. doi: 10.1109/TCBB.2007.1010.
10
A short proof that phylogenetic tree reconstruction by maximum likelihood is hard.关于通过最大似然法进行系统发育树重建很困难的一个简短证明。
IEEE/ACM Trans Comput Biol Bioinform. 2006 Jan-Mar;3(1):92-4. doi: 10.1109/TCBB.2006.4.