• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

核苷酸序列进化的一般马尔可夫模型下的系统发育和不变位点估计。

Estimation of phylogeny and invariant sites under the general Markov model of nucleotide sequence evolution.

作者信息

Jayaswal Vivek, Robinson John, Jermiin Lars

机构信息

Sydney Bioinformatics, University of Sydney, NSW 2006, Australia.

出版信息

Syst Biol. 2007 Apr;56(2):155-62. doi: 10.1080/10635150701247921.

DOI:10.1080/10635150701247921
PMID:17454972
Abstract

The models of nucleotide substitution used by most maximum likelihood-based methods assume that the evolutionary process is stationary, reversible, and homogeneous. We present an extension of the Barry and Hartigan model, which can be used to estimate parameters by maximum likelihood (ML) when the data contain invariant sites and there are violations of the assumptions of stationarity, reversibility, and homogeneity. Unlike most ML methods for estimating invariant sites, we estimate the nucleotide composition of invariant sites separately from that of variable sites. We analyze a bacterial data set where problems due to lack of stationarity and homogeneity have been previously well noted and use the parametric bootstrap to show that the data are consistent with our general Markov model. We also show that estimates of invariant sites obtained using our method are fairly accurate when applied to data simulated under the general Markov model.

摘要

大多数基于最大似然法的核苷酸替换模型假定进化过程是平稳的、可逆的且均匀的。我们提出了巴里和哈蒂根模型的一种扩展,当数据包含不变位点且违反平稳性、可逆性和均匀性假设时,该扩展可用于通过最大似然法(ML)估计参数。与大多数用于估计不变位点的ML方法不同,我们分别估计不变位点和可变位点的核苷酸组成。我们分析了一个细菌数据集,该数据集因缺乏平稳性和均匀性而导致的问题此前已得到充分关注,并使用参数自助法表明数据与我们的一般马尔可夫模型一致。我们还表明,当将我们的方法应用于在一般马尔可夫模型下模拟的数据时,获得的不变位点估计相当准确。

相似文献

1
Estimation of phylogeny and invariant sites under the general Markov model of nucleotide sequence evolution.核苷酸序列进化的一般马尔可夫模型下的系统发育和不变位点估计。
Syst Biol. 2007 Apr;56(2):155-62. doi: 10.1080/10635150701247921.
2
Two stationary nonhomogeneous Markov models of nucleotide sequence evolution.两个核苷酸序列进化的静态非齐次马尔可夫模型。
Syst Biol. 2011 Jan;60(1):74-86. doi: 10.1093/sysbio/syq076. Epub 2010 Nov 16.
3
Estimation of phylogeny using a general Markov model.使用通用马尔可夫模型进行系统发育估计。
Evol Bioinform Online. 2007 Feb 25;1:62-80.
4
Genetic distance for a general non-stationary markov substitution process.一般非平稳马尔可夫替换过程的遗传距离。
Syst Biol. 2015 Mar;64(2):281-93. doi: 10.1093/sysbio/syu106. Epub 2014 Dec 9.
5
Comparison of models for nucleotide substitution used in maximum-likelihood phylogenetic estimation.用于最大似然系统发育估计的核苷酸替换模型比较。
Mol Biol Evol. 1994 Mar;11(2):316-24. doi: 10.1093/oxfordjournals.molbev.a040112.
6
Unraveling the evolutionary radiation of the thoracican barnacles using molecular and morphological evidence: a comparison of several divergence time estimation approaches.利用分子和形态学证据揭示蔓足类藤壶的进化辐射:几种分歧时间估计方法的比较
Syst Biol. 2004 Apr;53(2):244-64. doi: 10.1080/10635150490423458.
7
Bayesian coestimation of phylogeny and sequence alignment.系统发育与序列比对的贝叶斯联合估计
BMC Bioinformatics. 2005 Apr 1;6:83. doi: 10.1186/1471-2105-6-83.
8
Were the original eubacteria thermophiles?最初的真细菌是嗜热菌吗?
Syst Appl Microbiol. 1987;9:34-9. doi: 10.1016/s0723-2020(87)80053-x.
9
Quantifying the stationarity and time reversibility of the nucleotide substitution process.量化核苷酸替换过程的平稳性和时间可逆性。
Mol Biol Evol. 2008 Dec;25(12):2525-35. doi: 10.1093/molbev/msn169. Epub 2008 Aug 5.
10
Exploring among-site rate variation models in a maximum likelihood framework using empirical data: effects of model assumptions on estimates of topology, branch lengths, and bootstrap support.在最大似然框架下使用经验数据探索位点间速率变化模型:模型假设对拓扑结构、分支长度和自展支持度估计的影响。
Syst Biol. 2001 Feb;50(1):67-86.

引用本文的文献

1
A new phylogenetic protocol: dealing with model misspecification and confirmation bias in molecular phylogenetics.一种新的系统发育分析方法:应对分子系统发育中的模型误设和确认偏差
NAR Genom Bioinform. 2020 Jun 23;2(2):lqaa041. doi: 10.1093/nargab/lqaa041. eCollection 2020 Jun.
2
Felsenstein Phylogenetic Likelihood.费雪氏系统发生似然
J Mol Evol. 2021 Apr;89(3):134-145. doi: 10.1007/s00239-020-09982-w. Epub 2021 Jan 13.
3
The Prevalence and Impact of Model Violations in Phylogenetic Analysis.系统发育分析中模型违反的普遍性及其影响。
Genome Biol Evol. 2019 Dec 1;11(12):3341-3352. doi: 10.1093/gbe/evz193.
4
Standard Codon Substitution Models Overestimate Purifying Selection for Nonstationary Data.标准密码子替换模型高估了非平稳数据的纯化选择。
Genome Biol Evol. 2017 Jan 1;9(1):134-149. doi: 10.1093/gbe/evw308.
5
A Nonstationary Markov Model Detects Directional Evolution in Hymenopteran Morphology.一种非平稳马尔可夫模型检测膜翅目形态的定向进化。
Syst Biol. 2015 Nov;64(6):1089-103. doi: 10.1093/sysbio/syv052. Epub 2015 Aug 12.
6
Genetic distance for a general non-stationary markov substitution process.一般非平稳马尔可夫替换过程的遗传距离。
Syst Biol. 2015 Mar;64(2):281-93. doi: 10.1093/sysbio/syu106. Epub 2014 Dec 9.
7
A branch-heterogeneous model of protein evolution for efficient inference of ancestral sequences.一种用于高效推断祖先序列的蛋白质进化分支异质模型。
Syst Biol. 2013 Jul;62(4):523-38. doi: 10.1093/sysbio/syt016. Epub 2013 Mar 7.
8
Sources of signal in 62 protein-coding nuclear genes for higher-level phylogenetics of arthropods.用于节肢动物高级系统发育的 62 个蛋白质编码核基因中的信号源。
PLoS One. 2011;6(8):e23408. doi: 10.1371/journal.pone.0023408. Epub 2011 Aug 4.
9
Performance, accuracy, and Web server for evolutionary placement of short sequence reads under maximum likelihood.基于最大似然法的短序列读取进化定位的性能、准确性和网络服务器。
Syst Biol. 2011 May;60(3):291-302. doi: 10.1093/sysbio/syr010. Epub 2011 Mar 23.
10
Comparison of methods for estimating the nucleotide substitution matrix.核苷酸替换矩阵估计方法的比较。
BMC Bioinformatics. 2008 Dec 1;9:511. doi: 10.1186/1471-2105-9-511.