• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

偏斜的碱基组成、不对称的转换矩阵和系统发育不变量。

Skewed base compositions, asymmetric transition matrices, and phylogenetic invariants.

作者信息

Ferretti V, Lang B F, Sankoff D

机构信息

Université de Montréal, CRM, Montreal, Quebec, Canada.

出版信息

J Comput Biol. 1994 Spring;1(1):77-92. doi: 10.1089/cmb.1994.1.77.

DOI:10.1089/cmb.1994.1.77
PMID:8790455
Abstract

Evolutionary inference methods that assume equal DNA base compositions and symmetric nucleotide substitution matrices, where these assumptions do not hold, are likely to group species on the basis of similar base compositions rather than true phylogenetic relationships. We propose an invariants-based method for dealing with this problem. An invariant QT of a tree T under a k-state Markov model, where a generalized time parameter is identified with the E edges of T, allows us to recognize whether data on N observed species can be associated with the N terminal vertices of T in the sense of having been generated on T rather than on any other tree with N terminals. The form of the generalized time parameter is a positive determinant matrix in some semigroup S of stochastic matrices. The invariance is with respect to the choice of the set of E matrices in S, one associated with each of the E edges of T. We apply a general "empirical" method of finding invariants of a parametrized functional form. It involves calculating the probability f of all KN data possibilities for each of m sets of E matrices in S to associate with the edges of T, then solving for the parameters using the m equations of form Q(f) = 0. We discuss the problems of finding asymmetric models satisfying the property of semigroup closure, of finding asymmetric models that admit invariants at all, and of the computational complexity of the method. We propose a class of semigroups Sc containing matrices of form [formula: see text] to account for A+T versus G+C asymmetries in DNA base composition. Quadratic invariants are obtained for rooted trees with three and with four terminals. In the latter case the smallest set of algebraically independent invariants is sought. These invariants are applied to data pertaining the fungal evolution and to the origin of mitochondria as bacterial endosymbionts.

摘要

在DNA碱基组成相等且核苷酸替换矩阵对称的假设不成立的情况下,基于进化推理的方法可能会依据相似的碱基组成而非真正的系统发育关系对物种进行分类。我们提出了一种基于不变量的方法来处理这个问题。在k状态马尔可夫模型下,树T的一个不变量QT(其中广义时间参数与T的E条边相关联)使我们能够识别关于N个观察物种的数据是否能与T的N个末端顶点相关联,即这些数据是否是在T上而非任何其他具有N个末端的树上生成的。广义时间参数的形式是某个随机矩阵半群S中的一个正行列式矩阵。这种不变性与S中E个矩阵的集合选择有关,其中每个矩阵与T的E条边之一相关联。我们应用一种通用的“经验”方法来寻找具有参数化函数形式的不变量。它包括计算S中m组E个矩阵与T的边相关联时所有KN种数据可能性的概率f,然后使用形式为Q(f) = 0的m个方程求解参数。我们讨论了寻找满足半群闭包性质的非对称模型、寻找根本允许不变量的非对称模型以及该方法的计算复杂性等问题。我们提出了一类半群Sc,其中包含形式为[公式:见原文]的矩阵,以解释DNA碱基组成中A + T与G + C的不对称性。对于具有三个和四个末端的有根树,我们得到了二次不变量。在后一种情况下,我们寻求最小的代数独立不变量集。这些不变量被应用于与真菌进化以及线粒体作为细菌内共生体起源相关的数据。

相似文献

1
Skewed base compositions, asymmetric transition matrices, and phylogenetic invariants.偏斜的碱基组成、不对称的转换矩阵和系统发育不变量。
J Comput Biol. 1994 Spring;1(1):77-92. doi: 10.1089/cmb.1994.1.77.
2
Phylogenetic invariants for more general evolutionary models.更一般进化模型的系统发育不变量。
J Theor Biol. 1995 Mar 21;173(2):147-62. doi: 10.1006/jtbi.1995.0052.
3
Mechanized derivation of linear invariants.线性不变量的机械化推导
Mol Biol Evol. 1989 May;6(3):301-16. doi: 10.1093/oxfordjournals.molbev.a040551.
4
Developing a statistically powerful measure for quartet tree inference using phylogenetic identities and Markov invariants.利用系统发育一致性和马尔可夫不变量开发一种用于四重树推断的具有统计学效力的方法。
J Math Biol. 2017 Dec;75(6-7):1619-1654. doi: 10.1007/s00285-017-1129-2. Epub 2017 Apr 22.
5
Phylogenetic invariants for the general Markov model of sequence mutation.序列突变通用马尔可夫模型的系统发育不变量。
Math Biosci. 2003 Dec;186(2):113-44. doi: 10.1016/j.mbs.2003.08.004.
6
Matrix group structure and Markov invariants in the strand symmetric phylogenetic substitution model.链对称系统发育替代模型中的矩阵群结构与马尔可夫不变量
J Math Biol. 2016 Aug;73(2):259-82. doi: 10.1007/s00285-015-0951-7. Epub 2015 Dec 11.
7
Linear invariants under Jukes' and Cantor's one-parameter model.
J Theor Biol. 1995 Apr 21;173(4):339-52. doi: 10.1006/jtbi.1995.0067.
8
Constructing and counting phylogenetic invariants.构建和计算系统发育不变量。
J Comput Biol. 1998 Winter;5(4):713-24. doi: 10.1089/cmb.1998.5.713.
9
Designer invariants for large phylogenies.
Mol Biol Evol. 1990 May;7(3):255-69. doi: 10.1093/oxfordjournals.molbev.a040597.
10
SPIn: model selection for phylogenetic mixtures via linear invariants.SPIn:通过线性不变量进行系统发育混合物的模型选择。
Mol Biol Evol. 2012 Mar;29(3):929-37. doi: 10.1093/molbev/msr259. Epub 2011 Oct 17.

引用本文的文献

1
Rooting gene trees without outgroups: EP rooting.无根基因树的构建:EP 无根法。
Genome Biol Evol. 2012;4(8):709-19. doi: 10.1093/gbe/evs047. Epub 2012 May 16.
2
Molecular phylogeny of Allomyces macrogynus: congruency between nuclear ribosomal RNA- and mitochondrial protein-based trees.大雌异水霉的分子系统发育:基于核糖体RNA和线粒体蛋白的树之间的一致性
J Mol Evol. 1995 Nov;41(5):657-65. doi: 10.1007/BF00175824.