• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

条件基因组重建:如何避免选择条件基因组。

Conditioned genome reconstruction: how to avoid choosing the conditioning genome.

作者信息

Spencer Matthew, Bryant David, Susko Edward

机构信息

Department of Mathematics and Statistics, Dalhousie University, Hali, Nova Scotia, B3H 3J5, Canada.

出版信息

Syst Biol. 2007 Feb;56(1):25-43. doi: 10.1080/10635150601156313.

DOI:10.1080/10635150601156313
PMID:17366135
Abstract

Genome phylogenies can be inferred from data on the presence and absence of genes across taxa. Logdet distances may be a good method, because they allow expected genome size to vary across the tree. Recently, Lake and Rivera proposed conditioned genome reconstruction (calculation of logdet distances using only those genes present in a conditioning genome) to deal with unobservable genes that are absent from every taxon of interest. We prove that their method can consistently estimate the topology for almost any choice of conditioning genome. Nevertheless, the choice of conditioning genome is important for small samples. For real bacterial genome data, different choices of conditioning genome can result in strong bootstrap support for different tree topologies. To overcome this problem, we developed supertree methods that combine information from all choices of conditioning genome. One of these methods, based on the BIONJ algorithm, performs well on simulated data and may have applications to other supertree problems. However, an analysis of 40 bacterial genomes using this method supports an incorrect clade of parasites. This is a common feature of model-based gene content methods and is due to parallel gene loss.

摘要

基因组系统发育可以从不同分类群中基因存在与否的数据推断出来。对数行列式距离可能是一种很好的方法,因为它们允许预期基因组大小在整个树中变化。最近,莱克和里维拉提出了条件基因组重建(仅使用条件基因组中存在的那些基因来计算对数行列式距离),以处理在所有感兴趣的分类群中都不存在的不可观察基因。我们证明,对于几乎任何条件基因组的选择,他们的方法都能一致地估计拓扑结构。然而,对于小样本,条件基因组的选择很重要。对于真实的细菌基因组数据,不同的条件基因组选择可能会导致对不同树拓扑结构的强大自引导支持。为了克服这个问题,我们开发了超树方法,该方法结合了来自所有条件基因组选择的信息。其中一种基于BIONJ算法的方法在模拟数据上表现良好,并且可能适用于其他超树问题。然而,使用这种方法对40个细菌基因组进行的分析支持了一个不正确的寄生虫分支。这是基于模型的基因含量方法的一个共同特征,并且是由于平行基因丢失所致。

相似文献

1
Conditioned genome reconstruction: how to avoid choosing the conditioning genome.条件基因组重建:如何避免选择条件基因组。
Syst Biol. 2007 Feb;56(1):25-43. doi: 10.1080/10635150601156313.
2
From phylogenetics to phylogenomics: the evolutionary relationships of insect endosymbiotic gamma-Proteobacteria as a test case.从系统发育学到系统基因组学:以昆虫内共生γ-变形菌的进化关系为例
Syst Biol. 2007 Feb;56(1):1-16. doi: 10.1080/10635150601109759.
3
Distinguishing terminal monophyletic groups from reticulate taxa: performance of phenetic, tree-based, and network procedures.区分终端单系类群与网状分类单元:表型、基于树和网络方法的性能
Syst Biol. 2007 Apr;56(2):302-20. doi: 10.1080/10635150701324225.
4
Imputing supertrees and supernetworks from quartets.从四重奏中推算超级树和超级网络。
Syst Biol. 2007 Feb;56(1):57-67. doi: 10.1080/10635150601167013.
5
A simple method for phylogenomic inference using the information of gene content of genomes.一种利用基因组基因内容信息进行系统发育基因组推断的简单方法。
Gene. 2009 Jul 15;441(1-2):163-8. doi: 10.1016/j.gene.2008.07.008. Epub 2008 Jul 17.
6
SDM: a fast distance-based approach for (super) tree building in phylogenomics.SDM:一种用于系统发育基因组学中(超)树构建的基于距离的快速方法。
Syst Biol. 2006 Oct;55(5):740-55. doi: 10.1080/10635150600969872.
7
Assessment of protein distance measures and tree-building methods for phylogenetic tree reconstruction.用于系统发育树重建的蛋白质距离度量和建树方法评估。
Mol Biol Evol. 2005 Nov;22(11):2257-64. doi: 10.1093/molbev/msi224. Epub 2005 Jul 27.
8
Supertree bootstrapping methods for assessing phylogenetic variation among genes in genome-scale data sets.用于评估基因组规模数据集中基因间系统发育变异的超树自展方法。
Syst Biol. 2006 Jun;55(3):426-40. doi: 10.1080/10635150500541722.
9
Inconsistency of phylogenetic estimates from concatenated data under coalescence.合并模型下串联数据的系统发育估计的不一致性。
Syst Biol. 2007 Feb;56(1):17-24. doi: 10.1080/10635150601146041.
10
Pitfalls of heterogeneous processes for phylogenetic reconstruction.系统发育重建异质过程的陷阱。
Syst Biol. 2007 Feb;56(1):113-24. doi: 10.1080/10635150701245388.

引用本文的文献

1
OrthoPhyl-streamlining large-scale, orthology-based phylogenomic studies of bacteria at broad evolutionary scales.OrthoPhyl——简化基于同源性的大规模细菌系统发育基因组学研究,以广泛的进化尺度为目标。
G3 (Bethesda). 2024 Aug 7;14(8). doi: 10.1093/g3journal/jkae119.
2
Automated reconstruction of whole-genome phylogenies from short-sequence reads.从短序列读段自动重建全基因组系统发育树。
Mol Biol Evol. 2014 May;31(5):1077-88. doi: 10.1093/molbev/msu088. Epub 2014 Mar 5.
3
The deep roots of the rings of life.生命之环的深深根源。
Genome Biol Evol. 2013;5(12):2440-8. doi: 10.1093/gbe/evt194.
4
Telling the whole story in a 10,000-genome world.在一个拥有 10000 个基因组的世界里讲述完整的故事。
Biol Direct. 2011 Jun 30;6:34. doi: 10.1186/1745-6150-6-34.
5
On the artefactual parasitic eubacteria clan in conditioned logdet phylogenies: heterotachy and ortholog identification artefacts as explanations.条件 logdet 系统发育中人为寄生真细菌类群:作为解释的异时性和直系同源鉴定人为产物。
BMC Evol Biol. 2010 Nov 9;10:343. doi: 10.1186/1471-2148-10-343.
6
Inferring bacterial genome flux while considering truncated genes.在考虑截断基因的情况下推断细菌基因组通量。
Genetics. 2010 Sep;186(1):411-26. doi: 10.1534/genetics.110.118448. Epub 2010 Jun 15.
7
Inference and characterization of horizontally transferred gene families using stochastic mapping.基于随机映射推断和刻画水平转移基因家族。
Mol Biol Evol. 2010 Mar;27(3):703-13. doi: 10.1093/molbev/msp240. Epub 2009 Oct 6.
8
The tree of genomes: an empirical comparison of genome-phylogeny reconstruction methods.基因组之树:基因组系统发育重建方法的实证比较
BMC Evol Biol. 2008 Nov 12;8:312. doi: 10.1186/1471-2148-8-312.
9
A likelihood framework to analyse phyletic patterns.一种用于分析系统发育模式的似然框架。
Philos Trans R Soc Lond B Biol Sci. 2008 Dec 27;363(1512):3903-11. doi: 10.1098/rstb.2008.0177.