• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

多洛数据的新距离。

Novel distances for dollo data.

机构信息

School of Mathematics and Physics, CRC for Forestry, School of Plant Science, University of Tasmania, Private Bag 55, Hobart 7001, Australia.

出版信息

Syst Biol. 2013 Jan 1;62(1):62-77. doi: 10.1093/sysbio/sys071. Epub 2012 Aug 22.

DOI:10.1093/sysbio/sys071
PMID:22914977
Abstract

We investigate distances on binary (presence/absence) data in the context of a Dollo process, where a trait can only arise once on a phylogenetic tree but may be lost many times. We introduce a novel distance, the Additive Dollo Distance (ADD), that applies to data generated under a Dollo model and show that it has some useful theoretical properties including an intriguing link to the LogDet/paralinear distance. Simulations of Dollo data are used to compare a number of binary distances including ADD, LogDet, a restriction-site-based distance, and some simple, but to our knowledge previously unstudied, variations on common binary distances. The simulations suggest that ADD outperforms other distances on Dollo data. Interestingly, we found that the LogDet distance performs poorly in the context of a Dollo process; this may have implications for its use in connection with conditioned genome reconstruction. We apply the ADD to two Diversity Arrays Technology data sets, one that broadly covers Eucalyptus species and one that focuses on the Eucalyptus series Adnataria. We also reanalyze gene family presence/absence data from bacterial genomes obtained from the COG database and compare the results with previous phylogenies estimated using the conditioned genome reconstruction approach. The results for these case studies are largely congruent with previous studies, in some cases giving more phylogenetic resolution.

摘要

我们研究了二分(存在/缺失)数据在多洛过程背景下的距离,其中特征在系统发育树上只能出现一次,但可能会多次丢失。我们引入了一种新的距离,即加性多洛距离(ADD),它适用于多洛模型生成的数据,并表明它具有一些有用的理论性质,包括与对数行列式/平行距离的有趣联系。对多洛数据的模拟比较了多种二进制距离,包括 ADD、对数行列式、基于限制位点的距离以及一些简单但据我们所知以前未研究过的常见二进制距离的变体。模拟表明,ADD 在多洛数据上的表现优于其他距离。有趣的是,我们发现对数行列式距离在多洛过程的背景下表现不佳;这可能对其与条件基因组重建的结合使用有影响。我们将 ADD 应用于两个多样性阵列技术数据集,一个广泛涵盖桉树物种,另一个专注于桉树系列 Adnataria。我们还重新分析了来自 COG 数据库的细菌基因组基因家族存在/缺失数据,并将结果与使用条件基因组重建方法估计的先前系统发育进行了比较。这些案例研究的结果与先前的研究基本一致,在某些情况下提供了更高的系统发育分辨率。

相似文献

1
Novel distances for dollo data.多洛数据的新距离。
Syst Biol. 2013 Jan 1;62(1):62-77. doi: 10.1093/sysbio/sys071. Epub 2012 Aug 22.
2
Conditioned genome reconstruction: how to avoid choosing the conditioning genome.条件基因组重建:如何避免选择条件基因组。
Syst Biol. 2007 Feb;56(1):25-43. doi: 10.1080/10635150601156313.
3
Population genetic analysis and phylogeny reconstruction in Eucalyptus (Myrtaceae) using high-throughput, genome-wide genotyping.利用高通量、全基因组基因分型进行桉树(桃金娘科)的群体遗传学分析和系统发育重建。
Mol Phylogenet Evol. 2011 Apr;59(1):206-24. doi: 10.1016/j.ympev.2011.02.003. Epub 2011 Feb 16.
4
On the artefactual parasitic eubacteria clan in conditioned logdet phylogenies: heterotachy and ortholog identification artefacts as explanations.条件 logdet 系统发育中人为寄生真细菌类群:作为解释的异时性和直系同源鉴定人为产物。
BMC Evol Biol. 2010 Nov 9;10:343. doi: 10.1186/1471-2148-10-343.
5
A simple method for phylogenomic inference using the information of gene content of genomes.一种利用基因组基因内容信息进行系统发育基因组推断的简单方法。
Gene. 2009 Jul 15;441(1-2):163-8. doi: 10.1016/j.gene.2008.07.008. Epub 2008 Jul 17.
6
Bias-corrected paralinear and LogDet distances and tests of molecular clocks and phylogenies under nonstationary nucleotide frequencies.在非平稳核苷酸频率下的偏差校正拟线性和对数行列式距离以及分子钟和系统发育树的检验。
Mol Biol Evol. 1996 Dec;13(10):1375-83. doi: 10.1093/oxfordjournals.molbev.a025584.
7
Patterns of Reproductive Isolation in Eucalyptus-A Phylogenetic Perspective.桉树生殖隔离模式的系统发育透视。
Mol Biol Evol. 2015 Jul;32(7):1833-46. doi: 10.1093/molbev/msv063. Epub 2015 Mar 16.
8
Distance measures in terms of substitution processes.基于替换过程的距离度量。
Theor Popul Biol. 1999 Apr;55(2):166-75. doi: 10.1006/tpbi.1998.1395.
9
Dollo Parsimony Overestimates Ancestral Gene Content Reconstructions.多洛简约性高估了祖先基因含量的重建。
Genome Biol Evol. 2024 Apr 2;16(4). doi: 10.1093/gbe/evae062.
10
A phylogenetic mixture model for gene family loss in parasitic bacteria.一种用于寄生细菌基因家族丢失的系统发育混合模型。
Mol Biol Evol. 2009 Aug;26(8):1901-8. doi: 10.1093/molbev/msp102. Epub 2009 May 12.

引用本文的文献

1
E. urophylla × E. grandis high-quality genome and comparative genomics provide insights on evolution and diversification of eucalyptus.《湿地科学》期刊是由中国科学院主管、中国科学院东北地理与农业生态研究所主办的综合性学术期刊,主要报道国内外湿地科学及相关领域具有创新性的基础研究和应用研究成果,反映国内外湿地科学领域新动态、新趋势、新理论。本刊已被国内外多家重要检索系统收录,包括美国《化学文摘》(CA)、俄罗斯《文摘杂志》(AJ)、英国《动物学记录》(ZR)、美国《乌利希期刊指南》(UPD)、中国科学引文数据库(CSCD)核心库、北京大学《中文核心期刊要目总览》、中国科技论文统计源期刊(中国科技核心期刊)等。
BMC Genomics. 2023 Apr 28;24(1):223. doi: 10.1186/s12864-023-09318-0.
2
A box on the river: The phylogenetics and phylogeography of Eucalyptus baueriana (Eucalyptus sect. Adnataria ser. Heterophloiae).河边的一个盒子:细叶桉(桉树属 Adnataria 组 Heterophloiae 系列)的系统发育和系统地理学。
PLoS One. 2022 Nov 17;17(11):e0276117. doi: 10.1371/journal.pone.0276117. eCollection 2022.
3
Simulating and Summarizing Sources of Gene Tree Incongruence.模拟和总结基因树不一致的来源。
Genome Biol Evol. 2016 May 9;8(5):1299-315. doi: 10.1093/gbe/evw065.
4
Phylogenetic responses of forest trees to global change.森林树木对全球变化的进化响应。
PLoS One. 2013 Apr 4;8(4):e60088. doi: 10.1371/journal.pone.0060088. Print 2013.