• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

修剪有害分类单元可提高系统发育准确性:一种高效算法和网络服务。

Pruning rogue taxa improves phylogenetic accuracy: an efficient algorithm and webservice.

机构信息

Exelixis Laboratory, Scientific Computing Group, Heidelberg Institute for Theoretical Studies (HITS gGmbH), Schloss-Wolfsbrunnenweg 35, D-69118 Heidelberg, Germany.

出版信息

Syst Biol. 2013 Jan 1;62(1):162-6. doi: 10.1093/sysbio/sys078. Epub 2012 Sep 6.

DOI:10.1093/sysbio/sys078
PMID:22962004
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC3526802/
Abstract

The presence of rogue taxa (rogues) in a set of trees can frequently have a negative impact on the results of a bootstrap analysis (e.g., the overall support in consensus trees). We introduce an efficient graph-based algorithm for rogue taxon identification as well as an interactive webservice implementing this algorithm. Compared with our previous method, the new algorithm is up to 4 orders of magnitude faster, while returning qualitatively identical results. Because of this significant improvement in scalability, the new algorithm can now identify substantially more complex and compute-intensive rogue taxon constellations. On a large and diverse collection of real-world data sets, we show that our method yields better supported reduced/pruned consensus trees than any competing rogue taxon identification method. Using the parallel version of our open-source code, we successfully identified rogue taxa in a set of 100 trees with 116 334 taxa each. For simulated data sets, we show that when removing/pruning rogue taxa with our method from a tree set, we consistently obtain bootstrap consensus trees as well as maximum-likelihood trees that are topologically closer to the respective true trees.

摘要

在一组树中存在离群分类单元(rogue taxa,rogues)通常会对自举分析的结果产生负面影响(例如,共识树中的整体支持度)。我们引入了一种有效的基于图的算法来识别离群分类单元,以及一个实现该算法的交互式网络服务。与我们之前的方法相比,新算法的速度快了 4 个数量级,同时返回的结果质量相同。由于可扩展性的显著提高,新算法现在可以识别更复杂和计算密集型的离群分类单元组合。在大量多样化的真实数据集上,我们表明,与任何竞争的离群分类单元识别方法相比,我们的方法生成了具有更好支持度的简化/修剪共识树。使用我们的开源代码的并行版本,我们成功地在 100 棵树的集合中识别了离群分类单元,每棵树包含 116334 个分类单元。对于模拟数据集,我们表明,当使用我们的方法从树集合中删除/修剪离群分类单元时,我们始终获得拓扑上更接近相应真实树的自举共识树和最大似然树。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/b263/3526802/191b042150d7/sys078f3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/b263/3526802/0997c2b78ac3/sys078f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/b263/3526802/3c6a421b0644/sys078f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/b263/3526802/191b042150d7/sys078f3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/b263/3526802/0997c2b78ac3/sys078f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/b263/3526802/3c6a421b0644/sys078f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/b263/3526802/191b042150d7/sys078f3.jpg

相似文献

1
Pruning rogue taxa improves phylogenetic accuracy: an efficient algorithm and webservice.修剪有害分类单元可提高系统发育准确性:一种高效算法和网络服务。
Syst Biol. 2013 Jan 1;62(1):162-6. doi: 10.1093/sysbio/sys078. Epub 2012 Sep 6.
2
Uncovering hidden phylogenetic consensus in large data sets.揭示大数据集中隐藏的系统发育共识。
IEEE/ACM Trans Comput Biol Bioinform. 2011 Jul-Aug;8(4):902-11. doi: 10.1109/TCBB.2011.28.
3
Using Information Theory to Detect Rogue Taxa and Improve Consensus Trees.利用信息理论检测异常分类单元并改进共识树。
Syst Biol. 2022 Aug 10;71(5):1088-1094. doi: 10.1093/sysbio/syab099.
4
Molecular phylogeny of the hyperdiverse genus Sarcophaga (Diptera: Sarcophagidae), and comparison between algorithms for identification of rogue taxa.超多样的麻蝇属(双翅目:麻蝇科)的分子系统发育,以及用于识别流氓分类群的算法之间的比较。
Cladistics. 2017 Apr;33(2):109-133. doi: 10.1111/cla.12161. Epub 2016 Apr 7.
5
Polyhedral geometry of phylogenetic rogue taxa.系统发育离群分类单元的多面体几何。
Bull Math Biol. 2011 Jun;73(6):1202-26. doi: 10.1007/s11538-010-9556-x. Epub 2010 Jul 17.
6
Bootstrap and Rogue Identification Tests for Phylogenetic Analyses.系统发育分析的自举和 Rogue 鉴定测试。
Mol Biol Evol. 2018 Sep 1;35(9):2327-2333. doi: 10.1093/molbev/msy118.
7
Rogue taxa phenomenon: a biological companion to simulation analysis.流氓分类单元现象:模拟分析的生物学伴生现象。
Mol Phylogenet Evol. 2013 Oct;69(1):1-3. doi: 10.1016/j.ympev.2013.05.010. Epub 2013 May 21.
8
The systematic component of phylogenetic error as a function of taxonomic sampling under parsimony.在简约法下,系统发育误差的系统组成部分作为分类抽样的函数。
Syst Biol. 2005 Jun;54(3):432-40. doi: 10.1080/10635150590946745.
9
Phylogenetic diversity within seconds.数秒内的系统发育多样性。
Syst Biol. 2006 Oct;55(5):769-73. doi: 10.1080/10635150600981604.
10
Mathematical and Simulation-Based Analysis of the Behavior of Admixed Taxa in the Neighbor-Joining Algorithm.基于数学和模拟的邻接法中混合分类群行为分析。
Bull Math Biol. 2019 Feb;81(2):452-493. doi: 10.1007/s11538-018-0444-0. Epub 2018 Jun 6.

引用本文的文献

1
Paleobiome dynamics shaped a large Gondwanan plant radiation.古生物群落动态塑造了冈瓦纳大陆的大规模植物辐射。
Proc Natl Acad Sci U S A. 2025 Jul 22;122(29):e2502129122. doi: 10.1073/pnas.2502129122. Epub 2025 Jul 15.
2
When the Past Fades: Detecting Phylogenetic Signal with SatuTe.当过去消逝:使用SatuTe检测系统发育信号。
Mol Biol Evol. 2025 Apr 30;42(5). doi: 10.1093/molbev/msaf090.
3
Phylogenetic relationships of Neogene hamsters (Mammalia, Rodentia, Cricetinae) revealed under Bayesian inference and maximum parsimony.

本文引用的文献

1
CONFIDENCE LIMITS ON PHYLOGENIES: AN APPROACH USING THE BOOTSTRAP.系统发育树的置信区间:一种使用自展法的方法。
Evolution. 1985 Jul;39(4):783-791. doi: 10.1111/j.1558-5646.1985.tb00420.x.
2
Uncovering hidden phylogenetic consensus in large data sets.揭示大数据集中隐藏的系统发育共识。
IEEE/ACM Trans Comput Biol Bioinform. 2011 Jul-Aug;8(4):902-11. doi: 10.1109/TCBB.2011.28.
3
Sparse supermatrices for phylogenetic inference: taxonomy, alignment, rogue taxa, and the phylogeny of living turtles.用于系统发育推断的稀疏超级矩阵:分类学、比对、异常分类单元和活海龟的系统发育。
运用贝叶斯推断和最大简约法解析新生代仓鼠(哺乳纲,啮齿目,仓鼠科)的系统发生关系。
PeerJ. 2024 Nov 15;12:e18440. doi: 10.7717/peerj.18440. eCollection 2024.
4
LukProt: A Database of Eukaryotic Predicted Proteins Designed for Investigations of Animal Origins.LukProt:一个用于研究动物起源的真核生物预测蛋白数据库。
Genome Biol Evol. 2024 Nov 1;16(11). doi: 10.1093/gbe/evae231.
5
A taxon-rich and genome-scale phylogeny of Opisthokonta.后生动物的一个富含分类群和基因组规模的系统发育关系。
PLoS Biol. 2024 Sep 16;22(9):e3002794. doi: 10.1371/journal.pbio.3002794. eCollection 2024 Sep.
6
A Late Devonian coelacanth reconfigures actinistian phylogeny, disparity, and evolutionary dynamics.晚泥盆世空棘鱼重构建鱼系统发育、形态分异和进化动态。
Nat Commun. 2024 Sep 12;15(1):7529. doi: 10.1038/s41467-024-51238-4.
7
Molecular time estimates for the Lagomorpha diversification.兔形目动物的分子时间估计。
PLoS One. 2024 Sep 6;19(9):e0307380. doi: 10.1371/journal.pone.0307380. eCollection 2024.
8
Genomic data provide insights into the classification of extant termites.基因组数据为现存白蚁的分类提供了深入了解。
Nat Commun. 2024 Aug 7;15(1):6724. doi: 10.1038/s41467-024-51028-y.
9
Molecular phylogeny reveals Varroa mites are not a separate family but a subfamily of Laelapidae.分子系统发育揭示,瓦螨并非一个独立的科,而是革螨科的一个亚科。
Sci Rep. 2024 Jun 18;14(1):13994. doi: 10.1038/s41598-024-63991-z.
10
A Guide to Phylogenomic Inference.系统发育基因组推断指南。
Methods Mol Biol. 2024;2802:267-345. doi: 10.1007/978-1-0716-3838-5_11.
Syst Biol. 2010 Jan;59(1):42-58. doi: 10.1093/sysbio/syp075. Epub 2009 Nov 11.
4
Rapid progress on the vertebrate tree of life.脊椎动物生命之树的快速发展。
BMC Biol. 2010 Mar 8;8:19. doi: 10.1186/1741-7007-8-19.
5
Placing the mountain goat: a total evidence approach to testing alternative hypotheses.放置山羊:测试替代假设的综合证据方法。
Mol Phylogenet Evol. 2010 Apr;55(1):18-25. doi: 10.1016/j.ympev.2010.01.015. Epub 2010 Jan 25.
6
Phylogenetic-signal dissection of nuclear housekeeping genes supports the paraphyly of sponges and the monophyly of Eumetazoa.核管家基因的系统发育信号剖析支持海绵动物的并系性和真后生动物的单系性。
Mol Biol Evol. 2009 Oct;26(10):2261-74. doi: 10.1093/molbev/msp148. Epub 2009 Jul 13.
7
Broad phylogenomic sampling improves resolution of the animal tree of life.广泛的系统发育基因组采样提高了动物生命树的分辨率。
Nature. 2008 Apr 10;452(7188):745-9. doi: 10.1038/nature06614. Epub 2008 Mar 5.
8
RAxML-VI-HPC: maximum likelihood-based phylogenetic analyses with thousands of taxa and mixed models.RAxML-VI-HPC:基于最大似然法的系统发育分析,适用于数千个分类单元及混合模型。
Bioinformatics. 2006 Nov 1;22(21):2688-90. doi: 10.1093/bioinformatics/btl446. Epub 2006 Aug 23.
9
MrBayes 3: Bayesian phylogenetic inference under mixed models.MrBayes 3:混合模型下的贝叶斯系统发育推断。
Bioinformatics. 2003 Aug 12;19(12):1572-4. doi: 10.1093/bioinformatics/btg180.
10
ATV: display and manipulation of annotated phylogenetic trees.ATV:带注释的系统发育树的显示与操作。
Bioinformatics. 2001 Apr;17(4):383-4. doi: 10.1093/bioinformatics/17.4.383.