• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

LSHPlace:使用局部敏感哈希进行快速系统发育定位

LSHPlace: fast phylogenetic placement using locality-sensitive hashing.

作者信息

Brown Daniel G, Truszkowski Jakub

机构信息

David R. Cheriton School of Computer Science, University of Waterloo, Waterloo ON N2L 3G1, Canada.

出版信息

Pac Symp Biocomput. 2013:310-9.

PMID:23424136
Abstract

We consider the problem of phylogenetic placement, in which large numbers of sequences (often next-generation sequencing reads) are placed onto an existing phylogenetic tree. We adapt our recent work on phylogenetic tree inference, which uses ancestral sequence reconstruction and locality-sensitive hashing, to this domain. With these ideas, new sequences can be placed onto trees with high fidelity in strikingly fast runtimes. Our results are two orders of magnitude faster than existing programs for this domain, and show a modest accuracy tradeoff. Our results offer the possibility of analyzing many more reads in a next-generation sequencing project than is currently possible.

摘要

我们考虑系统发育定位问题,即在这个问题中,大量序列(通常是二代测序 reads)被定位到现有的系统发育树上。我们将近期关于系统发育树推断的工作(该工作使用祖先序列重建和局部敏感哈希)应用于这个领域。基于这些理念,新序列能够以惊人的快速运行时间被高精度地定位到树上。我们的结果比该领域现有的程序快两个数量级,并且显示出适度的准确性权衡。我们的结果为在二代测序项目中分析比目前更多的 reads 提供了可能性。

相似文献

1
LSHPlace: fast phylogenetic placement using locality-sensitive hashing.LSHPlace:使用局部敏感哈希进行快速系统发育定位
Pac Symp Biocomput. 2013:310-9.
2
SEPP: SATé-enabled phylogenetic placement.SEPP:基于SATé的系统发育定位
Pac Symp Biocomput. 2012:247-58. doi: 10.1142/9789814366496_0024.
3
MetaDomain: a profile HMM-based protein domain classification tool for short sequences.MetaDomain:一种基于隐马尔可夫模型轮廓的短序列蛋白质结构域分类工具。
Pac Symp Biocomput. 2012:271-82.
4
On the quality of tree-based protein classification.论基于树的蛋白质分类的质量。
Bioinformatics. 2005 May 1;21(9):1876-90. doi: 10.1093/bioinformatics/bti244. Epub 2005 Jan 12.
5
Phylogenetic placement of metagenomic reads using the minimum evolution principle.基于最小进化原理对宏基因组 reads 进行系统发育定位。
BMC Genomics. 2015;16 Suppl 1(Suppl 1):S13. doi: 10.1186/1471-2164-16-S1-S13. Epub 2015 Jan 15.
6
New approaches to phylogenetic tree search and their application to large numbers of protein alignments.系统发育树搜索的新方法及其在大量蛋白质序列比对中的应用。
Syst Biol. 2007 Oct;56(5):727-40. doi: 10.1080/10635150701611134.
7
SATe-II: very fast and accurate simultaneous estimation of multiple sequence alignments and phylogenetic trees.SATe-II:一种非常快速且准确的同时估计多个序列比对和系统发育树的方法。
Syst Biol. 2012 Jan;61(1):90-106. doi: 10.1093/sysbio/syr095. Epub 2011 Dec 1.
8
PASTA: Ultra-Large Multiple Sequence Alignment for Nucleotide and Amino-Acid Sequences.PASTA:用于核苷酸和氨基酸序列的超大多重序列比对
J Comput Biol. 2015 May;22(5):377-86. doi: 10.1089/cmb.2014.0156. Epub 2014 Dec 30.
9
Bayesian coestimation of phylogeny and sequence alignment.系统发育与序列比对的贝叶斯联合估计
BMC Bioinformatics. 2005 Apr 1;6:83. doi: 10.1186/1471-2105-6-83.
10
Pash 2.0: scaleable sequence anchoring for next-generation sequencing technologies.Pash 2.0:用于下一代测序技术的可扩展序列锚定
Pac Symp Biocomput. 2008:102-13.

引用本文的文献

1
CONSULT-II: accurate taxonomic identification and profiling using locality-sensitive hashing.CONSULT-II:基于位置敏感哈希的准确分类鉴定和特征分析。
Bioinformatics. 2024 Mar 29;40(4). doi: 10.1093/bioinformatics/btae150.
2
Online tree expansion could help solve the problem of scalability in Bayesian phylogenetics.在线树扩展可以帮助解决贝叶斯系统发生学中的可扩展性问题。
Syst Biol. 2023 Nov 1;72(5):1199-1206. doi: 10.1093/sysbio/syad045.
3
App-SpaM: phylogenetic placement of short reads without sequence alignment.App-SpaM:无需序列比对的短读段系统发育定位
Bioinform Adv. 2021 Oct 13;1(1):vbab027. doi: 10.1093/bioadv/vbab027. eCollection 2021.
4
Metagenomic Analysis Using Phylogenetic Placement-A Review of the First Decade.基于系统发育定位的宏基因组分析——首个十年综述
Front Bioinform. 2022 May 26;2:871393. doi: 10.3389/fbinf.2022.871393. eCollection 2022.
5
Distance-Based Phylogenetic Placement with Statistical Support.具有统计支持的基于距离的系统发育定位
Biology (Basel). 2022 Aug 12;11(8):1212. doi: 10.3390/biology11081212.
6
CONSULT: accurate contamination removal using locality-sensitive hashing.咨询:使用局部敏感哈希进行精确的污染去除。
NAR Genom Bioinform. 2021 Aug 5;3(3):lqab071. doi: 10.1093/nargab/lqab071. eCollection 2021 Sep.
7
Read-SpaM: assembly-free and alignment-free comparison of bacterial genomes with low sequencing coverage.Read-SpaM:用于低测序覆盖度细菌基因组的无组装和无比对比较。
BMC Bioinformatics. 2019 Dec 17;20(Suppl 20):638. doi: 10.1186/s12859-019-3205-7.
8
APPLES: Scalable Distance-Based Phylogenetic Placement with or without Alignments.APPLS:基于距离的可扩展系统发育排列,无需或需进行比对。
Syst Biol. 2020 May 1;69(3):566-578. doi: 10.1093/sysbio/syz063.
9
Phylogenetics and the human microbiome.系统发育学与人类微生物组
Syst Biol. 2015 Jan;64(1):e26-41. doi: 10.1093/sysbio/syu053. Epub 2014 Aug 7.