• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

相似文献

1
Many-core algorithms for high-dimensional gradients on phylogenetic trees.用于系统发育树上高维梯度的多核算法。
ArXiv. 2023 Mar 8:arXiv:2303.04390v1.
2
Many-core algorithms for high-dimensional gradients on phylogenetic trees.用于系统发育树上高维梯度的多核算法。
Bioinformatics. 2024 Feb 1;40(2). doi: 10.1093/bioinformatics/btae030.
3
Gradients Do Grow on Trees: A Linear-Time O(N)-Dimensional Gradient for Statistical Phylogenetics.梯度确实长在树上:统计系统发生学的一种线性时间 O(N)维梯度。
Mol Biol Evol. 2020 Oct 1;37(10):3047-3060. doi: 10.1093/molbev/msaa130.
4
Many-core algorithms for statistical phylogenetics.用于统计系统发育学的多核算法。
Bioinformatics. 2009 Jun 1;25(11):1370-6. doi: 10.1093/bioinformatics/btp244. Epub 2009 Apr 15.
5
Parallel beamlet dose calculation via beamlet contexts in a distributed multi-GPU framework.基于分布式多 GPU 框架中的束流子区域进行平行束流子剂量计算。
Med Phys. 2019 Aug;46(8):3719-3733. doi: 10.1002/mp.13651. Epub 2019 Jun 30.
6
Extending the BEAGLE library to a multi-FPGA platform.将 BEAGLE 库扩展到多 FPGA 平台。
BMC Bioinformatics. 2013 Jan 19;14:25. doi: 10.1186/1471-2105-14-25.
7
XIORT-MC: A real-time MC-based dose computation tool for low- energy X-rays intraoperative radiation therapy.XIORT-MC:一种基于 MC 的实时剂量计算工具,用于低能 X 射线术中放射治疗。
Med Phys. 2021 Dec;48(12):8089-8106. doi: 10.1002/mp.15291. Epub 2021 Oct 26.
8
Bayesian Phylogenetic Analysis on Multi-Core Compute Architectures: Implementation and Evaluation of BEAGLE in RevBayes With MPI.多核计算架构上的贝叶斯系统发育分析:MPI 下 RevBayes 中 BEAGLE 的实现与评估。
Syst Biol. 2024 Jul 27;73(2):455-469. doi: 10.1093/sysbio/syae005.
9
BEAGLE: an application programming interface and high-performance computing library for statistical phylogenetics.BEAGLE:一个用于统计系统发生学的应用程序编程接口和高性能计算库。
Syst Biol. 2012 Jan;61(1):170-3. doi: 10.1093/sysbio/syr100. Epub 2011 Oct 1.
10
BEAGLE 3: Improved Performance, Scaling, and Usability for a High-Performance Computing Library for Statistical Phylogenetics.BEAGLE 3:为统计系统发生学的高性能计算库提供改进的性能、可扩展性和可用性。
Syst Biol. 2019 Nov 1;68(6):1052-1061. doi: 10.1093/sysbio/syz020.

用于系统发育树上高维梯度的多核算法。

Many-core algorithms for high-dimensional gradients on phylogenetic trees.

作者信息

Gangavarapu Karthik, Ji Xiang, Baele Guy, Fourment Mathieu, Lemey Philippe, Iv Frederick A Matsen, Suchard Marc A

出版信息

ArXiv. 2023 Mar 8:arXiv:2303.04390v1.

PMID:36945693
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC10029048/
Abstract

The rapid growth in genomic pathogen data spurs the need for efficient inference techniques, such as Hamiltonian Monte Carlo (HMC) in a Bayesian framework, to estimate parameters of these phylogenetic models where the dimensions of the parameters increase with the number of sequences $N$. HMC requires repeated calculation of the gradient of the data log-likelihood with respect to (wrt) all branch-length-specific (BLS) parameters that traditionally takes $\mathcal{O}(N^2)$ operations using the standard pruning algorithm. A recent study proposes an approach to calculate this gradient in $\mathcal{O}(N)$, enabling researchers to take advantage of gradient-based samplers such as HMC. The CPU implementation of this approach makes the calculation of the gradient computationally tractable for nucleotide-based models but falls short in performance for larger state-space size models, such as codon models. Here, we describe novel massively parallel algorithms to calculate the gradient of the log-likelihood wrt all BLS parameters that take advantage of graphics processing units (GPUs) and result in many fold higher speedups over previous CPU implementations. We benchmark these GPU algorithms on three computing systems using three evolutionary inference examples: carnivores, dengue and yeast, and observe a greater than 128-fold speedup over the CPU implementation for codon-based models and greater than 8-fold speedup for nucleotide-based models. As a practical demonstration, we also estimate the timing of the first introduction of West Nile virus into the continental Unites States under a codon model with a relaxed molecular clock from 104 full viral genomes, an inference task previously intractable. We provide an implementation of our GPU algorithms in BEAGLE v4.0.0, an open source library for statistical phylogenetics that enables parallel calculations on multi-core CPUs and GPUs.

摘要

基因组病原体数据的快速增长促使人们需要高效的推理技术,例如贝叶斯框架下的哈密顿蒙特卡罗(HMC)方法,来估计这些系统发育模型的参数,其中参数的维度会随着序列数量(N)的增加而增大。HMC需要反复计算数据对数似然相对于所有分支长度特定(BLS)参数的梯度,传统上使用标准剪枝算法进行此计算需要(\mathcal{O}(N^2))次操作。最近的一项研究提出了一种在(\mathcal{O}(N))时间内计算此梯度的方法,使研究人员能够利用诸如HMC之类的基于梯度的采样器。该方法的CPU实现使得基于核苷酸的模型在计算梯度时变得易于处理,但对于更大状态空间大小的模型(如密码子模型),其性能有所不足。在此,我们描述了新颖的大规模并行算法,用于计算对数似然相对于所有BLS参数的梯度,该算法利用图形处理单元(GPU),并比以前的CPU实现带来了许多倍的加速。我们在三个计算系统上使用三个进化推理示例(食肉动物、登革热和酵母)对这些GPU算法进行基准测试,观察到基于密码子的模型比CPU实现加速超过128倍,基于核苷酸的模型加速超过8倍。作为一个实际演示,我们还在具有宽松分子钟的密码子模型下,根据104个完整病毒基因组估计了西尼罗河病毒首次传入美国大陆的时间,这是一个以前难以处理的推理任务。我们在BEAGLE v4.0.0中提供了我们的GPU算法实现,BEAGLE v4.0.0是一个用于统计系统发育学的开源库,可在多核CPU和GPU上进行并行计算。