• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

在 SPARC 电子结构代码中 GPU 加速局部和半局部密度泛函计算。

GPU acceleration of local and semilocal density functional calculations in the SPARC electronic structure code.

机构信息

Physics Division, Lawrence Livermore National Laboratory, Livermore, California 94550, USA.

College of Engineering, Georgia Institute of Technology, Atlanta, Georgia 30332, USA.

出版信息

J Chem Phys. 2023 May 28;158(20). doi: 10.1063/5.0147249.

DOI:10.1063/5.0147249
PMID:37249229
Abstract

We present a Graphics Processing Unit (GPU)-accelerated version of the real-space SPARC electronic structure code for performing Kohn-Sham density functional theory calculations within the local density and generalized gradient approximations. In particular, we develop a modular math-kernel based implementation for NVIDIA architectures wherein the computationally expensive operations are carried out on the GPUs, with the remainder of the workload retained on the central processing units (CPUs). Using representative bulk and slab examples, we show that relative to CPU-only execution, GPUs enable speedups of up to 6× and 60× in node and core hours, respectively, bringing time to solution down to less than 30 s for a metallic system with over 14 000 electrons and enabling significant reductions in computational resources required for a given wall time.

摘要

我们提出了一个图形处理单元 (GPU) 加速的实空间 SPARC 电子结构代码版本,用于在局域密度近似和广义梯度近似下进行 Kohn-Sham 密度泛函理论计算。特别是,我们为 NVIDIA 架构开发了一种基于模块化数学内核的实现方式,其中计算密集型操作在 GPU 上执行,其余工作负载保留在中央处理单元 (CPU) 上。使用代表性的体和片例子,我们表明相对于仅 CPU 执行,GPU 分别实现了高达 6×和 60×的节点和核小时的加速,将解决方案的时间缩短到不到 30 s,对于具有超过 14000 个电子的金属系统,并显著减少了给定计算时间所需的计算资源。

相似文献

1
GPU acceleration of local and semilocal density functional calculations in the SPARC electronic structure code.在 SPARC 电子结构代码中 GPU 加速局部和半局部密度泛函计算。
J Chem Phys. 2023 May 28;158(20). doi: 10.1063/5.0147249.
2
Accelerating Coupled-Cluster Calculations with GPUs: An Implementation of the Density-Fitted CCSD(T) Approach for Heterogeneous Computing Architectures Using OpenMP Directives.利用GPU加速耦合簇计算:一种使用OpenMP指令在异构计算架构上实现密度拟合CCSD(T)方法的方案
J Chem Theory Comput. 2023 Nov 14;19(21):7640-7657. doi: 10.1021/acs.jctc.3c00876. Epub 2023 Oct 25.
3
Acceleration of High Angular Momentum Electron Repulsion Integrals and Integral Derivatives on Graphics Processing Units.图形处理器上高角动量电子排斥积分及积分导数的加速计算
J Chem Theory Comput. 2015 Apr 14;11(4):1449-62. doi: 10.1021/ct500984t. Epub 2015 Mar 9.
4
Parallel Implementation of Density Functional Theory Methods in the Quantum Interaction Computational Kernel Program.量子相互作用计算内核程序中密度泛函理论方法的并行实现。
J Chem Theory Comput. 2020 Jul 14;16(7):4315-4326. doi: 10.1021/acs.jctc.0c00290. Epub 2020 Jun 24.
5
Faster Self-Consistent Field (SCF) Calculations on GPU Clusters.在GPU集群上更快的自洽场(SCF)计算
J Chem Theory Comput. 2021 Dec 14;17(12):7486-7503. doi: 10.1021/acs.jctc.1c00720. Epub 2021 Nov 15.
6
Open-Source Multi-GPU-Accelerated QM/MM Simulations with AMBER and QUICK.使用 AMBER 和 QUICK 进行开源的多 GPU 加速的 QM/MM 模拟。
J Chem Inf Model. 2021 May 24;61(5):2109-2115. doi: 10.1021/acs.jcim.1c00169. Epub 2021 Apr 29.
7
Double-buffered, heterogeneous CPU + GPU integral digestion algorithm for single-excitation calculations involving a large number of excited states.用于涉及大量激发态的单激发计算的双缓冲异构CPU+GPU积分消化算法
J Comput Chem. 2018 Oct 5;39(26):2173-2182. doi: 10.1002/jcc.25531. Epub 2018 Oct 3.
8
Harnessing the Power of Multi-GPU Acceleration into the Quantum Interaction Computational Kernel Program.利用多 GPU 加速到量子相互作用计算核心程序中。
J Chem Theory Comput. 2021 Jul 13;17(7):3955-3966. doi: 10.1021/acs.jctc.1c00145. Epub 2021 Jun 1.
9
Highly Efficient Resolution-of-Identity Density Functional Theory Calculations on Central and Graphics Processing Units.基于中央处理器和图形处理器的高效密度泛函理论中的单位分解计算
J Chem Theory Comput. 2021 Mar 9;17(3):1512-1521. doi: 10.1021/acs.jctc.0c01252. Epub 2021 Feb 22.
10
GPUs, a new tool of acceleration in CFD: efficiency and reliability on smoothed particle hydrodynamics methods.图形处理器(GPU):CFD 中的一种新加速工具:光滑粒子流体动力学方法的效率和可靠性。
PLoS One. 2011;6(6):e20685. doi: 10.1371/journal.pone.0020685. Epub 2011 Jun 13.

引用本文的文献

1
Random Phase Approximation Correlation Energy Using Real-Space Density Functional Perturbation Theory.基于实空间密度泛函微扰理论的随机相位近似相关能
J Chem Theory Comput. 2025 Jun 24;21(12):6023-6033. doi: 10.1021/acs.jctc.5c00528. Epub 2025 Jun 12.
2
Acceleration of the Relativistic Dirac-Kohn-Sham Method with GPU: A Pre-Exascale Implementation of BERTHA and PyBERTHA.利用GPU加速相对论性狄拉克-科恩-沙姆方法:BERTHA和PyBERTHA的百亿亿次级前实现
J Chem Theory Comput. 2025 Apr 8;21(7):3460-3475. doi: 10.1021/acs.jctc.4c01759. Epub 2025 Mar 21.
3
Efficient Shift-and-Invert Preconditioning for Multi-GPU Accelerated Density Functional Calculations.
用于多GPU加速密度泛函计算的高效移位反转预处理
J Chem Theory Comput. 2024 Sep 10;20(17):7443-7452. doi: 10.1021/acs.jctc.4c00721. Epub 2024 Aug 27.