• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

利用多 GPU 加速到量子相互作用计算核心程序中。

Harnessing the Power of Multi-GPU Acceleration into the Quantum Interaction Computational Kernel Program.

机构信息

Department of Chemistry and Department of Biochemistry and Molecular Biology, Michigan State University, 578 S. Shaw Lane, East Lansing, Michigan 48824-1322, United States.

San Diego Supercomputer Center, University of California San Diego, 9500 Gilman Drive, La Jolla, California 92093-0505, United States.

出版信息

J Chem Theory Comput. 2021 Jul 13;17(7):3955-3966. doi: 10.1021/acs.jctc.1c00145. Epub 2021 Jun 1.

DOI:10.1021/acs.jctc.1c00145
PMID:34062061
Abstract

We report a new multi-GPU capable Hartree-Fock/density functional theory implementation integrated into the open source QUantum Interaction Computational Kernel (QUICK) program. Details on the load balancing algorithms for electron repulsion integrals and exchange correlation quadrature across multiple GPUs are described. Benchmarking studies carried out on up to four GPU nodes, each containing four NVIDIA V100-SXM2 type GPUs demonstrate that our implementation is capable of achieving excellent load balancing and high parallel efficiency. For representative medium to large size protein/organic molecular systems, the observed parallel efficiencies remained above 82% for the Kohn-Sham matrix formation and above 90% for nuclear gradient calculations. The accelerations on NVIDIA A100, P100, and K80 platforms also have realized parallel efficiencies higher than 68% in all tested cases, paving the way for large-scale electronic structure calculations with QUICK.

摘要

我们报告了一种新的多 GPU 兼容的 Hartree-Fock/密度泛函理论实现,该实现集成到了开源 QUantum Interaction Computational Kernel(QUICK)程序中。本文详细介绍了在多个 GPU 之间进行电子排斥积分和交换相关积分的负载平衡算法。在多达四个 GPU 节点上进行的基准测试研究,每个节点包含四个 NVIDIA V100-SXM2 类型的 GPU,表明我们的实现能够实现出色的负载平衡和高并行效率。对于代表性的中等至大型蛋白质/有机分子系统,在 Kohn-Sham 矩阵形成和核梯度计算方面,观察到的并行效率均保持在 82%以上。在所有测试案例中,在 NVIDIA A100、P100 和 K80 平台上的加速也实现了高于 68%的并行效率,为使用 QUICK 进行大规模电子结构计算铺平了道路。

相似文献

1
Harnessing the Power of Multi-GPU Acceleration into the Quantum Interaction Computational Kernel Program.利用多 GPU 加速到量子相互作用计算核心程序中。
J Chem Theory Comput. 2021 Jul 13;17(7):3955-3966. doi: 10.1021/acs.jctc.1c00145. Epub 2021 Jun 1.
2
Parallel Implementation of Density Functional Theory Methods in the Quantum Interaction Computational Kernel Program.量子相互作用计算内核程序中密度泛函理论方法的并行实现。
J Chem Theory Comput. 2020 Jul 14;16(7):4315-4326. doi: 10.1021/acs.jctc.0c00290. Epub 2020 Jun 24.
3
Quantum Mechanics/Molecular Mechanics Simulations on NVIDIA and AMD Graphics Processing Units.在 NVIDIA 和 AMD 图形处理单元上进行量子力学/分子力学模拟。
J Chem Inf Model. 2023 Feb 13;63(3):711-717. doi: 10.1021/acs.jcim.2c01505. Epub 2023 Jan 31.
4
Very-Large-Scale GPU-Accelerated Nuclear Gradient of Time-Dependent Density Functional Theory with Tamm-Dancoff Approximation and Range-Separated Hybrid Functionals.基于Tamm-Dancoff近似和范围分离混合泛函的大规模GPU加速含时密度泛函理论的核梯度
J Chem Theory Comput. 2024 Oct 22;20(20):9018-9031. doi: 10.1021/acs.jctc.4c01003. Epub 2024 Oct 7.
5
Faster Self-Consistent Field (SCF) Calculations on GPU Clusters.在GPU集群上更快的自洽场(SCF)计算
J Chem Theory Comput. 2021 Dec 14;17(12):7486-7503. doi: 10.1021/acs.jctc.1c00720. Epub 2021 Nov 15.
6
Open-Source Multi-GPU-Accelerated QM/MM Simulations with AMBER and QUICK.使用 AMBER 和 QUICK 进行开源的多 GPU 加速的 QM/MM 模拟。
J Chem Inf Model. 2021 May 24;61(5):2109-2115. doi: 10.1021/acs.jcim.1c00169. Epub 2021 Apr 29.
7
Multinode Multi-GPU Two-Electron Integrals: Code Generation Using the Regent Language.多节点多 GPU 双电子积分:使用 Regent 语言生成代码。
J Chem Theory Comput. 2022 Nov 8;18(11):6522-6536. doi: 10.1021/acs.jctc.2c00414. Epub 2022 Oct 6.
8
GPU acceleration of local and semilocal density functional calculations in the SPARC electronic structure code.在 SPARC 电子结构代码中 GPU 加速局部和半局部密度泛函计算。
J Chem Phys. 2023 May 28;158(20). doi: 10.1063/5.0147249.
9
Acceleration of the GAMESS-UK electronic structure package on graphical processing units.GAMESS-UK电子结构软件包在图形处理单元上的加速。
J Comput Chem. 2011 Jul 30;32(10):2313-8. doi: 10.1002/jcc.21815. Epub 2011 May 3.
10
Parallel Implementation of the Density Matrix Renormalization Group Method Achieving a Quarter petaFLOPS Performance on a Single DGX-H100 GPU Node.密度矩阵重整化群方法的并行实现,在单个DGX-H100 GPU节点上实现了四分之一petaFLOPS的性能。
J Chem Theory Comput. 2024 Oct 8;20(19):8397-8404. doi: 10.1021/acs.jctc.4c00903. Epub 2024 Sep 19.

引用本文的文献

1
The Effects of Conformational Sampling and QM Region Size in QM/MM Simulations: An Adaptive QM/MM Study With Model Systems.QM/MM模拟中构象采样和量子力学区域大小的影响:基于模型系统的自适应QM/MM研究
J Comput Chem. 2025 Apr 30;46(11):e70109. doi: 10.1002/jcc.70109.
2
Search for Correlations Between the Results of the Density Functional Theory and Hartree-Fock Calculations Using Neural Networks and Classical Machine Learning Algorithms.使用神经网络和经典机器学习算法寻找密度泛函理论与哈特里-福克计算结果之间的相关性。
ACS Omega. 2025 Feb 6;10(6):5919-5933. doi: 10.1021/acsomega.4c09861. eCollection 2025 Feb 18.
3
Acceleration without Disruption: DFT Software as a Service.
加速而不中断:作为服务的离散傅里叶变换(DFT)软件
J Chem Theory Comput. 2024 Dec 24;20(24):10838-10851. doi: 10.1021/acs.jctc.4c00940. Epub 2024 Dec 11.
4
AmberTools. AmberTools。
J Chem Inf Model. 2023 Oct 23;63(20):6183-6191. doi: 10.1021/acs.jcim.3c01153. Epub 2023 Oct 8.