• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

使用富士通A64FX处理器移植和优化BWA-MEM2

Porting and Optimizing BWA-MEM2 Using the Fujitsu A64FX Processor.

作者信息

Langarita Ruben, Armejach Adria, Ibanez Pablo, Alastruey-Benede Jesus, Moreto Miquel

出版信息

IEEE/ACM Trans Comput Biol Bioinform. 2023 Sep-Oct;20(5):3139-3153. doi: 10.1109/TCBB.2023.3264514. Epub 2023 Oct 9.

DOI:10.1109/TCBB.2023.3264514
PMID:37018085
Abstract

Sequence alignment pipelines for human genomes are an emerging workload that will dominate in the precision medicine field. BWA-MEM2 is a tool widely used in the scientific community to perform read mapping studies. In this paper, we port BWA-MEM2 to the AArch64 architecture using the ARMv8-A specification, and we compare the resulting version against an Intel Skylake system both in performance and in energy-to-solution. The porting effort entails numerous code modifications, since BWA-MEM2 implements certain kernels using x86_64 specific intrinsics, e.g., AVX-512. To adapt this code we use the recently introduced Arm's Scalable Vector Extensions (SVE). More specifically, we use Fujitsu's A64FX processor, the first to implement SVE. The A64FX powers the Fugaku Supercomputer that led the Top500 ranking from June 2020 to November 2021. After porting BWA-MEM2 we define and implement a number of optimizations to improve performance in the A64FX target architecture. We show that while the A64FX performance is lower than that of the Skylake system, A64FX delivers 11.6% better energy-to-solution on average. All the code used for this article is available at https://gitlab.bsc.es/rlangari/bwa-a64fx.

摘要

用于人类基因组的序列比对流程是一种新兴的工作负载,将在精准医学领域占据主导地位。BWA-MEM2是科学界广泛用于进行读段映射研究的工具。在本文中,我们使用ARMv8-A规范将BWA-MEM2移植到AArch64架构,并在性能和能耗比方面将生成的版本与英特尔Skylake系统进行比较。由于BWA-MEM2使用x86_64特定的内在函数(例如AVX-512)来实现某些内核,因此移植工作需要进行大量代码修改。为了适配此代码,我们使用了最近推出的Arm可扩展向量扩展(SVE)。更具体地说,我们使用富士通的A64FX处理器,这是首个实现SVE的处理器。A64FX为在2020年6月至2021年11月期间排名全球超级计算机500强榜首的富岳超级计算机提供动力。在移植BWA-MEM2之后,我们定义并实现了一些优化措施,以提高在A64FX目标架构上的性能。我们表明,虽然A64FX的性能低于Skylake系统,但A64FX的平均能耗比高出11.6%。本文使用的所有代码可在https://gitlab.bsc.es/rlangari/bwa-a64fx获取。

相似文献

1
Porting and Optimizing BWA-MEM2 Using the Fujitsu A64FX Processor.使用富士通A64FX处理器移植和优化BWA-MEM2
IEEE/ACM Trans Comput Biol Bioinform. 2023 Sep-Oct;20(5):3139-3153. doi: 10.1109/TCBB.2023.3264514. Epub 2023 Oct 9.
2
BWA-MEME: BWA-MEM emulated with a machine learning approach.BWA-MEME:使用机器学习方法模拟的 BWA-MEM。
Bioinformatics. 2022 Apr 28;38(9):2404-2413. doi: 10.1093/bioinformatics/btac137.
3
Accelerating BWA-MEM Read Mapping on GPUs.在图形处理器上加速BWA-MEM读段比对
ICS. 2023 Jun;2023:155-166. doi: 10.1145/3577193.3593703. Epub 2023 Jun 21.
4
Faster single-end alignment generation utilizing multi-thread for BWA.利用多线程实现更快的BWA单端比对生成。
Biomed Mater Eng. 2015;26 Suppl 1:S1791-6. doi: 10.3233/BME-151480.
5
Multi-threading the generation of Burrows-Wheeler Alignment.多线程生成布罗-惠勒比对。
Genet Mol Res. 2016 May 23;15(2):gmr8650. doi: 10.4238/gmr.15028650.
6
PipeMEM: A Framework to Speed Up BWA-MEM in Spark with Low Overhead.PipeMEM:一种在 Spark 中使用低开销加速 BWA-MEM 的框架。
Genes (Basel). 2019 Nov 4;10(11):886. doi: 10.3390/genes10110886.
7
MICA: A fast short-read aligner that takes full advantage of Many Integrated Core Architecture (MIC).MICA:一种充分利用多核集成架构(MIC)的快速短读长比对工具。
BMC Bioinformatics. 2015;16 Suppl 7(Suppl 7):S10. doi: 10.1186/1471-2105-16-S7-S10. Epub 2015 Apr 23.
8
Evaluation of an optimized germline exomes pipeline using BWA-MEM2 and Dragen-GATK tools.使用 BWA-MEM2 和 Dragen-GATK 工具评估优化后的种系外显子组管道。
PLoS One. 2023 Aug 3;18(8):e0288371. doi: 10.1371/journal.pone.0288371. eCollection 2023.
9
A fast vectorized sorting implementation based on the ARM scalable vector extension (SVE).一种基于ARM可扩展向量扩展(SVE)的快速矢量化排序实现。
PeerJ Comput Sci. 2021 Nov 19;7:e769. doi: 10.7717/peerj-cs.769. eCollection 2021.
10
CGAP-align: a high performance DNA short read alignment tool.CGAP-align:一款高性能的 DNA 短读序列比对工具。
PLoS One. 2013 Apr 11;8(4):e61033. doi: 10.1371/journal.pone.0061033. Print 2013.

引用本文的文献

1
Genome-wide identification analysis in wild-type reveals some genes defending against .在野生型中进行的全基因组鉴定分析揭示了一些抵御……的基因。 (原文中“against”后面内容缺失)
Front Genet. 2024 May 15;15:1379784. doi: 10.3389/fgene.2024.1379784. eCollection 2024.