• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

基于真实处理内存储系统的高通量序列比对框架。

A framework for high-throughput sequence alignment using real processing-in-memory systems.

机构信息

Department of Computer Science, American University of Beirut, Riad El-Solh, Beirut 1107 2020, Lebanon.

Department of Information Technology and Electrical Engineering, ETH Zürich, Gloriastrasse 35, Zürich 8092, Switzerland.

出版信息

Bioinformatics. 2023 May 4;39(5). doi: 10.1093/bioinformatics/btad155.

DOI:10.1093/bioinformatics/btad155
PMID:36971586
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC10159653/
Abstract

MOTIVATION

Sequence alignment is a memory bound computation whose performance in modern systems is limited by the memory bandwidth bottleneck. Processing-in-memory (PIM) architectures alleviate this bottleneck by providing the memory with computing competencies. We propose Alignment-in-Memory (AIM), a framework for high-throughput sequence alignment using PIM, and evaluate it on UPMEM, the first publicly available general-purpose programmable PIM system.

RESULTS

Our evaluation shows that a real PIM system can substantially outperform server-grade multi-threaded CPU systems running at full-scale when performing sequence alignment for a variety of algorithms, read lengths, and edit distance thresholds. We hope that our findings inspire more work on creating and accelerating bioinformatics algorithms for such real PIM systems.

AVAILABILITY AND IMPLEMENTATION

Our code is available at https://github.com/safaad/aim.

摘要

动机

序列比对是一种受内存限制的计算,其在现代系统中的性能受内存带宽瓶颈的限制。基于内存处理(PIM)架构通过为内存提供计算能力来缓解这一瓶颈。我们提出了 Alignment-in-Memory(AIM),这是一个使用 PIM 进行高通量序列比对的框架,并在第一个公开可用的通用可编程 PIM 系统 UPMEM 上对其进行了评估。

结果

我们的评估表明,在针对各种算法、读取长度和编辑距离阈值执行序列比对时,实际的 PIM 系统在性能上可以大大超过全规模运行的服务器级多线程 CPU 系统。我们希望我们的发现能够激发更多针对这种实际 PIM 系统的生物信息学算法的创建和加速工作。

可用性和实现

我们的代码可在 https://github.com/safaad/aim 上获得。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/afd6/10159653/825d28f6740f/btad155f7.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/afd6/10159653/1a2c1f180086/btad155f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/afd6/10159653/259521c02204/btad155f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/afd6/10159653/88b5541ebdec/btad155f3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/afd6/10159653/ae5b3b8f8c17/btad155f4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/afd6/10159653/873c11717ed4/btad155f5.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/afd6/10159653/923c02b707e5/btad155f6.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/afd6/10159653/825d28f6740f/btad155f7.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/afd6/10159653/1a2c1f180086/btad155f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/afd6/10159653/259521c02204/btad155f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/afd6/10159653/88b5541ebdec/btad155f3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/afd6/10159653/ae5b3b8f8c17/btad155f4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/afd6/10159653/873c11717ed4/btad155f5.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/afd6/10159653/923c02b707e5/btad155f6.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/afd6/10159653/825d28f6740f/btad155f7.jpg

相似文献

1
A framework for high-throughput sequence alignment using real processing-in-memory systems.基于真实处理内存储系统的高通量序列比对框架。
Bioinformatics. 2023 May 4;39(5). doi: 10.1093/bioinformatics/btad155.
2
Fast gap-affine pairwise alignment using the wavefront algorithm.基于波前算法的快速间隙亲和双序列比对。
Bioinformatics. 2021 May 1;37(4):456-463. doi: 10.1093/bioinformatics/btaa777.
3
GateKeeper: a new hardware architecture for accelerating pre-alignment in DNA short read mapping.GateKeeper:一种用于加速 DNA 短读映射预对齐的新硬件架构。
Bioinformatics. 2017 Nov 1;33(21):3355-3363. doi: 10.1093/bioinformatics/btx342.
4
GRIM-Filter: Fast seed location filtering in DNA read mapping using processing-in-memory technologies.GRIM-Filter:使用内存处理技术在 DNA 读取映射中快速进行种子位置过滤。
BMC Genomics. 2018 May 9;19(Suppl 2):89. doi: 10.1186/s12864-018-4460-0.
5
WFA-GPU: gap-affine pairwise read-alignment using GPUs.WFA-GPU:基于 GPU 的缺口仿射两两序列比对
Bioinformatics. 2023 Dec 1;39(12). doi: 10.1093/bioinformatics/btad701.
6
RandAL: a randomized approach to aligning DNA sequences to reference genomes.RandAL:一种将DNA序列与参考基因组进行比对的随机方法。
BMC Genomics. 2014;15 Suppl 5(Suppl 5):S2. doi: 10.1186/1471-2164-15-S5-S2. Epub 2014 Jul 14.
7
CMSA: a heterogeneous CPU/GPU computing system for multiple similar RNA/DNA sequence alignment.CMSA:一种用于多个相似RNA/DNA序列比对的异构CPU/GPU计算系统。
BMC Bioinformatics. 2017 Jun 24;18(1):315. doi: 10.1186/s12859-017-1725-6.
8
Arioc: GPU-accelerated alignment of short bisulfite-treated reads.Arioc:用于短亚硫酸氢盐处理读取物的 GPU 加速对齐。
Bioinformatics. 2018 Aug 1;34(15):2673-2675. doi: 10.1093/bioinformatics/bty167.
9
BGSA: a bit-parallel global sequence alignment toolkit for multi-core and many-core architectures.BGSA:用于多核和众核架构的位并行全局序列比对工具包。
Bioinformatics. 2019 Jul 1;35(13):2306-2308. doi: 10.1093/bioinformatics/bty930.
10
Optimal gap-affine alignment in O(s) space.最优间隙仿射对齐,时间复杂度为 O(s)。
Bioinformatics. 2023 Feb 3;39(2). doi: 10.1093/bioinformatics/btad074.

引用本文的文献

1
BIMSA: accelerating long sequence alignment using processing-in-memory.BIMSA:使用内存中处理加速长序列比对。
Bioinformatics. 2024 Nov 1;40(11). doi: 10.1093/bioinformatics/btae631.

本文引用的文献

1
Accelerating minimap2 for long-read sequencing applications on modern CPUs.在现代CPU上加速用于长读长测序应用的minimap2
Nat Comput Sci. 2022 Feb;2(2):78-83. doi: 10.1038/s43588-022-00201-8. Epub 2022 Feb 28.
2
WFA-GPU: gap-affine pairwise read-alignment using GPUs.WFA-GPU:基于 GPU 的缺口仿射两两序列比对
Bioinformatics. 2023 Dec 1;39(12). doi: 10.1093/bioinformatics/btad701.
3
Optimal gap-affine alignment in O(s) space.最优间隙仿射对齐,时间复杂度为 O(s)。
Bioinformatics. 2023 Feb 3;39(2). doi: 10.1093/bioinformatics/btad074.
4
From molecules to genomic variations: Accelerating genome analysis via intelligent algorithms and architectures.从分子到基因组变异:通过智能算法和架构加速基因组分析
Comput Struct Biotechnol J. 2022 Aug 18;20:4579-4599. doi: 10.1016/j.csbj.2022.08.019. eCollection 2022.
5
Technology dictates algorithms: recent developments in read alignment.技术决定算法:读段比对的最新进展。
Genome Biol. 2021 Aug 26;22(1):249. doi: 10.1186/s13059-021-02443-7.
6
SneakySnake: a fast and accurate universal genome pre-alignment filter for CPUs, GPUs and FPGAs.SneakySnake:一种适用于CPU、GPU和FPGA的快速且准确的通用基因组预比对过滤器。
Bioinformatics. 2021 Apr 1;36(22-23):5282-5290. doi: 10.1093/bioinformatics/btaa1015.
7
GPU acceleration of Darwin read overlapper for de novo assembly of long DNA reads.GPU 加速 Darwin 读重叠算法用于长 DNA reads 的从头组装。
BMC Bioinformatics. 2020 Sep 17;21(Suppl 13):388. doi: 10.1186/s12859-020-03685-1.
8
Fast gap-affine pairwise alignment using the wavefront algorithm.基于波前算法的快速间隙亲和双序列比对。
Bioinformatics. 2021 May 1;37(4):456-463. doi: 10.1093/bioinformatics/btaa777.
9
Shouji: a fast and efficient pre-alignment filter for sequence alignment.狩集:一种快速高效的序列比对预对齐滤波器。
Bioinformatics. 2019 Nov 1;35(21):4255-4263. doi: 10.1093/bioinformatics/btz234.
10
GRIM-Filter: Fast seed location filtering in DNA read mapping using processing-in-memory technologies.GRIM-Filter:使用内存处理技术在 DNA 读取映射中快速进行种子位置过滤。
BMC Genomics. 2018 May 9;19(Suppl 2):89. doi: 10.1186/s12864-018-4460-0.