• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

基于 de Bruijn 图的局部重组装在变异调用中的缓存友好优化。

Cache Friendly Optimisation of de Bruijn Graph Based Local Re-Assembly in Variant Calling.

出版信息

IEEE/ACM Trans Comput Biol Bioinform. 2020 Jul-Aug;17(4):1125-1133. doi: 10.1109/TCBB.2018.2881975. Epub 2018 Nov 19.

DOI:10.1109/TCBB.2018.2881975
PMID:30452377
Abstract

A variant caller is used to identify variations in an individual genome (compared to the reference genome) in a genome processing pipeline. For the sake of accuracy, modern variant callers perform many local re-assemblies on small regions of the genome using a graph-based algorithm. However, such graph-based data structures are inefficiently stored in the linear memory of modern computers, which in turn reduces computing efficiency. Therefore, variant calling can take several CPU hours for a typical human genome. We have sped up the local re-assembly algorithm with no impact on its accuracy, by the effective use of the memory hierarchy. The proposed algorithm maximises data locality so that the fast internal processor memory (cache) is efficiently used. By the increased use of caches, accesses to main memory are minimised. The resulting algorithm is up to twice as fast as the original one when executed on a commodity computer and could gain even more speed up on computers with less complex memory subsystems.

摘要

变异调用程序用于在基因组处理管道中识别个体基因组(与参考基因组相比)中的变异。为了提高准确性,现代变异调用程序使用基于图的算法对基因组的小区域进行多次局部重新组装。然而,基于图的数据结构在现代计算机的线性内存中存储效率低下,这反过来又降低了计算效率。因此,典型的人类基因组的变异调用可能需要几个 CPU 小时。通过有效利用内存层次结构,我们在不影响准确性的情况下加快了局部重新组装算法。所提出的算法最大程度地提高了数据局部性,以便有效地利用快速的内部处理器内存(缓存)。通过增加缓存的使用,减少了对主内存的访问。在商品计算机上执行时,该算法的速度比原始算法快两倍,在具有更简单内存子系统的计算机上甚至可以获得更快的速度提升。

相似文献

1
Cache Friendly Optimisation of de Bruijn Graph Based Local Re-Assembly in Variant Calling.基于 de Bruijn 图的局部重组装在变异调用中的缓存友好优化。
IEEE/ACM Trans Comput Biol Bioinform. 2020 Jul-Aug;17(4):1125-1133. doi: 10.1109/TCBB.2018.2881975. Epub 2018 Nov 19.
2
Integrating long-range connectivity information into de Bruijn graphs.将长程连接信息整合到 de Bruijn 图中。
Bioinformatics. 2018 Aug 1;34(15):2556-2565. doi: 10.1093/bioinformatics/bty157.
3
A space and time-efficient index for the compacted colored de Bruijn graph.一种用于压缩彩色 de Bruijn 图的空间和时间高效索引。
Bioinformatics. 2018 Jul 1;34(13):i169-i177. doi: 10.1093/bioinformatics/bty292.
4
Read mapping on de Bruijn graphs.在德布鲁因图上进行读段映射。
BMC Bioinformatics. 2016 Jun 16;17(1):237. doi: 10.1186/s12859-016-1103-9.
5
LightAssembler: fast and memory-efficient assembly algorithm for high-throughput sequencing reads.LightAssembler:一种用于高通量测序reads 的快速且节省内存的组装算法。
Bioinformatics. 2016 Nov 1;32(21):3215-3223. doi: 10.1093/bioinformatics/btw470. Epub 2016 Jul 13.
6
BrownieAligner: accurate alignment of Illumina sequencing data to de Bruijn graphs.BrownieAligner:Illumina 测序数据到 de Bruijn 图的精确比对。
BMC Bioinformatics. 2018 Sep 4;19(1):311. doi: 10.1186/s12859-018-2319-7.
7
Benchmarking of de novo assembly algorithms for Nanopore data reveals optimal performance of OLC approaches.用于纳米孔数据的从头组装算法基准测试揭示了重叠布局一致(OLC)方法的最佳性能。
BMC Genomics. 2016 Aug 22;17 Suppl 7(Suppl 7):507. doi: 10.1186/s12864-016-2895-8.
8
Fast de Bruijn Graph Compaction in Distributed Memory Environments.快速有向无环图压缩在分布式内存环境中。
IEEE/ACM Trans Comput Biol Bioinform. 2020 Jan-Feb;17(1):136-148. doi: 10.1109/TCBB.2018.2858797. Epub 2018 Jul 31.
9
Scalable, ultra-fast, and low-memory construction of compacted de Bruijn graphs with Cuttlefish 2.使用 Cuttlefish 2 实现可扩展、超快速和低内存消耗的紧凑 de Bruijn 图构建。
Genome Biol. 2022 Sep 8;23(1):190. doi: 10.1186/s13059-022-02743-6.
10
FSG: Fast String Graph Construction for De Novo Assembly.FSG:用于从头组装的快速字符串图构建
J Comput Biol. 2017 Oct;24(10):953-968. doi: 10.1089/cmb.2017.0089. Epub 2017 Jul 17.

引用本文的文献

1
RiceReceptor: The Cell-Surface and Intracellular Immune Receptors of the Genus.水稻受体:该属的细胞表面和细胞内免疫受体。
Genes (Basel). 2025 May 18;16(5):597. doi: 10.3390/genes16050597.
2
Efficient end-to-end long-read sequence mapping using minimap2-fpga integrated with hardware accelerated chaining.使用 minimap2-fpga 与硬件加速链接集成实现高效的端到端长读序列映射。
Sci Rep. 2023 Nov 17;13(1):20174. doi: 10.1038/s41598-023-47354-8.