• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

使用级联布隆过滤器来提高德布鲁因图的内存使用率。

Using cascading Bloom filters to improve the memory usage for de Brujin graphs.

作者信息

Salikhov Kamil, Sacomoto Gustavo, Kucherov Gregory

机构信息

Department of Computer Science, Ben-Gurion University of the Negev, Be'er Sheva, Israel.

出版信息

Algorithms Mol Biol. 2014 Feb 24;9(1):2. doi: 10.1186/1748-7188-9-2.

DOI:10.1186/1748-7188-9-2
PMID:24565280
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC3974045/
Abstract

BACKGROUND

De Brujin graphs are widely used in bioinformatics for processing next-generation sequencing data. Due to a very large size of NGS datasets, it is essential to represent de Bruijn graphs compactly, and several approaches to this problem have been proposed recently.

RESULTS

In this work, we show how to reduce the memory required by the data structure of Chikhi and Rizk (WABI'12) that represents de Brujin graphs using Bloom filters. Our method requires 30% to 40% less memory with respect to their method, with insignificant impact on construction time. At the same time, our experiments showed a better query time compared to the method of Chikhi and Rizk.

CONCLUSION

The proposed data structure constitutes, to our knowledge, currently the most efficient practical representation of de Bruijn graphs.

摘要

背景

德布鲁因图在生物信息学中被广泛用于处理下一代测序数据。由于下一代测序数据集规模非常大,紧凑地表示德布鲁因图至关重要,最近已经提出了几种解决该问题的方法。

结果

在这项工作中,我们展示了如何减少Chikhi和Rizk(WABI'12)的数据结构所需的内存,该数据结构使用布隆过滤器来表示德布鲁因图。相对于他们的方法,我们的方法所需内存减少30%至40%,对构建时间的影响微不足道。同时,我们的实验表明,与Chikhi和Rizk的方法相比,查询时间更短。

结论

据我们所知,所提出的数据结构构成了目前德布鲁因图最有效的实际表示。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4427/3974045/7f911475e408/1748-7188-9-2-3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4427/3974045/88c711e70976/1748-7188-9-2-1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4427/3974045/21386c828647/1748-7188-9-2-2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4427/3974045/7f911475e408/1748-7188-9-2-3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4427/3974045/88c711e70976/1748-7188-9-2-1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4427/3974045/21386c828647/1748-7188-9-2-2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4427/3974045/7f911475e408/1748-7188-9-2-3.jpg

相似文献

1
Using cascading Bloom filters to improve the memory usage for de Brujin graphs.使用级联布隆过滤器来提高德布鲁因图的内存使用率。
Algorithms Mol Biol. 2014 Feb 24;9(1):2. doi: 10.1186/1748-7188-9-2.
2
Practical dynamic de Bruijn graphs.实用动态 de Bruijn 图。
Bioinformatics. 2018 Dec 15;34(24):4189-4195. doi: 10.1093/bioinformatics/bty500.
3
Compacting de Bruijn graphs from sequencing data quickly and in low memory.从测序数据中快速且低内存地压缩德布鲁因图。
Bioinformatics. 2016 Jun 15;32(12):i201-i208. doi: 10.1093/bioinformatics/btw279.
4
MegaGTA: a sensitive and accurate metagenomic gene-targeted assembler using iterative de Bruijn graphs.MegaGTA:一种使用迭代德布鲁因图的灵敏且准确的宏基因组基因靶向组装器。
BMC Bioinformatics. 2017 Oct 16;18(Suppl 12):408. doi: 10.1186/s12859-017-1825-3.
5
Efficient parallel and out of core algorithms for constructing large bi-directed de Bruijn graphs.用于构建大型双向 de Bruijn 图的高效并行和外核算法。
BMC Bioinformatics. 2010 Nov 15;11:560. doi: 10.1186/1471-2105-11-560.
6
Space-efficient and exact de Bruijn graph representation based on a Bloom filter.基于布隆过滤器的空间高效且精确的德布鲁因图表示。
Algorithms Mol Biol. 2013 Sep 16;8(1):22. doi: 10.1186/1748-7188-8-22.
7
Compression Algorithm for Colored de Bruijn Graphs.彩色德布鲁因图的压缩算法
Lebniz Int Proc Inform. 2023 Sep;273. doi: 10.4230/LIPIcs.WABI.2023.17. Epub 2023 Aug 29.
8
Applications of de Bruijn graphs in microbiome research.德布鲁因图在微生物组研究中的应用。
Imeta. 2022 Mar 1;1(1):e4. doi: 10.1002/imt2.4. eCollection 2022 Mar.
9
Scaling metagenome sequence assembly with probabilistic de Bruijn graphs.基于概率有向图的宏基因组序列组装规模化方法。
Proc Natl Acad Sci U S A. 2012 Aug 14;109(33):13272-7. doi: 10.1073/pnas.1121464109. Epub 2012 Jul 30.
10
On the representation of de Bruijn graphs.关于德布鲁因图的表示。
J Comput Biol. 2015 May;22(5):336-52. doi: 10.1089/cmb.2014.0160. Epub 2015 Jan 28.

引用本文的文献

1
Plant graph-based pangenomics: techniques, applications, and challenges.基于植物图谱的泛基因组学:技术、应用与挑战。
aBIOTECH. 2025 Mar 28;6(2):361-376. doi: 10.1007/s42994-025-00206-7. eCollection 2025 Jun.
2
Computational tools for plant genomics and breeding.植物基因组学和育种的计算工具。
Sci China Life Sci. 2024 Aug;67(8):1579-1590. doi: 10.1007/s11427-024-2578-6. Epub 2024 Apr 23.
3
ntEdit+Sealer: Efficient Targeted Error Resolution and Automated Finishing of Long-Read Genome Assemblies.ntEdit+Sealer:高效靶向纠错与长读长基因组组装自动化封端。

本文引用的文献

1
Space-efficient and exact de Bruijn graph representation based on a Bloom filter.基于布隆过滤器的空间高效且精确的德布鲁因图表示。
Algorithms Mol Biol. 2013 Sep 16;8(1):22. doi: 10.1186/1748-7188-8-22.
2
DSK: k-mer counting with very low memory usage.DSK:使用极低内存进行 k-mer 计数。
Bioinformatics. 2013 Mar 1;29(5):652-3. doi: 10.1093/bioinformatics/btt020. Epub 2013 Jan 16.
3
Scaling metagenome sequence assembly with probabilistic de Bruijn graphs.基于概率有向图的宏基因组序列组装规模化方法。
Curr Protoc. 2022 May;2(5):e442. doi: 10.1002/cpz1.442.
4
Space-efficient representation of genomic k-mer count tables.基因组k-mer计数表的空间高效表示。
Algorithms Mol Biol. 2022 Mar 21;17(1):5. doi: 10.1186/s13015-022-00212-0.
5
EXFI: Exon and splice graph prediction without a reference genome.EXFI:无需参考基因组的外显子和剪接图预测。
Ecol Evol. 2020 Jul 28;10(16):8880-8893. doi: 10.1002/ece3.6587. eCollection 2020 Aug.
6
To Petabytes and beyond: recent advances in probabilistic and signal processing algorithms and their application to metagenomics.从 PB 级到更多:概率和信号处理算法的最新进展及其在宏基因组学中的应用。
Nucleic Acids Res. 2020 Jun 4;48(10):5217-5234. doi: 10.1093/nar/gkaa265.
7
An Efficient, Scalable, and Exact Representation of High-Dimensional Color Information Enabled Using de Bruijn Graph Search.使用德布鲁因图搜索实现高维颜色信息的高效、可扩展且精确表示。
J Comput Biol. 2020 Apr;27(4):485-499. doi: 10.1089/cmb.2019.0322. Epub 2020 Mar 16.
8
Whole-Genome Resequencing of Seven Eggplant () and One Wild Relative () Accessions Provides New Insights and Breeding Tools for Eggplant Enhancement.七个茄子()和一个野生近缘种()种质的全基因组重测序为茄子改良提供了新见解和育种工具。
Front Plant Sci. 2019 Oct 8;10:1220. doi: 10.3389/fpls.2019.01220. eCollection 2019.
9
The Utility of Data Transformation for Alignment, De Novo Assembly and Classification of Short Read Virus Sequences.数据转换在短读病毒序列比对、从头组装和分类中的应用。
Viruses. 2019 Apr 26;11(5):394. doi: 10.3390/v11050394.
10
In silico read normalization using set multi-cover optimization.基于集合多重覆盖优化的计算读归一化。
Bioinformatics. 2018 Oct 1;34(19):3273-3280. doi: 10.1093/bioinformatics/bty307.
Proc Natl Acad Sci U S A. 2012 Aug 14;109(33):13272-7. doi: 10.1073/pnas.1121464109. Epub 2012 Jul 30.
4
KISSPLICE: de-novo calling alternative splicing events from RNA-seq data.KISSPLICE:从 RNA-seq 数据中进行新的剪接事件调用。
BMC Bioinformatics. 2012 Apr 19;13 Suppl 6(Suppl 6):S5. doi: 10.1186/1471-2105-13-S6-S5.
5
Exploiting sparseness in de novo genome assembly.从头组装基因组中的稀疏性利用。
BMC Bioinformatics. 2012 Apr 19;13 Suppl 6(Suppl 6):S1. doi: 10.1186/1471-2105-13-S6-S1.
6
De novo assembly and genotyping of variants using colored de Bruijn graphs.利用有色 de Bruijn 图进行从头组装和变体基因分型。
Nat Genet. 2012 Jan 8;44(2):226-32. doi: 10.1038/ng.1028.
7
Meta-IDBA: a de Novo assembler for metagenomic data.Meta-IDBA:一种用于宏基因组数据的从头组装程序。
Bioinformatics. 2011 Jul 1;27(13):i94-101. doi: 10.1093/bioinformatics/btr216.
8
Full-length transcriptome assembly from RNA-Seq data without a reference genome.无参考基因组的 RNA-Seq 数据的全长转录组组装。
Nat Biotechnol. 2011 May 15;29(7):644-52. doi: 10.1038/nbt.1883.
9
Succinct data structures for assembling large genomes.用于组装大型基因组的简明数据结构。
Bioinformatics. 2011 Feb 15;27(4):479-86. doi: 10.1093/bioinformatics/btq697. Epub 2011 Jan 17.
10
Assembly algorithms for next-generation sequencing data.下一代测序数据的组装算法。
Genomics. 2010 Jun;95(6):315-27. doi: 10.1016/j.ygeno.2010.03.001. Epub 2010 Mar 6.