• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

BubbleGun:基因组图中的泡和超泡枚举。

BubbleGun: enumerating bubbles and superbubbles in genome graphs.

机构信息

Medical Faculty, Institute for Medical Biometry and Bioinformatics, Heinrich Heine University Düsseldorf, Düsseldorf 40225, Germany.

Helmholtz Centre for Infection Research (HZI), Helmholtz Institute for Pharmaceutical Research Saarland (HIPS), Saarbrücken 66123, Germany.

出版信息

Bioinformatics. 2022 Sep 2;38(17):4217-4219. doi: 10.1093/bioinformatics/btac448.

DOI:10.1093/bioinformatics/btac448
PMID:35799353
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC9438957/
Abstract

MOTIVATION

With the fast development of sequencing technology, accurate de novo genome assembly is now possible even for larger genomes. Graph-based representations of genomes arise both as part of the assembly process, but also in the context of pangenomes representing a population. In both cases, polymorphic loci lead to bubble structures in such graphs. Detecting bubbles is hence an important task when working with genomic variants in the context of genome graphs.

RESULTS

Here, we present a fast general-purpose tool, called BubbleGun, for detecting bubbles and superbubbles in genome graphs. Furthermore, BubbleGun detects and outputs runs of linearly connected bubbles and superbubbles, which we call bubble chains. We showcase its utility on de Bruijn graphs and compare our results to vg's snarl detection. We show that BubbleGun is considerably faster than vg especially in bigger graphs, where it reports all bubbles in less than 30 min on a human sample de Bruijn graph of around 2 million nodes.

AVAILABILITY AND IMPLEMENTATION

BubbleGun is available and documented as a Python3 package at https://github.com/fawaz-dabbaghieh/bubble_gun under MIT license.

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

动机

随着测序技术的快速发展,即使是较大的基因组,现在也可以进行准确的从头基因组组装。基于图的基因组表示法既出现在组装过程中,也出现在代表群体的泛基因组上下文中。在这两种情况下,多态性位点都会导致此类图中的气泡结构。因此,在基因组图上下文中处理基因组变体时,检测气泡是一项重要任务。

结果

在这里,我们提出了一种快速的通用工具,称为 BubbleGun,用于检测基因组图中的气泡和超级气泡。此外,BubbleGun 还可以检测和输出线性连接的气泡和超级气泡的运行,我们称之为气泡链。我们在 de Bruijn 图上展示了它的实用性,并将我们的结果与 vg 的 snarl 检测进行了比较。我们表明,BubbleGun 比 vg 快得多,尤其是在更大的图中,它可以在不到 30 分钟的时间内报告人类样本 de Bruijn 图中大约 200 万个节点的所有气泡。

可用性和实现

BubbleGun 是一个 Python3 包,可在 MIT 许可证下在 https://github.com/fawaz-dabbaghieh/bubble_gun 上获得和记录。

补充信息

补充数据可在 Bioinformatics 在线获得。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/7a0f/9438957/60bdc3923d18/btac448f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/7a0f/9438957/60bdc3923d18/btac448f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/7a0f/9438957/60bdc3923d18/btac448f1.jpg

相似文献

1
BubbleGun: enumerating bubbles and superbubbles in genome graphs.BubbleGun:基因组图中的泡和超泡枚举。
Bioinformatics. 2022 Sep 2;38(17):4217-4219. doi: 10.1093/bioinformatics/btac448.
2
Integrating long-range connectivity information into de Bruijn graphs.将长程连接信息整合到 de Bruijn 图中。
Bioinformatics. 2018 Aug 1;34(15):2556-2565. doi: 10.1093/bioinformatics/bty157.
3
Cuttlefish: fast, parallel and low-memory compaction of de Bruijn graphs from large-scale genome collections.乌贼算法:从大规模基因组集合中快速、并行且低内存消耗的 de Bruijn 图压缩。
Bioinformatics. 2021 Jul 12;37(Suppl_1):i177-i186. doi: 10.1093/bioinformatics/btab309.
4
Using 2k + 2 bubble searches to find single nucleotide polymorphisms in k-mer graphs.使用2k + 2次冒泡搜索在k-mer图中查找单核苷酸多态性。
Bioinformatics. 2015 Mar 1;31(5):642-6. doi: 10.1093/bioinformatics/btu706. Epub 2014 Oct 24.
5
Aligning optical maps to de Bruijn graphs.将光学图谱比对到 De Bruijn 图上。
Bioinformatics. 2019 Sep 15;35(18):3250-3256. doi: 10.1093/bioinformatics/btz069.
6
Succinct colored de Bruijn graphs.简明彩色 de Bruijn 图。
Bioinformatics. 2017 Oct 15;33(20):3181-3187. doi: 10.1093/bioinformatics/btx067.
7
RResolver: efficient short-read repeat resolution within ABySS.RResolver:AByss 内高效的短读重复序列解决工具。
BMC Bioinformatics. 2022 Jun 21;23(1):246. doi: 10.1186/s12859-022-04790-z.
8
A space and time-efficient index for the compacted colored de Bruijn graph.一种用于压缩彩色 de Bruijn 图的空间和时间高效索引。
Bioinformatics. 2018 Jul 1;34(13):i169-i177. doi: 10.1093/bioinformatics/bty292.
9
Superbubbles revisited.再探超级气泡
Algorithms Mol Biol. 2018 Dec 1;13:16. doi: 10.1186/s13015-018-0134-3. eCollection 2018.
10
Population-scale detection of non-reference sequence variants using colored de Bruijn graphs.使用有色 de Bruijn 图进行大规模人群中非参考序列变异的检测。
Bioinformatics. 2022 Jan 12;38(3):604-611. doi: 10.1093/bioinformatics/btab749.

引用本文的文献

1
A survey of sequence-to-graph mapping algorithms in the pangenome era.泛基因组时代序列到图谱映射算法综述。
Genome Biol. 2025 May 22;26(1):138. doi: 10.1186/s13059-025-03606-6.
2
Exploring gene content with pangene graphs.利用泛基因图探索基因内容。
Bioinformatics. 2024 Jul 23;40(7). doi: 10.1093/bioinformatics/btae456.
3
KSNP: a fast de Bruijn graph-based haplotyping tool approaching data-in time cost.KSNP:一种基于快速 de Bruijn 图的单倍型工具,可实现接近数据输入的时间成本。
Nat Commun. 2024 Apr 11;15(1):3126. doi: 10.1038/s41467-024-47562-4.
4
Exploring gene content with pangene graphs.利用泛基因图探索基因内容。
ArXiv. 2024 May 29:arXiv:2402.16185v3.