Suppr超能文献

ModDotPlot-快速和交互式串联重复序列可视化。

ModDotPlot-rapid and interactive visualization of tandem repeats.

机构信息

Genome Informatics Section, Center for Genomics and Data Science Research, National Human Genome Research Institute, National Institutes of Health, Bethesda, MD 20892, United States.

Department of Computer Science, Johns Hopkins University, Baltimore, MD 21211, United States.

出版信息

Bioinformatics. 2024 Aug 2;40(8). doi: 10.1093/bioinformatics/btae493.

Abstract

MOTIVATION

A common method for analyzing genomic repeats is to produce a sequence similarity matrix visualized via a dot plot. Innovative approaches such as StainedGlass have improved upon this classic visualization by rendering dot plots as a heatmap of sequence identity, enabling researchers to better visualize multi-megabase tandem repeat arrays within centromeres and other heterochromatic regions of the genome. However, computing the similarity estimates for heatmaps requires high computational overhead and can suffer from decreasing accuracy.

RESULTS

In this work, we introduce ModDotPlot, an interactive and alignment-free dot plot viewer. By approximating average nucleotide identity via a k-mer-based containment index, ModDotPlot produces accurate plots orders of magnitude faster than StainedGlass. We accomplish this through the use of a hierarchical modimizer scheme that can visualize the full 128 Mb genome of Arabidopsis thaliana in under 5 min on a laptop. ModDotPlot is bundled with a graphical user interface supporting real-time interactive navigation of entire chromosomes.

AVAILABILITY AND IMPLEMENTATION

ModDotPlot is available at https://github.com/marbl/ModDotPlot.

摘要

动机

分析基因组重复序列的一种常用方法是生成序列相似性矩阵,通过点图可视化。StainedGlass 等创新方法通过将点图渲染为序列同一性的热图,改进了这种经典可视化,使研究人员能够更好地可视化着丝粒和基因组其他异染色质区域内的多兆碱基串联重复阵列。然而,计算热图的相似度估计值需要很高的计算开销,并且可能会降低准确性。

结果

在这项工作中,我们引入了 ModDotPlot,这是一种交互式的、无需对齐的点图查看器。通过使用基于 k-mer 的包含指数来近似平均核苷酸同一性,ModDotPlot 可以以比 StainedGlass 快几个数量级的速度生成准确的图谱。我们通过使用分层 modimizer 方案来实现这一点,该方案可以在笔记本电脑上在不到 5 分钟的时间内可视化拟南芥完整的 128 Mb 基因组。ModDotPlot 随附有一个图形用户界面,支持实时交互式导航整个染色体。

可用性和实现

ModDotPlot 可在 https://github.com/marbl/ModDotPlot 上获得。

相似文献

4
TRASH: Tandem Repeat Annotation and Structural Hierarchy.TRASH:串联重复注释和结构层次。
Bioinformatics. 2023 May 4;39(5). doi: 10.1093/bioinformatics/btad308.
5
jHeatmap: an interactive heatmap viewer for the web.jHeatmap:一个用于网页的交互式热图查看器。
Bioinformatics. 2014 Jun 15;30(12):1757-8. doi: 10.1093/bioinformatics/btu094. Epub 2014 Feb 23.
6
TROLL--tandem repeat occurrence locator.TROLL——串联重复序列出现定位器。
Bioinformatics. 2002 Apr;18(4):634-6. doi: 10.1093/bioinformatics/18.4.634.
10
Skittle: a 2-dimensional genome visualization tool.Skittle:一种二维基因组可视化工具。
BMC Bioinformatics. 2009 Dec 30;10:452. doi: 10.1186/1471-2105-10-452.

引用本文的文献

10
Complete sequencing of ape genomes.猿类基因组的完整测序。
Nature. 2025 May;641(8062):401-418. doi: 10.1038/s41586-025-08816-3. Epub 2025 Apr 9.

本文引用的文献

1
The complete sequence and comparative analysis of ape sex chromosomes.猿类性染色体的完整序列与比较分析。
Nature. 2024 Jun;630(8016):401-411. doi: 10.1038/s41586-024-07473-2. Epub 2024 May 29.
3
The variation and evolution of complete human centromeres.人类完整着丝粒的变异与进化。
Nature. 2024 May;629(8010):136-145. doi: 10.1038/s41586-024-07278-3. Epub 2024 Apr 3.
4
The complete sequence of a human Y chromosome.人类 Y 染色体的完整序列。
Nature. 2023 Sep;621(7978):344-354. doi: 10.1038/s41586-023-06457-y. Epub 2023 Aug 23.
6
UniAligner: a parameter-free framework for fast sequence alignment.UniAligner:一种无参的快速序列比对框架。
Nat Methods. 2023 Sep;20(9):1346-1354. doi: 10.1038/s41592-023-01970-4. Epub 2023 Aug 14.
8
A survey of mapping algorithms in the long-reads era.长读时代的图谱算法研究综述。
Genome Biol. 2023 Jun 1;24(1):133. doi: 10.1186/s13059-023-02972-3.
9
Cycles of satellite and transposon evolution in Arabidopsis centromeres.拟南芥着丝粒卫星和转座子的演化循环。
Nature. 2023 Jun;618(7965):557-565. doi: 10.1038/s41586-023-06062-z. Epub 2023 May 17.
10
Telomere-to-telomere assembly of diploid chromosomes with Verkko.利用 Verkko 进行二倍体染色体的端粒到端粒组装。
Nat Biotechnol. 2023 Oct;41(10):1474-1482. doi: 10.1038/s41587-023-01662-6. Epub 2023 Feb 16.

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验