• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

序列流:用于可视化偏序比对的交互式网络应用程序。

Sequence Flow: interactive web application for visualizing partial order alignments.

机构信息

Institute of Informatics, University of Warsaw, Banacha 2, Warszawa, 02-097, Poland.

出版信息

BMC Genomics. 2024 Oct 16;25(1):973. doi: 10.1186/s12864-024-10886-y.

DOI:10.1186/s12864-024-10886-y
PMID:39415087
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC11483981/
Abstract

BACKGROUND

Multiple sequence alignment (MSA) has proven extremely useful in computational biology, especially in inferring evolutionary relationships via phylogenetic analysis and providing insight into protein structure and function. An alternative to the standard MSA model is partial order alignment (POA), in which aligned sequences are represented as paths in a graph rather than rows in a matrix. While the POA model has proven useful in several applications (e.g. sequencing reads assembly and pangenome structure exploration), we lack efficient visualization tools that could highlight its advantages.

RESULTS

We propose Sequence Flow - a web application designed to address the above problem. Sequence Flow presents the POA as a Sankey diagram, a kind of graph visualisation typically used for graphs representing flowcharts. Sequence Flow enables interactive alignment exploration, including fragment selection, highlighting a selected group of sequences, modification of the position of graph nodes, structure simplification etc. After adjustment, the visualization can be saved as a high-quality graphic file. Thanks to the use of SanKEY.js - a JavaScript library for creating Sankey diagrams, designed specifically to visualize POAs, Sequence Flow provides satisfactory performance even with large alignments.

CONCLUSIONS

We provide Sankey diagram-based POA visualization tools for both end users (Sequence Flow) and bioinformatic software developers (SanKEY.js). Sequence Flow webservice is available at https://sequenceflow.mimuw.edu.pl/ . The source code for SanKEY.js is available at https://github.com/Krzysiekzd/SanKEY.js and for Sequence Flow at https://github.com/Krzysiekzd/SequenceFlow .

摘要

背景

多序列比对 (MSA) 在计算生物学中已被证明非常有用,特别是在通过系统发育分析推断进化关系,并深入了解蛋白质结构和功能方面。标准 MSA 模型的替代方法是部分有序比对 (POA),其中对齐的序列表示为图中的路径,而不是矩阵中的行。虽然 POA 模型在几个应用程序中已被证明是有用的(例如测序读段组装和泛基因组结构探索),但我们缺乏能够突出其优势的高效可视化工具。

结果

我们提出了 Sequence Flow——一种旨在解决上述问题的网络应用程序。Sequence Flow 将 POA 表示为 Sankey 图,这是一种通常用于表示流程图的图形可视化类型。Sequence Flow 支持交互式对齐探索,包括片段选择、突出显示选定的序列组、修改图形节点的位置、简化结构等。调整后,可视化可以保存为高质量的图形文件。由于使用了 SanKEY.js——一种用于创建 Sankey 图的 JavaScript 库,专门用于可视化 POA,因此 Sequence Flow 甚至可以在处理大型对齐时提供令人满意的性能。

结论

我们为最终用户(Sequence Flow)和生物信息学软件开发人员(SanKEY.js)提供了基于 Sankey 图的 POA 可视化工具。Sequence Flow 网络服务可在 https://sequenceflow.mimuw.edu.pl/ 访问。SanKEY.js 的源代码可在 https://github.com/Krzysiekzd/SanKEY.js 获得,而 Sequence Flow 的源代码可在 https://github.com/Krzysiekzd/SequenceFlow 获得。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8f67/11483981/053ca3b2e5bc/12864_2024_10886_Fig5_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8f67/11483981/4b41138c9795/12864_2024_10886_Fig1_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8f67/11483981/5888ba04b561/12864_2024_10886_Fig2_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8f67/11483981/345272d76636/12864_2024_10886_Fig3_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8f67/11483981/61fe9016cd3b/12864_2024_10886_Fig4_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8f67/11483981/053ca3b2e5bc/12864_2024_10886_Fig5_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8f67/11483981/4b41138c9795/12864_2024_10886_Fig1_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8f67/11483981/5888ba04b561/12864_2024_10886_Fig2_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8f67/11483981/345272d76636/12864_2024_10886_Fig3_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8f67/11483981/61fe9016cd3b/12864_2024_10886_Fig4_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/8f67/11483981/053ca3b2e5bc/12864_2024_10886_Fig5_HTML.jpg

相似文献

1
Sequence Flow: interactive web application for visualizing partial order alignments.序列流:用于可视化偏序比对的交互式网络应用程序。
BMC Genomics. 2024 Oct 16;25(1):973. doi: 10.1186/s12864-024-10886-y.
2
RCSB protein Data Bank: exploring protein 3D similarities via comprehensive structural alignments.RCSB 蛋白质数据库:通过全面的结构比对探索蛋白质 3D 相似性。
Bioinformatics. 2024 Jun 3;40(6). doi: 10.1093/bioinformatics/btae370.
3
phylotree.js - a JavaScript library for application development and interactive data visualization in phylogenetics.phylotree.js - 一个用于应用程序开发和系统发育学中交互式数据可视化的 JavaScript 库。
BMC Bioinformatics. 2018 Jul 25;19(1):276. doi: 10.1186/s12859-018-2283-2.
4
SATCHMO-JS: a webserver for simultaneous protein multiple sequence alignment and phylogenetic tree construction.SATCHMO-JS:一个用于同时进行蛋白质多重序列比对和系统发育树构建的网络服务器。
Nucleic Acids Res. 2010 Jul;38(Web Server issue):W29-34. doi: 10.1093/nar/gkq298. Epub 2010 Apr 29.
5
AliWABA: alignment on the web through an A-Bruijn approach.AliWABA:通过A-Bruijn方法实现的网络比对
Nucleic Acids Res. 2006 Jul 1;34(Web Server issue):W613-6. doi: 10.1093/nar/gkl288.
6
Cytoscape.js: a graph theory library for visualisation and analysis.Cytoscape.js:一个用于可视化和分析的图论库。
Bioinformatics. 2016 Jan 15;32(2):309-11. doi: 10.1093/bioinformatics/btv557. Epub 2015 Sep 28.
7
phylo-node: A molecular phylogenetic toolkit using Node.js.系统发育节点:一个使用Node.js的分子系统发育工具包。
PLoS One. 2017 Apr 14;12(4):e0175480. doi: 10.1371/journal.pone.0175480. eCollection 2017.
8
blastjs: a BLAST+ wrapper for Node.js.blastjs:一个用于Node.js的BLAST+包装器。
BMC Res Notes. 2016 Feb 27;9:130. doi: 10.1186/s13104-016-1938-1.
9
MAFFT online service: multiple sequence alignment, interactive sequence choice and visualization.MAFFT 在线服务:多序列比对、交互式序列选择和可视化。
Brief Bioinform. 2019 Jul 19;20(4):1160-1166. doi: 10.1093/bib/bbx108.
10
BOV--a web-based BLAST output visualization tool.BOV——一个基于网络的BLAST输出可视化工具。
BMC Genomics. 2008 Sep 15;9:414. doi: 10.1186/1471-2164-9-414.

本文引用的文献

1
ODGI: understanding pangenome graphs.ODGI:理解泛基因组图谱。
Bioinformatics. 2022 Jun 27;38(13):3319-3326. doi: 10.1093/bioinformatics/btac308.
2
Getting insight into the pan-genome structure with PangTree.利用 PangTree 深入了解泛基因组结构。
BMC Genomics. 2020 Apr 16;21(Suppl 2):274. doi: 10.1186/s12864-020-6610-4.
3
MoMI-G: modular multi-scale integrated genome graph browser.MoMI-G:模块化多尺度综合基因组图谱浏览器。
BMC Bioinformatics. 2019 Nov 5;20(1):548. doi: 10.1186/s12859-019-3145-2.
4
Sequence tube maps: making graph genomes intuitive to commuters.序列管图:让图基因组更容易被通勤者理解。
Bioinformatics. 2019 Dec 15;35(24):5318-5320. doi: 10.1093/bioinformatics/btz597.
5
GfaViz: flexible and interactive visualization of GFA sequence graphs.GfaViz:GFA 序列图的灵活交互可视化。
Bioinformatics. 2019 Aug 15;35(16):2853-2855. doi: 10.1093/bioinformatics/bty1046.
6
BioSankey: Visualization of Microbial Communities Over Time.生物桑基图:微生物群落随时间的可视化
J Integr Bioinform. 2018 Jun 13;15(4):20170063. doi: 10.1515/jib-2017-0063.
7
Dynamic visualization of multi-level molecular data: The Director package in R.多层次分子数据的动态可视化:R 中的 Director 包。
Comput Methods Programs Biomed. 2018 Jan;153:129-136. doi: 10.1016/j.cmpb.2017.10.013. Epub 2017 Oct 12.
8
Bandage: interactive visualization of de novo genome assemblies.绷带:从头基因组组装的交互式可视化
Bioinformatics. 2015 Oct 15;31(20):3350-2. doi: 10.1093/bioinformatics/btv383. Epub 2015 Jun 22.
9
Biopython: freely available Python tools for computational molecular biology and bioinformatics.Biopython:用于计算分子生物学和生物信息学的免费可用Python工具。
Bioinformatics. 2009 Jun 1;25(11):1422-3. doi: 10.1093/bioinformatics/btp163. Epub 2009 Mar 20.
10
POAVIZ: a Partial order multiple sequence alignment visualizer.POAVIZ:一种偏序多序列比对可视化工具。
Bioinformatics. 2003 Jul 22;19(11):1446-8. doi: 10.1093/bioinformatics/btg175.