• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

泛基因组工具:泛基因组数据的表示、存储与探索

PanTools: representation, storage and exploration of pan-genomic data.

作者信息

Sheikhizadeh Siavash, Schranz M Eric, Akdel Mehmet, de Ridder Dick, Smit Sandra

机构信息

Bioinformatics Group, Wageningen University, Droevendaalsesteeg 1, 6708PB, Wageningen, The Netherlands.

Biosystematics Group, Wageningen University, Droevendaalsesteeg 1, 6708PB, The Netherlands.

出版信息

Bioinformatics. 2016 Sep 1;32(17):i487-i493. doi: 10.1093/bioinformatics/btw455.

DOI:10.1093/bioinformatics/btw455
PMID:27587666
Abstract

MOTIVATION

Next-generation sequencing technology is generating a wealth of highly similar genome sequences for many species, paving the way for a transition from single-genome to pan-genome analyses. Accordingly, genomics research is going to switch from reference-centric to pan-genomic approaches. We define the pan-genome as a comprehensive representation of multiple annotated genomes, facilitating analyses on the similarity and divergence of the constituent genomes at the nucleotide, gene and genome structure level. Current pan-genomic approaches do not thoroughly address scalability, functionality and usability.

RESULTS

We introduce a generalized De Bruijn graph as a pan-genome representation, as well as an online algorithm to construct it. This representation is stored in a Neo4j graph database, which makes our approach scalable to large eukaryotic genomes. Besides the construction algorithm, our software package, called PanTools, currently provides functionality for annotating pan-genomes, adding sequences, grouping genes, retrieving gene sequences or genomic regions, reconstructing genomes and comparing and querying pan-genomes. We demonstrate the performance of the tool using datasets of 62 E. coli genomes, 93 yeast genomes and 19 Arabidopsis thaliana genomes.

AVAILABILITY AND IMPLEMENTATION

The Java implementation of PanTools is publicly available at http://www.bif.wur.nl

CONTACT

sandra.smit@wur.nl.

摘要

动机

新一代测序技术正在为许多物种生成大量高度相似的基因组序列,为从单基因组分析向泛基因组分析的转变铺平了道路。因此,基因组学研究即将从以参考基因组为中心的方法转向泛基因组方法。我们将泛基因组定义为多个注释基因组的全面表示,便于在核苷酸、基因和基因组结构水平上分析组成基因组的相似性和差异性。当前的泛基因组方法并未全面解决可扩展性、功能性和可用性问题。

结果

我们引入了一种广义的德布鲁因图作为泛基因组的表示形式,并介绍了一种构建它的在线算法。这种表示形式存储在一个Neo4j图形数据库中,这使得我们的方法能够扩展到大型真核生物基因组。除了构建算法外,我们名为PanTools的软件包目前还提供了注释泛基因组、添加序列、对基因进行分组、检索基因序列或基因组区域、重建基因组以及比较和查询泛基因组等功能。我们使用62个大肠杆菌基因组、93个酵母基因组和19个拟南芥基因组的数据集展示了该工具的性能。

可用性与实现

PanTools的Java实现可在http://www.bif.wur.nl上公开获取。

联系方式

sandra.smit@wur.nl

相似文献

1
PanTools: representation, storage and exploration of pan-genomic data.泛基因组工具:泛基因组数据的表示、存储与探索
Bioinformatics. 2016 Sep 1;32(17):i487-i493. doi: 10.1093/bioinformatics/btw455.
2
FastEtch: A Fast Sketch-Based Assembler for Genomes.FastEtch:一种基于草图的快速基因组装配器。
IEEE/ACM Trans Comput Biol Bioinform. 2019 Jul-Aug;16(4):1091-1106. doi: 10.1109/TCBB.2017.2737999. Epub 2017 Sep 11.
3
Pan-Tetris: an interactive visualisation for Pan-genomes.泛基因组的Pan-Tetris交互式可视化工具
BMC Bioinformatics. 2015;16 Suppl 11(Suppl 11):S3. doi: 10.1186/1471-2105-16-S11-S3. Epub 2015 Aug 13.
4
PanTools v3: functional annotation, classification and phylogenomics.PanTools v3:功能注释、分类和系统发生基因组学。
Bioinformatics. 2022 Sep 15;38(18):4403-4405. doi: 10.1093/bioinformatics/btac506.
5
Panoramic: A package for constructing eukaryotic pan-genomes.全景图:构建真核生物泛基因组的工具包。
Mol Ecol Resour. 2021 May;21(4):1393-1403. doi: 10.1111/1755-0998.13344. Epub 2021 Mar 12.
6
PanWeb: A web interface for pan-genomic analysis.PanWeb:用于泛基因组分析的网络界面。
PLoS One. 2017 May 24;12(5):e0178154. doi: 10.1371/journal.pone.0178154. eCollection 2017.
7
SplitMEM: a graphical algorithm for pan-genome analysis with suffix skips.SplitMEM:一种具有后缀跳跃的泛基因组分析图形算法。
Bioinformatics. 2014 Dec 15;30(24):3476-83. doi: 10.1093/bioinformatics/btu756. Epub 2014 Nov 13.
8
Simplitigs as an efficient and scalable representation of de Bruijn graphs.Simplitigs 作为一种高效且可扩展的 de Bruijn 图表示方法。
Genome Biol. 2021 Apr 6;22(1):96. doi: 10.1186/s13059-021-02297-z.
9
Distributed hybrid-indexing of compressed pan-genomes for scalable and fast sequence alignment.压缩泛基因组的分布式混合索引,实现可扩展和快速的序列比对。
PLoS One. 2021 Aug 3;16(8):e0255260. doi: 10.1371/journal.pone.0255260. eCollection 2021.
10
Graphical pan-genome analysis with compressed suffix trees and the Burrows-Wheeler transform.利用压缩后缀树和布罗伊登-弗莱彻-戈德法布-香农(BFGS)变换进行图形化泛基因组分析。 (注:原文中未提及“布罗伊登-弗莱彻-戈德法布-香农(BFGS)变换”,这里按照常规理解将Burrows-Wheeler transform翻译为布罗伊登-弗莱彻-戈德法布-香农变换,你可根据实际情况进行调整,因为它可能是特定领域有固定译法的专业术语,也有可能是输入有误,如果实际是Burrows-Wheeler transform应翻译为“伯罗斯-惠勒变换” ) 修正后的译文:利用压缩后缀树和伯罗斯-惠勒变换进行图形化泛基因组分析。
Bioinformatics. 2016 Feb 15;32(4):497-504. doi: 10.1093/bioinformatics/btv603. Epub 2015 Oct 26.

引用本文的文献

1
Plant graph-based pangenomics: techniques, applications, and challenges.基于植物图谱的泛基因组学:技术、应用与挑战。
aBIOTECH. 2025 Mar 28;6(2):361-376. doi: 10.1007/s42994-025-00206-7. eCollection 2025 Jun.
2
Pangenomics to understand prophage dynamics in the genus and the radiating lineages of .泛基因组学用于理解该属及相关辐射谱系中的前噬菌体动态。
Microb Genom. 2025 May;11(5). doi: 10.1099/mgen.0.001392.
3
Pan-genomics: Insight into the Functional Genome, Applications, Advancements, and Challenges.泛基因组学:对功能基因组的洞察、应用、进展与挑战
Curr Genomics. 2025;26(1):2-14. doi: 10.2174/0113892029311541240627111506. Epub 2024 Jul 3.
4
Exploring intra- and intergenomic variation in haplotype-resolved pangenomes.探索单倍型解析泛基因组中的基因组内和基因组间变异。
Plant Biotechnol J. 2025 Mar;23(3):874-886. doi: 10.1111/pbi.14545. Epub 2025 Jan 5.
5
A stepwise guide for pangenome development in crop plants: an alfalfa (Medicago sativa) case study.作物泛基因组开发的分步指南:以紫花苜蓿(Medicago sativa)为例。
BMC Genomics. 2024 Oct 31;25(1):1022. doi: 10.1186/s12864-024-10931-w.
6
Strain heterogeneity in a non-pathogenic Aspergillus fungus highlights factors associated with virulence.非致病真菌曲霉的菌株异质性突出了与毒力相关的因素。
Commun Biol. 2024 Sep 4;7(1):1082. doi: 10.1038/s42003-024-06756-8.
7
Cross-species transcriptomics reveals differential regulation of essential photosynthesis genes in Hirschfeldia incana.种间转录组学揭示了 Hirschfeldia incana 中关键光合作用基因的差异调控。
G3 (Bethesda). 2024 Oct 7;14(10). doi: 10.1093/g3journal/jkae175.
8
Visualizing metagenomic and metatranscriptomic data: A comprehensive review.宏基因组学和宏转录组学数据的可视化:全面综述
Comput Struct Biotechnol J. 2024 May 3;23:2011-2033. doi: 10.1016/j.csbj.2024.04.060. eCollection 2024 Dec.
9
Strain heterogeneity in a non-pathogenic fungus highlights factors contributing to virulence.一种非致病性真菌中的菌株异质性突出了导致毒力的因素。
bioRxiv. 2024 Mar 10:2024.03.08.583994. doi: 10.1101/2024.03.08.583994.
10
DandD: Efficient measurement of sequence growth and similarity.DandD:序列增长与相似性的高效测量
iScience. 2024 Feb 1;27(3):109054. doi: 10.1016/j.isci.2024.109054. eCollection 2024 Mar 15.