• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

wgatools:一个用于操作全基因组比对的超快速工具包。

wgatools: an ultrafast toolkit for manipulating whole-genome alignments.

作者信息

Wei Wenjie, Gui Songtao, Yang Jian, Garrison Erik, Yan Jianbing, Liu Hai-Jun

机构信息

School of Life Sciences, Westlake University, Hangzhou 310030, China.

National Laboratory of Crop Genetic Improvement, Huazhong Agricultural University, Wuhan 430070, China.

出版信息

Bioinformatics. 2025 Mar 29;41(4). doi: 10.1093/bioinformatics/btaf132.

DOI:10.1093/bioinformatics/btaf132
PMID:40152239
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC11978383/
Abstract

SUMMARY

With the rapid development of long-read sequencing technologies, the era of individual complete genomes is approaching. We have developed wgatools, a cross-platform, ultrafast toolkit that supports a range of whole-genome alignment formats, offering practical tools for conversion, processing, evaluation, and visualization of alignments, thereby facilitating population-level genome analysis and advancing functional and evolutionary genomics.

AVAILABILITY AND IMPLEMENTATION

wgatools supports diverse formats and can process, filter, and statistically evaluate alignments, perform alignment-based variant calling, and visualize alignments both locally and genome-wide. Built with Rust for efficiency and safe memory usage, it ensures fast performance and can handle large datasets consisting of hundreds of genomes. wgatools is published as free software under the MIT open-source license, and its source code is freely available at https://github.com/wjwei-handsome/wgatools and https://zenodo.org/records/14882797.

摘要

摘要

随着长读长测序技术的快速发展,个体完整基因组时代即将来临。我们开发了wgatools,这是一个跨平台的超快速工具包,支持一系列全基因组比对格式,提供用于比对的转换、处理、评估和可视化的实用工具,从而促进群体水平的基因组分析,并推动功能基因组学和进化基因组学的发展。

可用性与实现

wgatools支持多种格式,能够处理、过滤和统计评估比对,基于比对进行变异检测,并在本地和全基因组范围内可视化比对。它采用Rust构建,以提高效率并安全使用内存,确保快速性能,能够处理由数百个基因组组成的大型数据集。wgatools作为免费软件根据MIT开源许可发布,其源代码可在https://github.com/wjwei-handsome/wgatools和https://zenodo.org/records/14882797上免费获取。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/eba5/11978383/b9cea7fb4dc7/btaf132f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/eba5/11978383/b9cea7fb4dc7/btaf132f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/eba5/11978383/b9cea7fb4dc7/btaf132f1.jpg

相似文献

1
wgatools: an ultrafast toolkit for manipulating whole-genome alignments.wgatools:一个用于操作全基因组比对的超快速工具包。
Bioinformatics. 2025 Mar 29;41(4). doi: 10.1093/bioinformatics/btaf132.
2
wgatools: an ultrafast toolkit for manipulating whole genome alignments.Wgatools:一个用于操作全基因组比对的超快速工具包。
ArXiv. 2024 Sep 13:arXiv:2409.08569v1.
3
chainCleaner improves genome alignment specificity and sensitivity.链清洁器提高了基因组比对的特异性和灵敏度。
Bioinformatics. 2017 Jun 1;33(11):1596-1603. doi: 10.1093/bioinformatics/btx024.
4
halSynteny: a fast, easy-to-use conserved synteny block construction method for multiple whole-genome alignments.halSynteny:一种用于多组全基因组比对的快速、易用的保守同线性块构建方法。
Gigascience. 2020 Jun 1;9(6). doi: 10.1093/gigascience/giaa047.
5
tidk: a toolkit to rapidly identify telomeric repeats from genomic datasets.TIDK:一种从基因组数据集中快速识别端粒重复序列的工具包。
Bioinformatics. 2025 Feb 4;41(2). doi: 10.1093/bioinformatics/btaf049.
6
BioKIT: a versatile toolkit for processing and analyzing diverse types of sequence data.BioKIT:一个用于处理和分析多种类型序列数据的多功能工具包。
Genetics. 2022 Jul 4;221(3). doi: 10.1093/genetics/iyac079.
7
GCI: a continuity inspector for complete genome assembly.GCI:用于完整基因组组装的连续性检查器。
Bioinformatics. 2024 Nov 1;40(11). doi: 10.1093/bioinformatics/btae633.
8
SynMap2 and SynMap3D: web-based whole-genome synteny browsers.SynMap2 和 SynMap3D:基于网络的全基因组同线性浏览器。
Bioinformatics. 2017 Jul 15;33(14):2197-2198. doi: 10.1093/bioinformatics/btx144.
9
MethylCoder: software pipeline for bisulfite-treated sequences.MethylCoder:用于亚硫酸氢盐处理序列的软件管道。
Bioinformatics. 2011 Sep 1;27(17):2435-6. doi: 10.1093/bioinformatics/btr394. Epub 2011 Jun 30.
10
HomBlocks: A multiple-alignment construction pipeline for organelle phylogenomics based on locally collinear block searching.HomBlocks:基于局部共线性块搜索的细胞器系统发育基因组学多重比对构建流水线。
Genomics. 2018 Jan;110(1):18-22. doi: 10.1016/j.ygeno.2017.08.001. Epub 2017 Aug 3.

引用本文的文献

1
Genetic variation at transcription factor binding sites largely explains phenotypic heritability in maize.转录因子结合位点的遗传变异在很大程度上解释了玉米的表型遗传性。
Nat Genet. 2025 Aug 11. doi: 10.1038/s41588-025-02246-7.

本文引用的文献

1
ACMGA: a reference-free multiple-genome alignment pipeline for plant species.ACMGA:一种用于植物物种的无参考多基因组比对管道。
BMC Genomics. 2024 May 25;25(1):515. doi: 10.1186/s12864-024-10430-y.
2
Genome assembly in the telomere-to-telomere era.端粒到端粒时代的基因组组装。
Nat Rev Genet. 2024 Sep;25(9):658-670. doi: 10.1038/s41576-024-00718-w. Epub 2024 Apr 22.
3
New whole-genome alignment tools are needed for tapping into plant diversity.需要新的全基因组比对工具来挖掘植物多样性。
Trends Plant Sci. 2024 Mar;29(3):355-369. doi: 10.1016/j.tplants.2023.08.013. Epub 2023 Sep 23.
4
Multiple genome alignment in the telomere-to-telomere assembly era.端粒到端粒组装时代的多基因组比对。
Genome Biol. 2022 Aug 29;23(1):182. doi: 10.1186/s13059-022-02735-6.
5
AnchorWave: Sensitive alignment of genomes with high sequence diversity, extensive structural polymorphism, and whole-genome duplication.AnchorWave:具有高度序列多样性、广泛结构多态性和全基因组重复的基因组的敏感比对。
Proc Natl Acad Sci U S A. 2022 Jan 4;119(1). doi: 10.1073/pnas.2113075119.
6
Whole-Genome Alignment.全基因组比对
Methods Mol Biol. 2019;1910:121-147. doi: 10.1007/978-1-4939-9074-0_4.
7
The Third Revolution in Sequencing Technology.测序技术的第三次革命。
Trends Genet. 2018 Sep;34(9):666-681. doi: 10.1016/j.tig.2018.05.008. Epub 2018 Jun 22.
8
Minimap2: pairwise alignment for nucleotide sequences.Minimap2:核苷酸序列的两两比对。
Bioinformatics. 2018 Sep 15;34(18):3094-3100. doi: 10.1093/bioinformatics/bty191.
9
HAL: a hierarchical format for storing and analyzing multiple genome alignments.HAL:一种用于存储和分析多个基因组比对的层次格式。
Bioinformatics. 2013 May 15;29(10):1341-2. doi: 10.1093/bioinformatics/btt128. Epub 2013 Mar 16.