• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

基诺米克斯:用 Go 为基因组学实现高性能和易读性的统一。

Gonomics: uniting high performance and readability for genomics with Go.

机构信息

Department of Molecular Genetics and Microbiology, Duke University School of Medicine, Durham, NC 27710, United States.

University Program in Genetics and Genomics, Duke University School of Medicine, Durham, NC 27710, United States.

出版信息

Bioinformatics. 2023 Aug 1;39(8). doi: 10.1093/bioinformatics/btad516.

DOI:10.1093/bioinformatics/btad516
PMID:37624924
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC10466080/
Abstract

SUMMARY

Many existing software libraries for genomics require researchers to pick between competing considerations: the performance of compiled languages and the accessibility of interpreted languages. Go, a modern compiled language, provides an opportunity to address this conflict. We introduce Gonomics, an open-source collection of command line programs and bioinformatic libraries implemented in Go that unites readability and performance for genomic analyses. Gonomics contains packages to read, write, and manipulate a wide array of file formats (e.g. FASTA, FASTQ, BED, BEDPE, SAM, BAM, and VCF), and can convert and interface between these formats. Furthermore, our modular library structure provides a flexible platform for researchers developing their own software tools to address specific questions. These commands can be combined and incorporated into complex pipelines to meet the growing need for high-performance bioinformatic resources.

AVAILABILITY AND IMPLEMENTATION

Gonomics is implemented in the Go programming language. Source code, installation instructions, and documentation are freely available at https://github.com/vertgenlab/gonomics.

摘要

摘要

许多现有的基因组学软件库要求研究人员在竞争因素之间做出选择:编译语言的性能和解释语言的可访问性。Go 是一种现代的编译语言,为解决这一冲突提供了机会。我们引入了 Gonomics,这是一个用 Go 实现的开源命令行程序和生物信息学库集合,它为基因组分析统一了可读性和性能。Gonomics 包含用于读取、写入和操作各种文件格式(例如 FASTA、FASTQ、BED、BEDPE、SAM、BAM 和 VCF)的软件包,并可以在这些格式之间进行转换和接口。此外,我们的模块化库结构为开发人员提供了一个灵活的平台,用于开发自己的软件工具来解决特定问题。这些命令可以组合并纳入复杂的管道中,以满足对高性能生物信息学资源的不断增长的需求。

可用性和实现

Gonomics 是用 Go 编程语言实现的。源代码、安装说明和文档可在 https://github.com/vertgenlab/gonomics 上免费获取。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4ef1/10466080/ef77160f2d3e/btad516f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4ef1/10466080/ef77160f2d3e/btad516f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/4ef1/10466080/ef77160f2d3e/btad516f1.jpg

相似文献

1
Gonomics: uniting high performance and readability for genomics with Go.基诺米克斯:用 Go 为基因组学实现高性能和易读性的统一。
Bioinformatics. 2023 Aug 1;39(8). doi: 10.1093/bioinformatics/btad516.
2
Pygenomics: manipulating genomic intervals and data files in Python.Pygenomics:在 Python 中操作基因组区间和数据文件。
Bioinformatics. 2023 Jun 1;39(6). doi: 10.1093/bioinformatics/btad346.
3
BioStructures.jl: read, write and manipulate macromolecular structures in Julia.Julia 中的生物结构库:读取、写入和操作大分子结构。
Bioinformatics. 2020 Aug 15;36(14):4206-4207. doi: 10.1093/bioinformatics/btaa502.
4
hts-nim: scripting high-performance genomic analyses.hts-nim:高性能基因组分析脚本编写。
Bioinformatics. 2018 Oct 1;34(19):3387-3389. doi: 10.1093/bioinformatics/bty358.
5
Sushi.R: flexible, quantitative and integrative genomic visualizations for publication-quality multi-panel figures.Sushi.R:用于高质量多面板图表出版的灵活、定量和综合基因组可视化工具。
Bioinformatics. 2014 Oct;30(19):2808-10. doi: 10.1093/bioinformatics/btu379. Epub 2014 Jun 5.
6
SamQL: a structured query language and filtering tool for the SAM/BAM file format.SamQL:一种针对 SAM/BAM 文件格式的结构化查询语言和过滤工具。
BMC Bioinformatics. 2021 Oct 2;22(1):474. doi: 10.1186/s12859-021-04390-3.
7
The Ensembl REST API: Ensembl Data for Any Language.Ensembl REST应用程序编程接口:适用于任何语言的Ensembl数据。
Bioinformatics. 2015 Jan 1;31(1):143-5. doi: 10.1093/bioinformatics/btu613. Epub 2014 Sep 17.
8
DNA Features Viewer: a sequence annotation formatting and plotting library for Python.DNA 特征查看器:一个用于 Python 的序列注释格式化和绘图库。
Bioinformatics. 2020 Aug 1;36(15):4350-4352. doi: 10.1093/bioinformatics/btaa213.
9
SciPipe: A workflow library for agile development of complex and dynamic bioinformatics pipelines.SciPipe:一个用于敏捷开发复杂和动态生物信息学管道的工作流库。
Gigascience. 2019 May 1;8(5). doi: 10.1093/gigascience/giz044.
10
gofasta: command-line utilities for genomic epidemiology research.gofasta:用于基因组流行病学研究的命令行实用程序。
Bioinformatics. 2022 Aug 10;38(16):4033-4035. doi: 10.1093/bioinformatics/btac424.

引用本文的文献

1
Genome Sequence of a Marine Threespine Stickleback (Gasterosteus aculeatus) from Rabbit Slough in the Cook Inlet.来自库克湾兔子泥沼的一条海洋三刺鱼(Gasterosteus aculeatus)的基因组序列。
G3 (Bethesda). 2025 May 23. doi: 10.1093/g3journal/jkaf114.
2
Rapidly evolved genomic regions shape individual language abilities in present-day humans.快速进化的基因组区域塑造了现代人类的个体语言能力。
bioRxiv. 2025 Mar 10:2025.03.07.641231. doi: 10.1101/2025.03.07.641231.
3
Genome Sequence of a Marine Threespine Stickleback () from Rabbit Slough in the Cook Inlet.

本文引用的文献

1
GSEL: a fast, flexible python package for detecting signatures of diverse evolutionary forces on genomic regions.GSEL:一个快速、灵活的 Python 包,用于检测基因组区域上多种进化力量的特征。
Bioinformatics. 2023 Jan 1;39(1). doi: 10.1093/bioinformatics/btad037.
2
Adaptive sequence divergence forged new neurodevelopmental enhancers in humans.适应性序列分歧在人类中形成了新的神经发育增强子。
Cell. 2022 Nov 23;185(24):4587-4603.e23. doi: 10.1016/j.cell.2022.10.016.
3
An ancestral mycobacterial effector promotes dissemination of infection.
来自库克湾兔子浅滩的一条海洋三刺鱼()的基因组序列。
bioRxiv. 2025 Feb 8:2025.02.06.636934. doi: 10.1101/2025.02.06.636934.
4
Arteriovenous malformation from a patient with JP-HHT harbours two second-hit somatic DNA alterations in .一名患有少年息肉病伴遗传性出血性毛细血管扩张症(JP-HHT)的患者的动静脉畸形存在两种第二次打击体细胞DNA改变。
J Med Genet. 2025 Mar 20;62(4):281-288. doi: 10.1136/jmg-2024-110569.
5
Epigenetic control of metabolic identity across cell types.跨细胞类型的代谢特性的表观遗传控制。
bioRxiv. 2024 Dec 17:2024.07.24.604914. doi: 10.1101/2024.07.24.604914.
一种祖先分枝杆菌效应物促进感染的传播。
Cell. 2022 Nov 23;185(24):4507-4525.e18. doi: 10.1016/j.cell.2022.10.019. Epub 2022 Nov 9.
4
Developmental venous anomalies are a genetic primer for cerebral cavernous malformations.发育性静脉异常是脑海绵状血管畸形的遗传诱因。
Nat Cardiovasc Res. 2022 Mar;1:246-252. doi: 10.1038/s44161-022-00035-7. Epub 2022 Mar 14.
5
PIK3CA and CCM mutations fuel cavernomas through a cancer-like mechanism.PIK3CA 和 CCM 突变通过类似癌症的机制促进海绵状血管瘤的形成。
Nature. 2021 Jun;594(7862):271-276. doi: 10.1038/s41586-021-03562-8. Epub 2021 Apr 28.
6
HTSlib: C library for reading/writing high-throughput sequencing data.HTSlib:用于读取/写入高通量测序数据的 C 库。
Gigascience. 2021 Feb 16;10(2). doi: 10.1093/gigascience/giab007.
7
TRTools: a toolkit for genome-wide analysis of tandem repeats.TRTools:用于串联重复序列全基因组分析的工具包。
Bioinformatics. 2021 May 5;37(5):731-733. doi: 10.1093/bioinformatics/btaa736.
8
Genotyping structural variants in pangenome graphs using the vg toolkit.使用vg工具包对泛基因组图谱中的结构变异进行基因分型。
Genome Biol. 2020 Feb 12;21(1):35. doi: 10.1186/s13059-020-1941-7.
9
Comparing Ease of Programming in C++, Go, and Java for Implementing a Next-Generation Sequencing Tool.比较使用C++、Go和Java实现下一代测序工具时的编程难易程度。
Evol Bioinform Online. 2019 Aug 15;15:1176934319869015. doi: 10.1177/1176934319869015. eCollection 2019.
10
A comparison of three programming languages for a full-fledged next-generation sequencing tool.三种编程语言在全功能下一代测序工具中的比较。
BMC Bioinformatics. 2019 Jun 3;20(1):301. doi: 10.1186/s12859-019-2903-5.