• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

Pygenomics:在 Python 中操作基因组区间和数据文件。

Pygenomics: manipulating genomic intervals and data files in Python.

机构信息

Institute for Translational Biomedicine, Saint Petersburg State University, St. Petersburg 199034, Russia.

出版信息

Bioinformatics. 2023 Jun 1;39(6). doi: 10.1093/bioinformatics/btad346.

DOI:10.1093/bioinformatics/btad346
PMID:37228014
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC10246576/
Abstract

SUMMARY

We present pygenomics, a Python package for working with genomic intervals and bioinformatic data files. The package implements interval operations, provides both API and CLI, and supports reading and writing data in widely used bioinformatic formats, including BAM, BED, GFF3, and VCF. The source code of pygenomics is provided with in-source documentation and type annotations and adheres to the functional programming paradigm. These features facilitate seamless integration of pygenomics routines into scripts and pipelines. The package is implemented in pure Python using its standard library only and contains the property-based testing framework. Comparison of pygenomics with other Python bioinformatic packages with relation to features and performance is presented. The performance comparison covers operations with genomic intervals, read alignments, and genomic variants and demonstrates that pygenomics is suitable for computationally effective analysis.

AVAILABILITY AND IMPLEMENTATION

The source code is available at https://gitlab.com/gtamazian/pygenomics.

摘要

摘要

我们介绍了 pygenomics,这是一个用于处理基因组区间和生物信息学数据文件的 Python 包。该包实现了区间操作,提供了 API 和 CLI,并支持以广泛使用的生物信息学格式(包括 BAM、BED、GFF3 和 VCF)读写数据。pygenomics 的源代码提供了内联文档和类型注释,并遵循函数式编程范式。这些特性使得 pygenomics 例程能够无缝集成到脚本和管道中。该包完全使用 Python 标准库实现,仅包含基于属性的测试框架。我们展示了 pygenomics 与其他 Python 生物信息学包在功能和性能方面的比较。性能比较涵盖了基因组区间、读取对齐和基因组变异的操作,并证明了 pygenomics 适用于高效的计算分析。

可及性和实现

源代码可在 https://gitlab.com/gtamazian/pygenomics 上获得。

相似文献

1
Pygenomics: manipulating genomic intervals and data files in Python.Pygenomics:在 Python 中操作基因组区间和数据文件。
Bioinformatics. 2023 Jun 1;39(6). doi: 10.1093/bioinformatics/btad346.
2
Gonomics: uniting high performance and readability for genomics with Go.基诺米克斯:用 Go 为基因组学实现高性能和易读性的统一。
Bioinformatics. 2023 Aug 1;39(8). doi: 10.1093/bioinformatics/btad516.
3
Bioframe: operations on genomic intervals in Pandas dataframes.Bioframe:在 Pandas 数据框中操作基因组区间。
Bioinformatics. 2024 Feb 1;40(2). doi: 10.1093/bioinformatics/btae088.
4
PyRanges: efficient comparison of genomic intervals in Python.PyRanges:在 Python 中高效比较基因组区间。
Bioinformatics. 2020 Feb 1;36(3):918-919. doi: 10.1093/bioinformatics/btz615.
5
Pygenprop: a Python library for programmatic exploration and comparison of organism genome properties.Pygenprop:一个用于程序化探索和比较生物基因组属性的 Python 库。
Bioinformatics. 2019 Dec 1;35(23):5063-5065. doi: 10.1093/bioinformatics/btz522.
6
Pybedtools: a flexible Python library for manipulating genomic datasets and annotations.Pybedtools:一个灵活的 Python 库,用于操作基因组数据集和注释。
Bioinformatics. 2011 Dec 15;27(24):3423-4. doi: 10.1093/bioinformatics/btr539. Epub 2011 Sep 23.
7
Explore, edit and leverage genomic annotations using Python GTF toolkit.使用 Python GTF 工具包探索、编辑和利用基因组注释。
Bioinformatics. 2019 Sep 15;35(18):3487-3488. doi: 10.1093/bioinformatics/btz116.
8
A fast and efficient python library for interfacing with the Biological Magnetic Resonance Data Bank.一个用于与生物磁共振数据库接口的快速高效的Python库。
BMC Bioinformatics. 2017 Mar 17;18(1):175. doi: 10.1186/s12859-017-1580-5.
9
A Python library for FAIRer access and deposition to the Metabolomics Workbench Data Repository.一个用于更公平地访问和存入代谢组学工作台数据存储库的Python库。
Metabolomics. 2018;14(5):64. doi: 10.1007/s11306-018-1356-6. Epub 2018 Apr 20.
10
Gos: a declarative library for interactive genomics visualization in Python.Gos:一个用于 Python 中交互式基因组学可视化的声明式库。
Bioinformatics. 2023 Jan 1;39(1). doi: 10.1093/bioinformatics/btad050.