• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

Pygenprop:一个用于程序化探索和比较生物基因组属性的 Python 库。

Pygenprop: a Python library for programmatic exploration and comparison of organism genome properties.

机构信息

Department of Biology, University of Waterloo, Waterloo, Canada.

出版信息

Bioinformatics. 2019 Dec 1;35(23):5063-5065. doi: 10.1093/bioinformatics/btz522.

DOI:10.1093/bioinformatics/btz522
PMID:31240307
Abstract

SUMMARY

A critical step in comparative genomics is the identification of differences in the presence/absence of encoded biochemical pathways among organisms. Our library, Pygenprop, facilitates these comparisons using data from the Genome Properties database. Pygenprop is written in Python and, unlike existing libraries, it is compatible with a variety of tools in the Python data science ecosystem, such as Jupyter Notebooks for interactive analyses and scikit-learn for machine learning. Pygenprop assigns YES, NO, or PARTIAL support for each property based on InterProScan annotations of open reading frames from an organism's genome. The library contains classes for representing the Genome Properties database as a whole and methods for detecting differences in property assignments between organisms. As the Genome Properties database grows, we anticipate widespread adoption of Pygenprop for routine genome analyses and integration within third-party bioinformatics software.

AVAILABILITY AND IMPLEMENTATION

Pygenprop is written in Python and is compatible with versions 3.6 or higher. Source code is available under Apache Licence Version 2 at https://github.com/Micromeda/pygenprop. The package can be installed from both PyPi (https://pypi.org/project/pygenprop) and Anaconda (https://anaconda.org/lbergstrand/pygenprop). Documentation is available on Read the Docs (http://pygenprop.rtfd.io/).

摘要

摘要

比较基因组学的一个关键步骤是识别生物体之间编码生化途径存在/缺失的差异。我们的 Pygenprop 库使用来自基因组属性数据库的数据来促进这些比较。Pygenprop 是用 Python 编写的,与现有的库不同,它与 Python 数据科学生态系统中的各种工具兼容,如用于交互式分析的 Jupyter Notebooks 和用于机器学习的 scikit-learn。Pygenprop 根据生物体基因组中开放阅读框的 InterProScan 注释,为每个属性分配 YES、NO 或 PARTIAL 支持。该库包含表示整个基因组属性数据库的类,以及用于检测生物体之间属性分配差异的方法。随着基因组属性数据库的增长,我们预计 Pygenprop 将被广泛用于常规基因组分析,并集成到第三方生物信息学软件中。

可用性和实现

Pygenprop 是用 Python 编写的,与 3.6 或更高版本兼容。源代码可在 Apache 许可证版本 2 下在 https://github.com/Micromeda/pygenprop 获得。该包可从 PyPi(https://pypi.org/project/pygenprop)和 Anaconda(https://anaconda.org/lbergstrand/pygenprop)安装。文档可在 Read the Docs(http://pygenprop.rtfd.io/)上获得。

相似文献

1
Pygenprop: a Python library for programmatic exploration and comparison of organism genome properties.Pygenprop:一个用于程序化探索和比较生物基因组属性的 Python 库。
Bioinformatics. 2019 Dec 1;35(23):5063-5065. doi: 10.1093/bioinformatics/btz522.
2
JBrowse Jupyter: a Python interface to JBrowse 2.JBrowse Jupyter:JBrowse 2 的 Python 接口。
Bioinformatics. 2023 Jan 1;39(1). doi: 10.1093/bioinformatics/btad032.
3
Gos: a declarative library for interactive genomics visualization in Python.Gos:一个用于 Python 中交互式基因组学可视化的声明式库。
Bioinformatics. 2023 Jan 1;39(1). doi: 10.1093/bioinformatics/btad050.
4
pyrpipe: a Python package for RNA-Seq workflows.pyrpipe:一个用于RNA测序工作流程的Python软件包。
NAR Genom Bioinform. 2021 Jun 1;3(2):lqab049. doi: 10.1093/nargab/lqab049. eCollection 2021 Jun.
5
ssbio: a Python framework for structural systems biology.ssbio:一个用于结构系统生物学的 Python 框架。
Bioinformatics. 2018 Jun 15;34(12):2155-2157. doi: 10.1093/bioinformatics/bty077.
6
orfipy: a fast and flexible tool for extracting ORFs.orfipy:一个快速灵活的 ORF 提取工具。
Bioinformatics. 2021 Sep 29;37(18):3019-3020. doi: 10.1093/bioinformatics/btab090.
7
Efficient population-scale variant analysis and prioritization with VAPr.利用 VAPr 进行高效的群体规模变异分析和优先级排序。
Bioinformatics. 2018 Aug 15;34(16):2843-2845. doi: 10.1093/bioinformatics/bty192.
8
PyHMMER: a Python library binding to HMMER for efficient sequence analysis.PyHMMER:一个绑定到 HMMER 的 Python 库,用于高效的序列分析。
Bioinformatics. 2023 May 4;39(5). doi: 10.1093/bioinformatics/btad214.
9
PyRanges: efficient comparison of genomic intervals in Python.PyRanges:在 Python 中高效比较基因组区间。
Bioinformatics. 2020 Feb 1;36(3):918-919. doi: 10.1093/bioinformatics/btz615.
10
Pybedtools: a flexible Python library for manipulating genomic datasets and annotations.Pybedtools:一个灵活的 Python 库,用于操作基因组数据集和注释。
Bioinformatics. 2011 Dec 15;27(24):3423-4. doi: 10.1093/bioinformatics/btr539. Epub 2011 Sep 23.

引用本文的文献

1
Classification of the plant-associated lifestyle of Pseudomonas strains using genome properties and machine learning.利用基因组特性和机器学习对假单胞菌菌株的植物相关生活方式进行分类。
Sci Rep. 2022 Jun 27;12(1):10857. doi: 10.1038/s41598-022-14913-4.