• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

PyHMMER:一个绑定到 HMMER 的 Python 库,用于高效的序列分析。

PyHMMER: a Python library binding to HMMER for efficient sequence analysis.

机构信息

Structural and Computational Biology Unit, EMBL, Meyerhofstraße 1, Heidelberg 69117, Germany.

出版信息

Bioinformatics. 2023 May 4;39(5). doi: 10.1093/bioinformatics/btad214.

DOI:10.1093/bioinformatics/btad214
PMID:37074928
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC10159651/
Abstract

SUMMARY

PyHMMER provides Python integration of the popular profile Hidden Markov Model software HMMER via Cython bindings. This allows the annotation of protein sequences with profile HMMs and building new ones directly with Python. PyHMMER increases flexibility of use, allowing creating queries directly from Python code, launching searches, and obtaining results without I/O, or accessing previously unavailable statistics like uncorrected P-values. A new parallelization model greatly improves performance when running multithreaded searches, while producing the exact same results as HMMER.

AVAILABILITY AND IMPLEMENTATION

PyHMMER supports all modern Python versions (Python 3.6+) and similar platforms as HMMER (x86 or PowerPC UNIX systems). Pre-compiled packages are released via PyPI (https://pypi.org/project/pyhmmer/) and Bioconda (https://anaconda.org/bioconda/pyhmmer). The PyHMMER source code is available under the terms of the open-source MIT licence and hosted on GitHub (https://github.com/althonos/pyhmmer); its documentation is available on ReadTheDocs (https://pyhmmer.readthedocs.io).

摘要

摘要

PyHMMER 通过 Cython 绑定为流行的蛋白质结构域隐马尔可夫模型软件 HMMER 提供了 Python 集成。这允许使用蛋白质序列进行结构域 HMM 注释,并直接使用 Python 构建新的 HMM。PyHMMER 提高了使用的灵活性,允许直接从 Python 代码创建查询、启动搜索,并在没有 I/O 的情况下获得结果,或者访问以前无法获得的统计信息,如未校正的 P 值。新的并行化模型在运行多线程搜索时极大地提高了性能,同时产生与 HMMER 完全相同的结果。

可用性和实现

PyHMMER 支持所有现代 Python 版本(Python 3.6+)和类似的 HMMER 平台(x86 或 PowerPC UNIX 系统)。预编译的软件包通过 PyPI(https://pypi.org/project/pyhmmer/)和 Bioconda(https://anaconda.org/bioconda/pyhmmer)发布。PyHMMER 的源代码根据开源的 MIT 许可证条款提供,并托管在 GitHub(https://github.com/althonos/pyhmmer)上;其文档可在 ReadTheDocs(https://pyhmmer.readthedocs.io)上查阅。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/acd7/10159651/d1b25edd30ce/btad214f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/acd7/10159651/a3c0d5b9c84e/btad214f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/acd7/10159651/d1b25edd30ce/btad214f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/acd7/10159651/a3c0d5b9c84e/btad214f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/acd7/10159651/d1b25edd30ce/btad214f2.jpg

相似文献

1
PyHMMER: a Python library binding to HMMER for efficient sequence analysis.PyHMMER:一个绑定到 HMMER 的 Python 库,用于高效的序列分析。
Bioinformatics. 2023 May 4;39(5). doi: 10.1093/bioinformatics/btad214.
2
PxBLAT: An efficient python binding library for BLAT.PxBLAT:一个用于BLAT的高效Python绑定库。
bioRxiv. 2024 Feb 5:2023.08.02.551686. doi: 10.1101/2023.08.02.551686.
3
LOCAN: a python library for analyzing single-molecule localization microscopy data.LOCAN:一个用于分析单分子定位显微镜数据的 Python 库。
Bioinformatics. 2022 Apr 28;38(9):2670-2672. doi: 10.1093/bioinformatics/btac160.
4
pyrpipe: a Python package for RNA-Seq workflows.pyrpipe:一个用于RNA测序工作流程的Python软件包。
NAR Genom Bioinform. 2021 Jun 1;3(2):lqab049. doi: 10.1093/nargab/lqab049. eCollection 2021 Jun.
5
HOMELETTE: a unified interface to homology modelling software.HOMELETTE:同源建模软件的统一接口。
Bioinformatics. 2022 Mar 4;38(6):1749-1751. doi: 10.1093/bioinformatics/btab866.
6
htseq-clip: a toolset for the preprocessing of eCLIP/iCLIP datasets.htseq-clip:用于 eCLIP/iCLIP 数据集预处理的工具集。
Bioinformatics. 2023 Jan 1;39(1). doi: 10.1093/bioinformatics/btac747.
7
Pygenprop: a Python library for programmatic exploration and comparison of organism genome properties.Pygenprop:一个用于程序化探索和比较生物基因组属性的 Python 库。
Bioinformatics. 2019 Dec 1;35(23):5063-5065. doi: 10.1093/bioinformatics/btz522.
8
pyOpenMS: a Python-based interface to the OpenMS mass-spectrometry algorithm library.pyOpenMS:一个基于 Python 的 OpenMS 质谱算法库接口。
Proteomics. 2014 Jan;14(1):74-7. doi: 10.1002/pmic.201300246.
9
The nPYc-Toolbox, a Python module for the pre-processing, quality-control and analysis of metabolic profiling datasets.nPYc-Toolbox,一个用于代谢组学数据集预处理、质量控制和分析的 Python 模块。
Bioinformatics. 2019 Dec 15;35(24):5359-5360. doi: 10.1093/bioinformatics/btz566.
10
Entrezpy: a Python library to dynamically interact with the NCBI Entrez databases.Entrezpy:一个用于与 NCBI Entrez 数据库进行动态交互的 Python 库。
Bioinformatics. 2019 Nov 1;35(21):4511-4514. doi: 10.1093/bioinformatics/btz385.

引用本文的文献

1
Phage Host Range Expansion Through Directed Evolution on Highly Phage-Resistant Strains of .通过在高度抗噬菌体菌株上进行定向进化实现噬菌体宿主范围扩展 。 (原文句子不完整,此处补充完整句子结构以便理解翻译内容)
Int J Mol Sci. 2025 Aug 6;26(15):7597. doi: 10.3390/ijms26157597.
2
Fold first, ask later: structure-informed function annotation of phage proteins.先折叠,后询问:噬菌体蛋白质的结构导向功能注释
bioRxiv. 2025 Jul 20:2025.07.17.665397. doi: 10.1101/2025.07.17.665397.
3
Phyling: phylogenetic inference from annotated genomes.系统发育分析:从注释基因组进行系统发育推断。

本文引用的文献

1
IsoTools: a flexible workflow for long-read transcriptome sequencing analysis.IsoTools:一种用于长读转录组测序分析的灵活工作流程。
Bioinformatics. 2023 Jun 1;39(6). doi: 10.1093/bioinformatics/btad364.
2
BiG-SLiCE: A highly scalable tool maps the diversity of 1.2 million biosynthetic gene clusters.BiG-SLiCE:一个高度可扩展的工具,可绘制 120 万个生物合成基因簇的多样性图谱。
Gigascience. 2021 Jan 13;10(1). doi: 10.1093/gigascience/giaa154.
3
Pfam: The protein families database in 2021.Pfam:2021 年的蛋白质家族数据库。
bioRxiv. 2025 Aug 1:2025.07.30.666921. doi: 10.1101/2025.07.30.666921.
4
Genome sequence of staphylococcal phage ESa4 of the genus .属葡萄球菌噬菌体ESa4的基因组序列。
Microbiol Resour Announc. 2025 Aug 14;14(8):e0028025. doi: 10.1128/mra.00280-25. Epub 2025 Jul 25.
5
A generalized and efficient approach for complete mRNA design improves translation, stability and specificity.一种用于完整mRNA设计的通用且高效的方法可提高翻译效率、稳定性和特异性。
bioRxiv. 2025 Jun 17:2025.06.17.659751. doi: 10.1101/2025.06.17.659751.
6
Predicting coarse-grained representations of biogeochemical cycles from metabarcoding data.从宏条形码数据预测生物地球化学循环的粗粒度表示。
Bioinformatics. 2025 Jul 1;41(Supplement_1):i49-i57. doi: 10.1093/bioinformatics/btaf230.
7
Gaia: An AI-enabled genomic context-aware platform for protein sequence annotation.盖亚:一个用于蛋白质序列注释的人工智能驱动的基因组上下文感知平台。
Sci Adv. 2025 Jun 20;11(25):eadv5109. doi: 10.1126/sciadv.adv5109.
8
Tad pili with adaptable tips mediate contact-dependent killing during bacterial predation.具有可适应尖端的 Tad 菌毛在细菌捕食过程中介导接触依赖性杀伤。
Nat Commun. 2025 May 13;16(1):4425. doi: 10.1038/s41467-025-58967-0.
9
Six Novel Phages: Genomic Insights and Therapeutic Potential.六种新型噬菌体:基因组见解与治疗潜力
Phage (New Rochelle). 2025 Mar 17;6(1):32-40. doi: 10.1089/phage.2024.0037. eCollection 2025 Mar.
10
FastAAI: efficient estimation of genome average amino acid identity and phylum-level relationships using tetramers of universal proteins.FastAAI:利用通用蛋白质四聚体对基因组平均氨基酸同一性和门水平关系进行高效估计。
Nucleic Acids Res. 2025 Apr 22;53(8). doi: 10.1093/nar/gkaf348.
Nucleic Acids Res. 2021 Jan 8;49(D1):D412-D419. doi: 10.1093/nar/gkaa913.
4
Array programming with NumPy.使用 NumPy 进行数组编程。
Nature. 2020 Sep;585(7825):357-362. doi: 10.1038/s41586-020-2649-2. Epub 2020 Sep 16.
5
proGenomes2: an improved database for accurate and consistent habitat, taxonomic and functional annotations of prokaryotic genomes.proGenomes2:一个用于准确和一致地注释原核基因组的栖息地、分类和功能的改进型数据库。
Nucleic Acids Res. 2020 Jan 8;48(D1):D621-D625. doi: 10.1093/nar/gkz1002.
6
Ten simple rules for writing and sharing computational analyses in Jupyter Notebooks.在Jupyter Notebook中撰写和分享计算分析的十条简单规则。
PLoS Comput Biol. 2019 Jul 25;15(7):e1007007. doi: 10.1371/journal.pcbi.1007007. eCollection 2019 Jul.
7
Programming: Pick up Python.编程:学习Python。
Nature. 2015 Feb 5;518(7537):125-6. doi: 10.1038/518125a.
8
TIGRFAMs and Genome Properties in 2013.TIGRFAMs 和 2013 年的基因组特性。
Nucleic Acids Res. 2013 Jan;41(Database issue):D387-95. doi: 10.1093/nar/gks1234. Epub 2012 Nov 28.
9
Accelerated Profile HMM Searches.加速轮廓隐马尔可夫模型搜索。
PLoS Comput Biol. 2011 Oct;7(10):e1002195. doi: 10.1371/journal.pcbi.1002195. Epub 2011 Oct 20.