• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

PxBLAT:BLAT 的高效 Python 绑定库。

PxBLAT: an efficient python binding library for BLAT.

机构信息

Department of Urology, Northwestern University Feinberg School of Medicine, 303 E Superior St, Chicago, IL, 60611, USA.

Robert H. Lurie Comprehensive Cancer Center, Northwestern University Feinberg School of Medicine, 675 N St Clair St, Chicago, IL, 60611, USA.

出版信息

BMC Bioinformatics. 2024 Jun 19;25(1):219. doi: 10.1186/s12859-024-05844-0.

DOI:10.1186/s12859-024-05844-0
PMID:38898394
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC11549839/
Abstract

BACKGROUND

With the surge in genomic data driven by advancements in sequencing technologies, the demand for efficient bioinformatics tools for sequence analysis has become paramount. BLAST-like alignment tool (BLAT), a sequence alignment tool, faces limitations in performance efficiency and integration with modern programming environments, particularly Python. This study introduces PxBLAT, a Python-based framework designed to enhance the capabilities of BLAT, focusing on usability, computational efficiency, and seamless integration within the Python ecosystem.

RESULTS

PxBLAT demonstrates significant improvements over BLAT in execution speed and data handling, as evidenced by comprehensive benchmarks conducted across various sample groups ranging from 50 to 600 samples. These experiments highlight a notable speedup, reducing execution time compared to BLAT. The framework also introduces user-friendly features such as improved server management, data conversion utilities, and shell completion, enhancing the overall user experience. Additionally, the provision of extensive documentation and comprehensive testing supports community engagement and facilitates the adoption of PxBLAT.

CONCLUSIONS

PxBLAT stands out as a robust alternative to BLAT, offering performance and user interaction enhancements. Its development underscores the potential for modern programming languages to improve bioinformatics tools, aligning with the needs of contemporary genomic research. By providing a more efficient, user-friendly tool, PxBLAT has the potential to impact genomic data analysis workflows, supporting faster and more accurate sequence analysis in a Python environment.

摘要

背景

随着测序技术的进步,基因组数据呈指数级增长,对高效的序列分析生物信息学工具的需求变得至关重要。BLAT 类比对工具(BLAT)是一种序列比对工具,在性能效率和与现代编程环境(特别是 Python)的集成方面存在局限性。本研究介绍了 PxBLAT,这是一个基于 Python 的框架,旨在增强 BLAT 的功能,重点是可用性、计算效率和在 Python 生态系统中的无缝集成。

结果

PxBLAT 在执行速度和数据处理方面明显优于 BLAT,这一点可以通过在从 50 到 600 个样本的各种样本组上进行的全面基准测试中得到证明。这些实验突出了显著的加速,与 BLAT 相比,执行时间大大缩短。该框架还引入了用户友好的功能,如改进的服务器管理、数据转换实用程序和外壳完成,从而提高了整体用户体验。此外,广泛的文档和全面的测试提供了支持社区参与和促进 PxBLAT 采用的资源。

结论

PxBLAT 是 BLAT 的一个强大替代品,提供了性能和用户交互方面的增强。它的开发凸显了现代编程语言在改进生物信息学工具方面的潜力,符合当代基因组研究的需求。通过提供更高效、用户友好的工具,PxBLAT 有可能影响基因组数据分析工作流程,在 Python 环境中支持更快、更准确的序列分析。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/57e3/11549839/82d1d56ac77a/12859_2024_5844_Fig2_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/57e3/11549839/367ae092e9cb/12859_2024_5844_Figa_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/57e3/11549839/3bce8985a4fd/12859_2024_5844_Fig1_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/57e3/11549839/82d1d56ac77a/12859_2024_5844_Fig2_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/57e3/11549839/367ae092e9cb/12859_2024_5844_Figa_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/57e3/11549839/3bce8985a4fd/12859_2024_5844_Fig1_HTML.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/57e3/11549839/82d1d56ac77a/12859_2024_5844_Fig2_HTML.jpg

相似文献

1
PxBLAT: an efficient python binding library for BLAT.PxBLAT:BLAT 的高效 Python 绑定库。
BMC Bioinformatics. 2024 Jun 19;25(1):219. doi: 10.1186/s12859-024-05844-0.
2
PxBLAT: An efficient python binding library for BLAT.PxBLAT:一个用于BLAT的高效Python绑定库。
bioRxiv. 2024 Feb 5:2023.08.02.551686. doi: 10.1101/2023.08.02.551686.
3
BLAT--the BLAST-like alignment tool.BLAT——类BLAST比对工具。
Genome Res. 2002 Apr;12(4):656-64. doi: 10.1101/gr.229202.
4
pyPaSWAS: Python-based multi-core CPU and GPU sequence alignment.pyPaSWAS:基于Python的多核CPU和GPU序列比对工具。
PLoS One. 2018 Jan 2;13(1):e0190279. doi: 10.1371/journal.pone.0190279. eCollection 2018.
5
pblat: a multithread blat algorithm speeding up aligning sequences to genomes.pblat:一种多线程 blat 算法,用于加速将序列与基因组对齐。
BMC Bioinformatics. 2019 Jan 15;20(1):28. doi: 10.1186/s12859-019-2597-8.
6
Biotite: a unifying open source computational biology framework in Python.黑云母:一个用 Python 实现的统一的开源计算生物学框架。
BMC Bioinformatics. 2018 Oct 1;19(1):346. doi: 10.1186/s12859-018-2367-z.
7
OpenStructure: an integrated software framework for computational structural biology.开放结构:一个用于计算结构生物学的集成软件框架。
Acta Crystallogr D Biol Crystallogr. 2013 May;69(Pt 5):701-9. doi: 10.1107/S0907444913007051. Epub 2013 Apr 19.
8
Workflows for microarray data processing in the Kepler environment.在 Kepler 环境中进行微阵列数据处理的工作流程。
BMC Bioinformatics. 2012 May 17;13:102. doi: 10.1186/1471-2105-13-102.
9
A service-based BLAST command tool supported by cloud infrastructures.一种由云基础设施支持的基于服务的BLAST命令工具。
Stud Health Technol Inform. 2012;175:69-77.
10
Rapid detection and curation of conserved DNA via enhanced-BLAT and EvoPrinterHD analysis.通过增强型BLAT和EvoPrinterHD分析快速检测和整理保守DNA
BMC Genomics. 2008 Feb 28;9:106. doi: 10.1186/1471-2164-9-106.

引用本文的文献

1
A Genomic Language Model for Chimera Artifact Detection in Nanopore Direct RNA Sequencing.一种用于纳米孔直接RNA测序中嵌合体伪影检测的基因组语言模型。
bioRxiv. 2024 Oct 26:2024.10.23.619929. doi: 10.1101/2024.10.23.619929.

本文引用的文献

1
A draft Diabrotica virgifera virgifera genome: insights into control and host plant adaption by a major maize pest insect.一个玉米穗虫——玉米黄条跳甲的基因组草图:揭示主要玉米害虫对其控制和寄主植物适应性的见解。
BMC Genomics. 2023 Jan 13;24(1):19. doi: 10.1186/s12864-022-08990-y.
2
Method of the year: long-read sequencing.年度方法:长读长测序。
Nat Methods. 2023 Jan;20(1):6-11. doi: 10.1038/s41592-022-01730-w.
3
Deeper genomic insights into tomato CLE genes repertoire identify new active peptides.深入的番茄 CLE 基因家族基因组分析鉴定出新的活性肽。
BMC Genomics. 2022 Nov 17;23(1):756. doi: 10.1186/s12864-022-08980-0.
4
Analysing high-throughput sequencing data in Python with HTSeq 2.0.用 HTSeq 2.0 分析 Python 中的高通量测序数据。
Bioinformatics. 2022 May 13;38(10):2943-2945. doi: 10.1093/bioinformatics/btac166.
5
Placental methylome reveals a 22q13.33 brain regulatory gene locus associated with autism.胎盘甲基组揭示了与自闭症相关的 22q13.33 大脑调控基因座。
Genome Biol. 2022 Feb 16;23(1):46. doi: 10.1186/s13059-022-02613-1.
6
Complete pan-plastome sequences enable high resolution phylogenetic classification of sugar beet and closely related crop wild relatives.完整的叶绿体全基因组序列可实现甜菜及其近缘作物野生亲缘植物的高精度系统发育分类。
BMC Genomics. 2022 Feb 10;23(1):113. doi: 10.1186/s12864-022-08336-8.
7
Comparative assessment of genes driving cancer and somatic evolution in non-cancer tissues: an update of the Network of Cancer Genes (NCG) resource.比较非癌组织中驱动癌症和体细胞进化的基因:癌症基因网络 (NCG) 资源的更新。
Genome Biol. 2022 Jan 26;23(1):35. doi: 10.1186/s13059-022-02607-z.
8
pblat: a multithread blat algorithm speeding up aligning sequences to genomes.pblat:一种多线程 blat 算法,用于加速将序列与基因组对齐。
BMC Bioinformatics. 2019 Jan 15;20(1):28. doi: 10.1186/s12859-019-2597-8.
9
Programming: Pick up Python.编程:学习Python。
Nature. 2015 Feb 5;518(7537):125-6. doi: 10.1038/518125a.
10
Evaluation of alignment algorithms for discovery and identification of pathogens using RNA-Seq.使用RNA测序评估用于发现和鉴定病原体的比对算法。
PLoS One. 2013 Oct 30;8(10):e76935. doi: 10.1371/journal.pone.0076935. eCollection 2013.