• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

pyBedGraph:一个用于快速操作一维基因组信号轨迹的 Python 包。

pyBedGraph: a python package for fast operations on 1D genomic signal tracks.

机构信息

Department of Electrical and Computer Engineering, University of California, San Diego, La Jolla, CA 92093, USA.

The Jackson Laboratory for Genomic Medicine, Farmington, CT 06032, USA.

出版信息

Bioinformatics. 2020 May 1;36(10):3234-3235. doi: 10.1093/bioinformatics/btaa061.

DOI:10.1093/bioinformatics/btaa061
PMID:32044918
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC7214040/
Abstract

MOTIVATION

Modern genomic research is driven by next-generation sequencing experiments such as ChIP-seq and ChIA-PET that generate coverage files for transcription factor binding, as well as DHS and ATAC-seq that yield coverage files for chromatin accessibility. Such files are in a bedGraph text format or a bigWig binary format. Obtaining summary statistics in a given region is a fundamental task in analyzing protein binding intensity or chromatin accessibility. However, the existing Python package for operating on coverage files is not optimized for speed.

RESULTS

We developed pyBedGraph, a Python package to quickly obtain summary statistics for a given interval in a bedGraph or a bigWig file. When tested on 12 ChIP-seq, ATAC-seq, RNA-seq and ChIA-PET datasets, pyBedGraph is on average 260 times faster than the existing program pyBigWig. On average, pyBedGraph can look up the exact mean signal of 1 million regions in ∼0.26 s and can compute their approximate means in <0.12 s on a conventional laptop.

AVAILABILITY AND IMPLEMENTATION

pyBedGraph is publicly available at https://github.com/TheJacksonLaboratory/pyBedGraph under the MIT license.

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

动机

现代基因组学研究受到下一代测序实验的推动,例如 ChIP-seq 和 ChIA-PET,它们生成转录因子结合的覆盖文件,以及 DHS 和 ATAC-seq,它们生成染色质可及性的覆盖文件。这些文件采用 bedGraph 文本格式或 bigWig 二进制格式。在给定区域获取汇总统计信息是分析蛋白质结合强度或染色质可及性的基本任务。然而,用于操作覆盖文件的现有 Python 包不是针对速度进行优化的。

结果

我们开发了 pyBedGraph,这是一个 Python 包,用于快速获取 bedGraph 或 bigWig 文件中给定区间的汇总统计信息。在 12 个 ChIP-seq、ATAC-seq、RNA-seq 和 ChIA-PET 数据集上进行测试时,pyBedGraph 的速度平均比现有程序 pyBigWig 快 260 倍。平均而言,pyBedGraph 可以在约 0.26 秒内查找 100 万个区域的确切平均信号,并可以在传统笔记本电脑上在 <0.12 秒内计算它们的近似平均值。

可用性和实现

pyBedGraph 在 MIT 许可证下可在 https://github.com/TheJacksonLaboratory/pyBedGraph 上公开获得。

补充信息

补充数据可在 Bioinformatics 在线获得。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/9a6b/7214040/7b64aa2a8d2f/btaa061f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/9a6b/7214040/7b64aa2a8d2f/btaa061f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/9a6b/7214040/7b64aa2a8d2f/btaa061f1.jpg

相似文献

1
pyBedGraph: a python package for fast operations on 1D genomic signal tracks.pyBedGraph:一个用于快速操作一维基因组信号轨迹的 Python 包。
Bioinformatics. 2020 May 1;36(10):3234-3235. doi: 10.1093/bioinformatics/btaa061.
2
BAMscale: quantification of next-generation sequencing peaks and generation of scaled coverage tracks.BAMscale:下一代测序峰的定量分析和缩放覆盖轨道的生成。
Epigenetics Chromatin. 2020 Apr 22;13(1):21. doi: 10.1186/s13072-020-00343-x.
3
ggcoverage: an R package to visualize and annotate genome coverage for various NGS data.ggcoverage:一个用于可视化和注释各种 NGS 数据基因组覆盖度的 R 包。
BMC Bioinformatics. 2023 Aug 9;24(1):309. doi: 10.1186/s12859-023-05438-2.
4
Megadepth: efficient coverage quantification for BigWigs and BAMs.Megadepth:BigWigs 和 BAMs 的高效覆盖度量化。
Bioinformatics. 2021 Sep 29;37(18):3014-3016. doi: 10.1093/bioinformatics/btab152.
5
Explore, edit and leverage genomic annotations using Python GTF toolkit.使用 Python GTF 工具包探索、编辑和利用基因组注释。
Bioinformatics. 2019 Sep 15;35(18):3487-3488. doi: 10.1093/bioinformatics/btz116.
6
Bigtools: a high-performance BigWig and BigBed library in Rust.Bigtools:一个用 Rust 编写的高性能 BigWig 和 BigBed 库。
Bioinformatics. 2024 Jun 3;40(6). doi: 10.1093/bioinformatics/btae350.
7
ATACseqQC: a Bioconductor package for post-alignment quality assessment of ATAC-seq data.ATACseqQC:一个用于评估 ATAC-seq 数据的基于 Bioconductor 的序列后质量评估工具包。
BMC Genomics. 2018 Mar 1;19(1):169. doi: 10.1186/s12864-018-4559-3.
8
CWig: compressed representation of Wiggle/BedGraph format.CWig:Wiggle/BedGraph 格式的压缩表示。
Bioinformatics. 2014 Sep 15;30(18):2543-50. doi: 10.1093/bioinformatics/btu330. Epub 2014 May 27.
9
Mosdepth: quick coverage calculation for genomes and exomes.Mosdepth:基因组和外显子组的快速覆盖度计算。
Bioinformatics. 2018 Mar 1;34(5):867-868. doi: 10.1093/bioinformatics/btx699.
10
Predmoter-cross-species prediction of plant promoter and enhancer regions.植物启动子和增强子区域的启动子跨物种预测
Bioinform Adv. 2024 May 24;4(1):vbae074. doi: 10.1093/bioadv/vbae074. eCollection 2024.

引用本文的文献

1
Chrom-Sig: de-noising 1-dimensional genomic profiles by signal processing methods.Chrom-Sig:通过信号处理方法对一维基因组图谱进行去噪
bioRxiv. 2025 Aug 15:2025.08.12.670000. doi: 10.1101/2025.08.12.670000.
2
Bromodomain-containing proteins interact with a non-canonical RNA polymerase II kinase to maintain gene expression upon heat stress.含溴结构域的蛋白质与一种非典型RNA聚合酶II激酶相互作用,以在热应激时维持基因表达。
Nat Plants. 2025 Jul 9. doi: 10.1038/s41477-025-02044-3.
3
Multifaceted roles of cohesin in regulating transcriptional loops.

本文引用的文献

1
Multiplex chromatin interactions with single-molecule precision.多聚体染色质相互作用的单分子精度研究
Nature. 2019 Feb;566(7745):558-562. doi: 10.1038/s41586-019-0949-1. Epub 2019 Feb 18.
2
deepTools2: a next generation web server for deep-sequencing data analysis.深度工具2:用于深度测序数据分析的下一代网络服务器。
Nucleic Acids Res. 2016 Jul 8;44(W1):W160-5. doi: 10.1093/nar/gkw257. Epub 2016 Apr 13.
3
ENCODE data at the ENCODE portal.ENCODE门户中的ENCODE数据。
黏连蛋白在调控转录环中的多方面作用。
bioRxiv. 2024 Mar 27:2024.03.25.586715. doi: 10.1101/2024.03.25.586715.
4
Productive visualization of high-throughput sequencing data using the SeqCode open portable platform.使用 SeqCode 开放便携平台对高通量测序数据进行高效可视化。
Sci Rep. 2021 Oct 1;11(1):19545. doi: 10.1038/s41598-021-98889-7.
Nucleic Acids Res. 2016 Jan 4;44(D1):D726-32. doi: 10.1093/nar/gkv1160. Epub 2015 Nov 2.
4
ATAC-seq: A Method for Assaying Chromatin Accessibility Genome-Wide.ATAC测序:一种全基因组范围内检测染色质可及性的方法。
Curr Protoc Mol Biol. 2015 Jan 5;109:21.29.1-21.29.9. doi: 10.1002/0471142727.mb2129s109.
5
An integrated encyclopedia of DNA elements in the human genome.人类基因组中 DNA 元件的综合百科全书。
Nature. 2012 Sep 6;489(7414):57-74. doi: 10.1038/nature11247.
6
An oestrogen-receptor-alpha-bound human chromatin interactome.一个与雌激素受体α结合的人类染色质相互作用组。
Nature. 2009 Nov 5;462(7269):58-64. doi: 10.1038/nature08497.
7
Comprehensive mapping of long-range interactions reveals folding principles of the human genome.远距离相互作用的全面图谱揭示了人类基因组的折叠原理。
Science. 2009 Oct 9;326(5950):289-93. doi: 10.1126/science.1181369.
8
Mapping and quantifying mammalian transcriptomes by RNA-Seq.通过RNA测序对哺乳动物转录组进行定位和定量分析。
Nat Methods. 2008 Jul;5(7):621-8. doi: 10.1038/nmeth.1226. Epub 2008 May 30.
9
Genome-wide profiles of STAT1 DNA association using chromatin immunoprecipitation and massively parallel sequencing.利用染色质免疫沉淀和大规模平行测序技术对STAT1 DNA结合进行全基因组分析。
Nat Methods. 2007 Aug;4(8):651-7. doi: 10.1038/nmeth1068. Epub 2007 Jun 11.