• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

BAllC和BAllCools:单细胞DNA甲基化数据的高效格式化与操作

BAllC and BAllCools: Efficient Formatting and Operating for Single-Cell DNA Methylation Data.

作者信息

Tian Wei, Ding Wubin, Shen Jiawei, Li Daofeng, Wang Ting, Ecker Joseph R

机构信息

Genomic Analysis Laboratory, The Salk Institute for Biological Studies, La Jolla, CA 92037, USA.

Department of Genetics, The Edison Family Center for Genome Sciences & Systems Biology, Washington University School of Medicine, St. Louis, MO 63110, USA.

出版信息

bioRxiv. 2024 May 15:2023.09.22.559047. doi: 10.1101/2023.09.22.559047.

DOI:10.1101/2023.09.22.559047
PMID:37808734
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC10557610/
Abstract

MOTIVATION

With single-cell DNA methylation studies yielding vast datasets, existing data formats struggle with the unique challenges of storage and efficient operations, highlighting a need for improved solutions.

RESULTS

BAllC (Binary All Cytosines) emerges as a tailored binary format for methylation data, addressing these challenges. BAllCools, its complementary software toolkit, enhances parsing, indexing, and querying capabilities, promising superior operational speeds and reduced storage needs.

摘要

动机

随着单细胞DNA甲基化研究产生大量数据集,现有的数据格式在存储和高效操作的独特挑战面前捉襟见肘,凸显了对改进解决方案的需求。

结果

BAllC(二进制全胞嘧啶)作为一种针对甲基化数据量身定制的二进制格式应运而生,应对了这些挑战。其配套软件工具包BAllCools增强了解析、索引和查询功能,有望实现更高的操作速度并减少存储需求。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/c11a/11105873/84eb17bef90d/nihpp-2023.09.22.559047v3-f0001.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/c11a/11105873/84eb17bef90d/nihpp-2023.09.22.559047v3-f0001.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/c11a/11105873/84eb17bef90d/nihpp-2023.09.22.559047v3-f0001.jpg

相似文献

1
BAllC and BAllCools: Efficient Formatting and Operating for Single-Cell DNA Methylation Data.BAllC和BAllCools:单细胞DNA甲基化数据的高效格式化与操作
bioRxiv. 2024 May 15:2023.09.22.559047. doi: 10.1101/2023.09.22.559047.
2
BAllC and BAllCools: efficient formatting and operating for single-cell DNA methylation data.BAllC 和 BAllCools:单细胞 DNA 甲基化数据的高效格式化和操作。
Bioinformatics. 2024 Jul 1;40(7). doi: 10.1093/bioinformatics/btae404.
3
Processing genome scale tabular data with wormtable.使用 wormtable 处理基因组规模的表格数据。
BMC Bioinformatics. 2013 Dec 5;14:356. doi: 10.1186/1471-2105-14-356.
4
Scool: a new data storage format for single-cell Hi-C data.Scool:一种用于单细胞 Hi-C 数据的新型数据存储格式。
Bioinformatics. 2021 Aug 4;37(14):2053-2054. doi: 10.1093/bioinformatics/btaa924.
5
mzDB: a file format using multiple indexing strategies for the efficient analysis of large LC-MS/MS and SWATH-MS data sets.mzDB:一种使用多种索引策略的文件格式,用于高效分析大型液相色谱-串联质谱(LC-MS/MS)和全景式二级质谱(SWATH-MS)数据集。
Mol Cell Proteomics. 2015 Mar;14(3):771-81. doi: 10.1074/mcp.O114.039115. Epub 2014 Dec 11.
6
hictk: blazing fast toolkit to work with .hic and .cool files.hicTK:用于处理.hic 和.cool 文件的快速工具包。
Bioinformatics. 2024 Jul 1;40(7). doi: 10.1093/bioinformatics/btae408.
7
Comparison of Programmatic Approaches for Efficient Accessing to mzML Files.高效访问mzML文件的编程方法比较
J Data Mining Genomics Proteomics. 2011 Jan 1;2(1). doi: 10.4172/2153-0602.1000109.
8
DISMISS: detection of stranded methylation in MeDIP-Seq data.驳回:在甲基化DNA免疫沉淀测序(MeDIP-Seq)数据中检测滞留甲基化
BMC Bioinformatics. 2016 Jul 29;17(1):295. doi: 10.1186/s12859-016-1158-7.
9
Bigmelon: tools for analysing large DNA methylation datasets.Bigmelon:用于分析大型甲基化数据集的工具。
Bioinformatics. 2019 Mar 15;35(6):981-986. doi: 10.1093/bioinformatics/bty713.
10
Recommendations for the formatting of Variant Call Format (VCF) files to make plant genotyping data FAIR.推荐使用 Variant Call Format(VCF)文件格式,使植物基因型数据变得 FAIR。
F1000Res. 2022 Feb 24;11. doi: 10.12688/f1000research.109080.2. eCollection 2022.

本文引用的文献

1
Single-cell DNA methylation and 3D genome architecture in the human brain.人类大脑中的单细胞 DNA 甲基化和 3D 基因组结构。
Science. 2023 Oct 13;382(6667):eadf5357. doi: 10.1126/science.adf5357.
2
A DNA methylation atlas of normal human cell types.正常人类细胞类型的 DNA 甲基化图谱。
Nature. 2023 Jan;613(7943):355-364. doi: 10.1038/s41586-022-05580-6. Epub 2023 Jan 4.
3
mHapTk: a comprehensive toolkit for the analysis of DNA methylation haplotypes.mHapTk:用于分析 DNA 甲基化单倍型的综合工具包。
Bioinformatics. 2022 Nov 15;38(22):5141-5143. doi: 10.1093/bioinformatics/btac650.
4
DNA methylation atlas of the mouse brain at single-cell resolution.单细胞分辨率下的小鼠大脑 DNA 甲基化图谱。
Nature. 2021 Oct;598(7879):120-128. doi: 10.1038/s41586-020-03182-8. Epub 2021 Oct 6.
5
HTSlib: C library for reading/writing high-throughput sequencing data.HTSlib:用于读取/写入高通量测序数据的 C 库。
Gigascience. 2021 Feb 16;10(2). doi: 10.1093/gigascience/giab007.
6
Dissecting the epigenomic dynamics of human fetal germ cell development at single-cell resolution.单细胞分辨率解析人类胎儿生殖细胞发育的表观基因组动态。
Cell Res. 2021 Apr;31(4):463-477. doi: 10.1038/s41422-020-00401-9. Epub 2020 Sep 3.
7
Multi-omics profiling of mouse gastrulation at single-cell resolution.单细胞分辨率下的小鼠原肠胚形成的多组学分析。
Nature. 2019 Dec;576(7787):487-491. doi: 10.1038/s41586-019-1825-8. Epub 2019 Dec 11.
8
WashU Epigenome Browser update 2019.WashU Epigenome Browser 更新 2019.
Nucleic Acids Res. 2019 Jul 2;47(W1):W158-W165. doi: 10.1093/nar/gkz348.
9
Single-cell methylomes identify neuronal subtypes and regulatory elements in mammalian cortex.单细胞甲基化组鉴定哺乳动物皮层中的神经元亚型和调控元件。
Science. 2017 Aug 11;357(6351):600-604. doi: 10.1126/science.aan3351.
10
Human body epigenome maps reveal noncanonical DNA methylation variation.人类表观基因组图谱揭示了非典型DNA甲基化变异。
Nature. 2015 Jul 9;523(7559):212-6. doi: 10.1038/nature14465. Epub 2015 Jun 1.