• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

EpiCarousel:用于图谱级单细胞染色质可及性数据的元细胞的内存和时间高效识别。

EpiCarousel: memory- and time-efficient identification of metacells for atlas-level single-cell chromatin accessibility data.

作者信息

Li Sijie, Li Yuxi, Sun Yu, Li Yaru, Chen Xiaoyang, Tang Songming, Chen Shengquan

机构信息

School of Mathematical Sciences and LPMC, Nankai University, Tianjin 300071, China.

Institute of Health Service and Transfusion Medicine, Beijing 100850, China.

出版信息

Bioinformatics. 2024 Mar 29;40(4). doi: 10.1093/bioinformatics/btae191.

DOI:10.1093/bioinformatics/btae191
PMID:38588573
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC11037479/
Abstract

SUMMARY

Recent technical advancements in single-cell chromatin accessibility sequencing (scCAS) have brought new insights to the characterization of epigenetic heterogeneity. As single-cell genomics experiments scale up to hundreds of thousands of cells, the demand for computational resources for downstream analysis grows intractably large and exceeds the capabilities of most researchers. Here, we propose EpiCarousel, a tailored Python package based on lazy loading, parallel processing, and community detection for memory- and time-efficient identification of metacells, i.e. the emergence of homogenous cells, in large-scale scCAS data. Through comprehensive experiments on five datasets of various protocols, sample sizes, dimensions, number of cell types, and degrees of cell-type imbalance, EpiCarousel outperformed baseline methods in systematic evaluation of memory usage, computational time, and multiple downstream analyses including cell type identification. Moreover, EpiCarousel executes preprocessing and downstream cell clustering on the atlas-level dataset with 707 043 cells and 1 154 611 peaks within 2 h consuming <75 GB of RAM and provides superior performance for characterizing cell heterogeneity than state-of-the-art methods.

AVAILABILITY AND IMPLEMENTATION

The EpiCarousel software is well-documented and freely available at https://github.com/biox-nku/epicarousel. It can be seamlessly interoperated with extensive scCAS analysis toolkits.

摘要

摘要

单细胞染色质可及性测序(scCAS)的最新技术进展为表观遗传异质性的表征带来了新见解。随着单细胞基因组学实验规模扩大到数十万细胞,下游分析所需的计算资源需求增长到难以处理的程度,超出了大多数研究人员的能力范围。在此,我们提出了EpiCarousel,这是一个基于惰性加载、并行处理和社区检测的定制Python软件包,用于在大规模scCAS数据中高效地识别元细胞(即同质细胞的出现),同时节省内存和时间。通过对五个不同协议、样本大小、维度、细胞类型数量和细胞类型不平衡程度的数据集进行全面实验,EpiCarousel在内存使用、计算时间以及包括细胞类型识别在内的多个下游分析的系统评估中优于基线方法。此外,EpiCarousel在2小时内对包含707043个细胞和1154611个峰的图谱级数据集执行预处理和下游细胞聚类,内存消耗<75GB,并且在表征细胞异质性方面比现有方法具有更优的性能。

可用性和实现方式

EpiCarousel软件文档完善,可在https://github.com/biox-nku/epicarousel上免费获取。它可以与广泛的scCAS分析工具包无缝互操作。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/87a7/11037479/85890f5b21f4/btae191f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/87a7/11037479/85890f5b21f4/btae191f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/87a7/11037479/85890f5b21f4/btae191f1.jpg

相似文献

1
EpiCarousel: memory- and time-efficient identification of metacells for atlas-level single-cell chromatin accessibility data.EpiCarousel:用于图谱级单细胞染色质可及性数据的元细胞的内存和时间高效识别。
Bioinformatics. 2024 Mar 29;40(4). doi: 10.1093/bioinformatics/btae191.
2
ASTER: accurately estimating the number of cell types in single-cell chromatin accessibility data.ASTER:准确估计单细胞染色质可及性数据中的细胞类型数量。
Bioinformatics. 2023 Jan 1;39(1). doi: 10.1093/bioinformatics/btac842.
3
Accurate Annotation for Differentiating and Imbalanced Cell Types in Single-Cell Chromatin Accessibility Data.单细胞染色质可及性数据中区分和平衡细胞类型的精确注释。
IEEE/ACM Trans Comput Biol Bioinform. 2024 May-Jun;21(3):461-471. doi: 10.1109/TCBB.2024.3372970. Epub 2024 Jun 5.
4
Building and analyzing metacells in single-cell genomics data.在单细胞基因组学数据中构建和分析元细胞。
Mol Syst Biol. 2024 Jul;20(7):744-766. doi: 10.1038/s44320-024-00045-6. Epub 2024 May 29.
5
Scarf enables a highly memory-efficient analysis of large-scale single-cell genomics data.Scarf 能够实现对大规模单细胞基因组学数据的高效内存分析。
Nat Commun. 2022 Aug 8;13(1):4616. doi: 10.1038/s41467-022-32097-3.
6
scATAC-pro: a comprehensive workbench for single-cell chromatin accessibility sequencing data.scATAC-pro:单细胞染色质可及性测序数据的综合工作平台。
Genome Biol. 2020 Apr 20;21(1):94. doi: 10.1186/s13059-020-02008-0.
7
scBOL: a universal cell type identification framework for single-cell and spatial transcriptomics data.scBOL:单细胞和空间转录组学数据的通用细胞类型识别框架。
Brief Bioinform. 2024 Mar 27;25(3). doi: 10.1093/bib/bbae188.
8
RA3 is a reference-guided approach for epigenetic characterization of single cells.RA3 是一种基于参考的单细胞表观遗传学特征分析方法。
Nat Commun. 2021 Apr 12;12(1):2177. doi: 10.1038/s41467-021-22495-4.
9
scAMACE: model-based approach to the joint analysis of single-cell data on chromatin accessibility, gene expression and methylation.scAMACE:一种基于模型的方法,用于联合分析染色质可及性、基因表达和甲基化的单细胞数据。
Bioinformatics. 2021 Nov 5;37(21):3874-3880. doi: 10.1093/bioinformatics/btab426.
10
CloudATAC: a cloud-based framework for ATAC-Seq data analysis.CloudATAC:一个基于云的 ATAC-Seq 数据分析框架。
Brief Bioinform. 2024 Jul 23;25(Supplement_1). doi: 10.1093/bib/bbae090.

引用本文的文献

1
MINGLE: a mutual information-based interpretable framework for automatic cell type annotation in single-cell chromatin accessibility data.MINGLE:一种基于互信息的可解释框架,用于单细胞染色质可及性数据中的自动细胞类型注释。
Genome Biol. 2025 Jun 11;26(1):162. doi: 10.1186/s13059-025-03603-9.
2
Cellular mechanical memory: a potential tool for mesenchymal stem cell-based therapy.细胞机械记忆:基于间充质干细胞治疗的潜在工具。
Stem Cell Res Ther. 2025 Mar 31;16(1):159. doi: 10.1186/s13287-025-04249-x.
3
Graph neural networks for single-cell omics data: a review of approaches and applications.

本文引用的文献

1
scCASE: accurate and interpretable enhancement for single-cell chromatin accessibility sequencing data.scCASE:单细胞染色质可及性测序数据的准确可解释增强
Nat Commun. 2024 Feb 22;15(1):1629. doi: 10.1038/s41467-024-46045-w.
2
A fast, scalable and versatile tool for analysis of single-cell omics data.一种快速、可扩展且功能多样的单细胞组学数据分析工具。
Nat Methods. 2024 Feb;21(2):217-227. doi: 10.1038/s41592-023-02139-9. Epub 2024 Jan 8.
3
scEpiTools: a database to comprehensively interrogate analytic tools for single-cell epigenomic data.
用于单细胞组学数据的图神经网络:方法与应用综述
Brief Bioinform. 2025 Mar 4;26(2). doi: 10.1093/bib/bbaf109.
4
MetaQ: fast, scalable and accurate metacell inference via single-cell quantization.MetaQ:通过单细胞量化实现快速、可扩展且准确的元细胞推断。
Nat Commun. 2025 Jan 31;16(1):1205. doi: 10.1038/s41467-025-56424-6.
5
Enhancing spatial domain detection in spatial transcriptomics with EnSDD.利用 EnSDD 增强空间转录组学中的空间域检测。
Commun Biol. 2024 Oct 21;7(1):1358. doi: 10.1038/s42003-024-07001-y.
scEpiTools:一个全面查询单细胞表观基因组数据分析工具的数据库。
J Genet Genomics. 2024 Apr;51(4):462-465. doi: 10.1016/j.jgg.2023.09.011. Epub 2023 Sep 27.
4
Dictionary learning for integrative, multimodal and scalable single-cell analysis.基于字典学习的综合、多模态和可扩展的单细胞分析。
Nat Biotechnol. 2024 Feb;42(2):293-304. doi: 10.1038/s41587-023-01767-y. Epub 2023 May 25.
5
SEACells infers transcriptional and epigenomic cellular states from single-cell genomics data.SEACells 从单细胞基因组学数据推断转录和表观基因组细胞状态。
Nat Biotechnol. 2023 Dec;41(12):1746-1757. doi: 10.1038/s41587-023-01716-9. Epub 2023 Mar 27.
6
ASTER: accurately estimating the number of cell types in single-cell chromatin accessibility data.ASTER:准确估计单细胞染色质可及性数据中的细胞类型数量。
Bioinformatics. 2023 Jan 1;39(1). doi: 10.1093/bioinformatics/btac842.
7
Scarf enables a highly memory-efficient analysis of large-scale single-cell genomics data.Scarf 能够实现对大规模单细胞基因组学数据的高效内存分析。
Nat Commun. 2022 Aug 8;13(1):4616. doi: 10.1038/s41467-022-32097-3.
8
Metacell-2: a divide-and-conquer metacell algorithm for scalable scRNA-seq analysis.Metacell-2:一种用于可扩展 scRNA-seq 分析的分而治之的元细胞算法。
Genome Biol. 2022 Apr 19;23(1):100. doi: 10.1186/s13059-022-02667-1.
9
Chromatin-accessibility estimation from single-cell ATAC-seq data with scOpen.使用 scOpen 从单细胞 ATAC-seq 数据估计染色质可及性。
Nat Commun. 2021 Nov 4;12(1):6386. doi: 10.1038/s41467-021-26530-2.
10
EpiScanpy: integrated single-cell epigenomic analysis.EpiScanpy:整合的单细胞表观基因组分析。
Nat Commun. 2021 Sep 1;12(1):5228. doi: 10.1038/s41467-021-25131-3.