• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

FlowGrid能够对非常大的单细胞RNA测序数据进行快速聚类。

FlowGrid enables fast clustering of very large single-cell RNA-seq data.

作者信息

Fang Xiunan, Ho Joshua W K

机构信息

School of Biomedical Sciences, Li Ka Shing Faculty of Medicine, The University of Hong Kong, Hong Kong SAR, China.

Laboratory of Data Discovery for Health Limited (D24H), Hong Kong Science Park, New Territories, Hong Kong SAR, China.

出版信息

Bioinformatics. 2021 Dec 22;38(1):282-283. doi: 10.1093/bioinformatics/btab521.

DOI:10.1093/bioinformatics/btab521
PMID:34289014
Abstract

MOTIVATION

Scalable clustering algorithms are needed to analyze millions of cells in single cell RNA-seq (scRNA-seq) data.

RESULTS

Here, we present an open source python package called FlowGrid that can integrate into the Scanpy workflow to perform clustering on very large scRNA-seq datasets. FlowGrid implements a fast density-based clustering algorithm originally designed for flow cytometry data analysis. We introduce a new automated parameter tuning procedure, and show that FlowGrid can achieve comparable clustering accuracy as state-of-the-art clustering algorithms but at a substantially reduced run time for very large single cell RNA-seq datasets. For example, FlowGrid can complete a one-hour clustering task for one million cells in about five min.

AVAILABILITY AND IMPLEMENTATION

https://github.com/holab-hku/FlowGrid.

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

动机

需要可扩展的聚类算法来分析单细胞RNA测序(scRNA-seq)数据中的数百万个细胞。

结果

在此,我们展示了一个名为FlowGrid的开源Python软件包,它可以集成到Scanpy工作流程中,以便对非常大的scRNA-seq数据集进行聚类。FlowGrid实现了一种最初为流式细胞术数据分析设计的基于密度的快速聚类算法。我们引入了一种新的自动参数调整程序,并表明FlowGrid可以实现与最先进的聚类算法相当的聚类精度,但对于非常大的单细胞RNA-seq数据集,其运行时间大幅减少。例如,FlowGrid可以在大约五分钟内完成对一百万个细胞的一小时聚类任务。

可用性和实现方式

https://github.com/holab-hku/FlowGrid。

补充信息

补充数据可在《生物信息学》在线获取。

相似文献

1
FlowGrid enables fast clustering of very large single-cell RNA-seq data.FlowGrid能够对非常大的单细胞RNA测序数据进行快速聚类。
Bioinformatics. 2021 Dec 22;38(1):282-283. doi: 10.1093/bioinformatics/btab521.
2
Ultrafast clustering of single-cell flow cytometry data using FlowGrid.使用FlowGrid对单细胞流式细胞术数据进行超快速聚类。
BMC Syst Biol. 2019 Apr 5;13(Suppl 2):35. doi: 10.1186/s12918-019-0690-2.
3
scBGEDA: deep single-cell clustering analysis via a dual denoising autoencoder with bipartite graph ensemble clustering.scBGEDA:基于双分图集成分聚类的对偶去噪自动编码器的单细胞聚类分析。
Bioinformatics. 2023 Feb 14;39(2). doi: 10.1093/bioinformatics/btad075.
4
scNAME: neighborhood contrastive clustering with ancillary mask estimation for scRNA-seq data.scNAME:基于辅助掩模估计的 scRNA-seq 数据邻域对比聚类。
Bioinformatics. 2022 Mar 4;38(6):1575-1583. doi: 10.1093/bioinformatics/btac011.
5
scGAC: a graph attentional architecture for clustering single-cell RNA-seq data.scGAC:一种用于聚类单细胞 RNA-seq 数据的图注意力架构。
Bioinformatics. 2022 Apr 12;38(8):2187-2193. doi: 10.1093/bioinformatics/btac099.
6
Deep enhanced constraint clustering based on contrastive learning for scRNA-seq data.基于对比学习的深度增强约束聚类算法在单细胞 RNA-seq 数据分析中的应用。
Brief Bioinform. 2023 Jul 20;24(4). doi: 10.1093/bib/bbad222.
7
Scalable preprocessing for sparse scRNA-seq data exploiting prior knowledge.利用先验知识对稀疏 scRNA-seq 数据进行可扩展的预处理。
Bioinformatics. 2018 Jul 1;34(13):i124-i132. doi: 10.1093/bioinformatics/bty293.
8
Clustering scRNA-seq data with the cross-view collaborative information fusion strategy.使用跨视图协同信息融合策略对 scRNA-seq 数据进行聚类。
Brief Bioinform. 2024 Sep 23;25(6). doi: 10.1093/bib/bbae511.
9
SSNMDI: a novel joint learning model of semi-supervised non-negative matrix factorization and data imputation for clustering of single-cell RNA-seq data.SSNMDI:一种用于单细胞 RNA-seq 数据聚类的半监督非负矩阵分解和数据插补的新型联合学习模型。
Brief Bioinform. 2023 May 19;24(3). doi: 10.1093/bib/bbad149.
10
Secuer: Ultrafast, scalable and accurate clustering of single-cell RNA-seq data.Secuer:单细胞 RNA-seq 数据的超快速、可扩展和精确聚类。
PLoS Comput Biol. 2022 Dec 5;18(12):e1010753. doi: 10.1371/journal.pcbi.1010753. eCollection 2022 Dec.

引用本文的文献

1
Single-cell omics: experimental workflow, data analyses and applications.单细胞组学:实验工作流程、数据分析及应用
Sci China Life Sci. 2025 Jan;68(1):5-102. doi: 10.1007/s11427-023-2561-0. Epub 2024 Jul 23.
2
CDSKNN: a novel clustering framework for large-scale single-cell data based on a stable graph structure.CDSKNN:一种基于稳定图结构的大规模单细胞数据新型聚类框架。
J Transl Med. 2024 Mar 3;22(1):233. doi: 10.1186/s12967-024-05009-w.
3
Statistical and machine learning methods for immunoprofiling based on single-cell data.
基于单细胞数据的免疫分析的统计和机器学习方法。
Hum Vaccin Immunother. 2023 Aug 1;19(2):2234792. doi: 10.1080/21645515.2023.2234792. Epub 2023 Jul 24.