• 文献检索
  • 文档翻译
  • 深度研究
  • 学术资讯
  • Suppr Zotero 插件Zotero 插件
  • 邀请有礼
  • 套餐&价格
  • 历史记录
应用&插件
Suppr Zotero 插件Zotero 插件浏览器插件Mac 客户端Windows 客户端微信小程序
定价
高级版会员购买积分包购买API积分包
服务
文献检索文档翻译深度研究API 文档MCP 服务
关于我们
关于 Suppr公司介绍联系我们用户协议隐私条款
关注我们

Suppr 超能文献

核心技术专利:CN118964589B侵权必究
粤ICP备2023148730 号-1Suppr @ 2026

文献检索

告别复杂PubMed语法,用中文像聊天一样搜索,搜遍4000万医学文献。AI智能推荐,让科研检索更轻松。

立即免费搜索

文件翻译

保留排版,准确专业,支持PDF/Word/PPT等文件格式,支持 12+语言互译。

免费翻译文档

深度研究

AI帮你快速写综述,25分钟生成高质量综述,智能提取关键信息,辅助科研写作。

立即免费体验

qSNE:具有自动参数调整的二次速率 t-SNE 优化器,适用于大型数据集。

qSNE: quadratic rate t-SNE optimizer with automatic parameter tuning for large datasets.

机构信息

Research Program in Systems Oncology, Research Programs Unit, Faculty of Medicine, University of Helsinki, 00014 Helsinki, Finland.

Research Center for Cancer, Infections and Immunity, Institute of Biomedicine, University of Turku, Turku 20014, Finland.

出版信息

Bioinformatics. 2020 Dec 22;36(20):5086-5092. doi: 10.1093/bioinformatics/btaa637.

DOI:10.1093/bioinformatics/btaa637
PMID:32663244
原文链接:https://pmc.ncbi.nlm.nih.gov/articles/PMC7755412/
Abstract

MOTIVATION

Non-parametric dimensionality reduction techniques, such as t-distributed stochastic neighbor embedding (t-SNE), are the most frequently used methods in the exploratory analysis of single-cell datasets. Current implementations scale poorly to massive datasets and often require downsampling or interpolative approximations, which can leave less-frequent populations undiscovered and much information unexploited.

RESULTS

We implemented a fast t-SNE package, qSNE, which uses a quasi-Newton optimizer, allowing quadratic convergence rate and automatic perplexity (level of detail) optimizer. Our results show that these improvements make qSNE significantly faster than regular t-SNE packages and enables full analysis of large datasets, such as mass cytometry data, without downsampling.

AVAILABILITY AND IMPLEMENTATION

Source code and documentation are openly available at https://bitbucket.org/anthakki/qsne/.

SUPPLEMENTARY INFORMATION

Supplementary data are available at Bioinformatics online.

摘要

动机

非参数降维技术,如 t 分布随机邻域嵌入(t-SNE),是单细胞数据集探索性分析中最常用的方法。当前的实现方法在大规模数据集上的扩展效果不佳,通常需要下采样或插值近似,这可能会导致较少出现的群体未被发现,并且大量信息未被利用。

结果

我们实现了一个快速的 t-SNE 包 qSNE,它使用拟牛顿优化器,允许二次收敛速度和自动困惑度(详细程度)优化器。我们的结果表明,这些改进使得 qSNE 明显快于常规的 t-SNE 包,并能够对大型数据集(如质谱细胞术数据)进行完整分析,而无需下采样。

可用性和实现

源代码和文档可在 https://bitbucket.org/anthakki/qsne/ 上公开获取。

补充信息

补充数据可在生物信息学在线获得。

https://cdn.ncbi.nlm.nih.gov/pmc/blobs/14ab/7755412/5f643491b18b/btaa637f5.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/14ab/7755412/ff3802a33dcf/btaa637f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/14ab/7755412/0599bee32b3f/btaa637f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/14ab/7755412/43c9942b87df/btaa637f3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/14ab/7755412/e200bbece0de/btaa637f4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/14ab/7755412/5f643491b18b/btaa637f5.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/14ab/7755412/ff3802a33dcf/btaa637f1.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/14ab/7755412/0599bee32b3f/btaa637f2.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/14ab/7755412/43c9942b87df/btaa637f3.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/14ab/7755412/e200bbece0de/btaa637f4.jpg
https://cdn.ncbi.nlm.nih.gov/pmc/blobs/14ab/7755412/5f643491b18b/btaa637f5.jpg

相似文献

1
qSNE: quadratic rate t-SNE optimizer with automatic parameter tuning for large datasets.qSNE:具有自动参数调整的二次速率 t-SNE 优化器,适用于大型数据集。
Bioinformatics. 2020 Dec 22;36(20):5086-5092. doi: 10.1093/bioinformatics/btaa637.
2
Automated optimized parameters for T-distributed stochastic neighbor embedding improve visualization and analysis of large datasets.自动优化的 T 分布随机近邻嵌入参数可改善大数据集的可视化和分析。
Nat Commun. 2019 Nov 28;10(1):5415. doi: 10.1038/s41467-019-13055-y.
3
GPGPU Linear Complexity t-SNE Optimization.通用并行图形处理单元线性复杂度t-SNE优化
IEEE Trans Vis Comput Graph. 2020 Jan;26(1):1172-1181. doi: 10.1109/TVCG.2019.2934307. Epub 2019 Aug 23.
4
[Automatic clustering method of flow cytometry data based on -distributed stochastic neighbor embedding].基于分布式随机邻域嵌入的流式细胞术数据自动聚类方法
Sheng Wu Yi Xue Gong Cheng Xue Za Zhi. 2018 Oct 25;35(5):697-704. doi: 10.7507/1001-5515.201802037.
5
A cross entropy test allows quantitative statistical comparison of t-SNE and UMAP representations.交叉熵测试允许对 t-SNE 和 UMAP 表示进行定量统计比较。
Cell Rep Methods. 2023 Jan 13;3(1):100390. doi: 10.1016/j.crmeth.2022.100390. eCollection 2023 Jan 23.
6
Multiview: a software package for multiview pattern recognition methods.多视图:用于多视图模式识别方法的软件包。
Bioinformatics. 2019 Aug 15;35(16):2877-2879. doi: 10.1093/bioinformatics/bty1039.
7
Conditional t-SNE: more informative t-SNE embeddings.条件t-SNE:更具信息性的t-SNE嵌入
Mach Learn. 2021;110(10):2905-2940. doi: 10.1007/s10994-020-05917-0. Epub 2020 Dec 6.
8
NewWave: a scalable R/Bioconductor package for the dimensionality reduction and batch effect removal of single-cell RNA-seq data.NewWave:一个用于单细胞 RNA-seq 数据降维和批次效应去除的可扩展 R/Bioconductor 包。
Bioinformatics. 2022 Apr 28;38(9):2648-2650. doi: 10.1093/bioinformatics/btac149.
9
GSEApy: a comprehensive package for performing gene set enrichment analysis in Python.GSEApy:一个用于在 Python 中进行基因集富集分析的综合软件包。
Bioinformatics. 2023 Jan 1;39(1). doi: 10.1093/bioinformatics/btac757.
10
Quantitative Comparison of Conventional and t-SNE-guided Gating Analyses.常规门控分析与 t-SNE 引导门控分析的定量比较。
Front Immunol. 2019 Jun 5;10:1194. doi: 10.3389/fimmu.2019.01194. eCollection 2019.

引用本文的文献

1
Statistical method scDEED for detecting dubious 2D single-cell embeddings and optimizing t-SNE and UMAP hyperparameters.用于检测可疑的 2D 单细胞嵌入并优化 t-SNE 和 UMAP 参数的统计方法 scDEED。
Nat Commun. 2024 Feb 26;15(1):1753. doi: 10.1038/s41467-024-45891-y.
2
EMBEDR: Distinguishing signal from noise in single-cell omics data.EMBEDR:在单细胞组学数据中区分信号与噪声。
Patterns (N Y). 2022 Feb 8;3(3):100443. doi: 10.1016/j.patter.2022.100443. eCollection 2022 Mar 11.

本文引用的文献

1
Automated optimized parameters for T-distributed stochastic neighbor embedding improve visualization and analysis of large datasets.自动优化的 T 分布随机近邻嵌入参数可改善大数据集的可视化和分析。
Nat Commun. 2019 Nov 28;10(1):5415. doi: 10.1038/s41467-019-13055-y.
2
GPGPU Linear Complexity t-SNE Optimization.通用并行图形处理单元线性复杂度t-SNE优化
IEEE Trans Vis Comput Graph. 2020 Jan;26(1):1172-1181. doi: 10.1109/TVCG.2019.2934307. Epub 2019 Aug 23.
3
The single-cell transcriptional landscape of mammalian organogenesis.哺乳动物器官发生的单细胞转录组图谱。
Nature. 2019 Feb;566(7745):496-502. doi: 10.1038/s41586-019-0969-x. Epub 2019 Feb 20.
4
Fast interpolation-based t-SNE for improved visualization of single-cell RNA-seq data.基于快速插值的 t-SNE 用于改善单细胞 RNA-seq 数据的可视化。
Nat Methods. 2019 Mar;16(3):243-245. doi: 10.1038/s41592-018-0308-4. Epub 2019 Feb 11.
5
Integrative single-cell analysis.整合单细胞分析。
Nat Rev Genet. 2019 May;20(5):257-272. doi: 10.1038/s41576-019-0093-7.
6
Dimensionality reduction for visualizing single-cell data using UMAP.使用UMAP进行单细胞数据可视化的降维方法。
Nat Biotechnol. 2018 Dec 3. doi: 10.1038/nbt.4314.
7
Shared and distinct transcriptomic cell types across neocortical areas.不同脑区共有的和独特的转录组细胞类型。
Nature. 2018 Nov;563(7729):72-78. doi: 10.1038/s41586-018-0654-5. Epub 2018 Oct 31.
8
Integrating single-cell transcriptomic data across different conditions, technologies, and species.整合不同条件、技术和物种的单细胞转录组数据。
Nat Biotechnol. 2018 Jun;36(5):411-420. doi: 10.1038/nbt.4096. Epub 2018 Apr 2.
9
Single-cell analyses to tailor treatments.单细胞分析以定制治疗方案。
Sci Transl Med. 2017 Sep 20;9(408). doi: 10.1126/scitranslmed.aan4730.
10
Splatter: simulation of single-cell RNA sequencing data.Splatter:单细胞 RNA 测序数据模拟。
Genome Biol. 2017 Sep 12;18(1):174. doi: 10.1186/s13059-017-1305-0.